? 太長不看:它寫的比我好
大家好,我是 Ai 學(xué)習(xí)的老章
最近谷歌殺瘋了,三個新動態(tài),個個能打!
1、
Gemma 3
能用 27B 參數(shù)量達(dá)到開源模型第二水平2、
Gemini 2.0
系列,把多模態(tài)拉到全新境界,尤其是 flash 的 Experimantal 版,動動嘴就能修圖3、
Deep Research
輕松撰寫超詳細(xì)研究報(bào)告這個增強(qiáng)的深度研究 (Enhanced Deep Research) 面向所有用戶免費(fèi)試用,并支持超過 45 種語言。
其核心驅(qū)動力是全新的 Gemini 2.0 Flash Thinking Experimental 模型。它可以快速和高效在網(wǎng)絡(luò)上進(jìn)行信息檢索和整合分析,對需要進(jìn)行大量信息收集和整理的用戶而言,將大幅提升其工作效率。
我測試了幾個問題,大受震撼。
地址:https://gemini.google.com/
提出需求后,Deep Research
會先給出分析方案,如果不滿意,這個方案還支持手動修改。
其自動化思考,抓取網(wǎng)頁,逐步分析,逐步執(zhí)行,最后匯總成一篇分析報(bào)告,有點(diǎn) Manus 的感覺了。
報(bào)告還支持導(dǎo)出到谷歌文檔
稍作修改都能直接用了,一共 20 多頁,1.4 萬字,138 個參考鏈接。
為了本文,我又讓它撰寫了市面上 Deep Research 相關(guān)產(chǎn)品的對比,也是相當(dāng)完善,絕對可以拿去當(dāng)研究報(bào)告使用了。
這里展示一段,說實(shí)話 2.2 節(jié)寫的比我好:
2.1. OpenAI 深度研究
分析表明,OpenAI 的深度研究代表了高端解決方案,適用于需要廣泛研究能力和深入分析的用戶。其對強(qiáng)大推理模型的依賴以及處理復(fù)雜、多步驟任務(wù)的能力是顯著的優(yōu)勢。然而,高昂的訂閱費(fèi)用和不準(zhǔn)確的風(fēng)險(xiǎn)可能使其不太適合預(yù)算有限或需要絕對事實(shí)正確且無需徹底人工驗(yàn)證的用戶。與谷歌產(chǎn)品的比較表明,市場可能基于價(jià)格和可訪問性進(jìn)行細(xì)分。
推理鏈:OpenAI 深度研究的高價(jià)格點(diǎn)表明其專注于擁有大量研究預(yù)算的專業(yè)用戶或組織。對深入分析和使用強(qiáng)大推理模型的強(qiáng)調(diào)表明成本與能力之間存在權(quán)衡。用戶報(bào)告的來源質(zhì)量問題以及無法訪問付費(fèi)內(nèi)容突出了某些領(lǐng)域(尤其是學(xué)術(shù)研究)用戶需要考慮的限制。谷歌推出類似但更實(shí)惠的產(chǎn)品表明,OpenAI 可能面臨調(diào)整價(jià)格或展示明顯更優(yōu)越性能的壓力。
成本高昂(專業(yè)版用戶每月 200 美元,且查詢次數(shù)有限) 。這使得它比其他替代方案貴得多。
可能出現(xiàn)幻覺來源和信息:并非不會生成不正確或誤導(dǎo)性信息,需要進(jìn)行事實(shí)核查。
如果提示不夠強(qiáng)大,報(bào)告可能很長且包含重復(fù)信息。可能生成冗長的報(bào)告(多達(dá) 16,000 字),可能需要大量篩選。
無法訪問付費(fèi)內(nèi)容,限制了其在某些研究類型中的效用。
深入分析和富有洞察力的報(bào)告:提供周到的研究報(bào)告,具有觀點(diǎn),超越了簡單的總結(jié)。提供研究分析師級別的全面分析。
利用針對網(wǎng)絡(luò)瀏覽和數(shù)據(jù)分析優(yōu)化的強(qiáng)大推理模型 (o3):由即將推出的 OpenAI o3 模型的特定優(yōu)化版本驅(qū)動。
引用來源以供驗(yàn)證:包括清晰標(biāo)注的引用或所有發(fā)現(xiàn)的來源鏈接。
節(jié)省大量時間的潛力:在幾十分鐘內(nèi)完成人類需要數(shù)小時才能完成的工作。
多步驟研究和自主網(wǎng)絡(luò)瀏覽:能夠?qū)ヂ?lián)網(wǎng)進(jìn)行復(fù)雜、多階段的研究。它主動瀏覽在線資源,以訪問和綜合實(shí)時網(wǎng)絡(luò)數(shù)據(jù)。
來自眾多在線資源的信息綜合:能夠查找、分析和綜合來自數(shù)百個來源的信息。它整合來自整個網(wǎng)絡(luò)的信息。
生成包含引用的綜合報(bào)告:以結(jié)構(gòu)化報(bào)告格式提供詳細(xì)、可操作的洞察,并清晰引用原始來源。每項(xiàng)輸出都有完整的文檔記錄,方便驗(yàn)證和參考。
與 ChatGPT 界面集成:通過在消息編寫器中選擇“深度研究”在 ChatGPT 平臺中訪問。
支持文件附件以提供上下文:用戶可以附加圖像、文件或電子表格以添加研究問題的上下文。
OpenAI 及其在大型語言模型市場中的地位概述:OpenAI 是一家領(lǐng)先的人工智能研究機(jī)構(gòu),以其在自然語言處理和生成式人工智能方面的尖端進(jìn)展而聞名。OpenAI 的 GPT 模型不斷超越以往的能力。
深度研究功能詳細(xì)考察:
優(yōu)勢:
劣勢:
用戶評論和專家意見:關(guān)于性價(jià)比褒貶不一,有些人認(rèn)為令人印象深刻,但另一些人質(zhì)疑與谷歌同類產(chǎn)品相比的成本效益。一些用戶在使用在線資源質(zhì)量方面遇到問題。
2.2. 谷歌 Gemini 深度研究
分析表明,谷歌的 Gemini 深度研究定位為比 OpenAI 的深度研究更廣泛可及且更易于使用的替代方案。其較低的成本和與谷歌生態(tài)系統(tǒng)的集成使其對更廣泛的受眾具有吸引力。雖然它可能并不總是能提供與 OpenAI 相同水平的深度,但其速度和易用性對于許多用戶來說是顯著的優(yōu)勢。用戶報(bào)告的準(zhǔn)確性問題突顯了人工智能驅(qū)動研究中持續(xù)存在的挑戰(zhàn)。
推理鏈:谷歌為 Gemini 深度研究提供免費(fèi)試用和更實(shí)惠的訂閱費(fèi)用,這表明其目標(biāo)是占領(lǐng)更大的市場份額。對速度和與熟悉的谷歌工具集成的強(qiáng)調(diào)進(jìn)一步支持了這一策略。用戶報(bào)告的準(zhǔn)確性不一致表明該技術(shù)仍在發(fā)展,用戶應(yīng)謹(jǐn)慎使用并驗(yàn)證關(guān)鍵信息。
答案質(zhì)量和深度可能不如 OpenAI:雖然提供了扎實(shí)的概述,但在某些方面可能無法達(dá)到 OpenAI 的深度。
可能會犯錯誤并提供不準(zhǔn)確的信息:在某些領(lǐng)域(如股市數(shù)據(jù))顯示出準(zhǔn)確性問題。可能會產(chǎn)生幻覺并提供不正確的信息。
報(bào)告可能很基礎(chǔ),缺乏某些主題的細(xì)節(jié):關(guān)于更廣泛主題的報(bào)告可能比較基礎(chǔ),缺乏很多細(xì)節(jié)。
與 OpenAI 相比,定價(jià)更具可訪問性(免費(fèi)試用,高級版每月 20 美元):為更廣泛的用戶提供了更實(shí)惠的選擇。
在某些測試中,報(bào)告生成速度比 OpenAI 更快:早期測試表明,Perplexity 的最新人工智能工具比谷歌 Gemini 和 OpenAI 的深度研究更快。然而,其他比較指出,Gemini 的研究和報(bào)告生成速度很快,只需幾分鐘即可完成。
與 Google 生態(tài)系統(tǒng)集成:與 Google Docs 等 Google 服務(wù)無縫集成。
多步驟研究計(jì)劃生成:立即制定包含其計(jì)劃研究的關(guān)鍵領(lǐng)域的初步研究計(jì)劃。用戶可以修改或批準(zhǔn)此計(jì)劃。
分析來自整個網(wǎng)絡(luò)的信息:代表用戶深入分析來自整個網(wǎng)絡(luò)的相關(guān)信息。它瀏覽網(wǎng)絡(luò)、搜索、查找有趣的信息片段,并根據(jù)所學(xué)到的知識開始新的搜索。
生成包含引用的報(bào)告:研究完成后,它會生成一份包含關(guān)鍵發(fā)現(xiàn)的綜合報(bào)告,并附有原始來源的鏈接。最終報(bào)告具有相關(guān)性和時效性,通常包含信譽(yù)良好的來源。
與 Google Docs 集成:生成的報(bào)告可以輕松地在 Google Docs 中打開。
所有用戶均可免費(fèi)試用,高級版用戶可獲得擴(kuò)展訪問權(quán)限:Gemini 用戶可以免費(fèi)試用深度研究,Gemini 高級版用戶可以更頻繁地使用該工具。Gemini 高級版通過 Google One AI 高級版計(jì)劃提供。
通過 Gemini 2.0 Flash Thinking Experimental 增強(qiáng),以改進(jìn)推理和分析:通過 Gemini 2.0 Flash Thinking Experimental 升級,增強(qiáng)了所有研究階段的功能。這創(chuàng)建了更高質(zhì)量、更詳細(xì)和更具洞察力的多頁報(bào)告。
谷歌及其 Gemini 人工智能模型概述:谷歌是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的先驅(qū),Gemini 是其旗艦人工智能模型。Gemini 旨在成為在不同設(shè)備上運(yùn)行的人工智能模型系列。
深度研究功能詳細(xì)考察:
優(yōu)勢:
劣勢:
用戶評論和專家意見:總體評價(jià)積極,用戶贊賞其可訪問性、速度和易用性。一些用戶發(fā)現(xiàn)它令人印象深刻,并且對于快速了解不同主題很有用。
2.3. Grok3(深度搜索功能)
分析表明,Grok3 的深度搜索功能通過其獨(dú)特的 X 實(shí)時信息訪問及其透明的推理過程而脫穎而出。雖然其在技術(shù)推理方面表現(xiàn)出色,但用戶應(yīng)注意潛在的偏見和內(nèi)容審核方面。與社交媒體平臺的獨(dú)特集成既提供了優(yōu)勢,也為深入研究帶來了潛在的缺點(diǎn)。
推理鏈:Grok3 直接訪問 X 數(shù)據(jù)為需要最新信息或分析社交媒體趨勢的研究提供了獨(dú)特的優(yōu)勢。“思考模式”是理解人工智能邏輯的寶貴功能。然而,依賴于以其動態(tài)且有時未經(jīng)篩選的內(nèi)容而聞名的平臺,也引入了偏見的風(fēng)險(xiǎn)以及仔細(xì)評估檢索到的信息的必要性。與專用深度研究工具的比較表明,Grok3 可能更適合于實(shí)時社交數(shù)據(jù)或透明推理過程至關(guān)重要的特定用例。
由于實(shí)時從社交媒體獲取數(shù)據(jù),可能存在偏見:由于其處理的實(shí)時數(shù)據(jù),其響應(yīng)有時會反映出無意的傾向,尤其是在政治敏感的背景下。
內(nèi)容審核問題:其“不受約束”的語音交互模式引發(fā)了關(guān)于指導(dǎo)方針和錯誤信息傳播的討論。
與專用研究工具相比,關(guān)于其“深度搜索”的深度信息有限:雖然它提供了 DeepSearch,但與 OpenAI 和 Google 的專用深度研究工具相比,其功能的范圍尚未完全詳細(xì)說明。
實(shí)時獲取信息,這是一項(xiàng)獨(dú)特的優(yōu)勢:其從互聯(lián)網(wǎng)獲取并總結(jié)實(shí)時數(shù)據(jù)的能力使其脫穎而出。
在推理任務(wù)(包括數(shù)學(xué)和科學(xué))方面表現(xiàn)出色:Grok 3 在數(shù)學(xué)和科學(xué)測試中取得了高分,在某些基準(zhǔn)測試中優(yōu)于競爭對手。
“思考模式”提供了推理過程的透明度:此功能允許用戶了解人工智能如何得出結(jié)論。
實(shí)時從互聯(lián)網(wǎng)獲取數(shù)據(jù),包括最新新聞:Grok 不依賴預(yù)先捕獲的信息,而是主動從互聯(lián)網(wǎng)獲取并總結(jié)實(shí)時數(shù)據(jù)。
“思考模式”進(jìn)行逐步推理:Grok 3 具有“思考模式”,允許用戶查看答案背后的逐步推理過程。
DeepSearch 從大數(shù)據(jù)中快速獲取答案:Grok 3 包含 DeepSearch,可快速進(jìn)行研究并從大數(shù)據(jù)中提供簡短答案。
與 X(前身為 Twitter)集成:Grok 與 X 平臺集成,允許其訪問和處理來自該平臺的實(shí)時信息。
Grok 3 Mini 和 Grok 3 Think 等專用版本:xAI 為不同任務(wù)提供了 Grok 3 模型的專用版本。
xAI 及其 Grok 人工智能模型概述:xAI 由埃隆·馬斯克創(chuàng)立,開發(fā)了 Grok 人工智能聊天機(jī)器人。Grok 旨在成為“最大程度尋求真相的人工智能” 。
Grok3 深度搜索功能考察:
優(yōu)勢:
劣勢:
用戶評論和專家意見:關(guān)于其推理能力和實(shí)時信息訪問的評價(jià)普遍積極。專家稱贊其對細(xì)微問題的理解能力。
制作不易,如果這篇文章覺得對你有用,可否點(diǎn)個關(guān)注。給我個三連擊:點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個,謝謝你看我的文章,我們下篇再見!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.