網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

殺瘋了，谷歌的Deep Research也來了，免費(fèi)！

2025-03-15 13:55:08　來源: 機(jī)器學(xué)習(xí)與Python社區(qū)

北京舉報(bào)

分享至

? 太長不看：它寫的比我好

大家好，我是 Ai 學(xué)習(xí)的老章

最近谷歌殺瘋了，三個新動態(tài)，個個能打!

1、Gemma 3能用 27B 參數(shù)量達(dá)到開源模型第二水平
2、Gemini 2.0系列，把多模態(tài)拉到全新境界，尤其是 flash 的 Experimantal 版，動動嘴就能修圖
3、Deep Research輕松撰寫超詳細(xì)研究報(bào)告這個增強(qiáng)的深度研究 (Enhanced Deep Research) 面向所有用戶免費(fèi)試用，并支持超過 45 種語言。
其核心驅(qū)動力是全新的 Gemini 2.0 Flash Thinking Experimental 模型。它可以快速和高效在網(wǎng)絡(luò)上進(jìn)行信息檢索和整合分析，對需要進(jìn)行大量信息收集和整理的用戶而言，將大幅提升其工作效率。

我測試了幾個問題，大受震撼。

地址：https://gemini.google.com/

提出需求后，Deep Research會先給出分析方案，如果不滿意，這個方案還支持手動修改。

其自動化思考，抓取網(wǎng)頁，逐步分析，逐步執(zhí)行，最后匯總成一篇分析報(bào)告，有點(diǎn) Manus 的感覺了。

報(bào)告還支持導(dǎo)出到谷歌文檔

稍作修改都能直接用了,一共 20 多頁，1.4 萬字，138 個參考鏈接。

為了本文，我又讓它撰寫了市面上 Deep Research 相關(guān)產(chǎn)品的對比，也是相當(dāng)完善，絕對可以拿去當(dāng)研究報(bào)告使用了。

這里展示一段，說實(shí)話 2.2 節(jié)寫的比我好：

2.1. OpenAI 深度研究
- 分析表明，OpenAI 的深度研究代表了高端解決方案，適用于需要廣泛研究能力和深入分析的用戶。其對強(qiáng)大推理模型的依賴以及處理復(fù)雜、多步驟任務(wù)的能力是顯著的優(yōu)勢。然而，高昂的訂閱費(fèi)用和不準(zhǔn)確的風(fēng)險(xiǎn)可能使其不太適合預(yù)算有限或需要絕對事實(shí)正確且無需徹底人工驗(yàn)證的用戶。與谷歌產(chǎn)品的比較表明，市場可能基于價(jià)格和可訪問性進(jìn)行細(xì)分。
- 推理鏈：OpenAI 深度研究的高價(jià)格點(diǎn)表明其專注于擁有大量研究預(yù)算的專業(yè)用戶或組織。對深入分析和使用強(qiáng)大推理模型的強(qiáng)調(diào)表明成本與能力之間存在權(quán)衡。用戶報(bào)告的來源質(zhì)量問題以及無法訪問付費(fèi)內(nèi)容突出了某些領(lǐng)域（尤其是學(xué)術(shù)研究）用戶需要考慮的限制。谷歌推出類似但更實(shí)惠的產(chǎn)品表明，OpenAI 可能面臨調(diào)整價(jià)格或展示明顯更優(yōu)越性能的壓力。
- 成本高昂（專業(yè)版用戶每月 200 美元，且查詢次數(shù)有限）。這使得它比其他替代方案貴得多。
- 可能出現(xiàn)幻覺來源和信息：并非不會生成不正確或誤導(dǎo)性信息，需要進(jìn)行事實(shí)核查。
- 如果提示不夠強(qiáng)大，報(bào)告可能很長且包含重復(fù)信息。可能生成冗長的報(bào)告（多達(dá) 16,000 字），可能需要大量篩選。
- 無法訪問付費(fèi)內(nèi)容，限制了其在某些研究類型中的效用。
- 深入分析和富有洞察力的報(bào)告：提供周到的研究報(bào)告，具有觀點(diǎn)，超越了簡單的總結(jié)。提供研究分析師級別的全面分析。
- 利用針對網(wǎng)絡(luò)瀏覽和數(shù)據(jù)分析優(yōu)化的強(qiáng)大推理模型 (o3)：由即將推出的 OpenAI o3 模型的特定優(yōu)化版本驅(qū)動。
- 引用來源以供驗(yàn)證：包括清晰標(biāo)注的引用或所有發(fā)現(xiàn)的來源鏈接。
- 節(jié)省大量時間的潛力：在幾十分鐘內(nèi)完成人類需要數(shù)小時才能完成的工作。
- 多步驟研究和自主網(wǎng)絡(luò)瀏覽：能夠?qū)ヂ?lián)網(wǎng)進(jìn)行復(fù)雜、多階段的研究。它主動瀏覽在線資源，以訪問和綜合實(shí)時網(wǎng)絡(luò)數(shù)據(jù)。
- 來自眾多在線資源的信息綜合：能夠查找、分析和綜合來自數(shù)百個來源的信息。它整合來自整個網(wǎng)絡(luò)的信息。
- 生成包含引用的綜合報(bào)告：以結(jié)構(gòu)化報(bào)告格式提供詳細(xì)、可操作的洞察，并清晰引用原始來源。每項(xiàng)輸出都有完整的文檔記錄，方便驗(yàn)證和參考。
- 與 ChatGPT 界面集成：通過在消息編寫器中選擇“深度研究”在 ChatGPT 平臺中訪問。
- 支持文件附件以提供上下文：用戶可以附加圖像、文件或電子表格以添加研究問題的上下文。
- OpenAI 及其在大型語言模型市場中的地位概述：OpenAI 是一家領(lǐng)先的人工智能研究機(jī)構(gòu)，以其在自然語言處理和生成式人工智能方面的尖端進(jìn)展而聞名。OpenAI 的 GPT 模型不斷超越以往的能力。
- 深度研究功能詳細(xì)考察：
- 優(yōu)勢：
- 劣勢：
- 用戶評論和專家意見：關(guān)于性價(jià)比褒貶不一，有些人認(rèn)為令人印象深刻，但另一些人質(zhì)疑與谷歌同類產(chǎn)品相比的成本效益。一些用戶在使用在線資源質(zhì)量方面遇到問題。
2.2. 谷歌 Gemini 深度研究
- 分析表明，谷歌的 Gemini 深度研究定位為比 OpenAI 的深度研究更廣泛可及且更易于使用的替代方案。其較低的成本和與谷歌生態(tài)系統(tǒng)的集成使其對更廣泛的受眾具有吸引力。雖然它可能并不總是能提供與 OpenAI 相同水平的深度，但其速度和易用性對于許多用戶來說是顯著的優(yōu)勢。用戶報(bào)告的準(zhǔn)確性問題突顯了人工智能驅(qū)動研究中持續(xù)存在的挑戰(zhàn)。
- 推理鏈：谷歌為 Gemini 深度研究提供免費(fèi)試用和更實(shí)惠的訂閱費(fèi)用，這表明其目標(biāo)是占領(lǐng)更大的市場份額。對速度和與熟悉的谷歌工具集成的強(qiáng)調(diào)進(jìn)一步支持了這一策略。用戶報(bào)告的準(zhǔn)確性不一致表明該技術(shù)仍在發(fā)展，用戶應(yīng)謹(jǐn)慎使用并驗(yàn)證關(guān)鍵信息。
- 答案質(zhì)量和深度可能不如 OpenAI：雖然提供了扎實(shí)的概述，但在某些方面可能無法達(dá)到 OpenAI 的深度。
- 可能會犯錯誤并提供不準(zhǔn)確的信息：在某些領(lǐng)域（如股市數(shù)據(jù)）顯示出準(zhǔn)確性問題。可能會產(chǎn)生幻覺并提供不正確的信息。
- 報(bào)告可能很基礎(chǔ)，缺乏某些主題的細(xì)節(jié)：關(guān)于更廣泛主題的報(bào)告可能比較基礎(chǔ)，缺乏很多細(xì)節(jié)。
- 與 OpenAI 相比，定價(jià)更具可訪問性（免費(fèi)試用，高級版每月 20 美元）：為更廣泛的用戶提供了更實(shí)惠的選擇。
- 在某些測試中，報(bào)告生成速度比 OpenAI 更快：早期測試表明，Perplexity 的最新人工智能工具比谷歌 Gemini 和 OpenAI 的深度研究更快。然而，其他比較指出，Gemini 的研究和報(bào)告生成速度很快，只需幾分鐘即可完成。
- 與 Google 生態(tài)系統(tǒng)集成：與 Google Docs 等 Google 服務(wù)無縫集成。
- 多步驟研究計(jì)劃生成：立即制定包含其計(jì)劃研究的關(guān)鍵領(lǐng)域的初步研究計(jì)劃。用戶可以修改或批準(zhǔn)此計(jì)劃。
- 分析來自整個網(wǎng)絡(luò)的信息：代表用戶深入分析來自整個網(wǎng)絡(luò)的相關(guān)信息。它瀏覽網(wǎng)絡(luò)、搜索、查找有趣的信息片段，并根據(jù)所學(xué)到的知識開始新的搜索。
- 生成包含引用的報(bào)告：研究完成后，它會生成一份包含關(guān)鍵發(fā)現(xiàn)的綜合報(bào)告，并附有原始來源的鏈接。最終報(bào)告具有相關(guān)性和時效性，通常包含信譽(yù)良好的來源。
- 與 Google Docs 集成：生成的報(bào)告可以輕松地在 Google Docs 中打開。
- 所有用戶均可免費(fèi)試用，高級版用戶可獲得擴(kuò)展訪問權(quán)限：Gemini 用戶可以免費(fèi)試用深度研究，Gemini 高級版用戶可以更頻繁地使用該工具。Gemini 高級版通過 Google One AI 高級版計(jì)劃提供。
- 通過 Gemini 2.0 Flash Thinking Experimental 增強(qiáng)，以改進(jìn)推理和分析：通過 Gemini 2.0 Flash Thinking Experimental 升級，增強(qiáng)了所有研究階段的功能。這創(chuàng)建了更高質(zhì)量、更詳細(xì)和更具洞察力的多頁報(bào)告。
- 谷歌及其 Gemini 人工智能模型概述：谷歌是人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的先驅(qū)，Gemini 是其旗艦人工智能模型。Gemini 旨在成為在不同設(shè)備上運(yùn)行的人工智能模型系列。
- 深度研究功能詳細(xì)考察：
- 優(yōu)勢：
- 劣勢：
- 用戶評論和專家意見：總體評價(jià)積極，用戶贊賞其可訪問性、速度和易用性。一些用戶發(fā)現(xiàn)它令人印象深刻，并且對于快速了解不同主題很有用。
2.3. Grok3（深度搜索功能）
- 分析表明，Grok3 的深度搜索功能通過其獨(dú)特的 X 實(shí)時信息訪問及其透明的推理過程而脫穎而出。雖然其在技術(shù)推理方面表現(xiàn)出色，但用戶應(yīng)注意潛在的偏見和內(nèi)容審核方面。與社交媒體平臺的獨(dú)特集成既提供了優(yōu)勢，也為深入研究帶來了潛在的缺點(diǎn)。
- 推理鏈：Grok3 直接訪問 X 數(shù)據(jù)為需要最新信息或分析社交媒體趨勢的研究提供了獨(dú)特的優(yōu)勢。“思考模式”是理解人工智能邏輯的寶貴功能。然而，依賴于以其動態(tài)且有時未經(jīng)篩選的內(nèi)容而聞名的平臺，也引入了偏見的風(fēng)險(xiǎn)以及仔細(xì)評估檢索到的信息的必要性。與專用深度研究工具的比較表明，Grok3 可能更適合于實(shí)時社交數(shù)據(jù)或透明推理過程至關(guān)重要的特定用例。
- 由于實(shí)時從社交媒體獲取數(shù)據(jù)，可能存在偏見：由于其處理的實(shí)時數(shù)據(jù)，其響應(yīng)有時會反映出無意的傾向，尤其是在政治敏感的背景下。
- 內(nèi)容審核問題：其“不受約束”的語音交互模式引發(fā)了關(guān)于指導(dǎo)方針和錯誤信息傳播的討論。
- 與專用研究工具相比，關(guān)于其“深度搜索”的深度信息有限：雖然它提供了 DeepSearch，但與 OpenAI 和 Google 的專用深度研究工具相比，其功能的范圍尚未完全詳細(xì)說明。
- 實(shí)時獲取信息，這是一項(xiàng)獨(dú)特的優(yōu)勢：其從互聯(lián)網(wǎng)獲取并總結(jié)實(shí)時數(shù)據(jù)的能力使其脫穎而出。
- 在推理任務(wù)（包括數(shù)學(xué)和科學(xué)）方面表現(xiàn)出色：Grok 3 在數(shù)學(xué)和科學(xué)測試中取得了高分，在某些基準(zhǔn)測試中優(yōu)于競爭對手。
- “思考模式”提供了推理過程的透明度：此功能允許用戶了解人工智能如何得出結(jié)論。
- 實(shí)時從互聯(lián)網(wǎng)獲取數(shù)據(jù)，包括最新新聞：Grok 不依賴預(yù)先捕獲的信息，而是主動從互聯(lián)網(wǎng)獲取并總結(jié)實(shí)時數(shù)據(jù)。
- “思考模式”進(jìn)行逐步推理：Grok 3 具有“思考模式”，允許用戶查看答案背后的逐步推理過程。
- DeepSearch 從大數(shù)據(jù)中快速獲取答案：Grok 3 包含 DeepSearch，可快速進(jìn)行研究并從大數(shù)據(jù)中提供簡短答案。
- 與 X（前身為 Twitter）集成：Grok 與 X 平臺集成，允許其訪問和處理來自該平臺的實(shí)時信息。
- Grok 3 Mini 和 Grok 3 Think 等專用版本：xAI 為不同任務(wù)提供了 Grok 3 模型的專用版本。
- xAI 及其 Grok 人工智能模型概述：xAI 由埃隆·馬斯克創(chuàng)立，開發(fā)了 Grok 人工智能聊天機(jī)器人。Grok 旨在成為“最大程度尋求真相的人工智能” 。
- Grok3 深度搜索功能考察：
- 優(yōu)勢：
- 劣勢：
- 用戶評論和專家意見：關(guān)于其推理能力和實(shí)時信息訪問的評價(jià)普遍積極。專家稱贊其對細(xì)微問題的理解能力。

制作不易，如果這篇文章覺得對你有用，可否點(diǎn)個關(guān)注。給我個三連擊：點(diǎn)贊、轉(zhuǎn)發(fā)和在看。若可以再給我加個，謝謝你看我的文章，我們下篇再見！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.