新智元報道
編輯:編輯部
【新智元導讀】剛剛,國內首個免費可用Deep Research上線了!它在多個權威評測中拿下第一,準確率直接碾壓開源WebSailor。研究過程中,它能多線迭代追搜,直至邏輯閉環。更絕的是,一鍵生成炫酷的互動研究報告,視覺效果直接拉滿。
就在剛剛,國內第一家免費公開可用的「深度研究」產品來了!
這個產品,可以直接對標海外的Deep Research能力,性能十分強大。
在BrowseComp等評測集上,它們超越了上周剛開源且達到最好結果的WebSailor模型,準確率有明顯提升。
左右滑動查看
此時此刻,不得不感嘆,AI領域的變化節奏真的是一天一個樣。
如今,在秘塔AI搜索首頁登錄后,即可直接體驗「深度研究」了。
傳送門:https://metaso.cn/
一手實測,多線迭代搜
接下來,就讓我們來實測一番。
對于一個「深度研究」產品,最重要的是什么?答案自然是具體研究的深度和廣度了,這也正是讓它區別于普通AI聊天機器人和大部分搜索產品的地方。
實測第一彈,我們找來了上面提到的那個評測集中的一個問題——
有一著名詩詞人,他參加科舉考試時被主考官和小試官賞識且小試官的姓是花的名字。他的出生地a的南部毗鄰城市b在當前誕生了一位頂流男明星。該男星在2022年因為一部電視劇大火,并且他生于年末。求問該男星大學畢業院校成立于哪一年
看到這個刁鉆的問題,我大概能理解為什么GPT-4o只能得6分了。不僅涉及眾多事實性細節,還要將文學史上的常識與娛樂圈的信息通過地理信息來進行關聯,普通的搜索產品恐怕無法回答如此無厘頭的問題。
BrowseComp評測集的問題難點就在這里,不僅需要模型有尋找復雜信息的能力,還需要有整合推理、交叉驗證準確性的能力,從一個已知的事實出發,找到隱藏在多層細節之后的答案。
秘塔AI的表現,很符合他們準確率第一的成績。
在研究路徑圖中,它首先挖掘出,這位詩詞人就是蘇軾,當時科舉考試的小試官就是梅堯臣。
蘇軾的出生地為四川眉州(今眉山市),經過嚴格的篩選搜索結果,眉山直接毗鄰的樂山市出生的王鶴棣,是唯一匹配者。
最終秘塔AI分析出,該男星的大學畢業院校成立于2004年。
第二個問題是:宇宙中到底有沒有比碳更適合構建生命的元素?
在我們一般人的理解中,碳一定是那個被宇宙生命進化樹選中的天選元素,不過,在秘塔AI的研究路徑圖中,很快就展現出了出人意料的答案,而且居然是在外星生命的證據中發現的。
要知道,在一般硅谷大廠的DeepResearch產品中,展示過程大多還囿于線性的界面。
但是秘塔AI的界面,通過左上角的占用token數、信源數,下面滾動進行的任務,和極其具象化的證據鏈展示網,把這個問題的探索脈絡清清楚楚地展現了出來!
這個AI是如何搜索信源、如何整合信息、如何思考問題的,一步步條分縷析,無比清晰,簡直就像一個透明大腦,把它的內部運作流程直接展示給你看,太炸裂了。
比如它找到了多份學術資料,發現在極端行星環境(比如高壓高溫、液態甲烷海洋中)中,硅基或硫基的生化路徑相比碳基具備更大的優勢。
另外,在天體化學領域,人們還發現可以在星際復雜分子中用硼-氮鍵來替代碳-碳鍵,來構建生命基礎。
接著,它生成了一份研究報告,分析了硅、硫和硼作為碳的潛在替代元素的可行性。
最終的結論是,目前在宇宙中,碳仍然是最適合構建生命的元素。
這個問題的完整研究報告如下。
第三個問題,我們把視角從宇宙切回地球。
就在這兩周,剛剛爆出OpenAI欲收購Windsurf,卻被谷歌反手截胡的大瓜,硅谷巨頭們在Vibe Coding上,將會怎樣布局?
秘塔AI分析出了這次交易的核心細節,以及當前硅谷巨頭(包括谷歌、微軟、蘋果、亞馬遜等)的Vibe Coding布局。
而在AI編程對未來兩年市場的影響上,它總結出2025年AI投資將達2000億美元,代碼生成/測試工具將占生成式AI投資的35%;IPO的市場分化還會加劇。
而關于AI編程對于未來市場的影響,它分析出程序員的兩極分化會更嚴重,同時也會誕生全新的崗位——氛圍編程師。
在學術層面,秘塔AI會有怎樣的洞見呢?
最近,CMU大牛、Mamba架構作者Albert Gu陸續發出兩大動態,先是發布了一篇總結性博客,提出「Tokens都是胡扯」的觀點,然后又發布了一篇預示著Tokenizers正在退場的新論文。
論文地址:https://arxiv.org/pdf/2507.07955v1
讓我們來試試,秘塔AI的深度研究功能,是否能為我們梳理出一份足夠權威、準確的學術研究綜述?
在最終給出的總結報告中,它指出Tokenization的本質問題,就在于人為制造的「信息枷鎖」,由此造成了語義斷裂、信息損失、效率瓶頸和計算冗余等。
而相比空間狀態模型SSM,Transformer存在著眾多根本性的短板,為此,Albert Gu在論文中提出了H-Net分層架構,以克服Tokenization與Transformer的雙重缺陷。
而在未來,他預言了Tokenizer必然消亡,下一代模型將整合SSM的線性計算優勢(長序列低耗)和H-Net的層次化語義抽象能力,而這一方向已在Mamba-2上實現。
可以看出,秘塔AI的深度研究能力,可以在短時間內幫我們快速掌握大量關鍵信息,對于學術研究極有裨益。
交互式報告,一鍵生成
秘塔AI「深度研究」另一大特色功能,便是一鍵生成互動研究報告了。
若說結構清晰、內容詳細的專業報告,可以省去繁瑣的整理工作,互動研究報告則可以讓成果更具吸引力。
如何理解?
接下來,我們讓秘塔AI幫忙總結下,馬斯克xAI公司成立時間和Grok家族模型發布節點。
若是自主去查找信息,需要一個一個去查詢,Grok系模型迭代了4次,不僅耗時又耗力。
秘塔AI「深度研究」,就像一個AI助理一樣,直接幫你把所有信息匯總完畢。
這時,讓秘塔AI再次生成「互動研究報告」,沒幾分鐘,一個精美的圖文版報告就誕生了。
在網頁版最右邊,是報告的清晰目錄,任意點擊即可跳轉到相應的位置。
而且,在報告標題部分,秘塔AI還基于整體內容做了提煉總結,并呈現了了關鍵詞,甚至,還配上了一個非常有科技范兒的圖片。
往下劃拉,在xAI公司成立這部分,它主要總結了成立時間和背景,并提供了關鍵事實分析和配圖。
Grok所有模型的迭代路線圖,它都以時間線串了起來。
另外,Grok 4兩個版本的區分,秘塔AI還做成了一個可視化的對比表格,非常驚艷。
接下來,再來測個熱點相關的話題。
面對甘肅天水幼兒園血鉛事件,家長應該從中汲取怎樣教訓?
把問題扔給秘塔AI后,它同樣先將其拆解細化為多個問題,比如天水幼兒園鉛事件具體原因和污染源、鉛中毒對兒童健康主要影響和癥狀等等。
針對不同的細分問題,秘塔AI在其右上角,單獨展現了相關的結論、信息來源,部分問題還提供了視頻補充說明,方便查閱細節。
看得出,每個小問題,堪稱一個「深度研究」。
整個研究路徑圖中,后一個問題是前一個問題迭代和分支,如同剝洋蔥一樣,深挖到最核心的問題。
這次,我們依舊讓它生成互動研究報告,如下一個圖文版的報告現身了。
從事件背景、鉛中毒對兒童終身健康影響、家長主動防護措施,到事后法律維權途徑、制度改善,最終報告覆蓋了方方面面。
這一過程,僅消耗了3分鐘,要比人力調查效率高出好幾倍。
同樣,在報告開篇,非常直觀地呈現了內容主旨、關鍵詞。
可圈可點的是,針對鉛中毒對兒童的終身健康影響這部分,秘塔AI分列了對神經系統損傷的短期和長期風險,配上了一張可視化圖片、表格。
為了便于理解,在食品添加劑識別、監管變革部分,它還附上了相關的視頻,非常驚艷。
不難看出,每一份報告都是獨一無二的設計,根據相應內容的組合,融合了豐富的元素。
互動研究報告的風格和布局,能夠滿足不同場景的個性化需求,讓知識分享更具視覺沖擊力和交互體驗。
秘塔AI,開啟智能研究新時代
秘塔AI「深度研究」的上線,標志著AI智能研究邁入全新的紀元。
其意義遠超一款工具的發布,而是在知識生產與傳播方式上的深刻變革。
作為國內首款免費公開、對標國際頂尖Deep Research能力的工具,它打破了技術壁壘,讓所有人都能用上,極大地降低了知識獲取的門檻。
無論是學生、研究者,還是職場人士,進入秘塔AI即可輕松解鎖前沿的深度研究體驗。
在信息爆炸與知識碎片化的今天,獲取精準、系統化的洞察越來越復雜。
傳統的研究方式往往耗時耗力,且難以應對困難問題的多維度需求。
而秘塔AI「深度研究」以其強大的技術內容,為我們提供了一站式的解決方案,重新定義了知識探索的效率與深度。
它通過同步生成問題路徑圖、清晰的邏輯追溯,以及可靠的信息源,能讓每一步推導可以查證。
尤其是,針對商業決策、學術研究等嚴謹性要求高的領域來說,這種透明性大大提升了研究的效率。
此外,秘塔AI「深度研究」支持的多樣化輸出形式,從結構化專業報告到動態的互動網頁,提供了更多的靈活性。
從「研究」到「呈現」的全鏈條支持,可以極大地釋放人們的創造力,同時讓知識的傳播與應用更加高效。
這樣的免費羊毛,還不快點來薅?!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.