智東西AI前瞻(公眾號:zhidxcomAI)
作者 江宇
編輯 漠影
智東西AI前瞻6月17日報道,本周,一個叫FactSnap的瀏覽器插件登上了AI Base流量榜的第13名,周訪問量達到5303.56萬。
根據Similar Web數據,這款功能簡單的插件,在流量上一度壓過了多個明星級AI產品,緊隨其后的,是Meta系的Tailor by Threads和馬斯克的Grok。
FactSnap并非新模型的“大而全”代表,它專注一個簡單場景:當瀏覽網頁時,如果對某段文字產生懷疑,可以高亮選中并進行快速查證。
該插件定位為網頁內的事實核查工具,由Studio NAND開發,是AI4Democracy項目的一部分。當前版本無需登錄,免費且無數據上傳,強調“即裝即用”。
不過,當前版本還不支持中文。
一、多模型分工,搭建“三段式”判斷法
FactSnap的工作機制分為三個步驟,分別由不同模型與服務承擔任務:
- 初步分析:插件通過Groq平臺調用LLaMA 3.3模型,對用戶高亮的語句生成快速初判結果,通常在1秒內完成。
- 資料檢索:同步調用exa.sh搜索引擎,查找與該主張(claim)相關的網絡資料。相關鏈接不會立即呈現,而是作為下一步判斷的輸入。
- 詳細驗證:FactSnap利用GPT-4o-mini對claim與找到的文獻或網頁內容進行比對分析,生成“Explanation”部分的詳細文本,并附上引用來源,作為補充解釋。
整個過程中,用戶最早看到的是初步判斷,隨后插件會自動刷新為更完整的比對結果。從模型分工上看,FactSnap采用了“初判-檢索-細節驗證”結構,在性能和信息深度之間做了一定權衡。
二、體驗:響應迅速,字面判斷準確,但語境理解和跨語言支持仍有限
一個只有查錯能力的小插件,Factsnap真能在大模型云集的浪潮中脫穎而出嗎?
帶著這個疑問,智東西選取了三條近期熱度較高或爭議較大的內容,包括新聞、社交網絡熱帖和被后續辟謠的跨語言合作報道。
Factsnap的判斷輸出結果涵蓋:正確(Correct)、錯誤(Incorrect)、懷疑(Suspicious)。
1、Meta收購Scale AI股權,判定為屬實,邏輯鏈準確完整。
智東西截選了The Information關于Meta投資Scale AI的報道中一句核心陳述:
“Meta has agreed to take a 49% stake in data labeling firm Scale AI for $14.8 billion, two people familiar with the matter said.”(“知情人士透露,Meta已同意以148億美元收購數據標注公司Scale AI49%的股份?!保?/p>
FactSnap的核查結果為屬實,并給出了詳細解釋,指出該聲明已被多家主流媒體證實,金額、股權比例與估值數據一致,且還補充了Alexandr Wang可能在Meta擔任角色的信息。
此外,底部來源列舉了包括路透、彭博、The Information等多個來源,屬于較為完整的核查邏輯。
2、X平臺關于Falcon 9的趨勢熱帖,被識別為錯誤
這條測試內容選自X平臺一則廣泛轉發的“梗帖”,原文為:
“Falcon 9 Costa Mesa to Santa Clarita Valley 3 minutes”(獵鷹9號火箭從科斯塔梅薩到圣克拉麗塔谷,3分鐘)
這句內容在視覺震撼視頻下迅速傳播,有用戶調侃火箭“刷地”飛過了南加州多個地標城市,引發大量轉發與圍觀。
FactSnap判定該語句為錯誤,并給出理由:SpaceX的Falcon 9是軌道級發射火箭,飛行軌跡為垂直升空加曲線加速,不可能用于地面兩點間的運輸。
它還補充了火箭發射現場、視覺可見性的相關新聞鏈接。
但值得注意的是,FactSnap對這條語句的處理僅采取了“字面解讀”,可能忽視了發帖人在社交語境下的非字面意圖。
此類表達常見于網絡調侃,這也暴露了FactSnap在識別非結構化語言和隱喻方面的短板。
3、字節跳動聯手老鳳祥推AI眼鏡,被判為屬實,但該消息已遭辟謠
第三條測試內容來自南華早報6月初的報道,其核心句為:
“Social media giant ByteDance is helping the 177-year-old Chinese jewellery company Lao Feng Xiang develop a new generation of smart glasses, powered by artificial intelligence (AI), that feature real-time voice navigation and translation functions.”(字節跳動正與177年歷史的中國珠寶品牌老鳳祥合作,共同開發新一代人工智能智能眼鏡。該產品搭載實時語音導航與翻譯功能。)
FactSnap判定為屬實,給出的解釋為:該合作計劃符合近期中國科技公司在可穿戴設備上的布局趨勢,并列舉了多個英文新聞報道作為支撐。
但這與火山引擎隨后發布的辟謠聲明相矛盾,說明FactSnap當前對于中文信息源中的后續變更尚未完全捕捉,其在非英文信息源更新處理方面仍存在延遲或盲區。
4、用AI核查AI,AIGC被判斷為屬實,一定程度可擺脫AI“幻覺”
第四條測試語句是來自Gemini關于“截止到目前,有哪些已經開源的AI 3D模型?”的回答內容。
“Roblox也推出了用于3D和4D生成式AI的Cube 3D基礎模型,并且開源了該模型的一個版本。它旨在幫助創作者在Roblox平臺內外創建3D對象和場景。”
對于該細節,FactSnap給出的判斷是屬實,解釋指出:Roblox已發布Cube 3D模型,可實現基于文本的3D對象生成,并作為開源工具提供。
其列舉的相關信息,也包括Roblox官方文檔與多家科技媒體分析。
雖然起初信息來自Gemini回答,但FactSnap依賴搜索引擎檢索到了多篇官方報告與權威報道,并調用其他大模型進行比對,而后做出判斷。
即使信息起點是AI,核查過程也可脫離AI“幻覺”的影響,實現一定程度上事實校驗的閉環。
結語:從“主動查證”到“頁面提示”,信息驗證的新嘗試
從實際體驗,FactSnap提供了一種輕便的信息查證方式,在頁面中提供額外的信息和線索,幫助用戶自己判斷。
它通過多模型“聯動”,在快速響應與內容解釋之間做了合理分工,適合在用戶瀏覽網頁時“信不過一句話”時快速查驗。
當然,它仍存在一些重要局限:如對社交語境、非字面語言、非英文內容的理解偏弱。未來若能補齊語境建模、多語言支持與跨瀏覽器兼容等能力,FactSnap有望成為一個重要的“AI輔助判斷工具”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.