網易首頁 > 網易號 > 正文申請入駐

Anthropic投資AI模型解碼初創公司Goodfire，助力AI可解釋性發展

2025-04-18 02:10:03　來源: 荷馬國際

浙江舉報

分享至

近日，人工智能領域又有新動態。theinformation最新報道：據知情人士透露，Anthropic 對成立僅一年的初創公司 Goodfire 進行了 100 萬美元的投資，這是 Anthropic 首次對其他初創公司進行投資。此次投資也展現了大型 AI 企業與新興初創公司加強合作的趨勢。

Goodfire 致力于將 “機械可解釋性” 領域的研究商業化。當前，AI 模型內部運作機制猶如 “黑匣子”，數十億參數構成的模型讓開發者難以理解其工作原理。Goodfire 通過訓練單獨的解釋器模型，從原始模型的 “神經元” 中找出代表各種概念（從醫療狀況到質數）的信息，幫助 AI 開發者理解模型內部工作機制。例如，日本電商巨頭樂天就借助 Goodfire 的解釋器模型，檢測基于 Llama 的聊天機器人中與個人身份信息和幻覺相關的內容，防止敏感信息泄露和誤導用戶。用戶還能通過強調某些概念引導模型行為，如強化醫療相關概念輔助診斷。

此次投資并非偶然。去年，Anthropic 與門羅風投（Menlo Ventures）合作推出 Anthology 項目，門羅風投從 1 億美元基金中投資年輕 AI 初創公司，這些公司可獲得 Anthropic 的模型使用權、員工支持以及 2.5 萬美元的計算信用額度，Goodfire 此前就通過該項目獲得投資。而在最新一輪融資中，Goodfire 共籌集 5000 萬美元，公司估值達 2.5 億美元，門羅風投領投，Anthropic 的其他投資方光速創投（Lightspeed Venture Partners）和 B Capital 也參與其中。

Anthropic 首席執行官兼聯合創始人達里奧?阿莫代伊（Dario Amodei）表示，投資 Goodfire 反映出公司認為機械可解釋性有助于將黑箱神經網絡轉變為可理解、可操控的系統。Goodfire 的技術不僅適用于語言模型，在圖像和生物領域也有應用。公司近期與由 Stripe 首席執行官帕特里克?科利森（Patrick Collison）支持的生物醫學 Arc 研究所合作，解讀其基因組模型 Evo 2。

不過，AI 模型可解釋性研究并非一帆風順。谷歌 DeepMind 的機械可解釋性團隊就因一系列令人失望的研究結果，降低了對 Anthropic 和 Goodfire 所采用技術的優先級。但光速創投合伙人恩南迪?伊雷格布勒姆（Nnamdi Iregbulem）認為，Goodfire 的技術有助于緩解 AI 潛在風險，即使強大的 AI 比人類聰明，若能洞悉其 “大腦”，就能在一定程度上保持對它的控制。

Goodfire 通過軟件平臺 Ember 盈利，客戶需支付年度訂閱費，用于獲取軟件使用許可、公司 17 名員工的技術支持以及訓練解釋器模型的費用。雖然 Goodfire 目前已有收入，但首席執行官埃里克?何（Eric Ho）并未透露具體金額。

除埃里克?何外，Goodfire 的聯合創始人還包括曾助力創建谷歌 DeepMind 機械可解釋性團隊的湯姆?麥格拉思（Tom McGrath），他擔任公司首席科學家。此外，公司還招攬了在 OpenAI 從事可解釋性工作的尼克?坎馬拉塔（Nick Cammarata）、曾在谷歌領導編碼代理團隊的歐文?劉易斯（Owen Lewis），以及 Apollo Research 的機械可解釋性團隊，該團隊將負責 Goodfire 新設立的倫敦辦事處。埃里克?何表示，此次投資將加深 Goodfire 與 Anthropic 的研究合作，未來雙方可能會共同舉辦活動。

在 AI 行業不斷發展的當下，Anthropic 對 Goodfire 的投資為 AI 可解釋性發展注入新動力，未來這一領域將如何發展，值得持續關注。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.