99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

拉 DeepSeek 和通義“組隊”斗 OpenAI?小扎首屆 AI 大會變“大型商戰現場”,和微軟 CEO 瘋狂互曝!

0
分享至


整理 | 華衛、核子可樂

4 月 30 日凌晨,Meta 舉行了其有史以來的首屆 AI 開發者大會 LlamaCon。現場,該公司宣布推出一款面向消費者的獨立 Meta AI 聊天機器人應用程序,這款應用將與 ChatGPT 展開競爭,同時還發布了一個面向開發者的 API,用于在云端訪問 Llama 模型。

這兩項產品發布都旨在擴大 Meta 開源 Llama AI 模型的應用范圍,但這一目標或許只是次要的,Meta 的真正動機是:擊敗 OpenAI。從大致方向來看,Meta 的 AI 野心正推動形成一個蓬勃發展的開源 AI 生態系統,而這將對像 OpenAI 這樣將其模型封閉在服務背后的“封閉式” AI 供應商構成挑戰。

首先,Meta AI 應用幾乎像是對 OpenAI 傳聞中要推出的社交網絡的先發制人之舉。作為一款智能助手,Meta AI 基于 Llama 模型構建,集成了圖像生成和編輯功能,可以了解用戶的偏好、記住上下文,能根據用戶在應用程序上的活動提供個性化回復。到目前為止,這些個性化回復功能將在美國和加拿大地區提供。用戶還可以向 Meta 提供更多關于自己的信息,以便在未來與 AI 對話時能被記住。


Meta 表示,該應用能夠從現有的 AI 助手中脫穎而出,因為它可以 “利用你已經選擇在 Meta 產品上分享的信息”,比如個人資料以及所關注的內容。并且,該應用支持語音和文本交互,還額外支持全雙工語音交互(允許在接收語音的同時并行處理和響應,支持邊聽邊說、實時打斷等功能)。現在,Meta AI 還是 AI 眼鏡產品的配套應用程序, Meta View 用戶可以繼續通過該應用程序管理其 AI 眼鏡。

此外,Meta AI 應用引入了一個“探索動態”(Discover feed)板塊,這是一個分享和探索其他人如何使用 AI 的地方。只有在用戶選擇分享的情況下,他們與 Meta 人工智能的互動內容才會出現在這個動態板塊中。這個動態板塊可能會放大某些生成式人工智能的流行趨勢,比如最近人們嘗試讓自己看起來像芭比娃娃或吉卜力工作室動畫角色的潮流。不過話說回來,并非每個應用程序都需要有社交動態板塊。


至于 Llama API,這似乎是另一項對 OpenAI API 業務的挑戰。據介紹,Llama API 的設計初衷是讓開發者能夠更輕松地構建與云端 Llama 模型相連接的應用程序,只需使用一行代碼即可實現。它消除了依賴第三方云服務提供商來運行 Llama 模型的需求,并為 AI 開發人員提供更全面的一系列工具。

從今天開始,Meta 將提供 Llama API 的限量免費試用版,預計在未來幾周或幾個月內向更多用戶推出該工具。該公司表示:“你在 Llama API 上構建的模型歸你所有,可以將它們部署到任何你想托管的地方,我們不會把它們鎖定在我們的服務器上。” Meta 還指出,Llama API 不會使用用戶提示和模型響應來訓練自己的模型。


不管出于何種原因,Meta 似乎樂于啟動那些能夠強化開源模型生態系統并限制 OpenAI 發展的 AI 發布計劃,有時甚至以自身無法推出尖端模型為代價。除此之外,Meta 可能還試圖推廣其開源模型,以滿足監管方面的額外規定。據了解,《歐盟人工智能法案》給予了那些分發“免費且開源”AI 系統的公司特殊待遇。

在 LlamaCon 召開之前,幾位 AI 研究人員曾希望 Meta 能發布一款像 OpenAI 的 o3-mini 那樣具有競爭力的推理模型。但該公司最終并未這樣做。對 Meta 來說,似乎并不一定是要贏得人工智能競賽。而長期以來,削弱像 OpenAI 這樣的專有 AI 模型供應商一直是 Meta AI 戰略的核心。

在今年 1 月一樁針對 Meta 的人工智能版權案中,解封的內部信息顯示,負責 Meta 人工智能業務的高管和研究人員在開發 Llama 3 模型期間,一心想著要超越 OpenAI 的 GPT-4 模型。2024 年 7 月的一封信中,Meta 創始人兼 CEO 馬克·扎克伯格 (Mark Zuckerberg)試圖將 Meta 與 OpenAI 這樣的公司區分開來,他寫道:“出售對 AI 模型的訪問權限并非(Meta 的)商業模式。”

扎克伯格在與 Databricks 首席執行官阿里·戈德西(Ali Ghodsi)的臺上對話中表示,他將任何公開提供其模型的人工智能實驗室都視為對抗封閉式模型供應商的盟友,包括 DeepSeek 和阿里巴巴的 Qwen。

“開源的部分價值在于可以進行組合搭配。因此,如果另一個模型(如 DeepSeek)更好,或者 Qwen 更擅長某項工作,那么開發人員就有能力從不同模型中汲取最優秀的智能部分,并生產出所需要的東西。這就是我認為開源在質量上基本上會超越所有閉源(模型)的部分原因……這感覺就像是一股勢不可擋的力量。”扎克伯格說道。

據 Meta 透露,其 Llama 模型系列的下載量已達到 12 億次下載,由 Llama 提供支持的 Meta AI 助手已覆蓋約 10 億用戶。“我們有數千名開發人員貢獻了數萬個衍生模型,每月下載數十萬次。”Meta 首席產品官克里斯·考克斯(Chris Cox)在主題演講中說。

而就開源和閉源兩種模型生態在當下的演進、各自的優勢以及如何協同使用,扎克伯格與微軟 CEO 薩蒂亞·納德拉(Satya Nadala)在 LlamaCon 現場進行了一場深度的技術討論。對話中,兩人還互曝了 Meta 和微軟內部當前各自采用 AI 做研發的實際比例,并大談了關于“蒸餾工廠”的設想和各自接下來促成這件事的分工。

以下是經翻譯和編輯后不改變原意的對話內容:

“相比閉源,

開源有巨大結構性優勢”

Satya Nadala:Mark,我記得最早一次見你是我 2008 年在 Bing 工作時,你還給我上了一課,讓我印象深刻。當時你提醒我犯了一個錯誤,想想還挺尷尬的。我一直都記得,你說“網絡依附于人,要多體現人的要素”。我永遠都記得這一點,就像你可以在任何地方都有個人主頁。這對我來說是段很重要的回憶。

Mark Zuckerberg:很高興你能原諒我那次的批評,不過從整體上來講,網絡確實離不開人。所以我想那時候我的觀點大體是對的。但也許現在更偏向于智能體了,可以說是雙路并進吧。你多次提到當前 AI 關鍵技術時刻與過去的一些重大技術變革類似,比如從客戶端 - 服務器架構到 Web 初期的轉變等。我很好奇,你是怎么看的?

Satya Nadala:我個人當時正好經歷了客戶端計算剛剛興起的時期。我加入微軟的時候正值 Windows 3.0 發布之后,所以親眼見證了客戶端 - 服務器架構的誕生,接著是 Web、移動互聯網、云計算,而現在算是第四或第五次平臺級變革了吧。有趣的是,每一次技術平臺的轉變,整個技術棧都會被重新審視一遍,我們需要回歸最初的原則并重新開始建設。

比如說,就連我自己在 2007、2008 年左右構建的云基礎設施的核心存儲系統,也不具備如今模型訓練這類工作負載所需要的存儲結構。數據并行同步的負載模式與 Hadoop 等其他傳統系統截然不同。每次平臺發生巨變時,都需要從下至上徹底重構整個技術棧,我認為這就是永遠需要面對的挑戰。Web 起源于 Windows,但它早已超越了這個起點。這也是我對此的看法。

Mark Zuckerberg:很有道理。你之前也多次強調,隨著效率提升,系統的運作方式會發生變化,并促使用戶對服務的消費大幅上升。我有點好奇的是,你們身處企業市場核心業務之中,而我們在這方面的感知沒那么深。我好奇在這些 AI 模型周圍,你們觀察到了哪些變化趨勢?是不是覺得每一代模型都在變得更高效、將智能水平推向新高度?顯然,這一切都發生得太快了,所以我還不太清楚你們的體會。

Satya Nadala:仔細想想,幾年前我們還在討論摩爾定律是否終結的問題。而如今,我們正處在一個類似“超光速”發展的階段。事實上,技術平臺的每一次重大轉變都不是單線式,而是多線式疊加形成的復合增長。比如芯片本身就在進步,黃仁勛和蘇姿豐等人在硬件創新上的貢獻極大提高了迭代速度。我們可以說這是摩爾定律的延續,但除此之外,還有基礎設施優化、系統軟件改進、模型架構調優、推理內核優化、應用服務器優化、提示詞 緩存機制等。所有這些因素疊加在一起,使得每 6 到 12 個月就能帶來約十倍的整體性能提升。當能力提升如此迅速、成本下降如此之快時,本質上就會帶來消費量的激增。

因此,我非常樂觀地認為,我們正站在一個可以構建深度應用程序的階段。如果回顧第一代的應用,它們往往只綁定單個模型;但現在我們終于進入多模型應用時代,我可以據此總結出一個確定性的流程:通過智能體構建一個應用,這個智能體又可以接入其他模型。我們甚至已經有了一些有用的協議(如 MCP、A to N 等),只要我們能逐步標準化這些協議,就可以構建出既強大又靈活的應用。而在這個過程中,開源絕對可以發揮巨大作用。

Mark Zuckerberg:那咱們深入探討一下如何協同使用多個模型吧。我注意到你提到了“蒸餾工廠”的概念和相關的基礎設施建設。你覺得微軟在這方面是否具備優勢?我們可以稍后再聊這個問題。但在此之前,我想先聊聊你們最近在開源領域的探索。這也是你早期領導下的一個重要轉折點。你們一開始與 OpenAI 建立了早期合作關系,但同時也明確表示除了支持閉源模型外,也要為開源模型提供良好的服務。我想了解一下,你是如何看待開源生態的演進的?這對你的客戶為何如此重要?你們在整個基礎設施建設中又為什么要選取這樣的方向?

Satya Nadala:這是個很有趣的問題。事實上,我在微軟早年的一項關鍵工作,就是確保我們的 NT 系統能夠與各種 Unix 版本保持互操作性。這段經歷讓我明白了一件事:互操作性是客戶的需求,如果你做得好,不僅有利于客戶,也有利于你的業務。因此,我對開源的態度并不是出于某種教條主義之爭。無論是閉源還是開源,在這個世界里都有其必要性。而且最終,是客戶決定了他們需要什么。即使我們內部有人堅持某一種立場,現實世界也不會以個人意志為轉移。

舉個例子,SQL Server、MySQL、PostgreSQL、Linux、Windows 其實都共存已久。甚至 Linux 也能運行在 Windows 上,我個人最喜歡用的就是 WSL(Windows Subsystem for Linux)。它讓開發者可以輕松地將大量開發工具部署到 Windows 上。總體而言,我認為最好的選擇就是同時支持這兩種生態系統。這也契合你剛才談到的觀點:很多企業客戶希望蒸餾出屬于自己的模型,因為那是他們的知識產權所在。在這樣的場景下,開源模型相比閉源模型具有巨大的結構性優勢。

因此,我認為目前最好的狀態是:既有強大的閉源前沿模型,也有優秀的開源前沿模型。對于我們這種主流云服務提供商來說是一件好事。畢竟,我們在 Azure 上既可以提供出色的 Postgres、SQL Server,也可以提供 Linux 或 Windows 虛擬機。我們要做的就是提供選擇權以及配套的強大工具鏈。

Mark Zuckerberg:那你覺得你們在開源領域到底扮演著怎樣的角色?也不一定非得局限于開源,而是面向開發者群體,尤其是在他們起步階段,你們希望在哪些方面體現差異化或優勢?

Satya Nadala:首先,AI 工作負載遠不止一塊加速器芯片和一個推理模型那么簡單。現實情況是,每一個 AI 應用背后都離不開存儲、計算資源和網絡的支持。因此,底層基礎設施依然是重中之重。對于我們來說,無論是在亞洲還是全球范圍,我們都要打造世界級的 IaaS 層,把計算、存儲、網絡和 AI 加速器整合起來,服務于那些想要構建下一代智能體的用戶。在此之上,我們也正在構建 Foundry 這樣的應用服務器。

例如,每個平臺變遷時期,都會有相應的應用服務器出現。問題是:如何將搜索、內存管理、安全、評估等功能打包成一套完整的工具集?我們認為這就是核心所在。此外,我們還特別專注于 GitHub Copilot 這一類開發輔助工具。我們對它的進展感到非常振奮。因此,我認為要加速應用開發,必須依靠強大的工具鏈、強大的應用服務器和強大的基礎設施。

AI 帶來的生產力提升

Mark Zuckerberg:你剛才提到了“智能體”和“生產力提升”,這顯然是整個生態和社區的重要主題之一。我很想知道在微軟內部,你們目前是怎么應用這些技術的?有哪些特別有趣的案例可以分享?

Satya Nadala:我覺得對我們最有啟發的是軟件開發領域的變化。以 GitHub Copilot 為例,最開始它只提供代碼補全功能,后來又加入了聊天功能,意味著用戶不再需要切換到 Reddit 或 Stack Overflow,而可以在 IDE 中始終保持上下文連貫。再往后引入了基于智能體的工作流,你可以直接給模型分配任務。這三個功能雖然層層遞進,但并沒有相互替代。現在我們有了 Proto-3 類似的智能體原型,你可以直接給出高層次指令,或者把 Pull Request 分配給 SWE Agent 處理。在這四個層級上帶來的生產力提升,最關鍵的經驗是:必須把這些新技術無縫集成到現有的代碼倉庫和開發流程中。

新建一個空白項目當然不錯,但現實中我們很少有機會完全從零開始。我們面對的是龐大的代碼庫和復雜的流程體系,這就要求我們必須集成工具鏈。而這正是所有工程團隊必須完成的系統性工作,當我們真正做到這點時,生產力才會真正顯現出來。不僅是在開發領域,對知識工作者同樣適用。比如在銷售工作中,一種典型流程是準備客戶會議。自從 1992 年我加入微軟以來,準備這類會議的方式幾乎就沒變過:有人寫份報告,通過郵件或文檔發給你,你前一晚讀完。現在我只需要打開 Copilot Researcher,就能實時獲取來自互聯網、公司內部系統甚至 CRM 數據的綜合信息。這完全改變了流程——不再需要人為準備材料,因為一切都可以即時獲取,但這也意味著工作成果和流程本身必須改變。這種變化起初緩慢,但一旦突破臨界點,就會迅速普及。PC 技術的普及過程就是這樣。我想過在電子郵件和 EXCEL 互操作之前,世界是如何做預測的。你知道,傳真到處都是。我猜你從沒經歷過那樣的世界。

Mark Zuckerberg:當時我還在上初中,但你說得沒錯。

Satya Nadala:回想電子郵件和 Excel 出現之前的世界,人們靠傳真傳遞數據,直到某天有人說:“我把表格放進郵件里傳給你。”于是預測分析的方式從此改變。我認為我們正處于類似的轉折點上。在客服、營銷、內容創作等領域,這種變化已經開始顯現。我們看到的是可衡量的進步,雖然有些成果無法量化,但確實是實實在在的生產力提升。

Mark Zuckerberg:說到編程效率的提升,你估計目前微軟內部有多少比例的代碼是由 AI 編寫的?或者說是由工程師主導、AI 協助完成的?

Satya Nadala:我們主要看兩個指標:一個是用戶的接受率,大概在 30% 到 40%,而且呈持續上升趨勢。不同的編程語言表現不一,比如 Python 適配度最好,C# 也不錯,但 C++ 目前還沒那么成熟。隨著語言支持度的提升,代碼補全質量也在提高。而在“代理式編程”方面,目前更多適用于全新項目,在已有項目中使用較少。因此目前來看,可能有 20% 到 30% 的代碼已經由 AI 完成,甚至有些項目完全是 Sophia 寫的。你們那邊呢?

Mark Zuckerberg:我手上其實并沒有確切的數字,但我認為,我們看到的很多采用數據本質上還只是類似于“自動補全”這種功能。不過,我們內部有很多團隊正在做一些“推薦排序”或者“廣告排序”這樣的實驗。這些都是邊界非常清晰的具體領域,在這里面我們可以研究歷史上的所有改動記錄,并據此進行迭代。我認為這個方向挺有意思的。但對我們來說更重要的目標是:利用 AI 和機器學習來推動 Llama 系列模型的研發本身。因為未來一年內,可能有一半的工作都會由 AI 而不是人類完成,而且這一比例只會越來越高。所以剛才聽你說到微軟的情況,我覺得很有趣。

Satya Nadala:是的。在我們這邊,三大智能體(Researcher、Analyst 和 Copilot)可以說是我們在這條路上邁出的第一步。現在的問題是,明年我們能不能實現類似“內核優化”這樣級別的能力?在我看來,比起設計出全新的模型結構,我們更有可能在具體任務上取得突破。關鍵還是要看我們在哪些任務上優先發力。

Mark Zuckerberg:沒錯,像性能優化、安全增強這類任務,我覺得成功的可能性就很高。而且,我們也在嘗試解決一個不同的問題——你們主要服務于開發者和工程師群體,這也算是你們的核心業務。而對我們來說,更多是想提升 Meta 自身的研發效率,并繼續改進 Llama 系列模型,讓其他公司也能用得上。我們不會像你們那樣完整地構建端到端的開發流程,所以我一直很好奇你會怎么看待這件事。

Satya Nadala:從我們的角度來看,核心業務是從工具的角度出發的。比爾·蓋茨當年創立這家公司時,打造的就是一家工具供應商。現在我們考慮的是,也許應該重新定義“工具”的概念。換句話說,未來的工具其實就是一套為智能體服務的基礎設施。即便是“三大智能體”也需要配合一系列工具,那么它們應該是什么樣的?它們的基礎設施和沙盒機制又該如何設計?我們接下來要做的,很大程度上是在 GitHub 代碼倉庫這樣的系統上進行演化,比如針對 SWE Agent 做適配性調整。

Mark Zuckerberg:沒錯,這確實是個很有意思的概念。我也傾向于認為,未來的每一個工程師實際上都會變成某種意義上的技術負責人,他們手下會有“自己的小團隊”,也就是一批他們調教過的 AI 智能體來協助工作。另外,剛才你說起你在個人使用 AI 過程中的變化,我還挺好奇的,你是怎么看待這個問題的?還有一點也蠻有意思,就是你之前介紹了微軟早期是如何轉型做 AI 的。其實我一直有個問題:如果今天有位新手程序員打算開始構建點東西,你覺得他們會怎樣去選擇適合自己的開發工具呢?

Satya Nadala:這個問題非常重要。我記得最早大家常常會討論一些基本的問題,比如蓋茨曾經啟發我們思考:“文檔、應用和網頁之間到底有什么區別?”他總是把這個問題講得很深奧,比如說,到底是什么區分了文檔、應用和網站?現在來看,如果你使用 Meta AI、ChatGPT 或者 Copilot 之類的工具,你會發現“聊天對話”和“頁面操作”之間的界限其實并不清晰。舉個例子,我自己最近就在研究 Llama 4 的相關資料,我把所有信息都通過聊天的方式整理出來,然后保存成文檔格式。接著,我可以直接基于這段內容寫代碼,甚至生成一個完整的應用。

這就是我想表達的關鍵點之一:你可以從一個宏觀意圖出發,最終產出一個動態的內容載體——在過去,我們會稱它為“應用程序”。這種轉變會對整個開發流程產生深遠影響。我們現在正站在變革的起點,這也是我的夢想所在。作為工具的設計者和使用者,我們過去所劃分的那些類別界限——不管是人為設定的還是由于軟件限制而形成的——將來可能會被徹底打破,或者說被重新定義。

還有一個我們以前經常思考的問題:為什么 Word、Excel 和 PowerPoint 是三個獨立的東西?為什么它們不能合并為一個整體?雖然我們過去嘗試過多次整合,但直到現在才真正具備這個可能性。比如你可以在同一個工作流里先輸入一段文字,接著把它可視化成表格,再以 PPT 的形式展示,而所有這一切都可以存儲在一個統一的數據結構中。對我來說,這才是真正的可塑性和靈活性的體現,而這在以前是很難實現的。

Mark Zuckerberg:是的,這很有趣也非常合理。回想這些年我們的對話,我覺得你對技術趨勢的理解方式始終都很理性。面對當前鋪天蓋地的 AI 熱潮,你總能看穿表象,做出非常理性的判斷和投資決策。你曾提到的一個觀點讓我印象很深:盡管現在炒得火熱,但歸根結底,只有當 AI 真的帶來生產力的爆發式增長,才能反映在 GDP 的顯著提升上。而這一過程可能需要好幾年甚至更長時間才會顯現成效。我想知道你現在如何看待這些問題:我們應該關注哪些指標來衡量 AI 的發展進度?在未來 3 至 7 年的時間里,你預計它會發展到什么程度?

Satya Nadala:這個問題問得很好。對我們來說,AI 的意義已經不僅僅是技術升級,而是關乎人類社會生存與發展的根本問題。我們需要一種新的生產要素來應對大量現實挑戰。最好的類比可能就是工業革命時期的經濟增長,當時發達國家的增長率一度達到 10% 左右。想要實現類似的突破,就必須在各行各業大幅提升生產力,包括醫療、零售和廣泛的知識型工作。AI 當然具備這樣的潛力,但關鍵在于我們要讓它真正釋放出可觀的生產力提升。這不僅需要軟件層面的創新,也需要組織管理和流程上的深度重構。

因為某種程度上,人們必須改變與技術互動的方式。就像電力剛出現的時候一樣,在最初半個世紀內,人們并沒有意識到它可以徹底改變工廠的運作方式。福特汽車公司就是一個經典案例。我們現在正處在類似的中間階段。我希望這個過程不要半世紀那么久,但我同時也認為,僅僅把 AI 當作“不用馬的馬車”并不是通往未來的正確思路。這不只是技術的進步,而是要把這套新能力融入整個社會和企業的運作體系中,創造出全新的工作模式和成果形態。

Mark Zuckerberg:確實,我們都正在下注,賭這事不會花上半個世紀。我也確實希望不需要那么久。

“蒸餾工廠”的設想

Mark Zuckerberg:剛才我們已經討論了不少技術層面的問題,接下來也該說點宏觀的了。我突然意識到我們漏掉了一個關鍵話題——關于“蒸餾工廠”的設想,以及你打算如何整合各種為開源而打造的不同 AI 模型,并構建支持這種整合所需的基礎設施。這顯然是你之前經常提到的重要方向之一。

Satya Nadala:對我來說,“蒸餾工廠”正是我認為開源最重要的作用之一:能夠從一個大模型出發,比如你們 Llama 家族內的某個大模型,然后將其提煉成一個更加小巧但結構一致的模型。我覺得這是一個非常有潛力的應用場景。因此,圍繞這個過程來構建工具鏈和平臺服務、降低使用門檻,是我們未來需要重點推動的方向。

如你所說,部署這些大模型本身需要龐大的基礎設施,不是所有人都有能力或者有必要去親力親為。但如果把它放在云平臺上,再輔以易用的工具和輸出結果,比如對于每一個 Microsoft 365 的租戶來說,如果他們都能生成一個任務專用的小型蒸餾模型,并可以作為智能體或工作流調用,甚至可以直接在 Copilot 中觸發——這就意味著真正的突破。目前人們已經在做類似的事,但我們想讓它變得更簡單。

我所說的“蒸餾工廠”,是指那種由一到多的關系,也就是一個大模型可以生成多個蒸餾后的小模型,并將它們嵌入像 GitHub Copilot 這樣的產品內部流程中,與 MCP 服務器等現有機制配合調用其他智能體。

Mark Zuckerberg:沒錯,我一直對這個方向很著迷。我認為蒸餾是開源生態系統中最強大的能力之一。而且正如我們各自的角色分工,我們主要負責訓練最初的 Llama 模型,但開發者基礎設施這塊不是我們自己主導。所以我一直覺得,像你們這樣愿意投入建設復雜基礎設施的企業就顯得特別重要。我們也在做一個體量龐大的模型,但說實話,除了通過蒸餾把它壓縮成更實用的形式,我真不知道該怎么直接拿來用了。連我們自己要使用它,都需要先搭建大量內部系統,光是進行后續訓練就需要不少前置條件。在多數隨機場景下根本跑不起來。

Satya Nadala:你說的應該是 Maverick 吧?

Mark Zuckerberg:對,基本全靠蒸餾出來的 Maverick 小模型。我們能實現現在這樣的性能表現,很大程度上是因為它是多模態的,在文本處理方面表現突出,而且模型規模又比別的小。比如 DeepSeek 雖然更大,但在文本能力上跟 Maverick 差不多,而在圖像和多模態方面,只有 Maverick 具備這些能力,別的模型還不行。

這一切的背后,其實都源于我們完成了那個巨大模型的預訓練,現在正在進行后續訓練。但真正讓我們獲得實效的其實是蒸餾過程,簡直就像是魔法一樣。你可以做到幾乎保留原模型 90% 到 95% 的能力,體量卻縮小到原本的 1/20。這樣成本更低、效率更高,更適合實際應用。問題是,如何讓沒有足夠資源和技術積累的人也能用上這套東西?因為目前全球范圍內,能做到這類蒸餾工作的實驗室還非常有限。但如果我們能把你的愿景落地,讓大多數開發者都能方便地訪問這些工具,不僅限于從單一模型蒸餾,還能在未來逐步實現跨模型的知識組合和靈活調用,那將會是非常酷的一件事。

Satya Nadala:完全同意。所以接下來我們要解決的問題包括:如果你同時從多個模型中提取知識,那你如何評估并確認蒸餾后的模型質量?這方面就是我們可以在工具和基礎設施層面上發力的地方,目的就是降低靈活性使用的門檻。

好消息是,這件事其實已經開始起步了。已經有案例證明這條路可以跑通,問題只是能不能把整個門檻降得更低一些。另外還有一個挑戰是響應速度。比如我現在用一個模型做微調,可剛調好就有新的樣本數據出來了,我必須快速切換到新樣本。如果我們不能保持敏捷,就會被快速變化的技術節奏甩在后面。

Mark Zuckerberg:此外,開發者們也需要不同形式的產品形態。舉個例子,Llama 4 之所以設計成每個專家模塊 170 億參數的結構,是因為 Meta 這邊的基礎計算單元是 H100 顯卡。我們希望能在這種硬件上運行得盡可能高效。但你會發現,有些其他開源模型雖然性能不錯,但由于模型規模的原因,在推理階段反而不夠友好,可能更適合別的硬件架構。我們主要是面向服務器端生產環境優化的,但很多開源社區用戶其實想要更輕量級的模型。比如最受大家歡迎的 Llama 3 就是 8B 版本,所以我們也會考慮推出更小的版本。

我之前也提到了這點。我們內部稱之為“小 Llama”,至于最終會不會發布還有待觀察。但關鍵是,只要能把大模型中的智能抽取出來,并按需蒸餾成適合筆記本、手機或者其他設備運行的形態,我覺得這就是一件非常重要的事情。哪怕我自己都說不清楚到底有多重要,但我就是相信它的價值。

Satya Nadala:我明白。我知道你們在這方面一直積極推進。也深深為此感到高興。如果我們能進一步走向“混合模型”的時代,比如 MoE(混合專家)加上思維鏈模型,就可以通過靈活配置來調節延遲或推理時間,到時候我們將真正進入一個更加靈活和可控的 AI 發展階段。我想這正是我們所有人的共同目標。

Mark Zuckerberg:贊成!既然談到這里,我想我們可以用一個問題給今天的對話畫上句號。當你看看眼下這一切,你最感到樂觀的是什么?或者說,在接下來幾年里,你最期待開發者們能做些什么?

Satya Nadala:這么說吧,我總是會想起鮑勃·迪倫的那句歌詞:“你要么忙著出生,要么忙著死去。” 在當前這個時代,我們顯然應該選擇前者,努力讓自己不斷進化和成長。讓我感到樂觀的是,盡管存在種種限制,軟件——尤其是以 AI 新形態呈現的軟件——依然是我們手中最具可塑性的資源,是我們解決各類難題的關鍵工具。這給了我信心。我也認為,這應該成為我們所有人行動的號召:抓住機會深入參與其中,同時積極構建解決方案。

無論是企業 IT 系統里的需求積壓,還是現實世界中尚未解決的難題,它們都需要全新的思路和方法。而我認為,這就是這項技術最大的價值所在。歸根結底,這還是要落到開發者身上——只有他們才能毫無畏懼地沖在前面,把這些可能性變成現實。

Mark Zuckerberg:感謝 Satya,也感謝各位的到來。今天真是令人振奮的一天,我也將繼續對大家未來共同構建的一切充滿期待。

https://techcrunch.com/2025/04/29/metas-llamacon-was-all-about-undercutting-openai/

https://about.fb.com/news/2025/04/introducing-meta-ai-app-new-way-access-ai-assistant/

https://techcrunch.com/2025/04/29/meta-launches-a-standalone-ai-app-to-compete-with-chatgpt/

https://www.youtube.com/watch?v=FZ-RZ0dKO8o

聲明:本文為 InfoQ 整理,不代表平臺觀點,未經許可禁止轉載。

AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯動,全覽 AI 技術前沿和行業落地。大會聚焦技術與應用深度融合,匯聚 AI Agent、多模態、場景應用、大模型架構創新、智能數據基建、AI 產品設計和出海策略等話題。即刻掃碼購票,一同探索 AI 應用邊界!

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
狂炸俄轟炸機后,澤連斯基的一句話侮辱性極強,俄媒:他是在胡說

狂炸俄轟炸機后,澤連斯基的一句話侮辱性極強,俄媒:他是在胡說

千里持劍
2025-06-02 09:21:47
街頭巷尾的信號:老百姓咋知道快打仗了?

街頭巷尾的信號:老百姓咋知道快打仗了?

文雅筆墨
2025-06-01 15:43:20
花4萬體驗子宮激活療法,能持續高潮兩小時,治療方法:有手就行

花4萬體驗子宮激活療法,能持續高潮兩小時,治療方法:有手就行

社會醬
2025-06-01 09:51:58
陳震:尊界S800只是選擇了適合我的配置!庫里南賣掉,換了閃靈!

陳震:尊界S800只是選擇了適合我的配置!庫里南賣掉,換了閃靈!

悠閑歷史
2025-06-01 23:05:00
特朗普不裝了,直接對中國"開刀",沒成想當天就收到了"壞消息"

特朗普不裝了,直接對中國"開刀",沒成想當天就收到了"壞消息"

北緯的咖啡豆
2025-06-02 10:30:11
鄧文迪最高明之處,就是和70多歲默多克生下倆女兒,保住一生富貴

鄧文迪最高明之處,就是和70多歲默多克生下倆女兒,保住一生富貴

南南說娛
2025-06-02 09:48:22
南寧一女子花460多萬元購買大平層,要買第二套時竟發現土地使用權僅剩47年

南寧一女子花460多萬元購買大平層,要買第二套時竟發現土地使用權僅剩47年

環球網資訊
2025-06-02 12:36:42
巴黎奪冠后,納賽爾第一時間致電弟媳感謝其過去對球隊的貢獻

巴黎奪冠后,納賽爾第一時間致電弟媳感謝其過去對球隊的貢獻

懂球帝
2025-06-02 00:12:09
李亞鵬擬將花費上億元幼兒園無償移交!最初是為女兒李嫣量身打造

李亞鵬擬將花費上億元幼兒園無償移交!最初是為女兒李嫣量身打造

揚子晚報
2025-06-02 09:41:03
日本揚言3小時摧毀俄太平洋艦隊,必要時將聯手烏克蘭奪回四島

日本揚言3小時摧毀俄太平洋艦隊,必要時將聯手烏克蘭奪回四島

史政先鋒
2025-06-01 13:35:21
對陰道傷害很大的4個行為,很多女性都不知道!

對陰道傷害很大的4個行為,很多女性都不知道!

醫路向前巍子
2025-05-28 14:34:57
PLA已普及加固式機堡,可硬抗千磅炸彈直接命中,無懼無人機群攻

PLA已普及加固式機堡,可硬抗千磅炸彈直接命中,無懼無人機群攻

阿龍聊軍事
2025-06-02 08:50:23
“外賣詩人”王計兵,擬任新職

“外賣詩人”王計兵,擬任新職

極目新聞
2025-06-01 22:15:33
小沈陽演唱會口碑翻車,觀眾喊退票提前離場,力捧18歲女兒被吐槽

小沈陽演唱會口碑翻車,觀眾喊退票提前離場,力捧18歲女兒被吐槽

電影偵探社
2025-06-01 17:58:03
美媒:楊瀚森是姚明后最優秀的中國NBA新秀,價值或比弗拉格更高

美媒:楊瀚森是姚明后最優秀的中國NBA新秀,價值或比弗拉格更高

林小湜體育頻道
2025-06-02 00:02:18
小伙被扔燒烤金屬簽扎進脖子,醫院:已取出,脫離生命危險

小伙被扔燒烤金屬簽扎進脖子,醫院:已取出,脫離生命危險

極目新聞
2025-06-02 12:03:58
湖南一領導跳樓:連夜修改重要文件,家中搜出3個箱子,妻子發聲

湖南一領導跳樓:連夜修改重要文件,家中搜出3個箱子,妻子發聲

博士觀察
2025-06-01 13:10:00
樊振東出國打球,中國乒協正式表態,釋放出三大重要信號!

樊振東出國打球,中國乒協正式表態,釋放出三大重要信號!

十點街球體育
2025-06-01 17:12:10
父親臨終塞我銀行卡,叮囑我避開老公,5年后我翻出藏錢暗格淚崩

父親臨終塞我銀行卡,叮囑我避開老公,5年后我翻出藏錢暗格淚崩

今天說故事
2025-05-16 18:55:06
又一“打印”視頻出現,小伙們爭先恐后沖鋒,印軍一溜煙逃到山腳

又一“打印”視頻出現,小伙們爭先恐后沖鋒,印軍一溜煙逃到山腳

阿龍聊軍事
2025-06-02 09:40:46
2025-06-02 15:43:00
InfoQ incentive-icons
InfoQ
有內容的技術社區媒體
11142文章數 51279關注度
往期回顧 全部

科技要聞

新造車5月再洗牌:問界回前三,小米守第五

頭條要聞

美財長放話:美國永不會債務違約 我們不會公布"X日"

頭條要聞

美財長放話:美國永不會債務違約 我們不會公布"X日"

體育要聞

傲了一輩子的恩里克,心中永遠住著一個小天使

娛樂要聞

章子怡深夜曬娃,兒女正面照曝光

財經要聞

三大利空,突襲!

汽車要聞

吉利汽車5月銷量23.52萬輛 同比增長46%

態度原創

時尚
藝術
家居
數碼
公開課

后背小心機!4款鏤空單品讓你美得毫不費力

藝術要聞

故宮珍藏的墨跡《十七帖》,比拓本更精良,這才是地道的魏晉寫法

家居要聞

原木純白 邂逅自然本真

數碼要聞

機械革命筆記本新模具曝光,提供藍白撞色設計

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 贵阳市| 万山特区| 梓潼县| 乐业县| 板桥市| 留坝县| 阳山县| 双牌县| 普兰县| 融水| 海林市| 罗定市| 璧山县| 互助| 鄂尔多斯市| 错那县| 天祝| 南郑县| 汽车| 赤峰市| 同江市| 陈巴尔虎旗| 潢川县| 平阴县| 广饶县| 桂平市| 枣庄市| 平乡县| 阿勒泰市| 青海省| 黑水县| 金堂县| 涡阳县| 泰兴市| 大连市| 闻喜县| 大荔县| 大足县| 连江县| 务川| 内江市|