網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

NBC火爆專題: DeepSeek超越美國的AI突破，和PerPlexity創(chuàng)始人討論

2025-01-26 18:29:25　來源: Web3天空之城

浙江舉報(bào)

分享至

未經(jīng)許可不得轉(zhuǎn)載，務(wù)必保留原文出處鏈接和公眾號名片

Web3天空之城·城主

【城主說】

DeepSeek R1在美國已經(jīng)徹底爆發(fā)。

正如R1剛發(fā)布那天,本城文章所預(yù)測，經(jīng)過了幾天發(fā)酵，美國人終于徹底反應(yīng)過來，R1話題在周末刷爆各大主流媒體和輪胎，美國各大AI團(tuán)隊(duì)和實(shí)驗(yàn)室已手持DeepSeek無私分享的寶貴論文來全情投入復(fù)刻R1推理模型實(shí)現(xiàn)，并已經(jīng)有了諸多進(jìn)展。DeepSeek這一次確實(shí)為AI屆帶來了足以實(shí)現(xiàn)跨越突破的火種。

在眾多報(bào)道里， CNBC所做的長達(dá)40分鐘的專題報(bào)道“中國新型AI模型DeepSeek如何威脅美國的主導(dǎo)地位”很值得一看，除了主流分析，還邀請了當(dāng)紅AI搜索引擎Perplexity的創(chuàng)始人做了言之有物的深度訪談。

PerPlexity創(chuàng)始人Arvind對DeepSeek及中國在美國打壓之下的AI發(fā)展創(chuàng)新做了很中肯的評價(jià)，甚至比很多公知的立場都要客觀，讓城主對這位甚至還沒拿美國綠卡的小哥的印象大有加分。

很有趣的是，主持人和Arvind討論的時(shí)候，還在預(yù)測DeepSeek 推理模型什么時(shí)候會(huì)推出，他們的預(yù)測基本是到今年底。

他們一定沒想到，這個(gè)專訪才過去幾天，DeepSeek的R1就轟動(dòng)了世界。

不多說，這個(gè)NBC專題的全文和視頻完整版和大家分享：

【NBC完整版: 中國新型AI模型DeepSeek如何威脅美國的主導(dǎo)地位 | 油管爆火長篇報(bào)道-嗶哩嗶哩】 https://b23.tv/PMOjOJd

NBC：

中國最新的AI突破領(lǐng)先世界，值得高度重視。這項(xiàng)顛覆性成果并非來自O(shè)penAI、谷歌或Meta，而是一家名為（DeepSeek）的中國實(shí)驗(yàn)室。這一發(fā)現(xiàn)令硅谷震驚，也讓許多人重新審視中國人工智能領(lǐng)域的真實(shí)實(shí)力。

DeepSeek聲稱，其成果的研發(fā)成本僅為不到600萬美元，耗時(shí)兩個(gè)月，而谷歌和OpenAI花費(fèi)數(shù)年時(shí)間和數(shù)億美元才取得類似成果。DeepSeek的開源模型已成為許多美國開發(fā)者的基礎(chǔ)。

DeepSeek發(fā)布的免費(fèi)開源AI模型，在多項(xiàng)測試中擊敗了市場上最強(qiáng)大的模型，包括Meta的Llama、OpenAI的GPT-40和Anthropic的Claud Sonnet 3.5。這些測試涵蓋數(shù)學(xué)、編程和代碼錯(cuò)誤修復(fù)等多個(gè)領(lǐng)域。

DeepSeek的另一個(gè)推理模型R1，在一些第三方測試中也超越了OpenAI的尖端模型O1。在“人類的最后考試”這一新的AI模型評估基準(zhǔn)測試中，DeepSeek的模型表現(xiàn)最佳，或與最好的美國模型不相上下。

令人矚目的是，DeepSeek取得這些成就，是在美國政府對中國實(shí)施嚴(yán)格半導(dǎo)體限制的情況下完成的，這實(shí)際上限制了他們的計(jì)算能力。

在人工智能競賽中，美國對中國實(shí)施了嚴(yán)格的芯片出口管制，切斷中國獲取英偉達(dá)H100等高端芯片的途徑。這些芯片一度被認(rèn)為是構(gòu)建競爭力AI模型的必要條件，眾多企業(yè)爭相搶購。

然而，DeepSeek公司卻另辟蹊徑，利用性能較低的H800芯片構(gòu)建了最新的模型，證明了芯片出口管制并非完全有效的扼喉手段。他們顯著提升了硬件利用效率。

但DeepSeek的神秘面紗背后究竟隱藏著什么？關(guān)于其實(shí)驗(yàn)室和創(chuàng)始人梁文鋒的信息少之又少。據(jù)中國媒體報(bào)道，DeepSeek誕生于一家名為“幻方量化”的對沖基金，該公司管理著約80億美元資產(chǎn)。其官網(wǎng)的使命宣言簡潔明了：懷著好奇心解開AGI的奧秘，以長遠(yuǎn)的眼光解答根本性問題。這與OpenAI和Anthropic等美國AI公司詳細(xì)的章程和組織結(jié)構(gòu)形成鮮明對比。

盡管多次嘗試聯(lián)系DeepSeek，我們均未得到回應(yīng)。其人才隊(duì)伍組建、硬件采購、數(shù)據(jù)獲取等過程都未公開，令人費(fèi)解。但這一謎團(tuán)凸顯了中美之間人工智能對抗的緊迫性和復(fù)雜性。

這不僅僅是DeepSeek一家。其他中國AI模型也憑借有限資源在競爭中占據(jù)了一席之地。李開復(fù)的初創(chuàng)公司01.AI成立八個(gè)月就成為獨(dú)角獸公司，2024年創(chuàng)造近1400萬美元收入，其模型訓(xùn)練成本僅為300萬美元，遠(yuǎn)低于GPT-4的8000萬到1億美元。阿里巴巴的QN也大幅降低了大型語言模型的成本。

這些中國的突破削弱了美國AI實(shí)驗(yàn)室一度占據(jù)的領(lǐng)先地位。2024年初，埃里克·施密特曾預(yù)測中國在AI領(lǐng)域落后美國兩到三年，但如今他已經(jīng)改變了說法。

中國在過去六個(gè)月取得的進(jìn)展令人矚目，多個(gè)中國程序，例如“DeepSeek”，似乎已追趕上OpenAI。這對OpenAI的技術(shù)壁壘提出了重大疑問。

2022年11月ChatGPT發(fā)布時(shí)，OpenAI占據(jù)絕對領(lǐng)先地位。如今，它不僅面臨來自中國的國際競爭，還面臨谷歌Gemini、Anthropic Claud和Meta的Llama模型帶來的國內(nèi)競爭。

游戲規(guī)則已經(jīng)改變。功能強(qiáng)大的開源模型的廣泛可用性，使開發(fā)者能夠繞過高成本、高資源消耗的模型構(gòu)建和訓(xùn)練階段。他們可以在現(xiàn)有模型基礎(chǔ)上進(jìn)行構(gòu)建，從而更容易、更低成本地進(jìn)入該領(lǐng)域的前沿。

近兩周，人工智能研究團(tuán)隊(duì)視野更為開闊，對低成本實(shí)現(xiàn)的目標(biāo)也更為雄心勃勃。過去，達(dá)到行業(yè)前沿需要數(shù)億美元甚至數(shù)十億美元的投資。而“DeepSeek”則證明，數(shù)千萬美元的投資也能取得顯著成果。

這意味著任何一家聲稱處于領(lǐng)先地位的公司，例如OpenAI，都可能很快失去其優(yōu)勢。“DeepSeek”能夠快速趕超，正是因?yàn)樗⒃诂F(xiàn)有AI技術(shù)前沿的基礎(chǔ)上，并專注于對現(xiàn)有技術(shù)的迭代改進(jìn)，而非重新發(fā)明輪子。

他們采用優(yōu)秀的預(yù)訓(xùn)練大型模型，并使用蒸餾技術(shù)，利用大型模型來提升小型模型的特定能力，這是一種非常具有成本效益的方法。通過利用現(xiàn)有數(shù)據(jù)集、應(yīng)用創(chuàng)新調(diào)整以及利用現(xiàn)有模型，“DeepSeek”縮小了差距，甚至出現(xiàn)了“身份危機(jī)”，其自身模型確信自己是ChatGPT。

當(dāng)被問及模型類型時(shí)，“DeepSeek”回答說是OpenAI創(chuàng)建的基于GPT-4架構(gòu)的AI語言模型。這導(dǎo)致OpenAI首席執(zhí)行官Sam Altman發(fā)布了影射“DeepSeek”的帖子。

復(fù)制已知有效的方案相對容易，但探索未知領(lǐng)域則充滿挑戰(zhàn)。“DeepSeek”并非完全復(fù)制，它利用OpenAI的輸出和架構(gòu)原理模擬GPT，同時(shí)暗中加入自身增強(qiáng)功能，模糊了自身與ChatGPT的界限。

所有這些都給OpenAI等閉源領(lǐng)導(dǎo)者帶來了壓力，迫使他們證明其高成本模型在競爭日益激烈的情況下仍具有優(yōu)勢。在這個(gè)領(lǐng)域，企業(yè)間普遍存在技術(shù)借鑒現(xiàn)象。例如，谷歌率先應(yīng)用Transformer架構(gòu)，OpenAI隨后借鑒并將其產(chǎn)品化。因此，對單一大型語言模型的大規(guī)模投入是否仍是明智之舉值得商榷。

OpenAI面臨著巨大的風(fēng)險(xiǎn)。上一輪融資超過60億美元，但公司尚未盈利，且其核心業(yè)務(wù)依賴于模型構(gòu)建，風(fēng)險(xiǎn)遠(yuǎn)高于擁有云計(jì)算和廣告業(yè)務(wù)的谷歌和亞馬遜等公司。對OpenAI而言，推理能力至關(guān)重要，一個(gè)能夠進(jìn)行分析、邏輯推理和解決復(fù)雜問題的模型，將超越簡單的模式識別。

目前，OpenAI的01推理模型仍處于領(lǐng)先地位，但這一優(yōu)勢能否持續(xù)？伯克利研究人員近期展示了只需450美元即可構(gòu)建一個(gè)推理模型，這意味著低成本構(gòu)建具備推理能力的模型已成為可能，預(yù)訓(xùn)練模型的巨額投入不再是必需。游戲規(guī)則正在改變，保持領(lǐng)先地位可能需要更多創(chuàng)造力而非單純的資金投入。

DeepSeek的突破正值A(chǔ)I領(lǐng)域巨頭面臨諸多挑戰(zhàn)之際。OpenAI正轉(zhuǎn)向盈利模式，并面臨人才流失，如果游戲規(guī)則改變，它能否繼續(xù)以越來越高的估值融資？正如Chamath Palihapitiya所言，AI模型構(gòu)建可能是一個(gè)“金錢陷阱”。

美國政府的芯片限制旨在減緩競爭速度，將美國科技優(yōu)勢維持國內(nèi)。然而，這可能反而促進(jìn)了中國的創(chuàng)新。限制迫使中國尋找解決方案，最終可能創(chuàng)造出更高效的技術(shù)。中國以較低的資本投入取得了顯著進(jìn)展，這令人矚目。DeepSeek作為開源模型，開發(fā)者可以完全訪問并定制其權(quán)重或進(jìn)行微調(diào)。

一旦開源軟件趕上或超越閉源軟件，所有開發(fā)者都會(huì)遷移到開源軟件。關(guān)鍵在于開源軟件成本低廉，成本越低，開發(fā)者采用的吸引力就越大。我們的推理成本為每百萬個(gè)token 0.1美元，僅為同類模型收費(fèi)的三十分之一。這將大大降低構(gòu)建應(yīng)用程序的成本。

例如，構(gòu)建類似Perplexity的應(yīng)用程序，可以選擇向OpenAI支付每百萬個(gè)token 4.40美元，或使用我們的模型只需支付0.10美元。這可能意味著全球人工智能的主流模型將是開源的，各組織和國家將逐漸接受合作和去中心化能夠比專有封閉生態(tài)系統(tǒng)更快更高效地推動(dòng)創(chuàng)新。

來自中國的更便宜、更高效、被廣泛采用的開源模型，可能會(huì)導(dǎo)致全球人工智能格局發(fā)生重大轉(zhuǎn)變。這尤其危險(xiǎn)，因?yàn)檫@將使中國獲得市場份額和生態(tài)系統(tǒng)。大規(guī)模采用中國的開源模型可能會(huì)削弱美國的領(lǐng)導(dǎo)地位，同時(shí)使中國更深入地融入全球科技基礎(chǔ)設(shè)施。

開源軟件的許可證是可以更改的，因此在美國本土進(jìn)行建設(shè)至關(guān)重要。這也就是元宇宙如此重要的原因。

如果開發(fā)者因?yàn)樾矢叨笠?guī)模采用這些模型，可能會(huì)產(chǎn)生嚴(yán)重的連鎖反應(yīng)，甚至影響面向消費(fèi)者的AI應(yīng)用程序及聊天機(jī)器人生成的回應(yīng)的真實(shí)性。目前世界上真正能夠大規(guī)模構(gòu)建這種技術(shù)的國家只有美國和中國，利害關(guān)系和后果都極其重大，美國的領(lǐng)先地位正懸于一線。

為此，我們采訪了Perplexity的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Arvind Srinivas，他與我們深入探討了DeepSeek及其影響，以及Perplexity的路線圖。這段完整的對話值得一聽，現(xiàn)在開始播放。

主持人：

首先，我想了解中美之間AI競賽的利害關(guān)系。

Arvind：

中國在與美國競爭方面有很多劣勢。

首先，他們無法獲得我們這里可以獲得的所有硬件，使用的GPU比我們低端，幾乎相當(dāng)于勉強(qiáng)使用上一代GPU。更大的模型通常更智能，這自然使他們處于劣勢。

但另一方面，需求是發(fā)明之母。由于資源受限，他們不得不尋找解決方法，最終構(gòu)建了一些更高效的東西。這就像是被迫在有限資源下，想方設(shè)法做出頂級模型。除非數(shù)學(xué)上證明不可能，否則總能嘗試找到更有效的方法。這很可能會(huì)讓他們想出比美國更有效的解決方案，而且他們已經(jīng)開源了成果，我們也能借鑒。但他們培養(yǎng)的人才，最終將成為他們長期的優(yōu)勢。

美國領(lǐng)先的開源模型是Meta的Llama系列，表現(xiàn)優(yōu)秀，可以在電腦上運(yùn)行。但即使在發(fā)布時(shí)，質(zhì)量最接近GPT-4的，也是巨大的405B參數(shù)模型，而不是可以在電腦上運(yùn)行的70B參數(shù)模型。所以仍然沒有小型、廉價(jià)、快速、高效的開源模型能夠與OpenAI和Anthropic最強(qiáng)大的模型相抗衡。美國沒有，Mistral AI也沒有。

然后這些人卻搞出一個(gè)令人震驚的模型，API定價(jià)比GPT-4便宜10倍，比Sonnet便宜15倍，速度很快，每秒60個(gè)token。在一些基準(zhǔn)測試中表現(xiàn)相同或更好，在另一些則稍差，但大致處于GPT-4的質(zhì)量水平。他們只使用了大約2048個(gè)H800 GPU，相當(dāng)于大約1500個(gè)H100 GPU，這比GPT-4通常使用的GPU數(shù)量低了20到30倍。總計(jì)算預(yù)算大約為500萬美元。他們用這么少的錢就做出了如此驚人的模型，還免費(fèi)提供，并撰寫了技術(shù)論文。這讓我們質(zhì)疑，如果我們有類似的模型訓(xùn)練方法，就能取得同樣成果。

關(guān)鍵在于效率，成本和時(shí)間都大幅降低，GPU也簡化了。理解了他們的方法后，確實(shí)令人驚訝。閱讀技術(shù)論文后，發(fā)現(xiàn)他們想出了許多巧妙的解決方案，首先是訓(xùn)練了一個(gè)混合專家模型（MOE）。這并不容易，許多人難以追趕OpenAI，尤其是在MOE架構(gòu)方面，主要是因?yàn)榇嬖诤芏嗖灰?guī)則的損失峰值和數(shù)值不穩(wěn)定，經(jīng)常需要重新開始訓(xùn)練檢查點(diǎn)，這需要強(qiáng)大的基礎(chǔ)設(shè)施。

他們想出了非常巧妙的解決方案來平衡這一點(diǎn)，而無需添加額外的hack。他們還找到了浮點(diǎn)8，8位訓(xùn)練的方法，至少對于某些數(shù)值計(jì)算來說是如此。他們巧妙地確定了哪些需要更高的精度，哪些需要更低的精度。

據(jù)我所知，我認(rèn)為浮點(diǎn)8訓(xùn)練還沒有得到很好的理解。美國大部分的訓(xùn)練仍然在FP16上運(yùn)行，也許OpenAI也是。有些人正在嘗試探索這一點(diǎn)，但這很難做到正確。由于提到了必要性，因?yàn)樗麄儧]有那么多內(nèi)存，那么多GPU，他們找到很多數(shù)值穩(wěn)定性方面的東西，使他們的訓(xùn)練能夠工作。

他們在論文中聲稱大部分訓(xùn)練都是穩(wěn)定的，這意味著他們可以隨時(shí)在更多數(shù)據(jù)或更好的數(shù)據(jù)上重新運(yùn)行這些訓(xùn)練。然后它只訓(xùn)練了60天。所以這非常令人驚嘆。

主持人：

可以肯定地說，你很驚訝。

Arvind:

所以我很驚訝。

通常的觀點(diǎn)，或者說我不會(huì)稱之為觀點(diǎn)，而是個(gè)神話，認(rèn)為中國人只會(huì)抄襲。所以如果我們停止在美國撰寫研究論文，如果我們停止描述我們基礎(chǔ)設(shè)施和建筑的細(xì)節(jié)，停止開源，他們將無法趕上。但現(xiàn)實(shí)情況是，DeepSeek v3中的一些細(xì)節(jié)非常出色，如果Meta研究了它并將其中一些內(nèi)容整合到Llama 4中，我也不會(huì)感到驚訝。試圖抄寫下來。對吧？我不會(huì)說抄襲。這就像，你知道的，分享科學(xué)。工程。但是重點(diǎn)是，它正在變化。中國并非僅僅在模仿。他們也在創(chuàng)新。

主持人：

我們不知道它究竟是用什么數(shù)據(jù)訓(xùn)練的，對吧？即使它是開源的。我們知道它部分的訓(xùn)練方式和數(shù)據(jù)，但并非全部。有一種說法認(rèn)為它是在公共ChatGPT輸出上進(jìn)行訓(xùn)練的，這意味著它只是被復(fù)制了。但你認(rèn)為它超越了這一點(diǎn)。存在真正的創(chuàng)新。

Arvind:

是的，你看，我的意思是，他們用14.8萬億個(gè)詞元訓(xùn)練它。互聯(lián)網(wǎng)上充斥著大量的ChatGPT內(nèi)容。

如果你現(xiàn)在去看任何LinkedIn帖子或X帖子，大多數(shù)評論都是AI寫的。你一眼就能看出來。人們只是試圖寫作。事實(shí)上，即使在X上，也存在類似Grok推文增強(qiáng)器這樣的工具。或者在LinkedIn上，也有AI增強(qiáng)器。又或者在Google Docs和Word里，也有一些AI工具可以改寫你的內(nèi)容。所以，如果你在那里做了一些事情，然后把它復(fù)制粘貼到互聯(lián)網(wǎng)上的某個(gè)地方，它自然會(huì)包含一些類似ChatGPT訓(xùn)練的元素，對吧？而且很多人甚至懶得去除“我是一個(gè)語言模型”的部分。于是他們就把它粘貼到某個(gè)地方。這很難控制。我想可解釋AI（XAI）也談到了這個(gè)問題。

我不會(huì)因?yàn)椤澳闶钦l？”或“你是哪個(gè)模型？”這類提示而忽略他們的技術(shù)成就，我認(rèn)為這并不重要。

主持人：

長期以來，我們認(rèn)為——我不知道你是否認(rèn)同——中國在人工智能領(lǐng)域落后。這對于這場競爭意味著什么？我們可以說中國正在趕超，甚至已經(jīng)趕超了嗎？

Arvind：

如果說中國正在趕超OpenAI和Anthropic，那么同樣也可以說中國正在趕超美國。許多來自中國的論文試圖復(fù)現(xiàn)O1，事實(shí)上，我看到O1發(fā)布后試圖復(fù)現(xiàn)它的中國論文比美國的還多。DeepSeek能夠訪問的計(jì)算資源與美國博士生大致相同。

這并非為了批評任何人，例如，即使是我們自己，在PerPlexity方面，我們也決定不訓(xùn)練模型，因?yàn)槲覀冋J(rèn)為這成本過高，無法趕上其他研究。

主持人：

但你們會(huì)將DeepSeek整合到PerPlexity計(jì)算中嗎？

Arvind：

我們已經(jīng)開始使用了。他們有API，也開源了，所以我們也可以自己部署。這很好，因?yàn)樗屛覀兡軌蛞愿偷某杀咀龊芏嗍虑椤８顚哟蔚目紤]是，如果他們真的能和我們一起訓(xùn)練出這么好的模型，那么美國公司，包括我們自己，就再也沒有理由不去嘗試類似的事情了。

主持人：

你會(huì)聽到很多公眾人物、思想領(lǐng)袖和生成式AI領(lǐng)域的專家，包括研究人員和企業(yè)家，例如埃隆·馬斯克等人公開表示中國無法趕上。他們認(rèn)為人工智能的主導(dǎo)地位關(guān)系到經(jīng)濟(jì)和世界的主導(dǎo)權(quán)，這件事已經(jīng)被用如此宏大的術(shù)語討論過了。你擔(dān)心中國證明自己能夠做到的事情嗎？

Arvind：

首先，我不知道埃隆是否說過中國無法趕上，他只是指出了中國構(gòu)成的威脅。薩姆·奧特曼也說過類似的話，我們不能讓中國贏得人工智能競賽。我認(rèn)為，你必須將像薩姆這樣的人所說的話，與他的自身利益分開來看。

我認(rèn)為，無論你做了什么來阻止他們趕上，都毫無意義，他們最終還是趕上了。需要是發(fā)明之母。事實(shí)上，比試圖阻止他們趕上更危險(xiǎn)的是，他們擁有最好的開源模型，所有美國開發(fā)者都在此基礎(chǔ)上進(jìn)行開發(fā)。這更危險(xiǎn)，因?yàn)檫@樣他們就能掌握思想市場份額，掌握整個(gè)美國的AI生態(tài)系統(tǒng)。

一般來說，開源軟件一旦趕超閉源軟件，開發(fā)者就會(huì)遷移。這是歷史規(guī)律。但Llama的出現(xiàn)帶來一個(gè)問題：我們應(yīng)該信任扎克伯格嗎？更進(jìn)一步，我們應(yīng)該信任中國嗎？答案是相信開源。開源軟件的優(yōu)勢在于，無論開發(fā)者是誰，無論來自哪個(gè)國家，你都擁有完全的控制權(quán)，你可以在自己的電腦上運(yùn)行它，設(shè)置權(quán)重，你負(fù)責(zé)模型。

然而，依賴他人構(gòu)建的軟件，即使是開源軟件，也并非沒有風(fēng)險(xiǎn)。開源軟件的許可證可能隨時(shí)更改。因此，在美國擁有強(qiáng)大的AI研發(fā)力量至關(guān)重要，這也是Meta的重要意義所在。我們不必阻止Meta，而應(yīng)努力超越它。

美國公司應(yīng)該專注于做得更好。目前，我們聽到更多關(guān)于中國公司效率高、成本低的消息。這是因?yàn)橘Y金雄厚，能投入更多資源。這不是需要責(zé)備的問題，而是資源差異帶來的結(jié)果。

關(guān)于開源的定義也有多種解讀。有人批評Meta沒有完全公開所有內(nèi)容，DeepSeek 也并非完全透明。但并非所有人都具備完全復(fù)制其訓(xùn)練過程的資源。而Meta已經(jīng)通過技術(shù)報(bào)告分享了大量細(xì)節(jié)，遠(yuǎn)超其他公司。DeepSeek的研發(fā)成本不到600萬美元，而OpenAI的GPT模型成本遠(yuǎn)超此數(shù)。

這說明閉源模型的生態(tài)系統(tǒng)軌跡和發(fā)展勢頭與開源模型截然不同。

主持人：這對OpenAI意味著什么？

Arvind：

很明顯，今年我們將會(huì)有一個(gè)開源的4.0版本，甚至更好、更便宜。但這可能是OpenAI以外的其他人做到的。他們可能并不在乎是不是自己完成的。我認(rèn)為他們已經(jīng)轉(zhuǎn)向了O1系列模型這種新的范式，預(yù)訓(xùn)練時(shí)代已經(jīng)結(jié)束。但這并不意味著擴(kuò)展遇到了瓶頸，我認(rèn)為我們現(xiàn)在在不同的維度上進(jìn)行擴(kuò)展。模型在測試時(shí)思考的時(shí)間量、強(qiáng)化學(xué)習(xí)、模型構(gòu)建方式都在發(fā)生變化：如果它不知道如何處理新的提示，它會(huì)推理、收集數(shù)據(jù)、與世界互動(dòng)，并使用各種工具。我認(rèn)為OpenAI現(xiàn)在更專注于此，而不是僅僅追求更大、更好的推理能力模型。

主持人：

DeepSeek可能會(huì)將注意力轉(zhuǎn)向推理嗎？

Arvind:

我認(rèn)為會(huì)的，這讓我對他們的未來作品感到非常興奮。那么，OpenAI目前的護(hù)城河是什么？我認(rèn)為還沒有其他人創(chuàng)造出類似O1的系統(tǒng)。雖然關(guān)于O1是否真正值得有爭議，它在某些提示上表現(xiàn)更好，但在大多數(shù)情況下，它與SONET并無不同。但至少他們在O3中展示了具有競爭力的編碼能力，幾乎達(dá)到了AI軟件工程師的水平。

主持人：然而，內(nèi)網(wǎng)充斥著推理數(shù)據(jù)，這只是時(shí)間問題嗎？

Arvind：這有可能，但現(xiàn)在還不確定。所以，在它完成之前，仍存在不確定性，這或許就是他們的護(hù)城河，因?yàn)榍斑€沒有其他人擁有相同的推理能力。

主持人：但是到今年年底，即使在推理領(lǐng)域，也會(huì)出現(xiàn)多個(gè)參與者嗎？

Arvind：我絕對這么認(rèn)為。

主持人：

我們是否正在見證大型語言模型的商品化？

Arvind：

我認(rèn)為我們會(huì)看到類似于預(yù)訓(xùn)練和后訓(xùn)練的軌跡，這些系統(tǒng)會(huì)被商品化，今年會(huì)有更多商品化出現(xiàn)。我認(rèn)為這種推理模型會(huì)經(jīng)歷類似的軌跡，一開始只有一兩個(gè)參與者真正知道怎么做，但隨著時(shí)間的推移……誰知道呢？因?yàn)镺penAI可以專注于另一個(gè)進(jìn)步。但現(xiàn)在，推理是他們的護(hù)城河。但如果進(jìn)步一次又一次地發(fā)生，“進(jìn)步”這個(gè)詞的意義也會(huì)失去一些價(jià)值。

即使現(xiàn)在，也很困難，因?yàn)橛蓄A(yù)訓(xùn)練的進(jìn)步，然后我們進(jìn)入了一個(gè)不同的階段。

可以肯定的是，現(xiàn)有模型的推理水平和多模態(tài)能力，很快就會(huì)以五到十倍更低的成本出現(xiàn)，而且是開源的。這只是時(shí)間問題。

然而，尚不清楚這種測試推理模型是否足夠廉價(jià)，能夠在手機(jī)上運(yùn)行。這一點(diǎn)我仍不明確。

DeepSeek 的成果改變了太多格局，堪稱中國的“ChatGPT 時(shí)刻”也未可知。這無疑增強(qiáng)了他們的信心，也讓我們感到并未真正落后。無論如何限制算力，我們總能找到解決方法。團(tuán)隊(duì)對結(jié)果非常興奮，這是肯定的。

主持人：

這將如何改變投資格局？那些每年在資本支出上花費(fèi)數(shù)十億美元的超大型云服務(wù)提供商，剛剛大幅增加了支出，而 OpenAI 和 Anthropic 則在籌集數(shù)十億美元購買 GPU。DeepSeek 告訴我們，你并不需要這些。

Arvind：

他們會(huì)更加努力地進(jìn)行推理，因?yàn)樗麄兠靼祝^去兩年構(gòu)建的東西變得非常便宜，繼續(xù)為籌集那么多資金找理由已無意義。支出方案會(huì)改變嗎？他們還需要相同數(shù)量的高端 GPU 嗎？或者可以使用 DeepSeek 擁有這種低端 GPU 進(jìn)行推理？在證明不可行之前，很難說。但本著快速行動(dòng)的精神，你會(huì)想要使用高端芯片，并比競爭對手更快行動(dòng)。

我認(rèn)為最好的天才仍然想在最先促成他們成功的團(tuán)隊(duì)工作。那些真正做到的人，擁有先驅(qū)的光環(huán)，而快速跟進(jìn)者則不然。

主持人：

薩姆·阿爾特曼的推文，是對 DeepSeek 成就的一種含蓄回應(yīng)，暗示他們只是復(fù)制。

Arvind：

任何人都可以復(fù)制。但在這個(gè)領(lǐng)域，每個(gè)人都在復(fù)制其他人。谷歌首先發(fā)明了 Transformer，OpenAI 只是復(fù)制了它；谷歌構(gòu)建了第一個(gè)大型語言模型，但 OpenAI 優(yōu)先進(jìn)行了這項(xiàng)工作。所以，這件事有很多種說法。

主持人：

我曾問過你為什么不想構(gòu)建模型，那是一種榮耀。一年后，你會(huì)因?yàn)闆]有參與那場激烈而昂貴的競爭而顯得非常聰明，并且你在生成式 AI 的實(shí)際應(yīng)用，殺手級應(yīng)用上占據(jù)了領(lǐng)先地位。

談?wù)勥@個(gè)決定，以及它如何引導(dǎo)你以及你對 Perplexity 未來展望。

Arvind：

一年前，我們甚至無法想象如今的成就。現(xiàn)在是2024年初，我們還未達(dá)到3.5的水平。雖然擁有GPT-4，并領(lǐng)先其他競爭對手，但多模態(tài)能力依然欠缺。鑒于資源和人才優(yōu)勢仍無法超越，我們決定另辟蹊徑。

人們渴望使用這些模型，其中一個(gè)主要用例是：提出問題并獲得準(zhǔn)確、包含來源和實(shí)時(shí)信息的答案。模型之外，還有大量工作要做，例如確保產(chǎn)品可靠運(yùn)行、擴(kuò)展使用規(guī)模以及構(gòu)建自定義UI。我們將專注于此，并充分利用模型改進(jìn)帶來的優(yōu)勢。

Sonnet 3.5的產(chǎn)品表現(xiàn)出色，它顯著降低了幻覺的發(fā)生率，有效解決了問答、事實(shí)核查和信息檢索等問題。這帶來了使用量10倍的增長，用戶數(shù)量也大幅增加，并獲得了眾多大型投資者的認(rèn)可，黃仁勛便是其中一例。

一年前，我們甚至沒有考慮貨幣化，那時(shí)我們專注于產(chǎn)品推廣和規(guī)模建設(shè)。如今，我們開始探索商業(yè)模式，越來越多地關(guān)注廣告模式。

我們理解一些人對于廣告的質(zhì)疑，即在有廣告的情況下能否保證答案引擎的真實(shí)性。我們對此進(jìn)行了充分考慮，只要答案準(zhǔn)確、公正，不受任何廣告預(yù)算影響，即使是贊助問題，其答案也不會(huì)被操縱，用戶也可以選擇忽略。廣告商希望展現(xiàn)品牌最佳形象，這與人際交往中希望展現(xiàn)最佳一面類似。目前我們僅向廣告商收取CPM費(fèi)用，因此我們自身并無動(dòng)力促使用戶點(diǎn)擊廣告。

我們致力于長期正確地解決問題，而不是像谷歌那樣強(qiáng)迫用戶點(diǎn)擊鏈接。

一年前，模型商品化還備受爭議，但現(xiàn)在已不再如此。密切關(guān)注這一趨勢非常明智。我們從模型商品化中獲益良多，同時(shí)也需要為付費(fèi)用戶提供更高級的功能，例如更復(fù)雜的搜索代理，能夠進(jìn)行多步推理，并提供分析性答案。所有這些功能都將保留在產(chǎn)品中。

然而，免費(fèi)用戶每天都會(huì)提出許多需要快速解答的問題，因此免費(fèi)服務(wù)必須保持快速響應(yīng)。這將是免費(fèi)的，這是用戶習(xí)慣，這意味著我們需要找到一種方法讓免費(fèi)流量也能獲利。我們并非試圖改變用戶習(xí)慣，而是引導(dǎo)廣告商適應(yīng)新的習(xí)慣。他們無法再依賴谷歌的十個(gè)藍(lán)色鏈接搜索模式。

目前，廣告商的反應(yīng)積極。許多品牌，例如Intuit、戴爾等，都在與我們合作進(jìn)行測試，并對未來充滿期待。他們都明白，未來五年到十年內(nèi)，大多數(shù)人都會(huì)轉(zhuǎn)向AI尋求答案，而非傳統(tǒng)的搜索引擎。他們都想成為新平臺和新用戶體驗(yàn)的早期采用者，并參與其中。他們沒有采取觀望態(tài)度，而是積極參與。

主持人：

這正好印證了你一開始提出的觀點(diǎn)：需求是所有發(fā)明之母。廣告商們認(rèn)識到行業(yè)正在變化，他們必須適應(yīng)。

非常感謝你抽出時(shí)間。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.