99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

NBC火爆專題: DeepSeek超越美國的AI突破,和PerPlexity創(chuàng)始人討論

0
分享至

未經(jīng)許可不得轉(zhuǎn)載,務(wù)必保留原文出處鏈接和公眾號名片


Web3天空之城·城主

【城主說】

DeepSeek R1在美國已經(jīng)徹底爆發(fā)。

正如R1剛發(fā)布那天,本城文章 所預(yù)測,經(jīng)過了幾天發(fā)酵,美國人終于徹底反應(yīng)過來,R1話題在周末刷爆各大主流媒體和輪胎,美國各大AI團(tuán)隊(duì)和實(shí)驗(yàn)室已手持DeepSeek無私分享的寶貴論文來全情投入復(fù)刻R1推理模型實(shí)現(xiàn),并已經(jīng)有了諸多進(jìn)展。DeepSeek這一次確實(shí)為AI屆帶來了足以實(shí)現(xiàn)跨越突破的火種。

在眾多報(bào)道里, CNBC所做的長達(dá)40分鐘的專題報(bào)道“中國新型AI模型DeepSeek如何威脅美國的主導(dǎo)地位”很值得一看,除了主流分析,還邀請了當(dāng)紅AI搜索引擎Perplexity的創(chuàng)始人做了言之有物的深度訪談。

PerPlexity創(chuàng)始人Arvind對DeepSeek及中國在美國打壓之下的AI發(fā)展創(chuàng)新做了很中肯的評價(jià),甚至比很多公知的立場都要客觀,讓城主對這位甚至還沒拿美國綠卡的小哥的印象大有加分。

很有趣的是,主持人和Arvind討論的時(shí)候,還在預(yù)測DeepSeek 推理模型什么時(shí)候會(huì)推出,他們的預(yù)測基本是到今年底。

他們一定沒想到,這個(gè)專訪才過去幾天,DeepSeek的R1就轟動(dòng)了世界。

不多說,這個(gè)NBC專題的全文和視頻完整版和大家分享:

【NBC完整版: 中國新型AI模型DeepSeek如何威脅美國的主導(dǎo)地位 | 油管爆火長篇報(bào)道-嗶哩嗶哩】 https://b23.tv/PMOjOJd

NBC:

中國最新的AI突破領(lǐng)先世界,值得高度重視。這項(xiàng)顛覆性成果并非來自O(shè)penAI、谷歌或Meta,而是一家名為(DeepSeek)的中國實(shí)驗(yàn)室。這一發(fā)現(xiàn)令硅谷震驚,也讓許多人重新審視中國人工智能領(lǐng)域的真實(shí)實(shí)力。

DeepSeek聲稱,其成果的研發(fā)成本僅為不到600萬美元,耗時(shí)兩個(gè)月,而谷歌和OpenAI花費(fèi)數(shù)年時(shí)間和數(shù)億美元才取得類似成果。DeepSeek的開源模型已成為許多美國開發(fā)者的基礎(chǔ)。

DeepSeek發(fā)布的免費(fèi)開源AI模型,在多項(xiàng)測試中擊敗了市場上最強(qiáng)大的模型,包括Meta的Llama、OpenAI的GPT-40和Anthropic的Claud Sonnet 3.5。這些測試涵蓋數(shù)學(xué)、編程和代碼錯(cuò)誤修復(fù)等多個(gè)領(lǐng)域。

DeepSeek的另一個(gè)推理模型R1,在一些第三方測試中也超越了OpenAI的尖端模型O1。在“人類的最后考試”這一新的AI模型評估基準(zhǔn)測試中,DeepSeek的模型表現(xiàn)最佳,或與最好的美國模型不相上下。

令人矚目的是,DeepSeek取得這些成就,是在美國政府對中國實(shí)施嚴(yán)格半導(dǎo)體限制的情況下完成的,這實(shí)際上限制了他們的計(jì)算能力。

在人工智能競賽中,美國對中國實(shí)施了嚴(yán)格的芯片出口管制,切斷中國獲取英偉達(dá)H100等高端芯片的途徑。這些芯片一度被認(rèn)為是構(gòu)建競爭力AI模型的必要條件,眾多企業(yè)爭相搶購。

然而,DeepSeek公司卻另辟蹊徑,利用性能較低的H800芯片構(gòu)建了最新的模型,證明了芯片出口管制并非完全有效的扼喉手段。他們顯著提升了硬件利用效率。

但DeepSeek的神秘面紗背后究竟隱藏著什么?關(guān)于其實(shí)驗(yàn)室和創(chuàng)始人梁文鋒的信息少之又少。據(jù)中國媒體報(bào)道,DeepSeek誕生于一家名為“幻方量化”的對沖基金,該公司管理著約80億美元資產(chǎn)。其官網(wǎng)的使命宣言簡潔明了:懷著好奇心解開AGI的奧秘,以長遠(yuǎn)的眼光解答根本性問題。這與OpenAI和Anthropic等美國AI公司詳細(xì)的章程和組織結(jié)構(gòu)形成鮮明對比。

盡管多次嘗試聯(lián)系DeepSeek,我們均未得到回應(yīng)。其人才隊(duì)伍組建、硬件采購、數(shù)據(jù)獲取等過程都未公開,令人費(fèi)解。但這一謎團(tuán)凸顯了中美之間人工智能對抗的緊迫性和復(fù)雜性。

這不僅僅是DeepSeek一家。其他中國AI模型也憑借有限資源在競爭中占據(jù)了一席之地。李開復(fù)的初創(chuàng)公司01.AI成立八個(gè)月就成為獨(dú)角獸公司,2024年創(chuàng)造近1400萬美元收入,其模型訓(xùn)練成本僅為300萬美元,遠(yuǎn)低于GPT-4的8000萬到1億美元。阿里巴巴的QN也大幅降低了大型語言模型的成本。

這些中國的突破削弱了美國AI實(shí)驗(yàn)室一度占據(jù)的領(lǐng)先地位。2024年初,埃里克·施密特曾預(yù)測中國在AI領(lǐng)域落后美國兩到三年,但如今他已經(jīng)改變了說法。

中國在過去六個(gè)月取得的進(jìn)展令人矚目,多個(gè)中國程序,例如“DeepSeek”,似乎已追趕上OpenAI。這對OpenAI的技術(shù)壁壘提出了重大疑問。

2022年11月ChatGPT發(fā)布時(shí),OpenAI占據(jù)絕對領(lǐng)先地位。如今,它不僅面臨來自中國的國際競爭,還面臨谷歌Gemini、Anthropic Claud和Meta的Llama模型帶來的國內(nèi)競爭。

游戲規(guī)則已經(jīng)改變。功能強(qiáng)大的開源模型的廣泛可用性,使開發(fā)者能夠繞過高成本、高資源消耗的模型構(gòu)建和訓(xùn)練階段。他們可以在現(xiàn)有模型基礎(chǔ)上進(jìn)行構(gòu)建,從而更容易、更低成本地進(jìn)入該領(lǐng)域的前沿。

近兩周,人工智能研究團(tuán)隊(duì)視野更為開闊,對低成本實(shí)現(xiàn)的目標(biāo)也更為雄心勃勃。過去,達(dá)到行業(yè)前沿需要數(shù)億美元甚至數(shù)十億美元的投資。而“DeepSeek”則證明,數(shù)千萬美元的投資也能取得顯著成果。

這意味著任何一家聲稱處于領(lǐng)先地位的公司,例如OpenAI,都可能很快失去其優(yōu)勢。“DeepSeek”能夠快速趕超,正是因?yàn)樗⒃诂F(xiàn)有AI技術(shù)前沿的基礎(chǔ)上,并專注于對現(xiàn)有技術(shù)的迭代改進(jìn),而非重新發(fā)明輪子。

他們采用優(yōu)秀的預(yù)訓(xùn)練大型模型,并使用蒸餾技術(shù),利用大型模型來提升小型模型的特定能力,這是一種非常具有成本效益的方法。通過利用現(xiàn)有數(shù)據(jù)集、應(yīng)用創(chuàng)新調(diào)整以及利用現(xiàn)有模型,“DeepSeek”縮小了差距,甚至出現(xiàn)了“身份危機(jī)”,其自身模型確信自己是ChatGPT。

當(dāng)被問及模型類型時(shí),“DeepSeek”回答說是OpenAI創(chuàng)建的基于GPT-4架構(gòu)的AI語言模型。這導(dǎo)致OpenAI首席執(zhí)行官Sam Altman發(fā)布了影射“DeepSeek”的帖子。

復(fù)制已知有效的方案相對容易,但探索未知領(lǐng)域則充滿挑戰(zhàn)。“DeepSeek”并非完全復(fù)制,它利用OpenAI的輸出和架構(gòu)原理模擬GPT,同時(shí)暗中加入自身增強(qiáng)功能,模糊了自身與ChatGPT的界限。

所有這些都給OpenAI等閉源領(lǐng)導(dǎo)者帶來了壓力,迫使他們證明其高成本模型在競爭日益激烈的情況下仍具有優(yōu)勢。在這個(gè)領(lǐng)域,企業(yè)間普遍存在技術(shù)借鑒現(xiàn)象。例如,谷歌率先應(yīng)用Transformer架構(gòu),OpenAI隨后借鑒并將其產(chǎn)品化。因此,對單一大型語言模型的大規(guī)模投入是否仍是明智之舉值得商榷。

OpenAI面臨著巨大的風(fēng)險(xiǎn)。上一輪融資超過60億美元,但公司尚未盈利,且其核心業(yè)務(wù)依賴于模型構(gòu)建,風(fēng)險(xiǎn)遠(yuǎn)高于擁有云計(jì)算和廣告業(yè)務(wù)的谷歌和亞馬遜等公司。對OpenAI而言,推理能力至關(guān)重要,一個(gè)能夠進(jìn)行分析、邏輯推理和解決復(fù)雜問題的模型,將超越簡單的模式識別。

目前,OpenAI的01推理模型仍處于領(lǐng)先地位,但這一優(yōu)勢能否持續(xù)?伯克利研究人員近期展示了只需450美元即可構(gòu)建一個(gè)推理模型,這意味著低成本構(gòu)建具備推理能力的模型已成為可能,預(yù)訓(xùn)練模型的巨額投入不再是必需。游戲規(guī)則正在改變,保持領(lǐng)先地位可能需要更多創(chuàng)造力而非單純的資金投入。

DeepSeek的突破正值A(chǔ)I領(lǐng)域巨頭面臨諸多挑戰(zhàn)之際。OpenAI正轉(zhuǎn)向盈利模式,并面臨人才流失,如果游戲規(guī)則改變,它能否繼續(xù)以越來越高的估值融資?正如Chamath Palihapitiya所言,AI模型構(gòu)建可能是一個(gè)“金錢陷阱”。

美國政府的芯片限制旨在減緩競爭速度,將美國科技優(yōu)勢維持國內(nèi)。然而,這可能反而促進(jìn)了中國的創(chuàng)新。限制迫使中國尋找解決方案,最終可能創(chuàng)造出更高效的技術(shù)。中國以較低的資本投入取得了顯著進(jìn)展,這令人矚目。DeepSeek作為開源模型,開發(fā)者可以完全訪問并定制其權(quán)重或進(jìn)行微調(diào)。

一旦開源軟件趕上或超越閉源軟件,所有開發(fā)者都會(huì)遷移到開源軟件。關(guān)鍵在于開源軟件成本低廉,成本越低,開發(fā)者采用的吸引力就越大。我們的推理成本為每百萬個(gè)token 0.1美元,僅為同類模型收費(fèi)的三十分之一。這將大大降低構(gòu)建應(yīng)用程序的成本。

例如,構(gòu)建類似Perplexity的應(yīng)用程序,可以選擇向OpenAI支付每百萬個(gè)token 4.40美元,或使用我們的模型只需支付0.10美元。這可能意味著全球人工智能的主流模型將是開源的,各組織和國家將逐漸接受合作和去中心化能夠比專有封閉生態(tài)系統(tǒng)更快更高效地推動(dòng)創(chuàng)新。

來自中國的更便宜、更高效、被廣泛采用的開源模型,可能會(huì)導(dǎo)致全球人工智能格局發(fā)生重大轉(zhuǎn)變。這尤其危險(xiǎn),因?yàn)檫@將使中國獲得市場份額和生態(tài)系統(tǒng)。大規(guī)模采用中國的開源模型可能會(huì)削弱美國的領(lǐng)導(dǎo)地位,同時(shí)使中國更深入地融入全球科技基礎(chǔ)設(shè)施。

開源軟件的許可證是可以更改的,因此在美國本土進(jìn)行建設(shè)至關(guān)重要。這也就是元宇宙如此重要的原因。

如果開發(fā)者因?yàn)樾矢叨笠?guī)模采用這些模型,可能會(huì)產(chǎn)生嚴(yán)重的連鎖反應(yīng),甚至影響面向消費(fèi)者的AI應(yīng)用程序及聊天機(jī)器人生成的回應(yīng)的真實(shí)性。目前世界上真正能夠大規(guī)模構(gòu)建這種技術(shù)的國家只有美國和中國,利害關(guān)系和后果都極其重大,美國的領(lǐng)先地位正懸于一線。

為此,我們采訪了Perplexity的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Arvind Srinivas,他與我們深入探討了DeepSeek及其影響,以及Perplexity的路線圖。這段完整的對話值得一聽,現(xiàn)在開始播放。

主持人:

首先,我想了解中美之間AI競賽的利害關(guān)系。

Arvind:

中國在與美國競爭方面有很多劣勢。

首先,他們無法獲得我們這里可以獲得的所有硬件,使用的GPU比我們低端,幾乎相當(dāng)于勉強(qiáng)使用上一代GPU。更大的模型通常更智能,這自然使他們處于劣勢。

但另一方面,需求是發(fā)明之母。由于資源受限,他們不得不尋找解決方法,最終構(gòu)建了一些更高效的東西。這就像是被迫在有限資源下,想方設(shè)法做出頂級模型。除非數(shù)學(xué)上證明不可能,否則總能嘗試找到更有效的方法。這很可能會(huì)讓他們想出比美國更有效的解決方案,而且他們已經(jīng)開源了成果,我們也能借鑒。但他們培養(yǎng)的人才,最終將成為他們長期的優(yōu)勢。

美國領(lǐng)先的開源模型是Meta的Llama系列,表現(xiàn)優(yōu)秀,可以在電腦上運(yùn)行。但即使在發(fā)布時(shí),質(zhì)量最接近GPT-4的,也是巨大的405B參數(shù)模型,而不是可以在電腦上運(yùn)行的70B參數(shù)模型。所以仍然沒有小型、廉價(jià)、快速、高效的開源模型能夠與OpenAI和Anthropic最強(qiáng)大的模型相抗衡。美國沒有,Mistral AI也沒有。

然后這些人卻搞出一個(gè)令人震驚的模型,API定價(jià)比GPT-4便宜10倍,比Sonnet便宜15倍,速度很快,每秒60個(gè)token。在一些基準(zhǔn)測試中表現(xiàn)相同或更好,在另一些則稍差,但大致處于GPT-4的質(zhì)量水平。他們只使用了大約2048個(gè)H800 GPU,相當(dāng)于大約1500個(gè)H100 GPU,這比GPT-4通常使用的GPU數(shù)量低了20到30倍。總計(jì)算預(yù)算大約為500萬美元。他們用這么少的錢就做出了如此驚人的模型,還免費(fèi)提供,并撰寫了技術(shù)論文。這讓我們質(zhì)疑,如果我們有類似的模型訓(xùn)練方法,就能取得同樣成果。

關(guān)鍵在于效率,成本和時(shí)間都大幅降低,GPU也簡化了。理解了他們的方法后,確實(shí)令人驚訝。閱讀技術(shù)論文后,發(fā)現(xiàn)他們想出了許多巧妙的解決方案,首先是訓(xùn)練了一個(gè)混合專家模型(MOE)。這并不容易,許多人難以追趕OpenAI,尤其是在MOE架構(gòu)方面,主要是因?yàn)榇嬖诤芏嗖灰?guī)則的損失峰值和數(shù)值不穩(wěn)定,經(jīng)常需要重新開始訓(xùn)練檢查點(diǎn),這需要強(qiáng)大的基礎(chǔ)設(shè)施。

他們想出了非常巧妙的解決方案來平衡這一點(diǎn),而無需添加額外的hack。他們還找到了浮點(diǎn)8,8位訓(xùn)練的方法,至少對于某些數(shù)值計(jì)算來說是如此。他們巧妙地確定了哪些需要更高的精度,哪些需要更低的精度。

據(jù)我所知,我認(rèn)為浮點(diǎn)8訓(xùn)練還沒有得到很好的理解。美國大部分的訓(xùn)練仍然在FP16上運(yùn)行,也許OpenAI也是。有些人正在嘗試探索這一點(diǎn),但這很難做到正確。由于提到了必要性,因?yàn)樗麄儧]有那么多內(nèi)存,那么多GPU,他們找到很多數(shù)值穩(wěn)定性方面的東西,使他們的訓(xùn)練能夠工作。

他們在論文中聲稱大部分訓(xùn)練都是穩(wěn)定的,這意味著他們可以隨時(shí)在更多數(shù)據(jù)或更好的數(shù)據(jù)上重新運(yùn)行這些訓(xùn)練。然后它只訓(xùn)練了60天。所以這非常令人驚嘆。

主持人:

可以肯定地說,你很驚訝。

Arvind:

所以我很驚訝。

通常的觀點(diǎn),或者說我不會(huì)稱之為觀點(diǎn),而是個(gè)神話,認(rèn)為中國人只會(huì)抄襲。所以如果我們停止在美國撰寫研究論文,如果我們停止描述我們基礎(chǔ)設(shè)施和建筑的細(xì)節(jié),停止開源,他們將無法趕上。但現(xiàn)實(shí)情況是,DeepSeek v3中的一些細(xì)節(jié)非常出色,如果Meta研究了它并將其中一些內(nèi)容整合到Llama 4中,我也不會(huì)感到驚訝。試圖抄寫下來。對吧?我不會(huì)說抄襲。這就像,你知道的,分享科學(xué)。工程。但是重點(diǎn)是,它正在變化。中國并非僅僅在模仿。他們也在創(chuàng)新。

主持人:

我們不知道它究竟是用什么數(shù)據(jù)訓(xùn)練的,對吧?即使它是開源的。我們知道它部分的訓(xùn)練方式和數(shù)據(jù),但并非全部。有一種說法認(rèn)為它是在公共ChatGPT輸出上進(jìn)行訓(xùn)練的,這意味著它只是被復(fù)制了。但你認(rèn)為它超越了這一點(diǎn)。存在真正的創(chuàng)新。

Arvind:

是的,你看,我的意思是,他們用14.8萬億個(gè)詞元訓(xùn)練它。互聯(lián)網(wǎng)上充斥著大量的ChatGPT內(nèi)容。

如果你現(xiàn)在去看任何LinkedIn帖子或X帖子,大多數(shù)評論都是AI寫的。你一眼就能看出來。人們只是試圖寫作。事實(shí)上,即使在X上,也存在類似Grok推文增強(qiáng)器這樣的工具。或者在LinkedIn上,也有AI增強(qiáng)器。又或者在Google Docs和Word里,也有一些AI工具可以改寫你的內(nèi)容。所以,如果你在那里做了一些事情,然后把它復(fù)制粘貼到互聯(lián)網(wǎng)上的某個(gè)地方,它自然會(huì)包含一些類似ChatGPT訓(xùn)練的元素,對吧?而且很多人甚至懶得去除“我是一個(gè)語言模型”的部分。于是他們就把它粘貼到某個(gè)地方。這很難控制。我想可解釋AI(XAI)也談到了這個(gè)問題。

我不會(huì)因?yàn)椤澳闶钦l?”或“你是哪個(gè)模型?”這類提示而忽略他們的技術(shù)成就,我認(rèn)為這并不重要。

主持人:

長期以來,我們認(rèn)為——我不知道你是否認(rèn)同——中國在人工智能領(lǐng)域落后。這對于這場競爭意味著什么?我們可以說中國正在趕超,甚至已經(jīng)趕超了嗎?

Arvind:

如果說中國正在趕超OpenAI和Anthropic,那么同樣也可以說中國正在趕超美國。許多來自中國的論文試圖復(fù)現(xiàn)O1,事實(shí)上,我看到O1發(fā)布后試圖復(fù)現(xiàn)它的中國論文比美國的還多。DeepSeek能夠訪問的計(jì)算資源與美國博士生大致相同。

這并非為了批評任何人,例如,即使是我們自己,在PerPlexity方面,我們也決定不訓(xùn)練模型,因?yàn)槲覀冋J(rèn)為這成本過高,無法趕上其他研究。

主持人:

但你們會(huì)將DeepSeek整合到PerPlexity計(jì)算中嗎?

Arvind:

我們已經(jīng)開始使用了。他們有API,也開源了,所以我們也可以自己部署。這很好,因?yàn)樗屛覀兡軌蛞愿偷某杀咀龊芏嗍虑椤8顚哟蔚目紤]是,如果他們真的能和我們一起訓(xùn)練出這么好的模型,那么美國公司,包括我們自己,就再也沒有理由不去嘗試類似的事情了。

主持人:

你會(huì)聽到很多公眾人物、思想領(lǐng)袖和生成式AI領(lǐng)域的專家,包括研究人員和企業(yè)家,例如埃隆·馬斯克等人公開表示中國無法趕上。他們認(rèn)為人工智能的主導(dǎo)地位關(guān)系到經(jīng)濟(jì)和世界的主導(dǎo)權(quán),這件事已經(jīng)被用如此宏大的術(shù)語討論過了。你擔(dān)心中國證明自己能夠做到的事情嗎?

Arvind:

首先,我不知道埃隆是否說過中國無法趕上,他只是指出了中國構(gòu)成的威脅。薩姆·奧特曼也說過類似的話,我們不能讓中國贏得人工智能競賽。我認(rèn)為,你必須將像薩姆這樣的人所說的話,與他的自身利益分開來看。

我認(rèn)為,無論你做了什么來阻止他們趕上,都毫無意義,他們最終還是趕上了。需要是發(fā)明之母。事實(shí)上,比試圖阻止他們趕上更危險(xiǎn)的是,他們擁有最好的開源模型,所有美國開發(fā)者都在此基礎(chǔ)上進(jìn)行開發(fā)。這更危險(xiǎn),因?yàn)檫@樣他們就能掌握思想市場份額,掌握整個(gè)美國的AI生態(tài)系統(tǒng)。

一般來說,開源軟件一旦趕超閉源軟件,開發(fā)者就會(huì)遷移。這是歷史規(guī)律。但Llama的出現(xiàn)帶來一個(gè)問題:我們應(yīng)該信任扎克伯格嗎?更進(jìn)一步,我們應(yīng)該信任中國嗎?答案是相信開源。 開源軟件的優(yōu)勢在于,無論開發(fā)者是誰,無論來自哪個(gè)國家,你都擁有完全的控制權(quán),你可以在自己的電腦上運(yùn)行它,設(shè)置權(quán)重,你負(fù)責(zé)模型。

然而,依賴他人構(gòu)建的軟件,即使是開源軟件,也并非沒有風(fēng)險(xiǎn)。開源軟件的許可證可能隨時(shí)更改。因此,在美國擁有強(qiáng)大的AI研發(fā)力量至關(guān)重要,這也是Meta的重要意義所在。我們不必阻止Meta,而應(yīng)努力超越它。

美國公司應(yīng)該專注于做得更好。目前,我們聽到更多關(guān)于中國公司效率高、成本低的消息。這是因?yàn)橘Y金雄厚,能投入更多資源。 這不是需要責(zé)備的問題,而是資源差異帶來的結(jié)果。

關(guān)于開源的定義也有多種解讀。有人批評Meta沒有完全公開所有內(nèi)容,DeepSeek 也并非完全透明。 但并非所有人都具備完全復(fù)制其訓(xùn)練過程的資源。而Meta已經(jīng)通過技術(shù)報(bào)告分享了大量細(xì)節(jié),遠(yuǎn)超其他公司。DeepSeek的研發(fā)成本不到600萬美元,而OpenAI的GPT模型成本遠(yuǎn)超此數(shù)。

這說明閉源模型的生態(tài)系統(tǒng)軌跡和發(fā)展勢頭與開源模型截然不同。

主持人:這對OpenAI意味著什么?

Arvind:

很明顯,今年我們將會(huì)有一個(gè)開源的4.0版本,甚至更好、更便宜。但這可能是OpenAI以外的其他人做到的。他們可能并不在乎是不是自己完成的。我認(rèn)為他們已經(jīng)轉(zhuǎn)向了O1系列模型這種新的范式,預(yù)訓(xùn)練時(shí)代已經(jīng)結(jié)束。但這并不意味著擴(kuò)展遇到了瓶頸,我認(rèn)為我們現(xiàn)在在不同的維度上進(jìn)行擴(kuò)展。模型在測試時(shí)思考的時(shí)間量、強(qiáng)化學(xué)習(xí)、模型構(gòu)建方式都在發(fā)生變化:如果它不知道如何處理新的提示,它會(huì)推理、收集數(shù)據(jù)、與世界互動(dòng),并使用各種工具。我認(rèn)為OpenAI現(xiàn)在更專注于此,而不是僅僅追求更大、更好的推理能力模型。

主持人:

DeepSeek可能會(huì)將注意力轉(zhuǎn)向推理嗎?

Arvind:

我認(rèn)為會(huì)的,這讓我對他們的未來作品感到非常興奮。那么,OpenAI目前的護(hù)城河是什么?我認(rèn)為還沒有其他人創(chuàng)造出類似O1的系統(tǒng)。雖然關(guān)于O1是否真正值得有爭議,它在某些提示上表現(xiàn)更好,但在大多數(shù)情況下,它與SONET并無不同。但至少他們在O3中展示了具有競爭力的編碼能力,幾乎達(dá)到了AI軟件工程師的水平。

主持人:然而,內(nèi)網(wǎng)充斥著推理數(shù)據(jù),這只是時(shí)間問題嗎?

Arvind:這有可能,但現(xiàn)在還不確定。所以,在它完成之前,仍存在不確定性,這或許就是他們的護(hù)城河,因?yàn)榍斑€沒有其他人擁有相同的推理能力。

主持人:但是到今年年底,即使在推理領(lǐng)域,也會(huì)出現(xiàn)多個(gè)參與者嗎?

Arvind:我絕對這么認(rèn)為。

主持人:

我們是否正在見證大型語言模型的商品化?

Arvind:

我認(rèn)為我們會(huì)看到類似于預(yù)訓(xùn)練和后訓(xùn)練的軌跡,這些系統(tǒng)會(huì)被商品化,今年會(huì)有更多商品化出現(xiàn)。我認(rèn)為這種推理模型會(huì)經(jīng)歷類似的軌跡,一開始只有一兩個(gè)參與者真正知道怎么做,但隨著時(shí)間的推移……誰知道呢?因?yàn)镺penAI可以專注于另一個(gè)進(jìn)步。但現(xiàn)在,推理是他們的護(hù)城河。但如果進(jìn)步一次又一次地發(fā)生,“進(jìn)步”這個(gè)詞的意義也會(huì)失去一些價(jià)值。

即使現(xiàn)在,也很困難,因?yàn)橛蓄A(yù)訓(xùn)練的進(jìn)步,然后我們進(jìn)入了一個(gè)不同的階段。

可以肯定的是,現(xiàn)有模型的推理水平和多模態(tài)能力,很快就會(huì)以五到十倍更低的成本出現(xiàn),而且是開源的。這只是時(shí)間問題。

然而,尚不清楚這種測試推理模型是否足夠廉價(jià),能夠在手機(jī)上運(yùn)行。這一點(diǎn)我仍不明確。

DeepSeek 的成果改變了太多格局,堪稱中國的“ChatGPT 時(shí)刻”也未可知。這無疑增強(qiáng)了他們的信心,也讓我們感到并未真正落后。無論如何限制算力,我們總能找到解決方法。團(tuán)隊(duì)對結(jié)果非常興奮,這是肯定的。

主持人:

這將如何改變投資格局?那些每年在資本支出上花費(fèi)數(shù)十億美元的超大型云服務(wù)提供商,剛剛大幅增加了支出,而 OpenAI 和 Anthropic 則在籌集數(shù)十億美元購買 GPU。DeepSeek 告訴我們,你并不需要這些。

Arvind:

他們會(huì)更加努力地進(jìn)行推理,因?yàn)樗麄兠靼祝^去兩年構(gòu)建的東西變得非常便宜,繼續(xù)為籌集那么多資金找理由已無意義。支出方案會(huì)改變嗎?他們還需要相同數(shù)量的高端 GPU 嗎?或者可以使用 DeepSeek 擁有這種低端 GPU 進(jìn)行推理?在證明不可行之前,很難說。但本著快速行動(dòng)的精神,你會(huì)想要使用高端芯片,并比競爭對手更快行動(dòng)。

我認(rèn)為最好的天才仍然想在最先促成他們成功的團(tuán)隊(duì)工作。那些真正做到的人,擁有先驅(qū)的光環(huán),而快速跟進(jìn)者則不然。

主持人:

薩姆·阿爾特曼的推文,是對 DeepSeek 成就的一種含蓄回應(yīng),暗示他們只是復(fù)制。

Arvind:

任何人都可以復(fù)制。但在這個(gè)領(lǐng)域,每個(gè)人都在復(fù)制其他人。谷歌首先發(fā)明了 Transformer,OpenAI 只是復(fù)制了它;谷歌構(gòu)建了第一個(gè)大型語言模型,但 OpenAI 優(yōu)先進(jìn)行了這項(xiàng)工作。所以,這件事有很多種說法。

主持人:

我曾問過你為什么不想構(gòu)建模型,那是一種榮耀。一年后,你會(huì)因?yàn)闆]有參與那場激烈而昂貴的競爭而顯得非常聰明,并且你在生成式 AI 的實(shí)際應(yīng)用,殺手級應(yīng)用上占據(jù)了領(lǐng)先地位。

談?wù)勥@個(gè)決定,以及它如何引導(dǎo)你以及你對 Perplexity 未來展望。

Arvind:

一年前,我們甚至無法想象如今的成就。現(xiàn)在是2024年初,我們還未達(dá)到3.5的水平。雖然擁有GPT-4,并領(lǐng)先其他競爭對手,但多模態(tài)能力依然欠缺。鑒于資源和人才優(yōu)勢仍無法超越,我們決定另辟蹊徑。

人們渴望使用這些模型,其中一個(gè)主要用例是:提出問題并獲得準(zhǔn)確、包含來源和實(shí)時(shí)信息的答案。模型之外,還有大量工作要做,例如確保產(chǎn)品可靠運(yùn)行、擴(kuò)展使用規(guī)模以及構(gòu)建自定義UI。我們將專注于此,并充分利用模型改進(jìn)帶來的優(yōu)勢。

Sonnet 3.5的產(chǎn)品表現(xiàn)出色,它顯著降低了幻覺的發(fā)生率,有效解決了問答、事實(shí)核查和信息檢索等問題。這帶來了使用量10倍的增長,用戶數(shù)量也大幅增加,并獲得了眾多大型投資者的認(rèn)可,黃仁勛便是其中一例。

一年前,我們甚至沒有考慮貨幣化,那時(shí)我們專注于產(chǎn)品推廣和規(guī)模建設(shè)。如今,我們開始探索商業(yè)模式,越來越多地關(guān)注廣告模式。

我們理解一些人對于廣告的質(zhì)疑,即在有廣告的情況下能否保證答案引擎的真實(shí)性。我們對此進(jìn)行了充分考慮,只要答案準(zhǔn)確、公正,不受任何廣告預(yù)算影響,即使是贊助問題,其答案也不會(huì)被操縱,用戶也可以選擇忽略。廣告商希望展現(xiàn)品牌最佳形象,這與人際交往中希望展現(xiàn)最佳一面類似。目前我們僅向廣告商收取CPM費(fèi)用,因此我們自身并無動(dòng)力促使用戶點(diǎn)擊廣告。

我們致力于長期正確地解決問題,而不是像谷歌那樣強(qiáng)迫用戶點(diǎn)擊鏈接。

一年前,模型商品化還備受爭議,但現(xiàn)在已不再如此。 密切關(guān)注這一趨勢非常明智。我們從模型商品化中獲益良多,同時(shí)也需要為付費(fèi)用戶提供更高級的功能,例如更復(fù)雜的搜索代理,能夠進(jìn)行多步推理,并提供分析性答案。所有這些功能都將保留在產(chǎn)品中。

然而,免費(fèi)用戶每天都會(huì)提出許多需要快速解答的問題,因此免費(fèi)服務(wù)必須保持快速響應(yīng)。 這將是免費(fèi)的,這是用戶習(xí)慣,這意味著我們需要找到一種方法讓免費(fèi)流量也能獲利。 我們并非試圖改變用戶習(xí)慣,而是引導(dǎo)廣告商適應(yīng)新的習(xí)慣。他們無法再依賴谷歌的十個(gè)藍(lán)色鏈接搜索模式。

目前,廣告商的反應(yīng)積極。許多品牌,例如Intuit、戴爾等,都在與我們合作進(jìn)行測試,并對未來充滿期待。 他們都明白,未來五年到十年內(nèi),大多數(shù)人都會(huì)轉(zhuǎn)向AI尋求答案,而非傳統(tǒng)的搜索引擎。 他們都想成為新平臺和新用戶體驗(yàn)的早期采用者,并參與其中。 他們沒有采取觀望態(tài)度,而是積極參與。

主持人:

這正好印證了你一開始提出的觀點(diǎn):需求是所有發(fā)明之母。廣告商們認(rèn)識到行業(yè)正在變化,他們必須適應(yīng)。

非常感謝你抽出時(shí)間。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
不忍了!伊朗宣布立即報(bào)復(fù)美國

不忍了!伊朗宣布立即報(bào)復(fù)美國

樵山7988
2025-06-22 12:28:30
伊朗外長:尚未決定關(guān)閉外交對話大門 將前往莫斯科會(huì)見普京

伊朗外長:尚未決定關(guān)閉外交對話大門 將前往莫斯科會(huì)見普京

新華社
2025-06-22 18:28:10
杭新景高速突發(fā)!浙ADR7858,已鎖定!

杭新景高速突發(fā)!浙ADR7858,已鎖定!

FM93浙江交通之聲
2025-06-22 15:35:55
世界最大鉆石交易所遭破壞

世界最大鉆石交易所遭破壞

魯中晨報(bào)
2025-06-20 11:41:19
73場16球+4年禁賽!切爾西最貴水貨被判死刑,身價(jià)暴跌5000萬

73場16球+4年禁賽!切爾西最貴水貨被判死刑,身價(jià)暴跌5000萬

夢憶之淺
2025-06-22 08:18:35
文班亞馬首談少林寺之旅:每天練功夫與世隔絕,曾偷溜出去吃肉

文班亞馬首談少林寺之旅:每天練功夫與世隔絕,曾偷溜出去吃肉

雷速體育
2025-06-22 07:27:43
震驚!馬斯克,突爆大消息!俄羅斯,最新發(fā)聲!

震驚!馬斯克,突爆大消息!俄羅斯,最新發(fā)聲!

證券時(shí)報(bào)
2025-06-21 16:01:08
意外!劉逸一腳踢飛大連英博三百萬贏球獎(jiǎng)金,讓球迷直言太遺憾了

意外!劉逸一腳踢飛大連英博三百萬贏球獎(jiǎng)金,讓球迷直言太遺憾了

懂個(gè)球
2025-06-22 15:22:57
溫柔手術(shù)刀:Whitney Hayes的影像作品深入探討

溫柔手術(shù)刀:Whitney Hayes的影像作品深入探討

國際藝術(shù)大觀
2025-06-22 14:06:33
特朗普服軟了?6枚重型鉆地彈落地后,美國向伊朗做出兩大保證

特朗普服軟了?6枚重型鉆地彈落地后,美國向伊朗做出兩大保證

涼羽亭
2025-06-22 10:43:54
江蘇一考生考試時(shí)說要去廁所,連著去了2趟后,監(jiān)考老師發(fā)現(xiàn)端倪

江蘇一考生考試時(shí)說要去廁所,連著去了2趟后,監(jiān)考老師發(fā)現(xiàn)端倪

坦然風(fēng)云
2025-06-20 19:47:16
《撈女游戲》刺痛了誰的神經(jīng)?游戲爆火的背后,本質(zhì)又是什么?

《撈女游戲》刺痛了誰的神經(jīng)?游戲爆火的背后,本質(zhì)又是什么?

星河四次元
2025-06-21 11:57:42
48歲左小青走紅毯,不知道她尷不尷尬,反正我挺尷尬的,何必呢

48歲左小青走紅毯,不知道她尷不尷尬,反正我挺尷尬的,何必呢

喜歡歷史的阿繁
2025-06-03 11:36:18
老鄉(xiāng)說,上海今天的繁華富裕,和上海人沒有關(guān)系,都是國家的政策

老鄉(xiāng)說,上海今天的繁華富裕,和上海人沒有關(guān)系,都是國家的政策

上海云河
2025-06-21 12:56:17
也門胡塞武裝:與美國達(dá)成停火協(xié)議是在其與伊朗“開戰(zhàn)”之前,我們對美國襲擊伊朗的回應(yīng)只是時(shí)間問題

也門胡塞武裝:與美國達(dá)成停火協(xié)議是在其與伊朗“開戰(zhàn)”之前,我們對美國襲擊伊朗的回應(yīng)只是時(shí)間問題

和訊網(wǎng)
2025-06-22 15:13:11
噩耗傳來,知名三甲醫(yī)院專家意外犧牲,年僅38歲!

噩耗傳來,知名三甲醫(yī)院專家意外犧牲,年僅38歲!

大象新聞
2025-06-21 13:11:04
文胖:杜蘭特希望掌控自己下一站去向的意愿,已大幅降低了他的交易價(jià)值

文胖:杜蘭特希望掌控自己下一站去向的意愿,已大幅降低了他的交易價(jià)值

雷速體育
2025-06-22 18:16:08
在伊中國人講述撤離經(jīng)歷:感謝一個(gè)伊朗女孩,她喜歡中國,想找一個(gè)中國男友

在伊中國人講述撤離經(jīng)歷:感謝一個(gè)伊朗女孩,她喜歡中國,想找一個(gè)中國男友

瀟湘晨報(bào)
2025-06-21 20:21:26
“明日三不空,一年不受窮”,明天五月廿八啥日子?3不空指啥?

“明日三不空,一年不受窮”,明天五月廿八啥日子?3不空指啥?

小談食刻美食
2025-06-22 08:59:19
藏了40年的爸爸竟是陳道明!不拼爹不炒作,怪不得她這么優(yōu)秀

藏了40年的爸爸竟是陳道明!不拼爹不炒作,怪不得她這么優(yōu)秀

卷史
2025-06-14 18:48:15
2025-06-22 19:35:00
Web3天空之城 incentive-icons
Web3天空之城
美好,有趣的,值得銘記的
186文章數(shù) 77關(guān)注度
往期回顧 全部

科技要聞

"你應(yīng)該靠嘴吃飯",羅永浩自述被梁文鋒勸退

頭條要聞

媒體:伊以沖突現(xiàn)重大轉(zhuǎn)折點(diǎn) 中東局勢面臨"危險(xiǎn)升級"

頭條要聞

媒體:伊以沖突現(xiàn)重大轉(zhuǎn)折點(diǎn) 中東局勢面臨"危險(xiǎn)升級"

體育要聞

這一次搶七,快要10年的回歸

娛樂要聞

離婚四年!趙麗穎被曝新戀情惹爭議

財(cái)經(jīng)要聞

蘋果后院起火

汽車要聞

首搭華為雙王牌/6月24日預(yù)售 嵐圖FREE+正式下線

態(tài)度原創(chuàng)

游戲
本地
旅游
健康
公開課

你期待哪款?IGN日本列希望移植到switch2的10款游戲

本地新聞

被貴妃帶火的“唐代頂流”,如今怎么不火了

旅游要聞

熱聞|清明假期將至,熱門目的地有哪些?

呼吸科專家破解呼吸道九大謠言!

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 应用必备| 焦作市| 玉田县| 苍山县| 响水县| 鞍山市| 白水县| 黑河市| 永昌县| 苗栗县| 宁化县| 吉水县| 云霄县| 麻栗坡县| 宜阳县| 景洪市| 桃园市| 凯里市| 城口县| 华容县| 获嘉县| 江山市| 新巴尔虎左旗| 长岭县| 浮山县| 丰原市| 夏邑县| 大田县| 崇信县| 和顺县| 宁蒗| 江安县| 莱阳市| 皮山县| 海丰县| 东台市| 宁蒗| 定南县| 广宗县| 泸定县| 虹口区|