用聲音,聽見真格。
「此話當(dāng)真」是一檔泛商業(yè)類播客,我們希望搭建這樣一個(gè)分享和交流的平臺(tái),讓每一個(gè)對商業(yè)、科技、創(chuàng)投充滿好奇的人都能在這里有所收獲。每期播客將會(huì)由不同的真格投資人擔(dān)任主持,和各領(lǐng)域的領(lǐng)軍人物一起帶大家深入了解科技趨勢,以及創(chuàng)新技術(shù)的影響力。交流科技熱點(diǎn),我們只想給你最專業(yè)的解讀。
當(dāng)然,我們希望這不僅僅是一個(gè)播客,更是一次創(chuàng)業(yè)的探索。真格,你的創(chuàng)業(yè)第一站!我們期待與你相遇,一同發(fā)現(xiàn)新的可能。
回顧 2024 年,AI Coding 無疑是過去一年里最炙手可熱的領(lǐng)域之一,Cursor、Poolside、Cognition、Magic、Codeium、Replit 等多家獨(dú)角獸的出現(xiàn),都在反復(fù)驗(yàn)證著這一市場需求。
從更長遠(yuǎn)的時(shí)間尺度來看,Agent 是 AI 落地人們?nèi)粘I畹淖钚】赡軉挝弧T谶^去不到兩個(gè)月的時(shí)間里,Coding Agent 已經(jīng)完成在產(chǎn)品形態(tài)上的二連跳,從能夠上下文預(yù)測的 IDE 編程助手 Cursor,到實(shí)現(xiàn)支持多輪對話的 Replit,用戶得到的「交付物」已不只是基于搜索關(guān)鍵詞的網(wǎng)頁,而是根據(jù)自身需求生成的軟件。12 月 11 日,Cognition AI 正式對公上線「AI 程序員」Devin,不僅能為用戶提供建議、自動(dòng)執(zhí)行指令任務(wù),更能獨(dú)立完成對整個(gè)軟件項(xiàng)目的開發(fā),再次打開了世人對 Coding Agent 全新的想象空間。
12 月 21 日,在 OpenAI 連續(xù) 12 天發(fā)布會(huì)的最后一天,o3 模型重磅登場。在由真實(shí)世界軟件任務(wù)組成的 SWE-Bench Verified 基準(zhǔn)測試中,o3 模型獲得了 71.7% 的準(zhǔn)確率,比 o1 模型高出 20% 以上;在評(píng)估 AI 類人推理能力的 ARC-AGI 測試中,則取得了 87.5% 的分?jǐn)?shù),首次突破人類水平閾值(85%)。OpenAI 首席執(zhí)行官山姆·奧特曼在發(fā)布會(huì)上表示,「我們認(rèn)為這是AI下一階段的開始。o3 能夠完成許多復(fù)雜且需要深度推理的任務(wù),尤其在編程和數(shù)學(xué)領(lǐng)域表現(xiàn)令人難以置信?!?/p>
展望 2025 年,AI 領(lǐng)域還有更多值得思考的問題。底層大模型突破后,AI Agent 還會(huì)以怎樣的形態(tài)出現(xiàn)?Coding Agent 產(chǎn)品的核心能力與技術(shù)壁壘在哪里?未來的組織里又需要怎樣的新員工?下一代的「互聯(lián)網(wǎng)」會(huì)以怎樣的形式到來?在面向未來的開放式想象中,Coding Agent 和以 RL(強(qiáng)化學(xué)習(xí))為新范式的 o3 系列,都會(huì)是所有討論里無可回避的焦點(diǎn)。
眼下,陳舊的想象已然無法滿足技術(shù)的野心。或許能夠?qū)崿F(xiàn) end-to-end 的 Coding Agent,能做成的事情已遠(yuǎn)不止 Coding 本身。以改變?nèi)藗兊墓ぷ鞣绞綖槠瘘c(diǎn),Agent 是人們邁向 AGI 的最小單位,而每次迭代帶來的全新范式,都在反復(fù)提醒人們這樣一個(gè)事實(shí) —— 未來,正在加速到來。
內(nèi)容綱要
為什么說 Devin 展示了「工作」的 scaling law?
最早引領(lǐng) Coding Agent 潮流的 Replit Agent,以及開源 Devin 項(xiàng)目 - Openhands, 在設(shè)計(jì)中有哪些關(guān)鍵決策?
Coding 領(lǐng)域未來是 Devin 形態(tài)贏家通吃嗎?
底層模型能力之外,Coding Agent 應(yīng)用公司的核心能力和壁壘是什么?
Coding Agent 對未來的社會(huì)組織和工作形態(tài),會(huì)有哪些深遠(yuǎn)影響?
如何看待 o3 超越大部分人類的能力?未來的發(fā)展空間在哪里?
未來,正在加速到來。
主持人
謝巖 Monica:真格基金投資副總裁
聯(lián)合主持人 Peak:真格基金 EIR
嘉賓
戴雨森:真格基金管理合伙人,聚美優(yōu)品聯(lián)合創(chuàng)始人
李珎:Replit Agent 核心成員,Replit 資深工程師
王星堯:Allhands Al (FIFIE OpenHands) 聯(lián)合創(chuàng)始人,首席人工智能官,UIUC PhD
惠彬原:阿里巴巴通義實(shí)驗(yàn)室科學(xué)家
時(shí)間軸
Coding Agent 的發(fā)展演進(jìn)
01:56 嘉賓自我介紹與最近體驗(yàn)到有意思的項(xiàng)目
13:36 Coding Agent 的四個(gè)代際與三次進(jìn)化
16:53 Devin 引發(fā)的全新想象:工作的 Scaling Law
兩家 Coding Agent 公司的創(chuàng)業(yè)故事
20:47 Replit Agent的創(chuàng)業(yè)歷程及關(guān)鍵節(jié)點(diǎn)
25:50 「優(yōu)秀創(chuàng)業(yè)者的產(chǎn)能會(huì)被無限放大?!?/p>
35:59 幾次技術(shù)更新:Integration、Edit 和 UI
38:06 未來不同 Coding Agent 產(chǎn)品形態(tài)會(huì)復(fù)合嗎?
37:30 OpenHands 不同尋常的誕生
47:48 「要用有限的空間,做無限的事情?!?/p>
52:25 開源:用 Coding 推動(dòng)一種技術(shù)民主化
1:02:40 Coding 產(chǎn)品的長期競爭力是什么?
o3 發(fā)布:突破、局限與趨勢
01:07:20 AGI 的未來已經(jīng)近在眼前
01:18:10 解決真實(shí)世界的復(fù)雜問題,o3 還需做什么?
01:22:23 SWE-bench 被「刷爆」,下一個(gè) Benchmark 是什么?
未來,如何做好一個(gè) Coding Agent?
01:34:27 Coding Agent 重要時(shí)點(diǎn)回顧
01:39:23 未來的組織形態(tài),理想工程師的畫像是?
01:56:11 如何提高模型多步驟任務(wù)的能力?
02:05:54 Agent 普及后,底層技術(shù)棧的新機(jī)會(huì)
02:11:30 投資人視角下的創(chuàng)業(yè)機(jī)遇
02:23:27 快問快答
Cursor:https://www.cursor.com/
Cognition labs/Devin:https://app.devin.ai/
Replit:https://replit.com/
Replit Agent:https://docs.replit.com/replitai/agent/
OpenHands:
官網(wǎng):http://github.com/
論文: http://arxiv.org/
VisualWebArena:http://arxiv.org/
TheAgentCompany:
官網(wǎng) http://the-agent-company.com/
論文 http://arxiv.org/
Computer use by Anthropic:https://www.anthropic.com/news/3-5-models-and-computer-use/
你可以通過小宇宙、蘋果 Podcast 、喜馬拉雅收聽我們。如果你對節(jié)目有任何的建議與期待,歡迎在留言區(qū)互動(dòng)~
如果你有任何的創(chuàng)業(yè)想法或合作想法,歡迎發(fā)郵件到 media@zhenfund.com !
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.