估值接近百億,最新一輪融資高達 9 億美元,Cursor 無疑是今年風頭最勁的 AI 產品。Cursor 不僅是一個 AI 協助編程的工具,更加是創造了「vibe coding」的理念,一種主打低代碼甚至零代碼的編程方式。
能在「套殼」的賽道上,真正闖出名堂,過程總比表象來得更艱辛。在做 AI 編程這個業務之前,Cursor 的初創團隊曾經在其它更硬工程的領域兜兜轉轉,直到最后意識到:創業太難了,還是要做點自己喜歡的。
Cursor CEO Michael Truell 作客 Y Combinator 的播客節目,分享了兩次創業以來的經驗,他重申了那個聽起來有點陳詞濫調,但總是有用的理念:
毫不懷疑,永遠堅信,直到時間證明你是對的。
下文為訪談內容,經編譯及刪減。
Garry Tan:
歡迎你,Michael。我們都知道并且非常喜歡 Cursor,你說過,Curosor 的目標是發明一種新型的編程方式,在這種方式下,你可以只描述你想要的東西,然后就可以構建它了。展開講講吧。
Michael Truell:
是的,公司的目標是用更好的東西代替編碼。我和我的 3 位聯合創始人,我們已經做程序員很長時間了。編程吸引我們的一點是,你可以非常快速地構建東西。但編程需要編輯,數百萬行深奧的正式編程語言,需要做很多很多的工作才能真正在屏幕上顯示出一些易于描述的東西。
我們認為,在未來的 5 到 10 年里,有可能發明一種新的方法來構建更高水平、更高效的軟件,我們使用 Cursor 的目標是到達那里。我們實現這一點的途徑是使用 AI 編程,然后不斷發展,將其從普通編程發展到看起來非常不同的東西。
Garry Tan:
所以有些人會說這就是我們今天所擁有的——你描述你想要什么,然后它就會出現。我們達到你真正想去的地方了嗎?
Michael Truell:
我們正在看到事情真正發生變化,在較小的代碼庫中,在一小部分軟件工作人群中,感受到變化最大。我們已經看到人們在代碼之上邁向更高的抽象層次。
但我認為還有很長的路要走。我認為 vibe coding 或編程的整個想法,如果不真正查看代碼并理解它,它就不會真正起作用。如果你現在要處理數百萬行代碼和數十或數百人在多年的時間里從事某件事情,你不能避免思考代碼。
我們的主要重點是幫助專業程序員、面向那些以構建軟件為生的人。在這些環境中。人們越來越多地使用 AI 進行編程。我們看到有人使用 AI 編寫 40% 到 50% 的 Cursor 內生成的代碼行,但這仍然是一個讀取 AI 生成的所有內容的過程。因此,我們需要跨越的一個重要鴻溝是產品。我們將會達到一個不再是生產力工具的階段,它可以幫助你閱讀、編寫、理解代碼。
Garry Tan:
有一些初創公司顯然是從零行代碼開始的,所以這好像很容易。你覺得有沒有一個界限,在那之上,僅僅是 vibe coding 就不太夠了?
Michael Truell:
如果打算讓代碼在很長一段時間內保持穩定,那么我們絕對不建議您使用 vibe coding。我認為,當你是幾 個人的初創公司時,并試圖弄清楚你在做什么時,開發的一個特點通常是:代碼只能存在數周。
現在,我們正處于這樣一個階段,AI 正在為你提供幫助,對嗎?要么將任務委托給人工智能,對它們說: 去幫我做這件事,去回答這個問題。
編程有時候是非??深A測的,當你只是在旁邊觀察某人工作時,你知道,他們接下來 10 分鐘、15 到 20 分鐘的工作內容。所以這種標簽頁的形式可以發揮很大作用。而且這種委托給另一個人的代理形式也可以發揮很大作用。
一旦這些開始變得成熟,對于 25%、30%的專業開發工作,可以完全端到端地依賴這些工具,而不用真正去關注具體細節。那么接下來需要弄清楚的是,關于如何讓這些在現實世界中真正發揮作用。
如果我們是一個幫助人類將頭腦中的想法轉化為屏幕上內容的工具,那么給人們對最細微細節的控制權總是很有幫助的。這是我們面臨的產品挑戰之一:你應該總是能夠編輯邏輯中非常具體的部分。
我認為一個有用的用戶界面是將軟件的邏輯寫下來。然后你可以指向邏輯的各個部分并實際編輯它們。但是如果我們達到一個你不必太關注代碼的地步,那個寫下來的軟件邏輯版本就必須變得更高層次。
我們對此感到興奮,在讓代理工作起來之后,在讓標簽頁形式變得非常成熟之后,AI 是否真的會改變編寫和查看編程語言的含義?
Garry Tan:
是跟上下文窗口有關嗎?一旦你超過大約 100 萬到 200 萬個 token,甚至我覺得直到最近 100 天我們才獲得了可用的 200 萬 token 長度,這是一個階段。一旦你的代碼庫達到一定規模,就必須使用 RAG(檢索增強生成),它有不完整的上下文,然后就無法做到人類程序員能做的事情?
Michael Truell:
是的,我認為在 agent 達到人類水平方面存在許多瓶頸。上下文窗口方面肯定是一個問題,如果你有 1000 萬行代碼,那大概是 1 億個 token,既要有一個能夠實際攝取這些內容的模型,又要讓它具有成本效益,然后不僅僅是要有一個能夠將這些內容攝取到其權重中的模型,還要有一個能夠有效關注那個上下文窗口的模型。這很復雜。
我認為這是這個領域需要解決的問題。而且這不僅僅是代碼庫的問題。這也是一個持續學習的問題:了解組織的背景和過去嘗試過的事情,以及讓模型真正持續學習某些東西的問題,這是我認為這個領域仍然沒有很好解決方案的問題。訓練這些模型的機構缺乏真正良好的長期上下文數據,所以我認為這將會很棘手。但是持續學習和長期的背景知識絕對是瓶頸。
在網上有一個關于過去一兩年在最大時間長度方面進展的驚人圖表。AI 能夠在一個任務上運行的時間已經從幾秒鐘增加到——我不知道這些數字實際上是如何得出的但有人聲稱,一些最新的模型可以達到一個小時。當然不同模態還存在問題,所以要成為一個軟件工程師,你需要運行代碼然后處理輸出。
所以計算機使用對于代碼的未來將是重要的,能夠運行代碼,能夠查看 Datadog 日志并與人類使用的那些工具進行交互。有很多我們將不得不面對的已知問題,還有很多我們將不得不面對的未知問題。
然后我要指出的一件事是,我認為僅僅有一個文本框來要求軟件更改的用戶界面是不精確的。所以,如果你關心人類能夠控制屏幕上顯示的內容,你就需要一種不同的界面方式讓他們進行交互。
一個潛在用戶界面是編程語言的演進,變成更高層次的東西。另一個可能是用戶界面的直接操作,能夠指向屏幕上的東西并說,哦,變這個,或者自己調整這些值。
Garry Tan:
這似乎是一堆剛剛冒頭的東西,對吧?模型似乎沒有明確的美學感知,所以也許這個需要人類設計師能夠看到。
Michael Truell:
看到它們在美學方面有所改善是很有趣的。我們的理解是,你教這些模型在美學等方面做得更好的方式,并不像你教人類那樣。它是通過收集大量數據,并對它們進行強化學習。這就是你在這個任務中的教學方式。這是一項足夠多的人關心的任務,你可以支付所有這些的成本,你可以去訓練并將其融入基礎模型中。
Garry Tan:
因此,考慮到每個人都在建設的未來,而你無疑是站在前沿的領導者,你認為未來作為一名軟件工程師,什么是不可替代的或類似的基本要素?是審美嗎?
Michael Truell:
人們通常在思考軟件的視覺方面時會考慮這個問題。我認為軟件的非視覺方面也需要審美:關于邏輯如何工作。而現在,主動編程某種程度上會弄清楚你到底想要東西如何工作——比如你通過編寫的邏輯真正定義的是什么產品,以及實現細節的高層次審美,即如何將其映射到物理計算機上——這些都捆綁在一起。
但是現在,很多編程都是你在做的一種人工編譯,你知道自己想要什么。你真的必須為計算機詳細說明,因為你能夠用來向計算機描述事物的語言是正常的編程,就是,你知道,for 循環、if 語句、變量和方法。你必須詳細說明。
所以我認為越來越多的那種人工編譯步驟將會消失,計算機將能夠填補空白,填補細節。但是由于我們的工具是幫助你實現的,幫助你構建你想的東西的那種品味,我認為永遠不會消失。
Garry Tan:
這很有道理。有句話說優秀的人會幫助你達到你能看到的標準,但真正偉大的、真正精通的人,他們能達到一個你甚至看不見的更高標準。而這需要審美。你把這稱為人們需要成為邏輯設計師。在意圖驅動編程方面,這意味著什么呢?
Michael Truell:
隨著這項技術越來越成熟,隨著我們越來越接近一個編程可以自動化,可以用更好的構建軟件的方式取代的世界,我認為會有很多影響。
一個是,專業的開發人員只會變得更加高效。千人軟件項目的進展速度如此之慢,百人軟件項目的進展速度如此之快,很瘋狂,其中很大一部分歸結于現有邏輯的重要性,只是讓你發揮最好的一面。
隨著這項技術越來越成熟,當我們越來越接近一個編程可以被自動化并且可以被更好的軟件構建方式取代的世界時,我認為會有很多影響。我認為其中一個是,專業開發者將變得更加高效。
千人軟件項目的進展速度,百人軟件項目的進展速度,以及真正的專業軟件項目的進展速度都慢得令人發狂,很大程度上這歸結于現有邏輯的負擔,就是讓你不堪重負。當你在一個代碼庫中時,可以從頭開始,你可以很快地做事情,當你改變某些東西時,卻會有一堆其他的東西隨之破壞而需要你去修復。
我認為其中一個影響將是,下一個分布式訓練框架,下一個數據庫或下一個視覺設計工具的構建速度將會快得多,下一個 AI 模型也是如此,如果你和實驗室交談,他們很大程度上在工程能力上受到瓶頸限制。我認為所有這些都會大幅改善。
我的第一份工作之一實際上是在一家生物技術公司工作,這是一家由實驗室科學家組成的公司。他們正在開發治療疾病的藥物,我是被聘用的第一個軟件工程師,他們正在生成大量的化學物質,然后讓它們通過這些生物實驗。然后他們需要讀取結果來弄清楚應該進一步研究哪些化學物質,需要大量的內部軟件開發來做這件事。
令人驚訝的是,看看現有的工具,它們是多么糟糕。然后想到這家軟件不是核心競爭力的公司,必須出去做這種瘋狂、費力的事情——雇傭一個真正的軟件工程團隊并培訓他們,讓他們進行內部產品開發,這簡直太瘋狂了。對于這種類型的公司,將會有更多的選擇可供他們使用。
Garry Tan:
換個話題,我想聽聽 Cursor 早期的故事,你在 MIT 遇到了你的聯合創始人 Sule、Arvid 和 Aman,這家公司成立于 2022 年。是什么把你們聚到一起的,你們什么時候意識到這是一個能夠一起構建真正宏大目標的團隊?
Cursor 的創始人團隊
Michael Truell:
我認為我們有很多年輕的天真,在當時可能是沒有根據的。一開始我們就相當有野心。Cursor 實際上來自于我們四個人的一個雄心勃勃的想法練習,你知道,我們都很年輕就開始了編程,然后我們的一些早期工程項目實際上與 AI 有關。我們中的一個人致力于提高機器人強化學習的數據效率,就是教機器人非??焖俚貙W習新任務。那是我們早期的 AI 項目之一。
另一個人致力于構建 Google 的競爭對手,使用神經網絡來嘗試快速構建一個令人驚嘆的網絡搜索引擎。其他人在 AI 方面做學術工作,但在 2021 年有兩個時刻讓我們真正興奮地想要建立一家專注于 AI 的公司。
其中一個是使用第一批真正有用的 AI 產品,其中 AI 真正處于核心地位,GitHub Copilot 老實說是那個讓我們真切感受到現在真的可以用 AI 制作非常有用的東西的時刻,我們不應該去實驗室工作來做這些事情。相反,是時候讓這些東西進入現實世界了。
另一件讓我們真正興奮的事情是看到來自 OpenAI 和其他地方的研究,顯示有這些非??深A測的自然法則,表明如果你擴大數據規模并擴大投入這些模型的計算量,它們就會變得更好。
我們想要選擇知識工作的一個領域,然后致力于隨著 AI 變得更加成熟,那個知識工作會變成什么樣。我們對這樣一種公司的形態非常感興趣:為那個知識工作領域構建產品。首先,隨著底層技術變得更加成熟,你就可以演進做那件事的形態。其次,即使在那時,很明顯你可能需要的不僅僅是擴大語言模型的規模到 GPT 級別,繼續推進底層機器學習進展的一種方式是獲得產品數據。
我們實際上并不太了解機械工程,我們研究了一段時間的計算機設計副駕駛。所以我們在訓練 3D 自動補全模型,幫助那些在 Solidworks Fusion 360 這樣的軟件中對他們想要構建的零件進行 3D 建模的人,試圖預測他們將要對幾何形狀做出的下一步改變。這是一個有趣的問題。這是學術界一直在研究的問題。實際上這也是 DeepMind 稍微研究過的問題。
Garry Tan:
這些都不是大語言模型。
Michael Truell:
你可以完全用 3D 來做,或者你可以說是我們研究了一段時間的一個方向,就是將其轉化為語言問題,你把某人在 CAD 系統中所做的步驟轉化為方法調用。相當復雜,但我們研究了一段時間。
這有幾個原因。一個是我們對機械工程真的沒有像對編程那樣興奮。我們都是程序員。另一個是,我認為當時的科學技術還沒有為 3D 做好準備,比如預訓練模型在這方面還不夠好。沒有很多數據?;ヂ摼W上 CAD 模型的數據比代碼少好幾個數量級。所以很難制作一個有用的模型,或者當時很難為那個領域制作一個有用的模型。
Garry Tan:
你會和那些使用 CAD 或機械師之類的人坐在一起嗎?
Michael Truell:
我們就是這樣做的。我們進行了大量的用戶訪談,我認為我們可以做得更好。我認為,在年輕的天真中,我們每天都在運轉,每周按小時計算任務,回顧我們在這方面花費的時間,我認為提早點更好。或者去一家雇傭機械工程師三周的公司工作吧,我認為那是非常有價值的,可以替代類似的數百個用戶訪談中的一些。
Garry Tan:
我猜除此之外,你還在訓練自己的模型來做到這一點,使用強化學習,這非常有用。同時學習如何啟動大型集群來實際訓練這些模型。
Michael Truell:
是的,我們當時并不知道。但是,是的,我們在那里做的一些事情最終對我們有用。它做了很多行為克隆,更少的 RL,但是在尋找人類所做的好的例子,然后訓練 AI 去做這些事情。訓練數百億參數的大型語言模型并不是當時很多人在做的事,而且老實說,現在也沒有那么多人訓練超過 100 億的參數規模、大型語言模型和機器學習模型。
因此,基礎設施的狀態非常非常早。我們正在做像 4k Megatron LM 或微軟這樣的事情,剝離內部結構,部署用于訓練的東西,甚至在推理方面,在那個時期,我們大規模運行了幾件事情。現在在 Curosr 中,我們每天通過自己的推理進行超過 5 億個模型調用,并且了解當時進行推理的一些經驗,并且當時的訓練對于 Curosr 體驗絕對是非常有用的。
Garry Tan:
所以,有一件事我覺得既非常勇敢、又非常有遠見,那就是你們在某個時刻停下來,說:「其實我們對 CAD 了解得還不夠,我們需要換一條路?!?/p>
當時是從訓練 CAD 模型開始的嗎?是不是最初的路徑是:看到大模型實驗室已經掌握了擴展能力,而 CAD 是一個可以深入的領域,于是就朝那個方向走下去?然后你們意識到,其實需要做的是別的事情。那么,真正讓你們轉向現在這個方向的那個契機是什么?
Michael Truell:
這并不是一時興起的想法。我們本身就是程序員,也受到像 Copilot 這樣的產品和早期 Codex 論文的啟發。我還記得,當時我們為了說服投資人支持我們這個聽起來有點瘋狂的 CAD 點子,做過一件事:我們算了一下訓練 Codex,第一個代碼模型,大致需要多少錢。按我們的粗略計算,大概只需要九萬美元或者十萬美元左右。這個數字當時讓投資人非常吃驚,也在某種程度上幫助我們籌到了足夠的資金去推進 CAD 項目——因為那個項目一上來就得開始訓練模型。
我們其實一直都很關注編程方向,也一直對 AI 會如何改變編程這件事感到興奮。但當時我們對投身這個領域還是有些顧慮,因為已經有很多人在做了,Copilot 本身就很厲害,還有幾十家其他公司也在做類似的事。
我們后來決定放下 CAD 項目——那個方向本身相對獨立,但科學上不太順利,我們自己對那個領域也逐漸失去了興趣。而真正讓我們重新回到編程方向的,是我們自身的興趣,而支撐我們繼續走下去的信心,則來自兩方面:
一是我們看到過去九個月左右,其他人在這個領域的進展似乎沒有我們想象中那么快;二是我們認真想了一下,如果我們真的相信自己的判斷,那么五年之內,所有的編程都會通過這些模型完成,編程這件事的本質會徹底改變。要走到那一步,無論是產品層面還是模型層面,都還需要邁出很多關鍵的躍遷,而這個方向的天花板實在太高了。
與此同時,我們也觀察到,現有的一些參與者好像并沒有真正立志去實現一種「全然不同的編程方式」,他們的野心并不在那個層面,也缺乏真正去實現那個目標的執行力。
第一次的經驗告訴我們,建立一家公司很難,所以不妨去做你真正興奮的事情。那個時候,我們開始著手研究公司的未來。
Garry Tan:
聽起來你們當時的判斷格外有遠見。大概一年前,Sam Altman 也坐在這把椅子上說過類似的話:如果你在賭模型不會變得更聰明,那就是個糟糕的賭注。你應該始終相信模型在接下來的 12、18、24 個月里會變得更聰明——而事實也確實越來越印證了這一點。
而你們聽起來是在他這么說之前整整提前了 12 個月,就已經下定了這個賭注。
Michael Truell:
是的,當時我們內部有一句話叫做 「follow the line」——意思就是始終要沿著那條進步的曲線前進,并為它的走向做規劃。
這個理念其實可以追溯到「擴展法則」(scaling laws):只要你沿著這條線走,這些模型就會不斷變得更好、更強、更聰明。我們相信這條曲線不會停,所以產品設計和路線規劃也得始終對準它,提前為模型的飛躍做準備。
Garry Tan:
彼得·蒂爾有句經典的問題是:「你相信什么,而別人都不相信?」而你們當時相信了這件事——而且事實證明你們是對的。也正因為如此,你們才能走到那個「冰球即將落點」的地方。
Michael Truell:
是的,我想這是我們當時的一個優勢。雖然現在這些觀點已經變得非常主流了,但回到當時——比如說 2022 年,那真的是一個瘋狂且關鍵的轉折點。
那一年年初,幾乎沒人真正談論 AI。GPT-3 是前一年發布的,Copilot 當時剛處在測試階段(2021 年),可能 2022 才正式上線。之后才慢慢開始引起注意。我們還清楚地記得當時一系列產品的發布,比如 InstructGPT,它通過指令微調讓 GPT-3 更好用了一點;夏天的時候是 DALL·E,那次發布非常直觀地打動了一些原本并不關注這個領域的人,讓他們開始正視 AI 的發展。
再接下來是 PaLM 和 Stable Diffusion,然后是 RLHF(人類反饋強化學習)、GPT-3.5 的出現。這些模型的能力提升非???,卻并沒有伴隨訓練成本的大幅上漲,這點非常引人注意。
有傳言說,從 GPT-3 到 ChatGPT(也就是大家真正關注的爆發點)之間,訓練成本只增長了大約 1%。這太瘋狂了。而促成這巨大躍升的,是對指令的微調(instruction tuning)、RLHF,以及一些其他細節調整。
Garry Tan:
你還記得有沒有哪些具體的產品功能或路線上的決策,是基于你們相信模型不僅會變得更聰明,而且會變得非常非常聰明這一前提做出的?這些決策后來有沒有真的成為讓你們「贏下比賽」的關鍵?
因為你之前也提到,其實當時這個領域里確實還有十幾家很不錯的公司在做類似的事——但最終你們走到了前面,是不是和你們在早期就押注模型飛躍式進化、并據此做出不同產品路線有關?
Michael Truell:
我們當時做出的一個不那么顯而易見的產品決策,就是不做瀏覽器插件(extension),而是選擇從頭構建一個編輯器(editor)。在當時,這個選擇對很多人來說并不直觀,甚至有點反常。
但它背后的邏輯其實來自我們對未來的激進設想——我們相信所有編程最終都會通過這些模型完成,而且整個編程的樣貌會完全不同。要實現那種形態,你就必須對用戶界面(UI)有完全的控制權,不能受限于現成的平臺或接口。所以我們從一開始就決定構建自己的編輯環境,而不是附著在別人的系統里。
Garry Tan:
2025 年了,我覺得我們其實才剛剛踏入「智能時代」的序幕,真的是一場徹頭徹尾的革命。你個人現在最讓你興奮、最期待的是什么?
Michael Truell:
我覺得未來這十年,大家的「創造力」都會被極大放大——那些一直活躍在創作第一線的人會更有力量,而更多之前沒機會動手的人,也會變得觸手可及。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.