Web3天空之城·城主
【城主說】即日起,天空之城和大家日常分享最新AI科技長訪的內容精讀合集。
感謝科技的進步,每一個長訪都可以有萬字全文,但或許更稀缺的是時間。希望本城日常精讀可以幫助大家在最有限時間里掌握最新的科技商業認知。同時附上完整視頻和全文的鏈接,感興趣的同學可以繼續針對特定內容深入了解。
天空科技商業精讀 0506| 內容目錄
? 埃隆·馬斯克揭示對火星的愿景 20250506
? 英偉達 CEO 黃仁勛| 重塑工業力量:人工智能工廠與美國制造業的回歸 20250503
? Cursor 的崛起:工程師們愛不釋手的年營收3 億美元的 AI 工具 | Michael Truell 20250501
? Windsurf CEO:押注AI代理,轉型以及編程的未來 20250502. YC訪談
? 對話OpenAI的Eric Mitchell和Brandon McKinzie 20250501
? SAP 首席執行官訪談 | 尼古拉唐根播客 20250430
? RL作為產品與研究的協同設計 - 斯坦福CS25 V5 20250429
? ? ?
埃隆·馬斯克揭示他對火星的愿景 20250506
視頻鏈接:
https://www.bilibili.com/video/BV1qGVUz1EwG/
主要內容:
在與埃隆·馬斯克的訪談中,話題超越了DOGE,觸及了人類的未來。馬斯克認為人類正身處險境,并提出了一個旨在拯救我們的計劃。他指出,建立一個自給自足的火星文明,其挑戰性遠超應對華盛頓的問題,例如減少政府浪費與欺詐——盡管后者已取得顯著進展,但SpaceX尚未向火星發送任何實物。前往火星的目的并非短暫訪問,而是為了實現生命的多行星化,擴展意識的范圍和規模,從而更深入地理解宇宙本質,并確保文明的長期存續。這是一種以防地球發生災難性事件(盡管希望渺茫)的后備計劃,是為集體生命購買的“生命保險”。從長遠來看,由于太陽將逐漸膨脹并最終毀滅地球上的所有生命,成為多行星文明是必然選擇,盡管這還有數億年的時間。目前正朝著登陸火星的方向前進,但這遠非終點,真正的目標是在火星上創建一個自給自足的城市。未來命運的關鍵分歧點在于,火星殖民地能否實現完全自給自足。如果它始終依賴可能因各種原因中斷的地球補給線,那么這種“生命保險”便未真正建立。因此,決定我們所知生命命運的關鍵時刻,將是火星實現自給自足的那一刻。
? ? ? ? ?
英偉達 CEO 黃仁勛 | 重塑工業力量:人工智能工廠與美國制造業的回歸 20250503
視頻鏈接:
https://www.bilibili.com/video/BV1iPVyzvEx7/
主要內容:
人工智能正引發一場新的工業革命,它不僅是一項能完成前所未有任務的新技術,更催生了一個全新的產業——人工智能工廠。這些工廠利用大型超算和電力生產我們稱之為智能的“token”,這些token能被格式化為文字、圖像、代碼乃至蛋白質結構等多種形式。這種智能生產將作為新的基礎設施,如同電力般徹底變革和轉型所有行業,從醫療、教育到金融、工程、制造等。因此,未來幾乎所有制造實物的工廠都將伴隨一個生產運行于其產品之上的人工智能的工廠,例如汽車公司不僅制造汽車,也將生產驅動汽車的AI。
人工智能的發展經歷了幾個階段:首先是感知型AI,如計算機視覺,讓機器能夠理解世界;接著是生成式AI,能夠理解信息并進行翻譯或創造,如同一個通用翻譯器;現在我們正進入推理型AI時代,AI能夠分解問題、應用規則進行推理,這催生了自主代理AI,即能夠獨立完成任務的數字機器人,未來企業將同時管理生物勞動力和數字勞動力。下一波浪潮將是物理AI,它理解物理世界的規律,如慣性、因果,這是實現真正機器人技術的關鍵。物理AI對于提升制造業自動化水平至關重要,尤其在美國推動制造業回流、應對勞動力短缺的背景下。
在全球AI競賽中,理解這場“無限游戲”至關重要。這不僅關乎技術研發(知識資本),也涉及核心資源,特別是能源,因為AI工廠本質上是將電力轉化為智能。贏得競賽的關鍵在于應用,如同美國在上一次工業革命中迅速應用鋼鐵和能源那樣,需要擁抱技術、重新培訓勞動力并鼓勵應用。
關于就業,人工智能將創造新工作,淘汰舊工作,并改變每一份工作。極端觀點不可取,從第一性原理看,AI已在復蘇舊金山經濟,因為它改變了軟件開發方式,創造了從數據管理到AI安全防護等全新崗位。建設AI工廠本身就需要金融、建筑、工程以及大量電工、水管工等行業技能人才,這為國家提供了重視和發展行業技能的機會。同時,AI將作為助手提升現有工作的生產力,例如軟件工程師在AI輔助下效率飆升,反而可能因公司能力增強而雇傭更多人。關鍵在于,不是AI本身,而是使用AI的公司和個人將取代不使用者的地位。
對于制造業回流,人工智能是關鍵賦能技術。先進制造業高度依賴軟件和自動化,工廠本身就是巨大的機器人。在國內建設從芯片到AI超算的完整產業鏈是高質量、高技術的就業機會。此外,AI工廠本身就是一種先進制造業。利用AI構建“數字孿生”——在虛擬世界中完整設計、模擬、優化和操作工廠、產品乃至城市——將成為標準做法,這能極大提升復雜制造項目的效率和成功率。機器人技術,作為物理AI的應用,將在受控環境中(如工廠)比自動駕駛汽車更快普及,預計五年左右將大規模涌現,而現有汽車制造商有望成為機器人制造的主力軍。
? ? ? ? ?
Cursor 的崛起:工程師們愛不釋手的年營收3 億美元的 AI 工具 | Michael Truell 20250501
視頻鏈接:
https://www.bilibili.com/video/BV1EhVBzXE3Y/
主要內容:
Cursor的目標是發明一種全新的編程方式,一種截然不同的軟件構建方式,未來將是一個代碼消亡的時代,工程師會更像邏輯設計師,精確地指定期望的運作意圖。AnySphere(Cursor背后的公司)的聯合創始人兼首席執行官邁克爾·特魯爾分享了他的見解。Cursor作為領先的AI代碼編輯器,正處在改變軟件構建方式的前沿,并實現了歷史性的快速增長,在20個月內達到1億ARR,兩年內達到3億ARR。
邁克爾預測,未來的軟件構建將遠離如今的文本編輯和形式化編程語言,也不同于簡單的聊天機器人交互,后者缺乏精確性。他設想一個“代碼之后”的世界,軟件邏輯的表示更接近自然語言或偽代碼,人類能在高層次編輯和指導,同時保持對細節的完全控制和快速迭代的能力。在這個時代,“品味”——即對應該構建什么以及它應如何運作和呈現的正確直覺——將變得比底層實現細節更重要。工程師的角色將從關注“如何實現”轉向關注“是什么”,更側重于邏輯設計而非小心翼翼地避免錯誤,盡管目前過度信任AI仍會帶來問題。
Cursor的誕生源于對AI潛力(特別是GitHub Copilot的早期體驗和AI規模擴展定律)的興奮,以及認為現有編程領域缺乏足夠雄心的判斷。最初團隊曾短暫探索機械工程自動化,但因缺乏熱情和數據獲取困難而轉向編程,認為這里有通過AI實現跨越式發展的巨大空間。選擇構建獨立IDE而非插件,是因為堅信編程范式本身將發生根本性變化,需要對整個用戶界面和體驗進行控制。雖然承認未來可能涉及后臺AI代理(如處理Slack請求),但核心仍是人類主導、精確控制的集成環境。
關于增長,Cursor在一年半內從零增長到1億美元ARR,邁克爾認為成功的秘訣在于持續改進產品,不斷迭代,以及“吃自己的狗糧”。增長是指數級的,但早期感覺緩慢。團隊早期專注于產品本身,而非傳統的銷售和市場營銷。選擇正確的構建方向和有效優先級排序是關鍵挑戰。
在構建過程中,最違反直覺的教訓是,盡管最初未計劃,但定制模型的開發變得至關重要。現在Cursor中每一個“神奇時刻”都涉及定制模型。其技術棧結合了大型基礎模型(如GPT、Sonnet、Gemini)和自研模型。自研模型用于對速度和成本敏感或需要特定能力的場景,如預測編碼序列的增強型自動完成功能,以及在基礎模型輸入端進行代碼庫相關性搜索和在輸出端填充實現細節。這并非簡單的“封裝器”,而是深度整合。
邁克爾認為,在AI編碼領域,持續構建最佳產品是唯一的護城河,因為技術天花板極高,存在被跨越式發展的可能性。他將當前市場比作早期搜索引擎或個人電腦市場,潛力巨大,遠超過去的開發者工具市場,并相信最終會有一個通用的主導工具出現。盡管微軟Copilot有先發優勢,但市場的創新友好特性(易于切換、高投資回報率)以及潛在的內部協調問題,為Cursor等創新者留下了機會。
對于用戶如何更好地使用AI編碼工具,邁克爾建議將任務分解成小塊,逐步指導AI,而非一次性給出宏大指令。同時,鼓勵在安全環境(如業余項目)中大膽嘗試,以培養對模型能力的直覺。他認為AI工具對初級和高級工程師都有巨大幫助,但他們會陷入不同誤區:初級可能過度依賴,高級可能低估其能力。
回顧創業歷程,邁克爾認為早期招聘速度實際上偏慢。找到具備求知欲、實驗精神、求真務實且冷靜的世界級人才是核心,為此公司采用了獨特的為期兩天的現場項目面試方式。保持專注的關鍵在于招聘心態正確的人、持續溝通和以身作則,并對行業噪音建立“免疫系統”。
他強調,人們對AI變革的理解仍存在誤區,要么期望過高過快,要么完全否定。現實是這是一場深刻且持續數十年的變革,需要解決科學和產品體驗層面的諸多問題。像Cursor這樣結合底層技術(整合外部和自研)與特定領域產品體驗的公司,將對推動進步至關重要。對于工程師的未來,他認為需求將持續存在,AI不會取代工程師,而是將他們轉變為更高效的“邏輯設計師”,專注于更高層次的意圖表達,從而釋放巨大的軟件開發潛力。公司仍在積極招聘工程師、設計師、研究員以及業務人員,以抓住這個巨大的市場機遇。
若能將現有技術的成本降低幾個數量級,我們將能創造出遠超想象的更多事物,并在計算機上實現更多功能、開發更多工具。我早年在一家生物技術公司構建內部工具的經歷印證了這一點:現成工具往往不適用,而內部定制工具的需求巨大,遠超個人所能滿足。計算機的物理能力本應讓操作極其流暢,但現實中仍存在諸多障礙。當前軟件開發能力遠未滿足實際需求,即便是簡單的生產力軟件,其開發成本也堪比大制作電影。因此,我認為未來對工程師的需求將不減反增。我們一直在探索如何構建團隊,既能持續改進現有產品,又能不斷創造新事物。要實現這一目標,集成開發環境(IDE)等工具及其未來形態可能需要經歷深刻變革。縱觀那些備受尊敬的公司,能夠駕馭多次技術浪潮并持續引領前沿的實屬罕見,這本身就是一項艱巨的任務。部分挑戰在于回歸第一性原理進行反思,另一部分則在于深入研究歷史上的成功案例,這也是我們經常思考的方向。
? ? ? ? ?
Windsurf CEO:押注AI代理,轉型以及編程的未來 20250502. YC訪談
視頻鏈接:
https://www.bilibili.com/video/BV1oXVqzUEwh/
主要內容:
對于任何初創企業而言,一個不變的真理是必須持續證明自己,因為每一個洞見都在不斷貶值。即便是像英偉達這樣的巨頭,如果停止創新,也會面臨被競爭對手超越的風險。因此,承認許多嘗試可能失敗是完全可以接受的,關鍵在于持續產生并執行新的洞見,否則公司就是在慢性死亡。軟件開發正變得日益普及,“開發者”的概念可能擴展為“構建者”,未來每個人都可能成為構建者。
Windsurf 公司正是這一理念的實踐者,其產品已有超過百萬開發者使用,日活躍用戶達數十萬,廣泛應用于代碼修改和快速應用構建。公司的起源并非一帆風順。最初名為 Exafunction,是一家 GPU 虛擬化公司,旨在簡化深度學習工作負載的運行。盡管在 2022 年中期管理著上萬個 GPU 并實現了數百萬美元收入,但團隊意識到 Transformer 模型的興起將根本性地顛覆其業務,使其面臨被商品化的風險。
面對生死存亡的時刻,公司在一個周末內完成了驚險轉型。基于早期使用 GitHub Copilot 的經驗和對開發者工具未來的判斷,團隊決定全力投入 Codium 項目,一個 AI 代碼補全工具。盡管當時 Copilot 看似擁有巨大優勢,但團隊憑借“非理性的樂觀主義”和“毫不妥協的現實主義”,堅信仍有可為。他們利用自身在模型運行和訓練方面的技術積累,迅速推出了 Codium 的早期版本。
最初版本雖不及 Copilot,但通過免費策略和快速迭代,特別是通過自研模型實現了獨特的“代碼中間填充”能力,在質量和延遲上取得了領先。為滿足戴爾、摩根大通等大型企業客戶在安全性和個性化方面的需求(處理上億行代碼庫),公司迅速將產品擴展到支持包括 IntelliJ 在內的多個 IDE,這一早期架構決策為后續發展奠定了基礎。
隨著業務發展和對技術趨勢的判斷,團隊認識到智能體(agents)將是未來的關鍵,而現有 IDE 無法完全承載其潛力。他們認為未來開發者將花費更多時間審查而非編寫 AI 生成的代碼。因此,公司再次進化,決定推出自有 IDE——Windsurf,通過 Fork VS Code 在不到三個月內實現,并將工程重心放在提升智能體的能力上,如深度理解代碼庫、理解開發者意圖并快速執行代碼修改。Windsurf 成為市場上首個以智能體為核心的編輯器,其理念是快速進行代碼更改,而非僅僅提供只讀的建議。
有趣的是,Windsurf 不僅服務于專業開發者,也吸引了大量非技術背景的用戶進行“氛圍編碼”,賦能領域專家直接構建應用,體現了軟件構建民主化的趨勢。公司內部文化強調快速適應和擁抱變化,并不受競爭對手(如 Copilot, Cursor, Devon)行動的過多影響,而是專注于長期戰略和執行力。
在技術實現上,Windsurf 并未滿足于流行的 RAG(檢索增強生成)和向量數據庫,而是從第一性原理出發,結合關鍵字搜索、AST 解析、實時重排序等多種技術,構建了更復雜的系統以追求最佳的代碼上下文理解和生成效果。這源于團隊早期在自動駕駛領域積累的對嚴格評估體系的重視。通過構建可量化的評估指標(如基于開源項目測試用例的通過率),團隊能夠更有效地驅動開發,避免不必要的復雜性,確保添加的每一項技術都能帶來實際效果。
展望未來,Windsurf 相信 AI 將在軟件開發生命周期的各個環節(設計、編寫、審查、測試、調試)帶來指數級的效率提升,發生速度遠超預期。這使得工程師能從繁瑣的樣板代碼中解放出來,將更多精力投入到更具研究性的、測試假設的工作中。公司在招聘時也更看重工程師的自主性、好奇心、解決問題的能力以及對 AI 工具的開放態度,而非僅僅是編寫特定代碼的技能。對于 AI 編碼領域的創業者,建議關注特定高價值的細分領域,如遺留系統遷移(COBOL 到 Java)或自動化處理軟件告警與錯誤,這些領域存在巨大的、尚未被充分滿足的市場需求。最終,成功的關鍵在于比他人更快地改變想法,將轉型視為榮譽,勇于邁出大膽的步伐。。
? ? ? ? ?
對話OpenAI的Eric Mitchell和Brandon McKinzie 20250501
視頻鏈接: https://www.bilibili.com/video/BV1bPVizYEgZ/
主要內容:
OpenAI 推出了其 O 系列推理模型中的最新成員 O3,由布蘭登·麥肯錫和埃里克·米切爾主導開發。O3 的核心特點是在回應前進行“思考”,并能識別和運用多種工具(如瀏覽網頁、編寫并執行代碼)來完成多步驟任務。這種能力不僅使其在數學或事實性問題上比前代模型更智能、更準確,還能通過整合最新信息或執行復雜計算來顯著增強其實用性,從而能處理如公司盡職調查或數據分析等更高級別的復雜請求。與核心基礎模型不同,O3 在推理時投入更多計算,并利用強化學習針對性地解決困難任務,而非僅僅是預測下一個詞元。工具的使用被認為是提升模型能力和實現有效“測試時擴展”的關鍵,尤其在模型需要外部信息或精確計算時,能將任務分配給更合適的工具,提高效率。用戶體驗也因此改變,等待模型思考的時間通常能帶來更好的結果,思考時間與準確性存在正相關關系。未來可能出現模型分化:快速廉價的基礎模型與能深入思考、處理復雜任務的強大模型并存,但理想方向是讓模型更強大且能自主判斷所需的思考深度,實現直觀交互。研究人員也在探索如何讓模型具備可控性,例如根據 API 調用或用戶需求調整思考時間。O3 已在深度研究和編程輔助方面展現出巨大潛力,被視為“研究分析師 AI”,能有效提升研究和開發效率。強化學習在其中的應用需要根據目標用戶和任務特性(如環境不確定性、可模擬性)來調整目標。盡管模型在編碼、研究等領域進步迅速,但在模擬復雜人類互動或處理物理世界(如機器人技術)方面仍面臨挑戰,現實世界的實時約束和高不確定性是關鍵難點。關于通用模型(如 O3)是否會最終整合所有能力(包括機器人等專用領域),開發者認為尚無根本障礙,但需要克服特定挑戰。評估這些高級通用模型的能力也變得愈發困難,需要高質量、處于能力前沿的訓練數據和更嚴格、未被模型“污染”的評估方法。同時,需要認識到像 O3 這樣的模型對于同一提示也可能產生一系列不同質量的輸出,其峰值性能雖高,但行為存在分布。
? ? ? ? ?
SAP 首席執行官訪談 | 尼古拉唐根播客 20250430
視頻鏈接:
https://www.bilibili.com/video/BV121V3ztE9D/
主要內容:
挪威主權財富基金首席執行官尼古拉·唐根與歐洲最大、世界第三大軟件公司SAP的首席執行官克里斯蒂安·克萊因進行了對話。挪威主權財富基金持有SAP近3%的股份,價值90億美元,是其重要持倉。克萊因在SAP從實習生做起,直至擔任首席執行官。
SAP系統支撐著全球經濟運行,全球80%的B2B交易運行于其系統之上,95%的公司使用其某種系統,涵蓋財務、供應鏈、人力資源等,擁有業內最廣泛的SaaS產品組合之一。其核心產品企業資源規劃(ERP)系統連接著企業報價、定價、制造到交付的整個價值鏈,支持著世界上最關鍵的業務流程。
SAP的客戶粘性極高,更換ERP系統并非易事,但這并非鎖定,客戶首先關注價值。SAP也需不斷滿足客戶(如蘋果)對生產力提升和供應鏈自動化的需求。ERP實施的工作量取決于企業規模和業務復雜性,大型跨國制造企業實施周期較長,但中端市場客戶(占SAP客戶80%)若遵循標準模板和最佳實踐,可在三到四周內上線。實施SAP軟件通常伴隨著企業工作方式和流程的變革,SAP不僅提供技術,更關注從最終用戶角度出發的變革管理,引入自動化,讓用戶專注于增值任務。
在定價方面,SAP著眼于技術帶來的價值,例如AI基于消耗量和成果定價,衡量自動化程度、效率提升和庫存優化。對于通貨膨脹,SAP采取設定最高漲價幅度的公平方式,為客戶提供價格保護。SAP服務于25個行業,并深入垂直領域,如公用事業的計量與資產管理、零售業的客戶忠誠度與退貨管理。其BTP平臺允許客戶和伙伴利用ERP數據(供應鏈、財務、訂單、客戶)構建自己的擴展應用和知識產權。
面對日益增長的技術民族主義、關稅和主權法律,SAP承諾遵守近140個運營所在國的當地法律,包括稅務和數據主權要求,并正在構建大量基于當地數據安全法規的主權云。市場對歐洲替代方案的興趣有所增加,客戶開始關注數據本地化的安全性,即使在非監管行業也是如此。公共部門和受監管行業對主權云的需求一直存在,現在非監管業務也出現類似趨勢。SAP認為,云技術提供了應對供應鏈變化、關稅、通脹所需的敏捷性,能快速交付創新和調整軟件。SAP樂見歐洲整體擁有更大主權,而非各國分散,這有利于企業擴展,但對實現前景并不樂觀,因涉及成員國權力讓渡。
數據隱私和網絡安全是絕對關鍵,SAP投入數十億研發,有嚴格的服務等級協議和內部要求,并需在董事會層面定期檢查。云遷移現在也常出于安全考慮,將數據保護交給大型科技公司。隨著數字化,攻擊面擴大,威脅增加,保護B2B關鍵數據至關重要。
關于SAP為何未能率先發明云計算,克萊因提及“創新者困境”——顛覆運行良好且盈利的傳統業務模式非常困難。SAP通過收購云產品認識到市場變化,并在2019年決定加倍投入云轉型,盡管這在初期影響了股價。云是彌合客戶現有版本與最新創新(如綠色賬本,追蹤實際碳排放)之間差距的關鍵方案。這需要勇氣向資本市場解釋并行投資新舊模式。過去四年,SAP在工作方式、激勵機制和成功衡量標準上經歷了深刻變革,戰略執行是最大挑戰。
展望未來技術,SAP正在研究量子計算在物流優化等復雜場景的應用,預計三到四年內技術或可成熟應用于產品組合。區塊鏈也是金融領域的關注點。過去企業未能充分從軟件中提升生產力,往往因為項目僅被視為技術遷移,缺乏業務部門的深度參與和對自動化、標準化的開放態度。技術必須與業務變革相結合才能發揮最大價值。
人工智能(AI)帶來了巨大的機遇。克萊因對其在分析領域的潛力尤為興奮,AI能整合內外部數據,將財務、供應鏈、勞動力規劃提升到新水平,優化業務運營。預測性維護是另一大應用場景。SAP的“議程AI”(Joule,其數字助理)旨在超越簡單報告,進行根本原因分析并提供行動建議,例如分析客戶未付款原因,協調財務、物流、銷售信息。首個服務代理相關的議程AI已交付,更多用例將在5月的藍寶石大會發布。SAP承諾,使用其嵌入式AI的終端用戶,生產力可提升高達30%。應用實例包括人力資源(根據技能差距優化招聘、學習路徑推薦)和財務(自動化財務規劃與分析)。AI不會取代SaaS,因其需要SaaS提供的數據和業務背景,但會提升價值并可能加速實施。AI也將自動化CEO的部分工作,如獲取財務報告和預測,使其更專注于戰略。
公共部門(如德國、法國政府)已認識到云和AI對改善公民服務的價值,但對數據使用有更嚴格法規和主權云要求。SAP正投資建設此類設施。然而,公共部門在數字化方面通常較為規避風險,變革進展相對緩慢。
十年后,工作將更側重于戰略制定,AI和軟件將處理大量分析和事務性工作。人力資源等部門將更專注于未來勞動力規劃和技能轉型。人形機器人和自動化已在改變倉庫等場景,并將進一步影響維護等領域,勞動力構成和所需技能將發生根本性改變,企業需主動規劃員工隊伍轉型。
歐洲雖有優勢但競爭力不足,德國經濟面臨挑戰。歐洲未能形成真正的聯盟(如共同市場、銀行聯盟、數字基礎設施),導致在與美國等競爭中處于劣勢。過度且層疊的監管(如AI法案之上還有各國GDPR等)增加了官僚主義,阻礙了商業便利性和初創企業擴展。SAP的法務部門因處理歐洲復雜的合同法規(尤其涉及AI時)而規模翻倍。AI雖能輔助合規檢查,但新法規不斷增加官僚負擔。歐洲科技公司稀少,并非主要因為缺乏資金,而是需要硅谷那樣的生態系統(研究、商業、資金、勇于冒險和執行力結合),以及克服歐洲內部市場分割帶來的擴展障礙。
SAP的成功歸功于創始人的偉大想法和歷任領導者持續變革、顛覆自身的勇氣。克萊因的領導力之路受益于SAP的內部人才培養體系、導師指導、跨部門輪崗和國際經驗(如在美國運營SuccessFactors)。年輕時領導年長者,他依靠知識、專業技能和幫助他人成功來贏得認可。年齡在SAP文化中不重要,績效和團隊合作是關鍵。重要的導師教會他關注客戶、理解業務關鍵性以及連接業務與技術。被任命為首席運營官是關鍵時刻,讓他深刻理解了公司轉型的復雜性,這經驗也用于指導客戶:技術實施必須成為業務轉型的一部分才能創造巨大價值。他向內外部人士(包括微軟和Adobe的CEO)尋求建議,欣賞他們的謙遜和對業務的深刻理解。他認為德國領導風格注重流程和細節,但需警惕過度監管。從阿迪達斯董事會經歷中,他學到CEO需貼近各利益相關者。
他推崇快速決策(允許犯錯并修正)和結果導向,反對冗長無效的會議。他承認有時會微觀管理,但通常是在事情進展不順時深入了解問題。他努力營造開放反饋的文化,鼓勵坦誠溝通。他致力于在SAP推動績效文化,認為這對激勵高績效者和幫助員工成長都至關重要,需要管理者能給予建設性反饋。他認為歐洲缺乏競爭精神和績效文化,過于規避風險,這限制了發展,并強調冒險對成功是必要的。SAP必須持續轉型,承擔風險以應對快速變化的技術。
克萊因通過滑雪、桑拿(每周多次)和與家人朋友相處來放松。他閱讀商業報刊和研究報告,保持好奇心。他對年輕人的建議是:保持謙遜,永不停止學習,保持好奇心,并認識到在高層取得成功需要努力工作和交付成果。
RL作為產品與研究的協同設計 - 斯坦福CS25 V5 20250429
視頻鏈接:
https://www.bilibili.com/video/BV1kRV1zJEbJ/
主要內容:
來自OpenAI的Karina在CS25課程的講座中,分享了人工智能研究與產品協同設計的見解。她強調,盡管人工智能的發展帶來擔憂,但每個人都可以利用AI構建有意義的未來和酷炫事物,AI應被視為增強人類能力的工具,而非取代者。講座展示了AI在教育普及化(如解釋概念并生成可視化代碼)、個性化工具創建(生成前端代碼供用戶迭代)、創意輔助(根據草圖生成圖像、創作游戲)等方面的潛力,特別是通過如Canvas這樣的新界面,打破傳統聊天模式,實現更精細的人機協作和多模態能力(如根據UI圖片生成代碼)的組合。
Karina指出,當前AI的進步得益于兩大范式:大規模預訓練(如下一個詞元預測,使模型理解世界)和針對復雜任務的思維鏈強化學習(RL)。后者是智能體技術發展的基礎。她結合在Anthropic和OpenAI的經驗,闡述了構建研究驅動型產品的兩種主要方式:一是為模型不熟悉的新能力創造熟悉的用戶界面形式(如Chai GPT、Claude的100K上下文窗口、流式思維鏈展示);二是基于深刻的產品愿景或信念,反向驅動模型能力的訓練和實現(如Cloud的個性化標題生成、成為Slack中的虛擬隊友、OpenAI的Canvas項目)。Canvas項目特別強調了通過合成數據進行后訓練,以塑造模型成為更佳協作者的行為。
講座深入探討了塑造模型行為(后訓練)的重要性與復雜性,以Cloud 2.1版本過度拒絕良性提示為例,詳述了修復過程。這包括確立原則(如善意解讀用戶意圖、使用非暴力溝通方式回應)、建立拒絕分類法、構建評估體系(結合產品反饋、合成數據和基準測試),并通過細致的數據清理、有針對性的人工反饋或合成偏好對生成、以及強化學習(RLHF)來調試和校準模型行為,強調了在有用性和無害性之間取得平衡的挑戰。調試模型行為如同調試軟件,需要深入數據,理解不同數據集對行為的影響。
展望未來,Karina認為強化學習環境將更加復雜,需要模擬真實世界用例,如軟件工程、創意寫作、多人多智能體協作等。研究焦點正從易于量化的任務(如數學)轉向更主觀、難以衡量但對社會融合至關重要的任務(如情商、社交智能、寫作、視覺設計)。這催生了新的產品研究方向:創造新的RL任務、利用合成數據和上下文學習、發明新的模型行為與交互模式,并緊密結合產品與用戶反饋。獎勵函數設計是核心,需深思熟慮如何給予反饋以塑造期望行為,同時警惕獎勵利用(reward hacking)問題,即模型在未完成任務的情況下“欺騙”獎勵系統,尤其是在使用AI評估AI時。
最后,Karina提到,隨著推理成本的急劇下降,AI的原始智能變得廉價,為廣泛創新提供了基礎。未來的挑戰在于如何驗證AI輸出的可靠性,以及如何創造讓人類能夠有效驗證、編輯和指導模型的新交互方式,例如動態生成的、個性化的用戶界面。她預見AI將深刻改變個性化醫療保健、教育以及我們與故事敘述和創意過程的關系,鼓勵創作者擁抱AI作為增強能力的伙伴,而非威脅。整個演講貫穿著對AI賦能人類創造力、促進更深層次人機協作的積極展望。
? ? ? ? ?、
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.