1866 年,西門子的一位工程師發明了人類第一臺直流發電機。
40 年后,通用電氣在 1906 年開始量產真正讓電燈普及的第一代白熾燈泡。
在這兩者之間的半個世紀里,人類世界依然黑暗,電氣的技術革命好像沒有發生。
但,這只是因為我們身處后世,才能如此輕描淡寫地將這 40 年一筆帶過。
對于當時的人們來說,電氣技術的發展,是他們眼皮底下一天天展開的:第一條電報線路的鋪設,第一個電話的接通,第一輛電車的開動,每一次技術的進步,都在真切地改變著他們的生活,只是它沒有快到讓當時的每個人都在一個時間點集體驚呼“啊,電氣革命終于來了!”
我們此刻正站在一個與 19 世紀末極為相似的節點上。AI 技術的“直流發電機”已經轟鳴作響,只能發光十幾個小時的“碳質燈絲”也已點亮,新的光明時代正在徐徐展開。然而,當我們身處其中時,卻發現這場變革似乎并沒有想象中那般迅猛,甚至有些遲緩。
在經歷了 2022 年末 ChatGPT 橫空出世帶來的震撼,2023 年大量 AI “玩具級產品”的轟炸之后,2024 年的 AI 領域顯得有些“波瀾不驚”。讓我們以 OpenAI 在 12 月的 12 場發布會為線索梳理一下:
Sora 猶抱琵琶半遮面,千呼萬喚跳票了一整年,出來的效果雖然是“同類最佳”,但很難說能有什么實際用處;
GPT-5 跳票,被寄予厚望的 GPT-o1 滿血版和暫時不能用的 o3 在價格和可用性(資料輸入、聯網、推理速度)都存在嚴重缺陷。
ChatGPT Canvas、ChatGPT 高級語音模式、Projects 功能要么是早就 PPT 發布過的功能實裝,要么是同行有的功能終于補齊。
除此之外涵蓋推理模型 API、微調技術、協作模式等還發了一大堆,乍一看令人眼花繚亂。但細細品來,卻總覺得少了點當初那種“革命性”的味道,更像是在已有成果上的修修補補。
如今再看 OpenAI 的發布會,甚至有種在看蘋果發布會的既視感——擠牙膏式升級。我覺得看完這 12 場發布會,還指望 o3 突破所謂 AGI 的人,和去年那些堅信 Apple Vision Pro 能帶我們跑步進入元宇宙的人一樣。我只能祝他們和 Sam Altman 幸福。
更多的人們反而是開始竊竊私語——說好的 AI 革命呢?說好的技術大爆炸呢?怎么感覺這 AI 的發展速度,和前兩年比起來,慢了不少呢?甚至有人開始質疑:難道說,Scaling Law 已經失效了嗎?
Scaling Law 失效了嗎?要回答這個問題,我們得先簡單科普一下 Scaling Law。
Scaling Law,簡單來說,就是“大力出奇跡”——只要不斷增加模型的參數量和訓練數據的規模,AI 模型的性能就能持續提升。這一規律在過去幾年里,推動了 AI 領域的高歌猛進,讓我們見證了 AI 能力的飛速增長。如果說 2022 年初的 ChatGPT 還能讓人覺得“這玩意兒挺新鮮”,那 2022 年末誕生的 ChatGPT 已經可以讓人驚呼“臥槽,這玩意兒成精了!”——而這背后,正是 Scaling Law 在發揮作用。
然而,隨著 AI 技術的不斷發展,一個問題逐漸浮現:當模型的參數量越來越大,訓練數據越來越多時,我們還能看到同樣顯著的性能提升嗎?一些研究表明,簡單地增加規模已經不能再帶來線性甚至指數級的進步了。模型變得更大,但邊際效益在逐漸遞減。
2024 年 11 月,在海外媒體報道 GPT-5 訓練遇到障礙后,Sam Altman 發的 X
這個問題對 AI 行業來說真的非常重要,甚至 OpenAI 的 12 場發布會本身就是對這種質疑的一個回應。雖然以我的視角來看,這個回應某種程度上證實了 Scaling Law 撞墻。
然而,Scaling Law 撞墻與否又和非 AI 行業有什么關系呢?
關系就是,如果 AI 技術撞墻了,那么我們普通人和非 AI 企業的 AI 革命就更快了。
在技術發展的歷程中,我們常常會看到這樣一種現象:當一項技術在取得突破性進展后,有時會在一段時間內進入一個相對平穩的發展期。這并不是說這項技術停止了發展,而是說它正在從“質變”重新走回“量變”,從追求技術的進一步突破,轉到如何將已有的技術應用到真正有價值的事情上。
可以設想一下:當一項新技術出現時,行業和資本往往會先關注它本身的能力,比如我們會關注 AI 是不是更聰明了,是不是能夠處理更復雜的任務了,哪些公司的模型最有優勢,能為投資帶來超額回報。
這就像是王者開局的“打野”階段,沒人會將注意力放在開團上。但是,隨著技術的逐漸成熟,業界的關注點會逐漸從技術本身轉向技術的應用,大家開始思考如何將 AI 技術與實際的應用場景相結合,如何利用 AI 來解決實際的問題。畢竟,到目前為止我們還是人類社會,一項技術必須要有用,要爭奪“人類”市場,才能真正獲得回報。這就進入了“推塔”階段,目標變成了如何將技術優勢轉化為實際的生產力。
當前 AI 領域的情況正是如此。一方面,我們看到 AI 技術本身的發展似乎有所放緩,大模型參數的增長速度、算力的提升都面臨瓶頸。過去那種“每隔幾個月就有一個重大突破”的景象似乎難以再現。但是另一方面,更穩定的模型參數和持續下降的價格,能吸引更多的開發者和企業將 AI 引入到自己的應用之中。
這對于普通人和非 AI 企業來說,是一件好事,畢竟普通用戶每天在用的不是 AI 的模型,甚至連 API 都不是,而是使用了 API 的應用產品。
而當技術的發展不再是唯一的核心命題,當“大力出奇跡”不再是性價比最高的選擇,整個行業的目光自然會轉向應用的探索。這時候,才是 AI 真正與各行各業深度融合的開始,才是 AI 應用百花齊放的時代。
我在《》中曾經給小白用戶科普過,AI 在實際應用中的能力等于模型能力和非 AI 的工程能力相加。但在應用過程中,模型的變動,甚至是“進化”經常會影響工程的構建。
你千辛萬苦搭建了一個 AI 應用/工作流,可能會被一次模型的更新全部摧毀,這是普通用戶難以理解,但實際可能出現的事情。
這也是為什么,在開發者圈子里,Anthropic 年中上線的 Claude 3.5 系列模型和 Google 為了對抗 OpenAI 在 12 月發的一系列 Gemini 2.0 系列模型反而更讓業界的人更興奮。因為這兩個公司的產品沒什么特別大的突破,也不搞什么花活,就是在已知的道路上繼續做到量大(上下文)管飽(價格)。
更何況,在生產力經驗那篇文章中,我提過另一個關鍵問題:大部分人和企業對當前能力水平的 AI 還挖掘不足,因為他們在工程化的方向上能力為零,以至于“現在的 AI 也就這樣”。但實際上,他們低估了現在 AI 的能力,并且錯誤的預期了更好的 AI 能力能讓他們覺得不可能的那些事情變可能(比如一周編個淘寶)。
這種認知的錯誤,讓大眾誤以為 Scaling Law 撞墻會終結這次 AI 革命給社會的影響,但實際上恰恰相反。許多人覺得 AI 的潛力已經到頭了,是因為他們的數字素養還不足以充分利用現有的 AI 工具。換句話說,這是連手頭的“鐵鍬”還沒用明白呢,就已經在擔憂“金礦”挖空了。
我們可以用一個不那么恰當,但很形象的例子來說明這個問題:
有人可能以為,在互聯網時代,技術在實驗室層面的革命會更快的推送到市場,但現實是并不一定。比如,如果你最近在中國的大江南北體驗過移動支付,應該會發現微信支付和支付寶正在進行新一輪的鏖戰。
前者推出了掌紋支付,你只要綁定一次你的手掌,以后即便是在沒有手機的情況下也可以用微信支付。掌紋識別是一項新的技術嗎?嘿,這可真是撞我槍口了。2013 年剛畢業的我,在一家 FA 工作,當時對接的一個叫 PalmVisa 的初創公司就是做掌紋識別的。按照當時創始人的說法,掌紋識別在當時就達到了金融支付憑證等級的安全性,而且它還沒有指紋、虹膜泄露的問題。
但在這之后的 10 年里,掌紋識別這項技術幾乎消失在商業領域,而微信之所以將它撿起來。是因為它的對家支付寶開始推碰一碰付款,也就是 NFC 支付。NFC 這項技術熟悉的人就更多了,媒體上一次討論“互聯網與現實世界的超鏈接應該是 NFC 還是二維碼”這個選題的時候還是 2012 年。
你看,在“金融支付”這么大的一個市場,掌紋識別和 NFC 這兩種在技術上完全可行的方案,都要十年才能推動。這說明什么?說明應用領域要逼近技術的“天花板”需要時間和契機。
實際上,這樣的例子屢見不鮮。
另一個比較典型的例子是,中小微企業的數字化。
在 2015 年,你很難相信隨便一個餐館都會做自己的獨立 App,但到了 2018 年,微信小程序如火如荼,隨便一個路邊攤都有自己的小程序,點餐、支付、會員、營銷,一應俱全。
這并不是因為 2018 年的 App 開發技術比 2015 年有了質的飛躍。恰恰相反,是因為微信(和美團)這個超級平臺已經形成,它為開發者提供了足夠的基礎設施、穩定的技術棧(不怎么更新的過時技術)和用戶流量,使得開發小程序的成本足夠低,收益足夠高。
幾乎所有做開發的人都會吐槽小程序,但實際上正是小程序在技術上的落后保障了它的普及性。畢竟,時至今日其實 Android 手機也沒有解決系統碎片化的問題,大量的用戶仍然使用著 5 年前的 Android 10 系統。iOS 方面稍微好一點,但也沒好到哪去。這意味著,對于主業不是做互聯網產品的其他行業來說,如果需要在給用戶一個數字化的入口,獨立客戶端都無論如何都不是一個性價比高的選擇。
基本上,只有平臺型企業形成穩定的寡頭壟斷之后,才能為海量的微小企業和非 IT 相關行業提供穩定成長的土壤。想必很多今年做出海的也都意識到了,一些諸如支付網關、電商、社交網絡、云、原生小程序(PWA)這樣的基礎設施型工具必然與平臺型互聯網公司彌密不可分。
平臺型產品孕育生態,而平臺型產品誕生于平臺期。
比個體數字素養增長更慢的,是組織的企業素養。即便是在極度內卷的中國職場上,一家企業也不可能只招 30 歲以下的人,尤其是對于非 IT 行業的企業來說更是如此——許多傳統行業的老板本身就不是年輕人,對非核心生產部分的技術并不敏感。
這就造成了,當京東和元氣森林等一些新型企業在試圖落地“無人工廠”這樣的先進技術時,中國絕大多數的中小規模以下工廠還在用 Excel(甚至是盜版)進行生產計劃安排、庫存管理以及排產調度等基礎工作,顯得頗為原始。
AI 什么時候能影響到這些工廠呢?我覺得可能至少要等他們把 Excel 換成正經的 ERP 系統,或者正經的 MES(制造執行系統)才行吧?
而老板和企業都是趨利的,想讓一個組織進行非核心技術的迭代,要讓他們看到足夠的好處或收益。這里的核心技術是指與他們生產直接相關的技術,比如對可口可樂來說,配方就是核心技術,而生產線的自動化設備或者供應鏈管理系統則是支撐配方實現的非核心技術。
顯然,對于非互聯網企業來說,一個光禿禿的 AI 模型無論多聰明都帶不來好處——很多人將 OpenAI 已經發布但上尚不可用的 o3 稱為“博士級模型”,但你可以去找個今年畢業的博士問問他們工作好不好找。
實際上,我們現實中的大部分工作并不需要博士級的智能,只需要高中級甚至是初中級。
我今年聽到的最好笑的證明 AI 不行的例子,就是很多人發現 GPT-4o 認為 4.11 比 4.8 大。但我想大家如果經常刷社交網絡也都知道,這個世界上確實有很多真人也搞不定 10 以內加減法的,但這并不影響他們在工作崗位上發光發熱,尤其是在歐美國家。
之前和一些機構型媒體的朋友交流,他們中的許多人認為當前 AI 對傳媒業的影響不大,但同時他們又十分害怕未來 GPT-5 或其他公司的新模型如傳聞中的那樣顛覆他們的工作。然而,這是典型的錯誤認知帶來的錯誤焦慮。
實際上,我之前分享過一個大致的流程。以現階段 AI 的水平,它已經可以完全替代記者編輯,全自動完整撰寫帶有真實采訪的人物特寫稿件。
之所以這件事沒有成為“現實”,或者說,大部分媒體朋友之所以感覺當下的 AI 對傳媒業影響不大,并非是因為 AI 模型能力不行,而是因為這件事目前的價格優勢沒有大到有人愿意將這個 Workflow 完整的工程化出來做成產品。
如果這樣帶有真實采訪的稿件生成器,可以將每篇萬字長稿的生成成本降到 300 元以內,那么想必它立刻就會出現,甚至會迅速在自媒體平臺上泛濫。
但這和模型能力的進一步提升關系不大,反而是需要 AI 廠商放一放對能力的執念,轉而卷一卷價格。
甚至連大部分成熟的 IT 和互聯網企業在接入 AI 這件事上也正處在一種“等待”的狀態,正如我在《》提到的:對于大多數我們現在已經熟知的,熟悉的產品來說,AI 并不能成為決定性的用戶需求。用戶并不可能因為一個 AI 功能而放棄那些在傳統功能和網絡效應上有極大優勢的產品。
那么,反過來說,那些看起來笨重的老牌互聯網企業,也就有更多的時間進行轉型。他們有足夠的時間等待 AI 更加穩定,無論是在輸出的內容上、性能上、安全性上、價格上等等,而不是每月要發一個新版本來適應 AI 進步的速度。用一個最簡單的道理來說明:
如果你是一個擁有自建 IDC 的傳統互聯網大廠,現在想引入一款開源模型來實現產品中的某個 AI 功能。現在開源模型的推理成本每個月季度降 30%,這看起來是一件好事,但這意味著你在服務同樣用戶量的情況下,第一個季度買的 1 萬張顯卡,第二個季度就只需要 7000 張顯卡。那么,你第二個月閑下來的 3000 張顯卡做什么?
明智的選擇,當然是讓用戶忍一忍,或選個已經停滯的模型,淺嘗輒止的先糊弄一下。因為你知道,AI 底層的進化速度根本不可能持續,等它撞墻了你功能再給它搭配套應用也不遲。
當 AI 技術的發展進入一個相對穩定的階段,當大模型的能力不再是稀缺資源,當 AI 基礎設施逐漸完善,我們會看到企業和資本會將更多的注意力轉入讓 AI 進入應用領域,與越來越多人工作和生活中的具體場景結合。它會在一些場景成功,而在另一些場景失敗,而這些都和撞墻或沒撞墻的 Scaling Law 沒有關系。
因為大多數人、企業、組織,甚至連 GPT-3.5 級別的人工智能都還沒能完美的嵌合到現有的工作流中。那么著急的唱衰 AI 或擅自期待 GPT-5 又有什么用呢?
所以,除非你是做基礎大模型的,否則別再糾結 Scaling Law 是不是失效了,也別再抱怨 AI 的發展速度變慢了。
對于大多數人來說的 AI 變革才剛剛開始。
本文首發于我的個人博客,有 RSS 或 Newsletter 訂閱習慣的朋友可以點擊閱讀原文訂閱。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.