世界格局的宏觀預測
一、國際格局將發生巨大改變
AI 的興起,可能會導致世界進一步割裂,分為能使用 GPT 的國家和不能使用的國家,這種割裂將極大地改變國際競爭的態勢。
對于不支持 GPT 的國家,即便人數占優勢,實際的生產力可能也無法對應增長。以程序員為例,假設使用 GPT 的國家,能讓其300萬程序員效率翻倍。相對而言,未使用 GPT 的國家,盡管程序員數量達到700萬,其戰力可能只等同于使用 GPT 的300萬程序員。
當然,這只是一個簡化的比喻,因為程序員的主要工作并非僅僅編寫代碼,而且 GPT-4 對不同領域的程序員提供的幫助程度也不同。然而,這個例子能夠提供一個角度,讓我們大致理解 AI 技術在提升工作效率方面的潛力。
而且,與互聯網時代不同的是,AI 有潛力滲透到各個行業,對整個經濟格局產生深遠影響,大多數行業未來都可能需要依賴 AI 技術。
因此,如果一個國家未能充分利用 AI 技術,導致其一些關鍵行業的生產力降低到原來的一半甚至更低,那么這將無疑對該國的全球競爭地位構成嚴重威脅。
AI 被視為新一輪工業革命的引擎,這已經成為業界共識。無論是個體還是國家,最早采用 AI 的一方將會獲得巨大的先發優勢,就像英國在工業革命時期那樣。
二、我國在 AI 領域不會被“卡脖子”
我之前擔心過,我國 AI 發展可能會被卡脖子。現在看來,這種想法可以推翻了,主要原因有以下幾點:
1、國內公司的投入大
國內 AI 熱潮正持續升溫。無論是百度、騰訊、阿里還是科大訊飛等頭部科技公司,都在重金投入 AI 大模型的研發和部署。
2、開源力量的推動
越來越多的開源產品在不斷豐富著 AI 領域的生態,開源本身也在推動著技術進步。
3、GPU 進貨問題不大
英偉達為了繞過美國政府對中國公司的銷售限制,專門推出為中國“特供”的 A800 芯片,作為 A100 芯片的替換版本(兩者都是專門用于訓練大模型的 AI 芯片),這無疑是給中國的 AI 企業打了一針強心劑。
英偉達A800芯片參數
在大模型訓練和推理兩個環節,我們也都已經擁有了自己的 GPU,盡管性能只有英偉達的10%-20%,應用范圍也相對狹窄。但是,我們已經有了起步,這就是關鍵,半導體行業的競爭并非只在于誰做得更好。我們現在雖然只有對手幾分之一的速度,但他們卻無法真正封鎖我們,我們也只不過速度慢了一些。如果他們拒絕向我們出售,反而會喪失潛在的利潤。
綜合上面的原因,我認為在一年內,我們自己也能訓練出 ChatGPT 類似的產品,達到 GPT-3.5 的水平。
在這個過程中,各大廠商重復創造輪子是在所難免的,但對于創業團隊,如果沒有特別的優勢或積累,從零開始研發是不必要的,因為很可能最后的結果,還不如已有的開源項目效果好。
盡管我們可能不會被卡脖子,但當我們達到 GPT-3.5 的水平時,別人可能已經開始研發 GPT-5,先發優勢依然明顯。
未來 AI 行業預測
一、OpenAI 未必是最終贏家
當前,普遍觀點認為 OpenAI 與其背后的微軟是贏家。然而,我認為 OpenAI 的勝利尚未確定。主要原因有以下幾點:
1、OpenAI 欠缺大公司的技術和用戶優勢
盡管 OpenAI 在技術方面展現出了顯著的領先地位,但這并不表明,其優勢就如表面上看起來的那樣巨大。
首要的挑戰是來自于其他大公司的威脅。比如 Google,作為全球領先的科技公司,其研發能力和技術積累是可以開發出 ChatGPT 同等級的產品。然而,作為一個商業組織,Google 需要考慮更為全面的商業利益和市場布局。
目前,Google 的核心盈利模式依然是搜索引擎廣告業務,這是一塊經過多年積累,已經相當穩定和盈利的市場。如果急于推出大模型產品,可能會對現有的穩定收入產生沖擊,甚至威脅到 Google 的主營業務。
在這種情況下,Google 更有可能采取謹慎的策略,堅守現有的盈利模式,同時在適當的時機,有策略地推出與相關產品,而不是著急“跟風”大模型,自己革自己的命。
其次,用戶群體是一大關鍵。移動互聯網時代的用戶,大部分都在 Google、Apple 這樣的傳統廠商手中。相較之下,像 ChatGPT 和 Midjourney 這類新興的 AI 應用產品,雖然表現出強大的潛力和創新性,但目前還只有一部分人在使用,其用戶群體相對較小,產品和商業模式也相對單一。
所以,我覺得將 AI 融入擁有大量用戶的傳統產品中,可能會開辟出更大的市場。
2、手機語音助手是最好的應用場景
如果 Apple 或 Google 能在其操作系統中內置一個自己的 GPT,再融入語音助手,OpenAI 可能難以抗衡。國內的手機制造商也可以在這方面嘗試創新,這可能會成為一個巨大的增長點。
因為,當前的技術足以實現,關于監管問題也會有應對方案,最重要的交互問題也可以解決:比如,可以設計讓 AI 在執行操作前請求用戶確認,像現在流行的 AutoGPT 在操作前會問用戶“Yes or No”。手機廠商也可以采取類似的保守策略。
每一步命令執行之前,AutoGPT會詢問用戶是否繼續
二、未來的 AI 將是一超多強的局面
未來將是多家強大的 AI 公司競爭的局面,而非 OpenAI 一家獨大。這些公司可能會分為開源和閉源兩個陣營。我對開源產品充滿信心,原因有以下幾點:
1、開源項目可以滿足非常強的定制化需求
以 Stable Diffusion 和 Midjourney 為例,雖然 Stable Diffusion 的效果可能比 Midjourney 差一些,但 Stable Diffusion 能做到 Midjourney 無法實現的事情——開源產品可以讓用戶自定義訓練和優化。
比如,一個廠商在做國風的品牌,他可以自己訓練或下載現成的國風 checkpoint,借助 Stable Diffusion 設計出眾多符合自身品牌定位的產品,提高自己的生產力。這對于一些特定的行業和特殊的需求,開源項目無疑提供了巨大的幫助。它不僅提供了極高的定制化能力,還允許用戶根據特定的專業和用途進行訓練,打破了 Midjourney 等閉源項目在交互和功能上的限制。
所以,我覺得開源產品只要能達到閉源產品70%的水平,應用場景就會非常廣泛。
在 Twitter 上,有位開發者用清華大學的開源模型 ChatGLM,創建了一個本地部署的 ChatPDF,雖然 ChatGLM 在文字生成能力上相較 GPT-3.5 有所不足,但它足以滿足基本需求。用戶只需將 PDF 論文輸入模型,便可通過 AI 進行深入的學習和分析。這種創新的方式開啟了 AI 改變傳統教育方式的新可能性,展現了在教育領域中 AI 的巨大潛力。
ChatGLM+ChatPDF的項目,GitHub上星標已超過6.3k
2、閉源產品的“越獄”需求很大
用戶對于“越獄”閉源產品的需求也異常旺盛,即通過各種手段突破閉源公司對 AI 的限制。
| NSFW的需求
互聯網的發展受到許多因素的推動,其中一個不可忽視的因素是"NSFW"(Not Safe For Work)的內容需求。這是一個專門用來標注可能不適合在工作場所瀏覽的內容的縮寫。
我介紹過一種被稱為"語音房"的產品。這些產品提供了一種"軟性"的 NSFW 內容,它們有很高的盈利能力,因為這種需求在現實生活中非常普遍,并且是合法的。然而,AI 文本生成模型如 ChatGPT 并不能生成 NSFW 內容。
然后讓我們想象一下,如果有了開源的文字生成產品,人們會如何使用它?
同樣,盡管 Stable Diffusion 已經更新到了2.x 的版本,但仍有很多人堅持使用1.5的版本,主要原因是1.5的版本能生成一些"小姐姐"的圖片,而更新的版本不能。
檢測到關鍵詞,Midjourney禁止了請求
| 隱私的需求
在一些敏感行業中,人們可能不愿意將數據交給 ChatGPT 等閉源公司,因為這會涉及到一定的風險,例如數據的濫用或泄露。因此,在本地部署的開源產品成為一種更安全的選擇。盡管這些開源產品在功能上略顯不足,但它們至少能夠滿足基本的安全要求,使數據得到保護。
3、強大的開源力量
Stable Diffusion 從2022年8月開源到現在,其相關微調方法的生態已經枝繁葉茂了。
開源者們貢獻了海量的 LoRA(Low-Rank Adaptation of Large Language Models,一種用于大型語言模型的優化方法,通過減少參數數量和計算復雜度,提高模型的訓練效率和適應性)、checkpoint(在計算機科學和深度學習中指的是程序執行的標記點或保存點,用于記錄程序狀態和數據,以實現中斷恢復、穩定訓練和模型選擇等功能。),以及 extension(為現有軟件添加額外功能或特性的模塊或插件,比如 ChatGPT 的 Summarize)。
Summarize插件,可以一鍵總結網頁內容
包括文本生成方面,從 Meta 公司開發的大型語言模型技術 LLaMa(Large Language Model Meta AI )到其衍生品 Alpaca(斯坦福在 LLaMa-7B 的基礎上監督微調出來的模型),都是因為開源的力量。
我相信在短短一年內,依靠開源力量,一些產品就能達到 GPT-3.5 的水平。包括現在,我們看到一些模型,在某個特定領域使用起來比 ChatGPT 更高效。所以,AI 技術并不會被“卡脖子”,我們應該感謝開源精神,這種無國界的精神真正推動了全球的進步。
GitHub上中文LLaMA模型和指令精調的Alpaca大模型,星標超9k
根據以上對 AI 行業的討論,我們可以得出三個關鍵預測,同時也是三個重要的推論:
第一,技術和數據不會被單一的公司壟斷
未來很可能形成開源陣營與閉源陣營對立的局面,實現一個超級強者與多個有力競爭者并存的格局。在這樣的環境下,各個領域的優質開源產品都將有很大的發展空間。
第二,應用端會成為最有利潤的環節
未來,大模型將像云服務一樣普及,但并不會成為行業中利潤最豐厚的部分。
技術愛好者可能會欣賞到現在這個時代的純粹性,例如 ChatGPT、Midjourney 等純技術驅動的成功案例,因為它們并不需要花費大量精力在產品開發上,也不需要過多考慮商業模式和策略優化。
然而,我認為隨著 AI 技術的日益成熟,價值最終還是會回歸到應用端和產品化的能力,發現需求和留住用戶的能力會變得越來越重要。
第三,創業公司需要保持靈活性
創業公司可以采用"大模型中立"的策略,隨時接入和切換不同的大模型。隨著大廠的參與和各種開源產品的發展,大模型的市場也將出現多元化的競爭局面。在這種環境下,使用 API 的價格不會過高,創業公司也能夠保持相當的靈活性。
創業 & 投資的建議
一、開源項目產品化是“低垂的果實”
無論是創業還是投資,我認為一個明確的方向就是將開源項目產品化。開源項目通常在產品化方面的能力較弱,很難實際落地,而創業公司可以填補這個空白。
比如 Stable Diffusion,2022年8月到現在開源這么久了,仍然不是一個普通人可以玩的一個產品。
再比如 AutoGPT,我用它去完成一些復雜的任務,但在數小時的嘗試之后,我遇到了各種報錯和死循環,最終什么都沒輸出出來。當然,最近也有人給 AutoGPT 做 UI 層的產品,雖然很好看,但都沒有解決 AutoGPT 的根本問題:工作不穩定。
現在很多人為了蹭熱度,急于推出一個產品,短期內可能吸引了一些眼球,但從長期看,這些產品的使用效果可能并不好。但是,如果能夠把 AutoGPT 思路提煉出來,并真正投入時間和精力去開發一個可靠且好用的產品,那么這將會有非常大的前景。
二、平衡開發速度與產品力
將一個原本只有極客們玩得轉的東西,轉變為適合大眾使用的產品,需要強大的產品化能力。在這個過程中,如果你做得太快,產品可能做得不夠好;如果做得太慢,你可能錯過了熱度。因此,平衡好速度與產品力之間的關系非常重要。
大公司往往在這方面會顯得比較遲緩和保守,這為創業公司提供了許多機會。
總之,這些開源的產品就是“低垂的果實”。而且,Twitter 和 Github 上很火爆的極客產品,在技術和市場驗證上都完成了從0到1的突破,只是最后的產品環節沒做好。如果創業者能夠將產品化的最后一公里走好,可能會取得非常大的成功。
視頻已經于4月19日發布,此篇文章并未對內容進行過多的增刪。值得注意的是,僅僅在過去的兩個月左右的時間里,我們已經可以看到一些預測正在逐步成為現實。
我曾經在社群中提到過某頭部金融機構發布的報告,他們嘗試預測未來一年的十大重要事件,結果卻有八個出現了誤判。這說明預測未來是一件極其復雜的事情,需要考慮的變量太多,而且未來的發展往往超出我們的想象。
此外,我在文章中提出的一些觀點與主流意見存在一定的差異。這些預測是否會被事實打臉,或者是否會成為現實,可能需要一個更長的時間去檢驗。
歡迎關注公眾號「李自然說」,及時獲取最新動態和文章內容!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.