過去十年,人工智能的發展經歷了從低谷到巔峰的劇烈轉變。特別是以生成式人工智能(GenAI)為代表的最新一輪技術浪潮,不僅吸引了科技界和資本市場的目光,更逐步滲透到人們的日常生活中。以Transformer為核心的算法架構與“Scaling Law”(擴展規律)的結合,為這一波技術躍升提供了強大的理論支撐和實踐方向。然而,這種方式是否是實現人工智能進一步突破的最佳路徑?答案可能并不簡單。
來源|中國SaaS大會;作者|段江 Fotor 創始人;整理|牛透社
全球頭部 AI 圖像、視頻平臺 Fotor 從出生即面向了海外市場,并且融入了 AI 的技術浪潮。Fotor 創始人段江在 2024 中國 SaaS 大會期間,分享了他對于 GenAI 時代的一些思考,以及 Fotor 在海外市場的一些實踐打法。
段江 Fotor 創始人
段江在分享中提到,“Scaling Law”揭示了人工智能模型性能隨參數量、數據量和計算能力增加而指數級提升的規律。
然而,這種“堆疊規模”的方式需要以巨大能耗為代價,與人類大腦僅消耗 20 瓦功率卻能完成復雜任務形成鮮明對比。作者通過圖像增強的案例進一步說明了高效算法的重要性——相比依賴大量訓練和推理的傳統方法,僅需零點幾秒就能完成優化的計算機視覺算法,或許為未來 AI 的發展提供了一條低能耗、高效率的可能路徑。
同時,段江也指出,當下 AI 訓練數據的消耗速度已經超越了人類數據產生的速度,這無疑給模型的可持續發展帶來了挑戰。生成式 AI 雖然能夠自行產出數據,但其潛在的錯誤和局限可能被不斷放大。前沿研究正在探索一種“雙模型”的方法:一個模型生成數據,另一個模型判斷其質量,以期打破現有困局。
從技術架構到訓練方法,從能耗效率到數據可用性,深入剖析了當前 AI 發展的關鍵議題,同時也對未來的發展方向提出了思考:AI 是否能夠從依賴大規模資源的模式中脫身?又是否能夠找到一條更符合人類智慧特質的進化路徑?
除此之外,段江也結合 Fotor 的出海實踐,分享了在競爭激烈的海外市場,如何通過 AI 產品留住客戶?如何獲得巨大的流量,并且將流量變現?
以下為演講內容,經牛透社整理(部分刪減):
大家好,今天非常高興能夠在這里和大家一起分享這兩年來在前沿科學技術領域非常重要的一個話題—— AI。過去十多年,我們已經進入了數字經濟時代。數字經濟也就對應一些重要的數字技術和思想。
數字技術里面非常重要的就是 ABCD,A 是 AI 人工智能,B 是區塊鏈 Block Chain,前幾年大家談的比較多。C 是 Cloud 云計算,D 是 Data 數據。
今天的話題聚焦到 AI。AI 其實已經經歷了很多輪的發展和迭代,我們給最新一輪的 AI 一個限定詞叫生成式 AI(GenAI)。
AI 的四次浪潮
人工智能發展的四次浪潮(圖源:演講PPT)
首先,聊聊 AI 的發展。這張圖是過去幾十年,從人工智能概念,到最近的發展情況。
1956 年,在達特茅斯會議上第一次提出了人工智能概念,從此拉開了人工智能發展的序幕。上個世紀 60 年代,進入機器學習時代。到 80 年代,神經網絡作為一個非常重要的技術走入了大家的視野。即使在今天,我們也在廣泛地談論神經網絡。但 80 年代剛誕生的神經網絡技術還不成熟,帶來的效果和結果并不理想,所以大家認為以神經網絡為基礎去做人工智能似乎看不到頭,也因此,很多人離開了人工智能這個領域,他們認為人工智能是一個偽概念。由此,80 年代逐漸進入了人工智能的第一個寒冬。
這個寒冬持續了十幾年,直到1997 年,人工智能才迎來復蘇。當時發生了一個非常標志性的事件——IBM 的深藍機器人戰勝了國際象棋世界冠軍。這件事又一次在公眾領域引發了人工智能的話題討論,成為了人工智能發展史上的里程碑。
隨著時間的遷移,2006 年,深度學習興起,到 2012 年取得重大突破,那一年,辛頓教授(2024年諾貝爾物理獎的獲得者)帶著他的學生搞了一個基于深度學習的神經網絡,獲得了李飛飛教授舉辦的圖片識別大賽冠軍。深度學習引發了工業界和學術界的極大關注,迎來高速發展。
到了2014 年,有人提出了生成式對抗網絡,這就是我們今天要談論的生成式人工智能最早的工作。盡管現在來看并不是非常完美,但是在 2014 年的時候,就已經有科學家在這方面進行大量的研究工作了。
2016 年,Google 收購 DeepMind,成為了一個標志性事件。而 DeepMind 推出的產品 Alphago 戰勝了韓國的圍棋選手李世石,再度引發了人工智能的浪潮。
2017 年,人工智能發展的一個重要的技術框架 Transformer 被提出來,這個技術又推動了這一輪人工智能的高速發展。
到了2018 年,基于 Transformer 技術的大模型被提出,到了2022年 12 月,以 Transformer 架構為基礎的大模型,它的 APP 叫 ChatGPT 上線,活躍用戶迅速上億,這在全球范圍內引發了極大的關注。
為什么現在人工智能又開始高速發展了呢?
我們看到有幾次波峰和波谷,其實還是我們經常提到的更好的算法模型,更好的算力,更多的數據。
先講算法。算法非常重要的,一篇由 Google 的 8 位科學家完成的題目為“Attention Is All You Need”的論文,成為了生成式人工智能的開山之作。現在很多大模型背后的技術框架都是基于這篇文章來的,也是我們講的 Transformer 架構。
在談到 Transformer 架構時,我們不得不提一個常被討論的話題——“Scaling Law”(擴展規律)。這一規律揭示了當前人工智能模型發展的一個重要趨勢:隨著模型規模的不斷擴大,它的性能也會得到顯著提升。具體來說,在 Transformer 這一算法框架下,通過增加模型的參數量、擴大模型規模,同時增加更多的訓練數據和計算能力,系統的能力也會隨之增強。當這些要素達到一定的臨界點時,系統的能力會出現指數級的提升。
因此,一些人認為,正是 Transformer 加上 Scaling Law,推動了人工智能的快速發展。不過,也有觀點提出,Transformer 與 Scaling Law 真的能夠引領我們走向通用人工智能(AGI)的正確道路嗎?目前,許多人認為我們正接近 AGI 的時代。
然而,我個人認為,盡管 Transformer 和 Scaling Law 對提升人工智能模型的智能水平至關重要,但它們與人腦的運作機制有著本質的差異。比如,人的大腦僅消耗約 20 多瓦的功率,卻能完成多種復雜任務,而現在的 Transformer 加上 Scaling Law 需要巨大的算力支持,才能讓模型展現更強的智能。
舉個例子,在圖像領域,我們常常進行一種叫做“圖像增強”的操作。假設有幾張看起來質量不太好的圖片,我們可以通過一些算法調整它們的亮度、色彩和對比度,使圖像變得更加清晰。當我們訓練了大量高質量的圖片后,上傳一張新圖時,系統會通過推理生成一張改善過的圖像。這個過程從上傳圖片到云端,再到云端進行計算和推理,可能需要 20 多秒才能完成。
Scaling law 確實能夠帶來顯著的效果,但它是否是最優的解決方案呢?我認為不一定。
再來看數據,有消息說當前訓練數據的消耗速度已經超過了人類產生數據的速度。在這種情況下,如果數據源枯竭,大模型是否還能繼續進步呢?這個問題依然沒有明確答案。有觀點認為,現在的模型具備生成數據的能力,例如生成文字、圖片和視頻等。那么,這些生成的數據能否用于進一步訓練模型呢?
這種方法有其優缺點。優點是,生成模型能夠無限產出數據,解決了數據量不足的問題。但缺點也很明顯,如果生成的數據存在錯誤或局限,模型將不斷地重復這些錯誤,可能會導致性能下降。
為了解決這一問題,一些前沿研究提出了使用兩個模型的方案。一方負責生成數據,另一方則對生成的數據進行判斷,確認其質量是否足夠高,是否可以用于大模型的訓練。
拐點:生成式人工智能的快速增長
下面講一講生成式人工智能行業的快速增長。
從互聯網到移動互聯網到GenAI,用戶的滲透率(圖源:演講PPT)
這張圖展示了過去 30 年技術創新路徑及其對用戶的滲透率。
在互聯網(Internet)時代,技術滲透到 80% 的用戶大概用了 20 多年時間。進入移動互聯網(Smartphones)時代,滲透 90% 用戶所需時間縮短至 15 年左右。而到了人工智能,確切地說是生成式人工智能(GenAI)時代,僅僅 4-5 年時間,就已經滲透了 60% 以上的用戶,這一輪技術發展的速度相當驚人。
不得不說,這一輪生成式人工智能能夠有如此高的滲透率,離不開前兩輪技術創新所帶來的大量計算設備,例如手機等。正是這些設備的存在,使得生成式人工智能的算法和產品能夠快速地推廣到大眾面前。
從 2022 年底開始,與生成式人工智能相關的代碼開發數量、應用數量以及模型數量都呈現出近乎直線上升的增長趨勢。各行各業都在積極地利用生成式人工智能來賦能自身業務。
(圖源:演講PPT)
再來看看 2020 年以來生成式人工智能的融資情況。可以明顯發現,從 2022 年底起,全球在人工智能領域的投入大幅增加。就我個人而言,從去年到今年,接觸了眾多投資人,感覺現在不管是什么行業,如果項目和生成式人工智能毫無關聯,可能很難得到風險投資(VC)的青睞。
未來,GPU + AI 模型=智腦
接下來,我們來探討一個引人深思的話題——生成式人工智能的超級應用。去年,人們大多關注大模型,認為應該先把底層基礎打好。
然而,今年業界的關注點發生了轉變,開始聚焦于應用。大家都在思考,在這一輪生成式人工智能時代,能夠吸引大量用戶使用的超級應用究竟會是什么呢?
我們先回顧一下過去 50 年計算機的發展歷程。計算機硬件更準確地說是由 CPU 構成,過去是 CPU 搭配軟件形成了我們的電腦。在這種模式下,構建的是自動化計算體系,該體系主要依賴程序員編寫的指令,來輔助人們更高效地完成工作和生活中的各項任務。
進入移動互聯網時代,手機引入了兩個新特性:地理位置和攝像頭。在這些因素的共同作用下,誕生了一批超級應用,例如國外的 YouTube、Facebook、Uber,以及中國的滴滴、美團等。不過在這個時代,這些應用還稱不上具有智能。雖然這些應用中可能會包含一些人工智能算法,比如推薦系統,但從整體上看,它們離真正的智能概念還相差甚遠。
未來,計算機可能會朝著“GPU + AI模型”的方向發展,進而形成一種“智腦”模式,構建出像人腦一樣智慧的計算機體系。
那么,如何構建超級應用呢?在這種新的框架下,我們需要思考當前人工智能在創造能力方面的重要體現。如今的生成式人工智能具備強大的創造能力,例如能夠幫助人們畫畫、寫詩,其推理能力也更強了。而且,大模型還可以解答數學題,交互方式也發生了很大變化,我們能夠通過語音與大模型進行準確、直接的交流。
在這些因素的綜合作用下,超級應用究竟會是什么呢?目前我無法給出答案,但我們可以圍繞這些方向進行深入思考。
海外市場流量為先,Fotor 的幾點經驗
簡單介紹一下我們在人工智能時代的機遇。我們的品牌是 Fotor,這是一款出海應用。
在生成式人工智能領域有一個排行榜,其數據由美國頂級數據公司 Similar Web 提供。在 2023 年 4 月 - 今年(2024年) 3 月期間的圖像類應用(Web)領域,Fotor 的月訪問量增速在全球排名第一。
我們的用戶數量在 GDP 排名前十的國家中比較可觀。這里給大家一個建議,做軟件出海應用時,很多人會去拓展東南亞流量,這種流量確實能快速增長,但在實現變現時會比較困難。
目前,我們應用的收入規模表現良好,在中國生成式人工智能領域屬于頭部企業,在一些重要國家我們的用戶數量也占據很大優勢。我們之所以能取得這樣的成績,和過去幾年的經驗有關。
首先是“早上線,唯快不破”。在這個行業,速度至關重要,一旦稍有落后,后續就需要付出大量努力來追趕。
2012 年 8 月,我們察覺到了生成式人工智能所蘊含的機遇,隨后便組織團隊著手開發相關產品,并在 10 月上線了文生圖功能。如今,文生圖功能隨處可見,但在當時,國外市場在這方面還是一片空白。
有一家叫 Midjourney 的公司,大家可能有所耳聞,不過使用它的產品需要在 DISCORD 平臺上操作,普通用戶使用起來不太方便。而我們直接在自己的網站上推出了文生圖功能,用戶只需在輸入框中輸入文字就能生成圖片,這一功能吸引了大量用戶來使用我們的產品,進而使我們的流量急劇增長。
在過去的十年間,我們還開發了幾十上百個與圖像、圖形和視頻相關的功能。用戶因為文生圖功能開始使用我們的產品后,又發現了其他眾多實用的功能,于是就留下來長期使用。
在此要提醒大家,在開拓海外市場時,搜索引擎優化(SEO)是非常值得關注的方法。
簡單來說,比如搜索機票時,怎樣才能讓自己的產品排在搜索結果的首位呢?如果排名靠后,被用戶點擊的概率就會很低。我發現從去年(2023年)開始,越來越多的創業公司都非常重視通過這種方法來獲取流量。
那么,如何進行搜索引擎優化呢?方法有很多,以我們的產品網站為例,我們設置了 100 萬個相關的搜索詞。因為用戶每天的搜索需求千差萬別,當你的網站有大量的搜索詞在谷歌上時,通過這些搜索詞的組合,就能匯聚海量的流量。所以,在這方面不要怕麻煩,要知道這是一個逐漸積累的過程,不可能一蹴而就。
第二,要精心打造內容與產品。Google 的算法會考量用戶對軟件的喜好程度,例如若用戶進入網站后很快就離開,那么該網站的權重必然不高,排名也難以靠前。
從收單的角度來看,這也是近期從事 AI 行業的一些用戶普遍反映的痛點。如今大家都在拓展海外業務,然而常常出現做了不到半年賬號就被封的情況。像我們常用的 PayPal、Stripe 等支付體系,其中一個極為關鍵的要點是爭議率不能過高。在 AI 領域,由于用戶因對 AI 感興趣而購買產品,但使用后發現與預期不符,便會發起退款,從而引發爭議。一旦爭議率升高,許多支付系統就會將商家拒之門外。
如何降低此類事件的發生頻率呢?我們內部為此開展了大量工作。這項工作主要在后臺運作,我們專門組建了一個團隊來控制爭議率。在用戶可見的前端,展現的是功能的不斷完善以及AI算法的持續提升。但實際上,只有將整個事情統籌做好,支付環節才能順利進行,因為若支付環節出現問題,支付系統將會終止服務,即便前端產品打造得再出色,也可能面臨零銷售的困境。
打造 AI Native 應用,真的必要嗎?
我們再來探討一下當下備受熱議的話題:是否要打造原生 AI(AI Native)應用?
我經常講一句話:只有 AI 的產品(AI Native)不一定賺錢,但是賺錢的產品一定有AI(工作流)。這話怎么理解呢?如今很多人覺得若不是原生 AI 應用,就稱不上是真正的 AI 產品。可仔細想想,若是純粹的原生 AI 產品,僅依賴AI技術,一旦像 OpenAI 這樣的大模型進行能力升級,就極有可能被其取代。而我所強調的“賺錢的產品一定有 AI”,重點在于構建良好的工作流。以我們的產品為例,它涉及龐大復雜的圖像、圖形與視頻工作流,我們在其中融入 AI 算法,助力用戶更高效便捷地完成任務。
我深信像 OpenAI 這種全球頂尖的大模型公司,不會涉足工作流業務。畢竟除了圖像領域,還有醫療、電商等諸多領域的工作流,它不可能一一兼顧。所以,我們務必要從工作流層面構建自身的競爭壁壘,借助 AI 讓這一壁壘更加穩固堅實。若僅僅著眼于開發單純的AI產品,極有可能被大模型輕易替代。
最后引用美國硅谷孵化器的一句話:今天的 AI 創業者將獲得如 1995 年的互聯網創業者和 2009 年移動互聯網創業者那樣的十大機會。讓我們共同努力!謝謝大家!
說明:文章為牛透社原創,未經允許,謝絕轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.