5G這里我不多作評論。實際上,在約十年前5G還沒落地,標準還沒制定完畢的時期,當時我在一家既有通信業務也有AI業務(深度學習應用)的公司做研發,恰好同時經歷了5G投資爆發的前期和深度學習應用爆發的前期。業內(移動通信技術業內)都已經很非常明晰,由于其通信原理性的限制,5G的應用場景和落地的實際性能體驗,相對4G必然非常有限。這一點在業內基本不存在爭議,不過這些信息不可能在大眾平臺廣泛傳播,其中原因大家自行想象和理解。由于其它非技術因素,國內5G方面的基建投入顯著超出移動通信技術行業人員的預估,即便如此,其體驗并沒有意料之外的相對4G的提升。
跟5G不同,在當前這個大模型(LLM)狂熱的時代,不僅僅是AI技術背景人員的“業內”,還是 跟AI完全不相關的人員的“業外”,我個人認為都存在普遍性的高估。當然,在這種普遍性的高估和狂熱的情況下,說一點關于LLM被人廣泛忽略的缺陷是難免要挨罵的,關于這一點我已做好心里準備并且體驗過多次。
當前大模型在大眾領域的熱度大爆發(以文字和圖像內容生產為典型應用),跟十年前的深度學習在大眾領域熱度大爆發(以人臉識別/美顏/自動駕駛為典型應用),在熱度上沒有太大差別。不同的是,十年前國內的創投市場還十分火熱,大家的資金還非常充裕,伴隨著對追蹤不上技術發展的緊張的,是似乎用不完的投資資金。而如今,投資資金規模已大不如前,伴隨著這種對追蹤不上技術發展的緊張的,是深刻的力不從心感。
從我個人在AI行業不到20年的短暫學習和工作經歷來看,類似的周期性潮起潮落就已經經歷過不少于4次,支持向量機(SVM), 概率圖模型(PGM), 深度學習(DL)和目前深度學習的繼續發展下的大語言模型, 多模態信息仍然被轉換為語義進行處理)各領風騷幾年,行業熱點不斷變換. 很多從業者也不得不主動或者被動的跟隨。
但在這些不斷發展之中,作為從業者/研發者和應用落地者,業內在1984年提出的一些基礎問題得到了很好的解決了嗎?
我們捫心自問,不難得出一個顯然的結論:并沒有。而且本次的爆發跟1984年之前的那一輪爆發,在社會上的影響似乎也沒有本質區別。一樣的社會性緊張、一級市場緊張 以及 從業者的緊張。實際上,1984年前那一輪緊張還觸發和塑造了我們今天視之為理所當然的科幻小說/電影的主題形態(賽博朋克等)。
從原理性角度粗加理解,這種“不解決”也是理所當然的。大模型的“幻覺”(Hallucination)問題,并非是 “幻覺”字面上這么簡單,它實際上是內生的,不可避免的,在當前技術路線下永遠存在且不可忽視的。連接主義統計機器學習中這類擬合條件概率分布的基礎做法,對于非線性的現實世界具有天然的無力感。
而人類的智能相比于連接主義統計機器學習AI來說,更擅長處理這些現實世界普遍存在的非線性問題,而不是統計性的概率分布擬合和計算。前者需要很少的樣本甚至零樣本,也同時需要對“概念”、“規則”的“理解”,從而產生“邏輯”。后者則需要大量的樣本進行訓練,但缺乏內生性的“概念”和“規則”,從而不會產生“邏輯”。神經網絡具有很強的非線性函數擬合能力,但我們也都明確的知道,即使是在數據量非常大且數據無噪聲的時候,神經網絡擬合任何非線性函數的誤差都不是0,這一點跟存粹的使用非線性函數進行前向推理(邏輯推理)是不一致的。在進行符號邏輯推理時候,我們還必須面對如何將符號對象 跟 非線性函數中的語義對象對應起來的問題。在大語言模型中,我們使用vocab的embedding疊加position embedding進行語義對象的學習和對應。顯然,這個對應關系的學習的結果也不會100%的準確。目前的大模型方案,是試圖使用全世界的可得樣本去解決,但這種技術路徑顯然不是“解決”,而是“緩解”(Mitigate)。
這些內生性問題,一直制約著AI的應用范圍的擴張。在應用中,如果對準確性、可靠性有很高的要求(比如需要承擔法律責任,對于錯誤需要承擔包括客服解釋、損失賠償等經濟成本),則應用擴張的零邊際成本(Zero Marginal Cost)不可能達到,也就是不可避免的高人工維護成本。
同時,連接主義統計機器學習AI不可能通過自身產生的數據樣本來提升性能。這在當前大模型技術發展路徑下也限制了其性能提升的邊際速率。在這種意義下,Transformer 解決的模型和訓練數據的Scale Up問題,在現實的引力下已經發展到了極限。我們甚至可以武斷的說,在當前還沒有很好解決的問題,多半不可能通過大模型更好的解決了。
當前,很多人已經認為AGI幾年之內就能產生了。AGI真就這么簡單達到嗎?這個問題目前似乎變成了怎么定義AGI的問題。作為前人腦研究者以及現AI從業者,我對人類智能有信心,對連接主義統計機器學習AI不可能接近人類智能也有信心。潮起又潮落,每個弄潮的人追求的不一樣,很多人追求的只是在潮水中獲取自己的利益而已,在這種利益驅動下,隨大流說一些違背自己認知和良心的話也是可以理解的。引用“The dark ages of AI: a panel discussion at AAAI-84”中的一句話結束吧:
The real problem is that what reporters see as real issues in the world are very different from what the AI community sees as real issues.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.