大數據文摘受權轉載自頭部科技
文丨丁靈波
最近幾天,AI圈沒有一家公司的熱度能比得上DeepSeek。
DeepSeek旗下R1大型語言模型推出之后,憑借開源共享和極具性價比的競爭優勢,引發了人們對中國AI力量快速趕超乃至顛覆美國AI引領地位預測,投資者紛紛重新評估AI競爭格局。
昨天,受“DeepSeek效應”影響,一些美國科技股紛紛下跌,尤其是和算力相關的公司如MRVL下跌19.1%,ORCL下跌13.8%,AVGO下跌17.4%,TSM下跌13.3%,AMD下跌6.4%,ASML下跌 5.8%,最慘的就是AI算力之王英偉達,下跌約17%市值一夜蒸發了近6000億美元,創下“美國公司有史以來的最大市值跌幅”。
在算力科技股大跌之際,DeepSeek并沒有放慢沖擊腳步。今天,他們又推出了一款基于視覺的模型Janus Pro 7B在開源社區上線,將其范圍從語言處理擴展到計算機視覺的關鍵領域。
進軍多模態
Janus Pro 7B是個啥?這應該算是DeepSeek進軍多模態模型的關鍵一步。
據介紹,這是一種全新的自回歸框架,兼具理解與生成能力的統一多模態大語言模型(MLLM),通過將視覺編碼解耦為不同路徑,克服了以往方法的局限,同時仍采用單一、統一的Transformer架構進行處理。
這種解耦不僅緩解了視覺編碼器在理解與生成兩種功能間的沖突,還增強了框架的靈活性,Janus Pro超越了以往的統一模型,其性能與特定任務模型相當甚至更優,此外,它還具備簡潔性、高度靈活性和高效性,Janus-Pro基于DeepSeek-LLM-15億參數基礎模型/DeepSeek-LLM-70億參數基礎模型構建,有望成為下一代統一多模態模型的有力候選。
論文介紹,Janus Pro 7B在各種視覺任務中表現出色,包括圖像生成、視覺問答和圖像字幕等,與一些規模巨大、資源最密集的AI模型不同,Janus Pro 7B無需消耗大量計算資源,用更少的參數實現了較高的平均性能。
這種效率可以大大降低希望將高級視覺AI集成到其運營中的企業的準入門檻,對于很多公司而言,無需承擔高昂的基礎算力成本即可部署復雜的視覺智能的前景越來越有吸引力。
2024年11月13日,DeepSeek曾上線一款JanusFlow模型,這次推出的Janus Pro是Janus系列中的高級版本,表現優于先前最先進的統一多模態模型以及一些特定任務模型。
Janus Pro能生成更穩定的圖像輸出,視覺質量有所提升,細節更豐富,不過圖像分辨率被限定為384×384,論文也提到輸入分辨率被限制在384×384算是一種局限性,會影響它在諸如光學字符識別(OCR)等精細任務中的表現。
不過,Janus Pro 7B生成的圖像高度逼真,在文本轉圖像生成方面盡管分辨率僅為384×384但仍包含大量細節。對于富有想象力和創意的場景,Janus Pro 7B能夠準確捕捉提示中的語義信息,生成邏輯合理、連貫一致的圖像,此外在圖像描述、地標識別、常識知識、文本識別等方便表現出色。
Janus Pro 7B的成效放在當下可能并不算轟動,但選擇的發布時機會放大其影響力,緊隨R1模型和引發美國AI市場動蕩之后,它進一步印證了DeepSeek作為AI秩序顛覆者的下一步雄心。
Janus Pro 7B 的開源性質或許會放大這種顛覆性,與之前的開源運動一樣,這降低了開發者對高級AI的訪問門檻,而不像封閉的專有模型那樣受限。不少國外媒體認為,DeepSeek的R1語言模型和視覺AI連擊兩拳,會進一步加劇美國人工智能公司的緊迫感和競爭壓力。
對于美國AI巨頭來說,DeepSeek構成了一些威脅,他們的專有高級模型能否在免費開源、高質量性價比服務替代品面前如何被市場繼續接受成為擺在面前的問題。
蘋果成“居家AGI”算力新寵
在美國社交媒體上,這兩天充斥著一種關于人工智能“天塌下來了”的情緒,引發了大型科技投資者們一定程度的恐慌,成為導致英偉達在內的AI算力科技股遭到拋售的原因之一,盡管DeepSeek的模型創新也需要使用英偉達芯片進行訓練。
英偉達的一位發言人表示:“DeepSeek是一項卓越的人工智能進展,是‘測試時縮放’(Test Time Scaling)的完美范例。DeepSeek的成果展示了如何利用這一技術,借助廣泛可用且完全符合出口管制規定的模型與計算資源,創建新的模型。”但該發言人稱,公司將DeepSeek的突破視為會給GPU帶來更多創新路線。
這位發言人補充道:“推理仍需要大量英偉達GPU和高性能網絡。我們現在有三條縮放定律:持續適用的預訓練和訓練后縮放定律,以及新的測試時縮放定律。”英偉達還表示,DeepSeek所使用的GPU完全符合美國出口規定。
Nvidia發言人的相關評論也反映了Nvidia首席執行官黃仁勛、OpenAI首席執行官Sam Altman近幾個月來討論的一個新主題:人工智能的熱潮和對Nvidia GPU的需求很大程度上是由“縮放定律”推動的。
自去年11月以來,黃仁勛和Altman一直專注于研究縮放定律的一個新方向,業內稱之為 “測試時縮放”。
這一概念指出,一個訓練完備的人工智能模型在進行預測、生成文本或圖像時,如果它能利用額外的計算能力,花費更多時間進行 “推理”,相較于運行時間較短的情況,它將給出更優的答案。
“測試時縮放定律” 的多種形式已應用于OpenAI的部分模型如o1,以及DeepSeek取得突破的R1模型,只不過R1基于有限算力的優化做到了更極致的水平。
雖然DeepSeek讓英偉達市值暴跌,但卻無意間帶動了蘋果的市值迎來一小波上漲,在AI賽道上掉隊的蘋果這回躺贏了一次。
因為好多開發者發現了DeepSeek在Apple硬件產品上運行效果很棒。一位開發者做了詳細分析,目前市場上能夠運行DeepSeek V3和R1的主流芯片:
NVIDIA H100:80GB內存,帶寬3TB/s,售價25000美元,每GB成本312.50美元;
AMD MI300X:192GB內存,帶寬5.3TB/s,售價20000美元,每GB成本104.17美元;
蘋果M2 Ultra:192GB內存,帶寬800GB/s,售價5000美元,每GB成本26.04美元!
原因在于,DeepSeek V3/R1是混合專家(MoE)模型,總共有6710億個參數,但每次生成一個token時,只有370億個參數處于激活狀態。在生成token令牌時,開發者無法確切知道哪370億個參數會被激活,所以所有參數都需要在高速GPU內存中隨時待命。
此外,開發者不能使用普通系統隨機存取存儲器(RAM),因為加載370億個激活參數時速度太慢(每秒生成令牌數會小于1)。另一方面,GPU內存速度快,但成本高昂。然而,Apple Silicon使用統一內存(Unified Memory)和UltraFusion技術連接芯片,這種折衷方案以較低成本提供了大量中速內存。
統一內存允許CPU和GPU共享同一內存池,而非各自擁有獨立內存,這樣就無需單獨的內存,也無需在CPU和GPU之間復制數據。
UltraFusion是蘋果專有的互連技術,能以超高速度、低延遲(2.5TB/s)連接兩個芯片,蘋果M2 Ultra實際上就是通過UltraFusion將兩個蘋果M2 Max芯片連接在一起,這就是蘋果能夠實現大容量內存(192GB)和高內存帶寬(800GB/s)的原因。
有傳言稱蘋果M4 Ultra將使用相同的UltraFusion技術連接兩個M4 Max芯片,這將使M4 Ultra擁有256GB的統一內存,帶寬1146GB/s,兩塊這樣的芯片可以每秒57個令牌的速度運行DeepSeek V3/R1。
蘋果成功地將這些技術整合在一個小巧的設備中,面向消費者提供高能效運營頂尖開源模型的能力。有不少用戶將多個蘋果計算設備集群在一起運行大型模型,例如在7臺M4 Mac Mini上流暢運行DeepSeek R1(6710 億參數)模型。
總而言之,除了NVIDIA,DeepSeek+Mac Mini讓開發者有了性價比更高的選擇,實現居家開發AGI。
特朗普敲響“行業警鐘”
美國總統特朗普周一表示, 中國AI程序DeepSeek的突然崛起 “應該給美國科技公司敲響警鐘”,因為又一款中國應用的火爆給政府和國會帶來了新的問題。
截至目前,關于TikTok的協商問題尚未解決,DeepSeek在上周末又沖到了蘋果應用商店免費應用第一名的位置,成為在美國大受歡迎的現象級應用之一,真是一波未平一波又起。
特朗普表示,他仍然預計美國科技公司將主導人工智能,但他承認低成本人工智能助手DeepSeek所帶來的挑戰,低成本模式對人工智能整體而言“是一個非常積極的發展”,“我們需要集中精力進行競爭”。
盡管美國對高性能半導體出口中國實行了嚴格管制,但仍沒阻止V3、R1等模型的誕生,這引發了網上關于這些管制措施有效性以及美國AI未來應如何發展的激烈爭論。
民主黨參議員馬克·沃納(Mark Warner)力挺現有的先進芯片技術出口管制,并表示可能需要進一步加強監管。 他認為:“聲稱出口管制無效的說法是錯誤的:DeepSeek的成績仍然依賴于先進的芯片,中國超大規模企業為部署這些模型而構建全球云基礎設施的努力仍然受到美國管制的嚴重影響。”
目前尚不清楚特朗普政府或國會是否會出臺新的人工智能政策來應對DeepSeek的崛起,但可以肯定的是,國內AI企業在取得成績的同時不能掉以輕心,面對更加激烈的下一步競爭同樣需要做好準備。
GPU算力按需租用
A100/H100 GPU算力按需租用,
秒級計費,平均節省開支30%以上!
掃碼了解詳情?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.