“地球上最聰明的人工智能”、“20萬塊英偉達GPU訓練”
2月18日,特斯拉創始人埃隆·馬斯克旗下XAI舉行Grok 3發布會,超過100萬人在線觀看,關注度拉滿。
是不是“地表最強”且不論,馬斯克 “有錢任性”確實是真的。
為了支持Grok3訓練,團隊僅用92天就已經實現了超算集群的算力翻倍,GPU數量已達20萬塊。啥概念呢?光是GPU消耗的電費就相當于30萬個家庭一年的用電量,僅電力支出就高達約2.6億美元。并且,xAI與戴爾達成50億美元協議,戴爾或將今年向xAI交付搭載英偉達GB200芯片的服務器。
根據xAI公布的測試數據,Grok 3在數學(AIME24測試得分52分)、科學(GPQA評估)和編程能力(LCB測試)上超過谷歌Gemini-2 Pro、DeepSeek-V3、Claude 3.5等模型,甚至在推理測試中達到93分(Grok 3 Reasoning Beta版)。
同時,引入“思維鏈”(Chain of Thought)機制,分步驟解決復雜問題,提升邏輯連貫性;DeepSearch功能可掃描互聯網信息并生成摘要,增強信息檢索效率。
盡管官方數據亮眼,獨立測試顯示其代碼生成能力不穩定(例如無法正確處理100個小球的彈跳模擬),且基礎邏輯問題(如判斷9.8與9.11大小)需依賴“推理模式”解決。此外,Grok 3未開源,核心算法被遮蔽,僅通過訂閱服務(如X平臺Premium Plus)提供訪問,限制開放生態構建。
反觀被部分網友稱之為“國民AI”的DeepSeek,之所以能快速出圈,“性能、成本、速度”都走在了行業前列。
據每日經濟新聞報道,DeepSeek R1的預訓練費用只有557.6萬美元,僅是OpenAI ChatGPT-4o模型訓練成本的不到十分之一。在擺脫硬件束縛的情況下,仍然在推理性能等方面接近ChatGPT-o1,部分領域還有所超越。
不是GPT用不起,而是DeepSeek更具性價比。
有了DeepSeek這個”大黑馬”,對于Grok 3的發布網友評價也呈現分化:
看好:
“看評測效果還不錯,榜單上的確是第一。”
“Grok 3是首個突破1400分的模型,并且在所有類別中排名第一”
不看好:
“有量變,無質變,性價比不高。我感覺馬斯克的 Grok3 走錯了方向,或者說,被 OpenAI 帶溝里去了。”
“在ds r1已經如此強大且開源的情況下,基模出現突破的重要性已經沒那么高了,而多模態和與大模型匹配的硬件的發展還有很大空間。”
這里我們不妨問問當局者“DeepSeek”怎么看這件事:
它給出的總結是:
“Grok 3在數學、科學等硬核任務中表現更強,但其高成本與閉源模式限制了普及性;DeepSeek則以性價比和場景適配性見長。兩者并非零和競爭,而是代表了AI發展的不同方向——技術極致化與應用普惠化的共存。未來,模型性能的邊際效益遞減可能促使行業更多轉向應用創新與倫理治理的平衡。”
同時,DeepSeek給出了自己的核心競爭力:
●性價比與輕量化:DeepSeek-R1以行業1/50的訓練成本實現頂級性能,API調用成本低至0.001元/千Tokens,且無需依賴超算集群即可高效部署。
●本土化與場景適配:在中文語義理解、政務流程優化(如深圳福田區政務效率提升60%)等場景中表現突出,更貼合中國市場實際需求。
●開源與生態優勢:通過開源策略快速激活開發者社區,覆蓋近百種語言實時互譯,并內置嚴格的倫理約束機制,避免爭議性輸出。
你怎么看馬斯克 Grok 3 大模型的發布,他夸下海口的“地表最強AI”名副其實嗎?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.