DeepSeek對全世界的改變都是非常巨大的,尤其是對大模型的一種重新審視,對算力和算法的重新匹配讓科技企業開始了深度思考。而且,開源的DeepSeek也讓OpenAI感到了壓力,后續OpenAI也開始了自己的免費之旅。國內市場也有相應的免費推介,這都應該歸功于DeepSeek推出帶來的改變。
科技巨頭相繼接入DeepSeek也是對這種算法的認可。由于DeepSeek的努力讓市場的認知也發生了改變。近日,我們看到馬斯克也在宣布自己的大模型即將推出了迭代版。Grok3即將推出。馬斯克表示,最新大模型Grok 3將于太平洋時間周一晚上8點發布,屆時將進行現場演示。
如果僅僅是一個產品的升級還無法達到什么效應,不過,馬斯克的高明之處,就是極好地利用各種展現的時候給自己做廣告了。馬斯克表示:“Grok 3具有極強推理能力,在我們迄今為止所做的測試中,其表現優于我們所知的任何已發布產品。”也就是說,馬斯克認為自己的產品會比ChatGPT、DeepSeek的推理能力更強,言外之意就是自己的Grok3更強大了。
那么,是不是Grok3就是“地球上最聰明的AI”?估計也只有發布之后才能驗證了。熟悉大模型的用戶都知道,Grok大模型是馬斯克旗下的xAI公司推出的新一代人工智能模型,2023年11月,xAI發布第一款大模型Grok-1,邁出了在大模型領域探索的第一步。2024年3月18日,xAI團隊又推出了參數量高達3140億的Grok-1模型,這一參數量遠超OpenAI GPT-3.5的1750億,成為當時參數量最大的開源大語言模型。
2024年8月,Grok 2大模型發布 。Grok2主要應用于訓練AI聊天機器人。與Grok 1相比,它在訓練數據的使用上有所改進。Grok 1在訓練時未完全依賴真實世界數據,采用了大量合成數據,導致在處理真實世界中的細微差別和復雜性時表現欠佳。而Grok 2雖然依舊使用了大規模合成數據集,但同時融入了少量高質量的真實世界數據,在一定程度上彌補了初代模型在處理真實場景方面的不足。
據悉,即將發布的Grok 3,其最大的特點在于引入了“思維鏈”(Chain Of Thought)推理能力。該能力讓Grok 3能夠像人類認知過程一樣逐步處理復雜任務,顯著提高了模型處理復雜查詢和提供更連貫、更有邏輯的響應的能力。Grok 3模型在推理、編程能力以及文本和圖像分析等多模態功能方面有了顯著的提升。
馬斯克還表示,Grok 3已完成預訓練,其計算量比Grok 2高10倍。眾所周知,馬斯克一直扮演著追趕OpenAI的步伐,如今顯然又增加了DeepSeek了。在DeepSeek剛推出的時候,馬斯克表達了認可。不過,其也表示,xAI將會推出“比DeepSeek更強大的模型”。Grok 3無疑就要扮演這樣的角色。馬斯克表示,大模型市場真正的“革命”需依賴更底層技術的突破(如多模態融合、生成式AI的深度應用)。
眾所周知,DeepSeek的“低價高能”模式可能推動大模型商業化落地,但馬斯克認為真正的變革需技術質變,而非單純優化。其實,當一種低價高能在某些應用方面開始落地的時候,這時候就是算法的突出性,對于算力達不到的企業來說,一樣可以布局自己的專業化的大模型應用,這才是最關鍵的。而且,這也暗示了全球AI競賽的激烈程度將持續升級。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.