天哪,怎么我們落后了,明明大家做的是一樣的事
這是阿里巴巴新任董事會(huì)主席蔡崇信回憶起DeepSeek強(qiáng)勢出圈時(shí)發(fā)出的驚嘆。
DeepSeek想必大家都不陌生了,現(xiàn)在的AI大模型幾乎都上了“深度思考”。
它能夠把它的推理過程給你展示出來。
DeepSeek官方于2025年1月20日首次公開了R1模型,宣布正式進(jìn)軍通用推理大模型賽道。
次日該大模型便引發(fā)了業(yè)界眾多AI大佬的廣泛關(guān)注,獲得了高度認(rèn)可。
這是一次國產(chǎn)AI大模型的技術(shù)里程碑,是強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)推理透明化的核心創(chuàng)新
打破了OpenAI此前的壟斷格局,更重要的是R1模型成本低、性能高!
近日蔡崇信在巴黎VivaTech技術(shù)大會(huì)上坦言,公司曾經(jīng)一度迷失了方向,阿里巴巴勢必要在AI領(lǐng)域押注
DeepSeek的成功讓阿里巴巴的工程師們感到壓力很大。
阿里巴巴擁有的資源要遠(yuǎn)遠(yuǎn)大于初創(chuàng)時(shí)期的DeepSeek,但是產(chǎn)出結(jié)果卻是反過來。
主管工程師當(dāng)即取消了所有研發(fā)人員的春節(jié)假期,所有人都必須全力以赴。
吃在公司,睡在公司,追上落后的AI大模型進(jìn)度。
經(jīng)過連日的研發(fā)奮戰(zhàn),終于阿里巴巴推出了自己的Qwen(千問)大模型。
當(dāng)然了“后來者居上”的逆轉(zhuǎn)其實(shí)并沒有出現(xiàn)。
根據(jù)資料顯示Qwen3-235B-A22B大模型的推理能力89.3分,代碼生成能力92.7分,多輪對話88.9分。
雖然數(shù)據(jù)上看得過去,但是與國際頂尖模型GPT-4.5、Claude3.7等差距還相差7%左右。
阿里巴巴的QWen大模型還需要進(jìn)行打磨以及創(chuàng)新。
蔡崇信表示,阿里巴巴并不是為了在技術(shù)上與業(yè)界對手競爭高下,最終的愿景則是讓AI使用普及,實(shí)現(xiàn)技術(shù)普惠
技術(shù)普惠的同時(shí),阿里巴巴通過海里的推理數(shù)據(jù),將電商與核心業(yè)務(wù)云計(jì)算進(jìn)行整合,產(chǎn)生價(jià)值。
蔡崇信表示,未來幾年,阿里巴巴將持續(xù)投入超3800億元人民幣,用于AI基礎(chǔ)設(shè)施的建設(shè)。
現(xiàn)在的表現(xiàn)依舊不能讓蔡崇信滿意,其仍然認(rèn)為當(dāng)前的環(huán)境還是非常艱難。
在這場AI的“角逐”中,不知道誰能夠最后活下來!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.