文:董指導(dǎo)
5月9日,阿里云正式發(fā)布了AI大模型“通義千問2.5”。從初代開始,歷經(jīng)一年多的研發(fā)迭代后,通義千問的能力再次提升。和上一個(gè)2.1版本相比,理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。
根據(jù)權(quán)威基準(zhǔn)OpenCompass的測評結(jié)果,通義千問2.5得分追平GPT-4 Turbo,目前已經(jīng)是中文大模型的領(lǐng)先者。
同時(shí),視覺理解模型在多個(gè)多模態(tài)標(biāo)準(zhǔn)測試中超越Gemini Ultra和GPT-4V;代碼大模型也是行業(yè)領(lǐng)先,其支撐的智能編碼助手通義靈碼也是國內(nèi)用戶規(guī)模第一。
這個(gè)進(jìn)展,對國內(nèi)AI行業(yè)的發(fā)展還是有不少幫助的。
首先,加速行業(yè)格局塑造。
從大模型層面來看,國內(nèi)大模型已經(jīng)從“百模大戰(zhàn)”,進(jìn)入了“加速淘汰”的階段。淘汰的主要指標(biāo)依然是“資金、算力”。而通義千問2.5的發(fā)布,將會(huì)繼續(xù)加速行業(yè)格局塑造,資金、人才等資源會(huì)持續(xù)涌向頭部大模型公司。
其次,加速應(yīng)用落地。
從2023年初到如今,一年多過去后,市場對AI的熱情,已經(jīng)有了一些消退。主要原因是應(yīng)用落地速度較慢。
應(yīng)用落地較慢的原因,供給端在于大模型的能力提升,需求端在于剛需且有支付能力的場景挖掘。
通義千問能力的提升,至少可以加速“長文本”場景的AI應(yīng)用落地。包括金融、法律、傳媒宣發(fā)、辦公等場景。
另外,拓展阿里云的商業(yè)增長來源。
目前阿里云自研大模型通義通過阿里云服務(wù)企業(yè)超過9萬、通過釘釘服務(wù)企業(yè)超過220萬。
比如,小米“小愛同學(xué)”與通義達(dá)成合作,強(qiáng)化其多模態(tài) AI 在小米汽車、手機(jī)等設(shè)備落地;諸如微博、眾安保險(xiǎn)、完美世界游戲等企業(yè)也都接入了通義大模型。中國科學(xué)院國家天文臺(tái)、陜西煤業(yè)等也在用通義大模型在各自領(lǐng)域落地。
同時(shí),通義大模型的研發(fā)進(jìn)展,也是阿里云AI戰(zhàn)略的體現(xiàn),同時(shí)加速國內(nèi)公有云擴(kuò)張。
中國信通院數(shù)據(jù)顯示,全球?qū)Ρ葋砜?,我國公共云在云市場的占比?0%左右,顯著低于美國的60%和歐盟的50%。而公共云的發(fā)展,就像水電一樣,可以為全社會(huì)創(chuàng)新帶來支撐。
整體來看,隨著通義大模型的迭代,國內(nèi)AI應(yīng)用的生產(chǎn)能力得到加強(qiáng);從而可以更高效、低成本地在需求和場景方面進(jìn)行探索,加速AI在生活中的落地。而長文本場景,有望最先爆發(fā)。
-全文完
和董指導(dǎo)聊聊天
點(diǎn)個(gè)在看和贊再走~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.