科技點(diǎn)評| 通義千問2.5發(fā)布，阿里云的AI野望

2024-05-10 11:33:06　來源: 董指導(dǎo)聊科技

上海舉報(bào)

分享至

文：董指導(dǎo)

5月9日，阿里云正式發(fā)布了AI大模型“通義千問2.5”。從初代開始，歷經(jīng)一年多的研發(fā)迭代后，通義千問的能力再次提升。和上一個(gè)2.1版本相比，理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%。

根據(jù)權(quán)威基準(zhǔn)OpenCompass的測評結(jié)果，通義千問2.5得分追平GPT-4 Turbo，目前已經(jīng)是中文大模型的領(lǐng)先者。

同時(shí)，視覺理解模型在多個(gè)多模態(tài)標(biāo)準(zhǔn)測試中超越Gemini Ultra和GPT-4V；代碼大模型也是行業(yè)領(lǐng)先，其支撐的智能編碼助手通義靈碼也是國內(nèi)用戶規(guī)模第一。

這個(gè)進(jìn)展，對國內(nèi)AI行業(yè)的發(fā)展還是有不少幫助的。

首先，加速行業(yè)格局塑造。

從大模型層面來看，國內(nèi)大模型已經(jīng)從“百模大戰(zhàn)”，進(jìn)入了“加速淘汰”的階段。淘汰的主要指標(biāo)依然是“資金、算力”。而通義千問2.5的發(fā)布，將會(huì)繼續(xù)加速行業(yè)格局塑造，資金、人才等資源會(huì)持續(xù)涌向頭部大模型公司。

其次，加速應(yīng)用落地。

從2023年初到如今，一年多過去后，市場對AI的熱情，已經(jīng)有了一些消退。主要原因是應(yīng)用落地速度較慢。

應(yīng)用落地較慢的原因，供給端在于大模型的能力提升，需求端在于剛需且有支付能力的場景挖掘。

通義千問能力的提升，至少可以加速“長文本”場景的AI應(yīng)用落地。包括金融、法律、傳媒宣發(fā)、辦公等場景。

另外，拓展阿里云的商業(yè)增長來源。

目前阿里云自研大模型通義通過阿里云服務(wù)企業(yè)超過9萬、通過釘釘服務(wù)企業(yè)超過220萬。

比如，小米“小愛同學(xué)”與通義達(dá)成合作，強(qiáng)化其多模態(tài) AI 在小米汽車、手機(jī)等設(shè)備落地；諸如微博、眾安保險(xiǎn)、完美世界游戲等企業(yè)也都接入了通義大模型。中國科學(xué)院國家天文臺(tái)、陜西煤業(yè)等也在用通義大模型在各自領(lǐng)域落地。

同時(shí)，通義大模型的研發(fā)進(jìn)展，也是阿里云AI戰(zhàn)略的體現(xiàn)，同時(shí)加速國內(nèi)公有云擴(kuò)張。

中國信通院數(shù)據(jù)顯示，全球?qū)Ρ葋砜?，我國公共云在云市場的占比?0%左右，顯著低于美國的60%和歐盟的50%。而公共云的發(fā)展，就像水電一樣，可以為全社會(huì)創(chuàng)新帶來支撐。

整體來看，隨著通義大模型的迭代，國內(nèi)AI應(yīng)用的生產(chǎn)能力得到加強(qiáng)；從而可以更高效、低成本地在需求和場景方面進(jìn)行探索，加速AI在生活中的落地。而長文本場景，有望最先爆發(fā)。

-全文完

和董指導(dǎo)聊聊天

點(diǎn)個(gè)在看和贊再走~

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.