8月21日,在2024火山引擎AI創(chuàng)新巡展上海站的采訪環(huán)節(jié),火山引擎總裁譚待用上面這句話,談到了大模型與云之間的關(guān)系。
他表示,無論是公有云,還是私有云,本質(zhì)上大模型都是其中的一部分,大模型私有化也是私有云的一部分;在公有云中,調(diào)用大模型,本質(zhì)上是在調(diào)用云上的一個(gè)PaaS服務(wù),只不過這個(gè)PaaS服務(wù)特別重要。
也因此,譚待強(qiáng)調(diào),沒有必要把AI和云對立來看——而火山引擎作為云服務(wù)廠商的定位,是沒有變化。
不過,不得不承認(rèn)的是,大模型的加持,讓火山引擎看到了它在云計(jì)算市場的未來機(jī)遇。所以,借重于這個(gè)千載難逢的機(jī)遇,火山引擎作為字節(jié)跳動(dòng)的云計(jì)算業(yè)務(wù)板塊,正在花大力氣推動(dòng)旗下豆包大模型的技術(shù)突破、成本降低和應(yīng)用拓展,并且面向不同的行業(yè)尋找落地機(jī)遇。
從目前的情況來看,火山引擎已經(jīng)取得了具備巨大可能性的突破。
進(jìn)擊的大模型:不僅僅是技術(shù)
作為火山引擎旗下的破局利器,豆包大模型的進(jìn)化速度令人刮目相看。
這其中,一個(gè)典型且容易被外界感知的數(shù)據(jù)是:根據(jù)公開及內(nèi)部測評集顯示,最新版豆包大語言模型相比發(fā)布初期綜合能力提升了20.3%。
從具體的細(xì)分能力來看,豆包大模型實(shí)現(xiàn)了如下方面的提升:
- 角色扮演能力提升了38.3%,具備了更強(qiáng)的上下文感知,讓對話情境更連貫、角色更擬人化。
- 語言理解能力提升了33.3%,讓豆包大模型在信息分類、抽取、摘要、理解和問答等NLP方面都有了顯著提升,能夠在更多生產(chǎn)力場景中得到應(yīng)用。
- 此外,模型在長文任務(wù)、數(shù)學(xué)、專業(yè)知識、代碼能力上也有不同程度的增強(qiáng)。
基于這些技術(shù)能力的升級,火山引擎還在本次活動(dòng)中公布了多個(gè)豆包垂類模型的最新升級,具體來說:
- 豆包·文生圖模型對長文本有更精準(zhǔn)的圖文匹配能力,多主體、多位置、手部結(jié)構(gòu)等復(fù)雜場景的生圖能力更強(qiáng),更善于理解中國特色元素,創(chuàng)造更具美感的中國風(fēng)圖片。
- 豆包·語音識別模型基于大語言模型豐富的知識和推理能力,通過上下文感知,提升語音識別準(zhǔn)確性,在多個(gè)公開測試集中,與國內(nèi)公開發(fā)布的語音識別大模型相比,錯(cuò)誤率最高降低40%;支持一個(gè)模型識別普通話和粵語、上海話、四川話、西安話、閩南語等方言。
- 豆包·語音合成模型升級了流式語音合成能力,能夠?qū)崟r(shí)響應(yīng)、精準(zhǔn)斷句,支持「邊想邊說」。
另外,基于上述能力,火山引擎還專門發(fā)布了對話式AI實(shí)時(shí)交互解決方案,該方案整合了豆包大模型和實(shí)時(shí)音視頻(RTC)技術(shù),提供端到端的大模型實(shí)時(shí)對話方案。
基于該方案,企業(yè)可以輕松地在自己AI應(yīng)用中嵌入該實(shí)時(shí)語音功能,用戶不僅能用語音與AI進(jìn)行交談,還能像平時(shí)說話一樣,在對話過程中適時(shí)打斷或插話,經(jīng)過升級后的AI聲音具備較好表現(xiàn)力和感情色彩,對話更自然、更真實(shí)、更流暢。
另外,除了模型效果,針對企業(yè)生產(chǎn)環(huán)境對AI高并發(fā)需求出發(fā),豆包通用模型pro提供了國內(nèi)最高標(biāo)準(zhǔn)的800k初始TPM(每分鐘處理tokens數(shù)量)。基于這樣的能力,火山引擎可以在客戶高并發(fā)的對話場景要求下,幫助客戶完成多輪提示詞的優(yōu)化,并且提供充分的高并發(fā)保障,幫助客戶應(yīng)對高峰場景。
總體來看,經(jīng)過技術(shù)能力的持續(xù)迭代,豆包大模型在三個(gè)月的時(shí)間里,已經(jīng)完成了新一輪肉眼可見的能力進(jìn)化,涵蓋了基礎(chǔ)能力提升、垂類模型優(yōu)化、實(shí)時(shí)對話方案、高并發(fā)場景保障等多個(gè)與客戶關(guān)聯(lián)密切的方面。
除了能力本身,我們還也注意到,火山引擎還在活動(dòng)現(xiàn)場介紹了一系列面向客戶的大模型相關(guān)產(chǎn)品升級點(diǎn),比如說火山方舟最新推出的全周期安全可信方案、扣子專業(yè)版、HiAgent的最新能力等。
這背后,自然也離不開字節(jié)跳動(dòng)本身在AI領(lǐng)域的深厚技術(shù)積累。
值得一提的是,除了技術(shù)開發(fā),火山引擎也尤其注重于降低豆包大模型的成本,從而使得它的快速走向「價(jià)值創(chuàng)造階段」。實(shí)際上,在5月15日的活動(dòng)上,豆包主力模型面向企業(yè)市場就掀起了一場價(jià)格戰(zhàn),并由此掀起了行業(yè)里的大模型降價(jià)風(fēng)潮。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.