作者 商迪安
最近,通義APP 翻譯能力全面升級。官方信息顯示,本次通義APP攻克了文字翻譯、同傳翻譯、文檔翻譯、圖片翻譯四大核心場景,打造面向個人與專業(yè)用戶的“最強(qiáng)翻譯綜合體”。
針對本次升級的諸多功能,「電廠」選取多個實(shí)際用例、分多角度進(jìn)行實(shí)測。
結(jié)果顯示,不論是小眾語言文本翻譯,還是在同聲傳譯、跨語言文檔翻譯、圖片翻譯等生產(chǎn)力場景下,升級后的通義APP都能精準(zhǔn)理解翻譯指令,以及有效處理專業(yè)術(shù)語、上下文語義一致性等復(fù)雜語言問題,在專業(yè)性表達(dá)、語義一致性等方面表現(xiàn)突出。
支持119種語言/方言翻譯,讓出游不再“難行”
據(jù)官方信息,升級后的通義APP新版本支持多達(dá)119種語言與方言的文字互譯,涵蓋印歐、亞非、南亞等多語種體系,并且著力打磨復(fù)雜語義處理能力。
提升語言覆蓋密度,在大模型應(yīng)用領(lǐng)域并不是一個容易的選擇。究其原因,作為世界第一大語言的英語既是當(dāng)下互聯(lián)網(wǎng)及科研領(lǐng)域的主流語言,又有豐富充足的訓(xùn)練語料,因此是各大AI翻譯應(yīng)用積累用戶規(guī)模、形成數(shù)據(jù)飛輪的最好選擇。
但在日常使用場景下,“小眾”語言無疑同樣存在用戶市場。通義APP選擇“看見”這部分人的需求,不僅事涉回報(bào)比,更意味著對技術(shù)的極大挑戰(zhàn)。
以隸屬印歐語系的葡萄牙語為例,其是擁有約2.6億母語或官方使用者的世界第六大語言,也是在巴西、葡萄牙等旅游勝地廣泛應(yīng)用的“區(qū)域性熱門語言”。即便如此,葡語翻譯在大模型應(yīng)用領(lǐng)域也絕非熱門功能。
為了測評通義APP在小眾語言翻譯領(lǐng)域的語義準(zhǔn)確度,本次「電廠」也以葡萄牙語為例,準(zhǔn)備了葡語版本的機(jī)場問詢臺常用問答、機(jī)場廣播素材,并將其輸入通義APP進(jìn)行翻譯為中文。
結(jié)果顯示,通義APP準(zhǔn)確地捕捉和翻譯出了地名、指引路線、登機(jī)口變更、登機(jī)時(shí)間等關(guān)鍵信息,足以滿足旅客的基本對話需求。
接下來,電廠還測試了通義APP對隸屬壯侗語系的老撾語的翻譯能力。
公開信息顯示,老撾語的語序、表達(dá)均與漢語差異極大。比如不同于中文常用的“形容詞+名詞”的語法結(jié)構(gòu)、老撾語通常將形容詞放在名詞之后;由于文化背景不同,許多老撾語表達(dá)在中文中并沒有直接可對照的詞匯……
「電廠」預(yù)設(shè)了一個旅行中常見的車站問答情景,將對話輸入通義APP。翻譯結(jié)果顯示,在對問答語氣的理解、翻譯的準(zhǔn)確性、金錢單位等專有名詞的理解方面,通義APP的表現(xiàn)同樣優(yōu)秀。
特別指出的是,不只是日常場景,在強(qiáng)專業(yè)性、高難度的翻譯場景下,通義APP的表現(xiàn)也較為優(yōu)異。
以馬來語為例,這是一門屬于南島語系的語言,目前廣泛應(yīng)用于馬來西亞、新加坡、印度尼西亞、文萊等熱帶國家。
我們將流行于馬來語地區(qū)的諺語“air yang tenang jangan disangka tiada buaya”輸入通義APP及其他多個模型進(jìn)行翻譯。
通義APP給出的答案為“靜水莫當(dāng)無鱷魚”,兼顧了精煉、準(zhǔn)確兩大要素;其他模型給出的答案則大多局限于字面意思理解,如“別以為平靜的水中沒有鱷魚”“風(fēng)平浪靜,別以為沒有鱷魚”。
打造專屬隨身的免費(fèi)同傳服務(wù),不限時(shí)間及次數(shù)
除了文本翻譯,升級后的通義APP更支持10大語種同傳翻譯。
具體來說,通義APP可以識別包含中文(普通話)、英語、日語、韓語、粵語、德語、法語、俄語、意大利語、西班牙語這10大語言,并能夠翻譯出中文、英語、日語、韓語這4大語言。
同聲傳譯,又稱為同步口譯,是一種高級翻譯形式,要求譯員在講話者發(fā)言的同時(shí)、幾乎同步地將其所說內(nèi)容翻譯成另一種語言。當(dāng)前世界上95%的國際高端會議都采用同聲傳譯的方式翻譯,由于難度極高,同傳有“翻譯之王”“翻譯皇冠之上的明珠”之稱,同傳師也供不應(yīng)求、日薪也高達(dá)萬元之上。
這樣的背景下,通義APP同傳功能的推出,意味著每個用戶都可以擁有一個專屬、隨身的同傳師。
針對同傳功能,「電廠」選取了最為常用的中、英文場景,分別測試了通義APP的英傳中、中傳英功能。
在英傳中場景下,「電廠」選取了斯坦福大學(xué)首位紅杉講席教授、美國國家工程院院士、華裔人工智能科學(xué)家李飛飛的TED演講《有了空間智能,AI將會理解現(xiàn)實(shí)世界》。
在整個同傳過程中,通義APP精準(zhǔn)地捕捉到了演講者的語氣、對演講內(nèi)容進(jìn)行合理分段,并實(shí)時(shí)將英文轉(zhuǎn)化為符合中文語序的譯文,同傳的中文內(nèi)容閱讀流暢、相較英文原文十分準(zhǔn)確。
在中傳英場景下,「電廠」讓通義APP翻譯了2025年6月21日晚間新聞聯(lián)播天氣預(yù)報(bào)的內(nèi)容。
結(jié)果顯示,在總時(shí)長約1分鐘50秒的主持人口播過程中,通義APP幾乎一字不差地識別了播報(bào)內(nèi)容,在頓挫的語氣中準(zhǔn)確完成了長句識別等任務(wù)。
同傳翻譯過程中,通義APP 幾乎不存在啟動延遲,也能夠合理翻譯長句和準(zhǔn)確預(yù)判譯文結(jié)構(gòu)。
特別要指出的是,相較同類型產(chǎn)品,通義APP同傳功能不限時(shí)、不限次、完全免費(fèi),完全擺脫了時(shí)間限制與付費(fèi)門檻。
告別DeepL,一個APP實(shí)現(xiàn)專業(yè)級文檔/圖片翻譯
在生產(chǎn)力場景中,通義APP全新升級的翻譯能力也能派上用場。針對跨語言文檔處理需求,可以提供專業(yè)級的文檔翻譯體驗(yàn)。
以英文文本閱讀為例,「電廠」將一份索尼NEX-7 微單相機(jī)英文版快速使用說明輸入了通義APP。后者在不到一分鐘的時(shí)間內(nèi)完成了全部64頁內(nèi)容的翻譯處理。
可以看到,翻譯文檔不僅實(shí)現(xiàn)了用詞的精準(zhǔn),而且還保持了和原文檔一致的排版。此外通義APP還完成了文中表格內(nèi)容的翻譯處理。
在全文翻譯完畢后,通義APP還自動生成了全文總結(jié)與腦圖,幫助用戶高效掌握文檔核心信息。
同時(shí),本次通義APP全面升級了圖像場景下的多語言理解與生成能力,其圖片翻譯體驗(yàn)同樣達(dá)到了專業(yè)級別。在菜單、圖文海報(bào)等應(yīng)用場景下,中英互譯、一鍵出圖不再是難題。
以一張英文攝像機(jī)功能使用說明圖為例,在圖片翻譯頁面將其輸入后,點(diǎn)擊“對照原圖查看譯文”按鈕,即可生成一張中文版本的實(shí)用功能說明圖。
可以看到,區(qū)別于傳統(tǒng)OCR(XXX)工具僅完成“翻譯單詞”的任務(wù),通義APP還保留了圖片原本的排版結(jié)構(gòu)。
左-英文原圖,右-中文翻譯圖片結(jié)果
2023年7月,通義APP上正式上架應(yīng)用市場,并在經(jīng)歷了一年多時(shí)間的穩(wěn)定更新后,于2024年末從阿里云分拆、并入阿里智能信息事業(yè)群。
為了更加貼近用戶,通義APP也悄然完成了一系列“改頭換面”,比如其在上半年完成了交互設(shè)計(jì)的全面改版、只為打造更加易用的用戶界面,曾引起市場廣泛關(guān)注。但這或許只是第一步。
翻譯功能的上線,折射出通義APP不止要“好看易用”,還希望在用戶深度使用的諸多生活和生產(chǎn)力場景中提供價(jià)值。隨著底層模型技術(shù)能力升級和產(chǎn)品打磨深入,通義APP的“進(jìn)化”遠(yuǎn)未停止,未來有望為AI智能應(yīng)用服務(wù)市場帶來更多新鮮感。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.