當業界還在熱議DeepSeek-R1開源戰略對AI生態的重構、持續探討Manus智能Agent的技術突破時,國產大模型已在垂直賽道實現關鍵性跨越。3月11日,網易有道宣布完成翻譯底層技術迭代,基于自主研發的子曰翻譯大模型2.0,在測試中實現翻譯質量超越國內外主流通用大模型,達行業第一。此次突破,也標志著國產大模型在專業領域取得實質性進展,通過數據、算法等技術創新,使得小參數垂類模型實現性能大幅提升。
據了解,搭載全新大模型的翻譯已在有道詞典、有道翻譯及有道翻譯官內上線,提供標準模型、高級模型兩種不同參數選擇,用戶可免費使用全新AI翻譯,體驗更精準、優質的翻譯服務。與此同時,有道詞典筆X7系列也已升級為最新的翻譯大模型,其余型號將陸續更新。
【有道翻譯首頁】
作為國內翻譯領域的領先者,有道全系翻譯產品目前擁有超10億用戶。QuestMobile數據顯示,從2019年至今,網易有道詞典已連續六年榮獲「中國互聯網APP TOP50賽道用戶規模NO.1」,持續占據教育工具領域榜首。
繼率先推出統計機器翻譯及神經網絡翻譯(NMT)后,有道再次領銜行業,在翻譯技術上實現重大突破,使子曰翻譯大模型2.0的整體性能實現質的飛躍。
根據國際權威翻譯評測集WMT和Flores200的最新測試數據顯示,子曰翻譯大模型2.0在中英互譯領域的譯文專業度和穩定性較前代版本均有顯著提升。除此之外,在涵蓋人文學科、商科、生活服務、醫療、科學等19個垂直領域的多學科對比測試中,子曰翻譯大模型2.0與國內外主流通用大模型及專業翻譯模型展開“全面競技”,數據顯示,子曰翻譯大模型2.0在專業性、準確性、語言慣例和風格等方面,展現出了更高的翻譯準確率、流暢度,模型翻譯質量達到行業第一。
經歷了10個月的技術更迭,子曰翻譯大模型2.0從數據、算法、評估三個層面進行技術突破,最終以14B小參數垂類模型實現高水準翻譯性能,這也再次展現出有道在教育大模型發展上的垂直專業優勢。
在數據層面,有道收集并嚴格清洗了高質量的翻譯語料數據,并由英語專八認證人員及職業譯員進行精細化人工標注,使得模型擁有海量的優質數據資源庫,增強其在多樣化翻譯場景的應對能力。
在算法層面,有道以子曰大模型為基礎,進行二次預訓練,進一步打造了更具專業性與針對性的翻譯基座大模型,結合大模型蒸餾技術、大模型融合技術、Online DPO技術等多項手段,有效避免了大模型的災難性遺忘問題,并在運行效率、準確性、流暢性等翻譯性能上實現了大幅提升。
在評估層面,借助翻譯數據沉淀,有道自主研發了翻譯評估模型Reward Model,其準確率超越了COMET——當前最先進的評估指標之一,為子曰翻譯大模型的性能評估提供可靠的量化依據及完善的人工評估方案,多維度對模型的翻譯結果進行評估和分析。
事實上,隨著DeepSeek等開源模型的應用范圍逐漸擴大,“場景+數據”越來越成為AI應用的護城河。作為深耕翻譯領域17年的代表,有道在該領域內的數據及資源積累,使其能夠以高質量語料訓練強化模型的翻譯性能,展現出更強的領域專業性和翻譯任務針對性,使得小參數垂類模型的翻譯質量反超通用大模型。
“通用大模型比的是參數大、算力強,但翻譯這件事,參數堆不出專業度;當通用大模型競逐參數規模時,我們還是更相信垂類模型的未來價值——用專業的垂直應用真正解決專業場景的痛點,這也正是我們持續努力和進化的方向。”網易有道相關負責人表示。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.