沉浸式翻譯我相信只要是 AI 圈子的人基本上人手一個(gè),甚至你如果經(jīng)??春M鈨?nèi)容不可能沒(méi)有。
他可以用 AI 或者常規(guī)翻譯生成整個(gè)網(wǎng)頁(yè)的多語(yǔ)言對(duì)照翻譯,還有連按三下空格將輸入框的中文翻譯為英文這個(gè)神級(jí)技能。
除了體驗(yàn)很好之外還非常良心,免費(fèi)提供幾乎無(wú)限量的谷歌翻譯額度,而且?guī)缀踹m配了所有的模型 API,你可以隨意填寫(xiě)自己的。
然后前幾天我發(fā)現(xiàn)他們發(fā)了個(gè)新功能:Babeldoc,支持在翻譯 PDF 的時(shí)候保持文件的原始排版,而且還能完整提取 PDF 內(nèi)嵌的圖表、腳注、公式等??本元素。
剛開(kāi)始我是不信的,過(guò)去這一兩年相信大家都用過(guò)很多類(lèi)似 PDF 翻譯工具了,都知道這玩意想要翻譯的同時(shí)保持排版有多難。
我隨手拿一個(gè)論文 PDF 試了一下,我去這玩意真的,整個(gè) PDF 的排版真的一點(diǎn)都不帶差的。
之后就用我們最近比較熱的幾個(gè) PDF 試了試,真的很猛,各位可以看一下詳細(xì)的測(cè)試。
另外翻譯好的谷歌提示詞 PDF 和 HAI 2025 年人工智能報(bào)告的文件我也會(huì)放在文章后面,感興趣的可以領(lǐng)取。
先來(lái)點(diǎn)低難度的常見(jiàn)的論文,一般都不會(huì)有非常復(fù)雜的排版,難點(diǎn)主要在圖表和表格以及公式上。
比如常見(jiàn)的論文開(kāi)頭部分,像字節(jié)和 Meta 的論文都是這樣,從標(biāo)題到摘要部分到下面的圖表都能對(duì)得上。
學(xué)術(shù)論文中很多數(shù)學(xué)公式、化學(xué)公式的排版非常復(fù)雜,以前如果周?chē)泄?,那文字的排版就不太好保持了?/p>
Babeldoc 這個(gè)就很厲害中英文的字?jǐn)?shù)和單詞長(zhǎng)度肯定是不一樣的,但是他們就是能保證兩者都在差不多的位置。
然后就是表格了雖然 Babeldoc 橫線沒(méi)了,但是不影響閱讀,整體的格式已經(jīng)保持的很好了。
然后我們來(lái)一個(gè)稍微復(fù)雜點(diǎn)的,前段時(shí)間比較火的谷歌提示詞寫(xiě)作教程的 PDF。
這個(gè) PDF 明顯會(huì)專(zhuān)門(mén)做了一些排版,重新定義了不同的字號(hào)和間距,還有不同的字體,這種一般挺麻煩的,雖然看起來(lái)還是白底黑字。
Babeldoc 依然沒(méi)有問(wèn)題,整個(gè)字號(hào)和段間距、行間距都跟原始 PDF 是一致的。
當(dāng)然這里也有點(diǎn)小問(wèn)題,由于谷歌這個(gè) PDF 在代碼和提示詞的部分用了一個(gè)別的字體,Babeldoc沒(méi)有讀取到,所以沒(méi)有翻譯。
但其實(shí)也還好本來(lái)代碼也不需要翻譯,同時(shí)為了兜底,沉浸式翻譯的文檔翻譯還支持導(dǎo)出中英雙語(yǔ)對(duì)照的 PDF,這個(gè)功能完美解決了問(wèn)題,而且這個(gè)問(wèn)題我也反饋給他們了。
最后的終極考驗(yàn)是斯坦福 HAI 的 2025 年人工智能研究報(bào)告,這個(gè) PDF 有456 頁(yè),而且內(nèi)容極其復(fù)雜,各種圖表、圖片、標(biāo)志、角標(biāo)、多列排版,疑難雜癥它全占了。
沒(méi)想到這個(gè)轉(zhuǎn)的非常完美,先看一下這一頁(yè),分割線、下劃線加上標(biāo)志,沒(méi)啥問(wèn)題,角標(biāo)都給你翻譯了。
這一頁(yè)更是重量級(jí),多列排版、圖表、大段注釋?zhuān)w依然翻譯的很好,而且圖表的主副標(biāo)題都翻譯了。
這個(gè)更邪門(mén)了,誰(shuí)會(huì)想到左上角這個(gè)帶顏色區(qū)塊這種排版啊,但是 Babeldoc 依然搞定了。
那說(shuō)了這么多如何使用呢,如果你有安裝沉浸式翻譯的話可以點(diǎn)擊插件,然后點(diǎn)擊圖片里的 PDF/ePub 就可以進(jìn)入文檔翻譯界面,進(jìn)去以后選擇 BabelDOC 就行,也可以直接訪問(wèn):https://app.immersivetranslate.com/babel-doc/
看了一下介紹BabelDOC PDF 之所以能做到「翻譯精準(zhǔn) + 版式還原」主要是有兩步跟傳統(tǒng)翻譯不同的操作:
1. BabelDOC PDF 會(huì)先完整解析PDF結(jié)構(gòu),像“剝洋蔥”一樣識(shí)別出文字、圖片、圖表、公式等元素的布局關(guān)系,并將這些版面信息“記憶”下來(lái),作為后續(xù)還原的參考。
2. 在完成結(jié)構(gòu)識(shí)別之后在交給 AI 翻譯時(shí),BabelDOC PDF 會(huì)根據(jù)剛才“記憶”的布局信息智能匹配字體、字號(hào)、行距,確保翻譯后的內(nèi)容能「無(wú)縫替換」原文內(nèi)容。
3. 最終,這一系列內(nèi)容會(huì)通過(guò) AI 排版引擎再次渲染生成一份新文檔,格式與原始文檔高度一致。
也就是說(shuō) BabelDOC 不是在簡(jiǎn)單的翻譯文檔,他是把所有內(nèi)容解析出來(lái)以后重新為你參照原來(lái)的排版創(chuàng)建了一份新的文檔。
當(dāng)然延續(xù)沉浸式翻譯的傳統(tǒng),這個(gè)產(chǎn)品依然是開(kāi)源的(https://github.com/funstory-ai/BabelDOC),還登上了4 月 5 日Github Python 語(yǔ)言的第一。
BabelDOC 的套餐依然延續(xù)了沉浸式翻譯的良心操作:
免費(fèi)版??每?享有 1000 ? 的PDF解析翻譯額度,并使? GLM-4-FLASH ?模型進(jìn)?翻譯,我一個(gè)月都沒(méi)這么多文檔需要翻譯的。
Pro 會(huì)員 則享有每? 10000 ? 額度,并接? DeepSeek ?級(jí)翻譯模型,帶來(lái)更強(qiáng)?的翻譯效果。
另外翻譯好的谷歌提示詞文檔和斯坦福的人工智能指數(shù)報(bào)告可以在這里領(lǐng)?。篽ttps://pan.quark.cn/s/e5f5b4ac8147
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.