智東西
作者 | 陳駿達
編輯 | 心緣
智東西6月17日報道,今天,豆包電腦版和網頁版全量上線了AI播客功能。用戶上傳PDF或網頁鏈接后,可一鍵生成雙人對話的播客節目。
上線后,智東西第一時間對豆包AI播客功能進行了體驗。實測中,豆包能將8萬詞英文文檔在3秒內生成為播客節目,用戶可在對話界面收聽播客,收聽的同時,豆包會并行生成后續內容。
豆包交付的AI播客節目以男女雙人對談的形式進行,能對用戶上傳的網頁、文件等進行深度改造,使其更適合聽眾消費。
AI播客對談的節奏流暢自然,還會有大量的語氣詞、附和、停頓,這很好地模擬了真人博客中的口語習慣,有效提升了擬人程度。智東西還了解到,這兩個聲音是由字節與專業播客創作者聯手打造的。
不過,在實測中,我們也發現了豆包AI播客當前存在的部分問題。例如,其生成節目的信息密度并不高,且含有大量重復的句式和語氣詞,在長時間收聽后,用戶可能會覺得有些單調。
日前,智東西曾與字節跳動語音中臺負責人鄭煒明進行交流,他向智東西透露,未來,豆包AI播客的收聽體驗會進一步豐富,不會只有簡單的承接,還能有觀點的交流與碰撞。團隊已經在開發不同風格的音色,探索音色克隆、風格定制等功能,語種范圍也會擴展至中文之外。
先前,豆包·AI播客模型已在字節旗下的AI Agent平臺扣子空間上線,并支持一句話生成播客的功能,可自主查找相關話題,輸出播客。
一、8萬詞PDF文件秒出播客,還能自主給節目“劃重點”
豆包AI播客功能的入口放在了輸入框下方,點擊進入后,會跳轉出兩個選項。用戶既可上傳文件,也可將網頁發送給豆包。不過,目前豆包AI播客僅支持PDF文件的上傳。
首先來聽聽生成效果。智東西將一份8萬余詞、共140頁的起訴書上傳給豆包,在花費數秒鐘解析文件后,豆包立刻返回了可供收聽播客的播放器和一張播客封面圖,完整生成一檔播客的時間大約在1-2分鐘,用戶可以邊聽邊等,不影響收聽體驗。
實測多個案例后,智東西發現豆包生成的AI播客基本遵循了一個特定的模式——女主持人負責控制播客的節奏、提問等,男主持人負責主要內容的講述。
豆包AI播客所生成的節目的語言風格較為口語化,在收聽過程中完全感受不到原文件中正式甚至有些拗口的表達。盡管智東西上傳的是一份英文文件,也沒有明顯的翻譯腔。
具體的收聽體驗層面,可以聽到AI主播們會通過調整語速等方式來強調重點信息。豆包也會使用一些語氣詞和包含情感的評價,這加強了播客的“真人感”。
在網頁轉播客場景,豆包AI播客能交付不錯的結果,不會受到網頁上無關信息的影響,基本可以準確反映網頁主要內容。
在智東西先前參與的內測中,豆包還會在網頁地址欄右側提供“網頁播客”的入口,不過在公測版本中,這一功能尚未上線。
二、可定制性、信息密度仍有提升空間,未來或擴展多人對談、單口播客
目前豆包AI播客功能的提示詞是固定的,用戶無法給出播客制作的更具體建議,在可定制化程度上還有些提升空間。系統提示詞很簡單,就是“生成播客”。
用戶暫時也無法直接導出豆包AI播客的生成結果。有需要下載播客的用戶可以移步“扣子空間”進行體驗,在這一應用中,豆包AI播客及其封面都可導出,還能看到具體的逐字稿。
智東西用不同長度的文本測試了豆包生成的AI播客時長。最終,其生成的節目最長不會超過10分鐘,大多集中在5分鐘左右。這導致了一些問題:當用戶上傳高信息量長文檔時,可能會被過度壓縮和省略;上傳簡短的內容時,豆包也會煞有介事的講上兩三分鐘。
在第一部分的測試案例中,長文檔中后半部分內容便被完全省略了。在下方案例中,智東西將一篇數百字的快訊發送給了豆包,由于原本的信息量不大,最終其生成結果也略顯單薄。大量語氣詞、口語化表述和模式化問答的存在,導致信息密度有待提高。
此外,豆包中提供的AI播客功能并不能對材料中的已有話題進行補充,提供背景信息,這可能導致播客在內容深度和廣度方面有所欠缺。
結語:AI播客已成熱門賽道
近期,AI播客已經成為業內一條相對小眾、但獲得諸多企業押注的賽道。除了字節的豆包AI播客之外,前段時間,國內頭部播客平臺小宇宙已經利用MiniMax的語音技術,內測了外語播客一鍵轉中文收聽功能。海外的谷歌NotebookLM生成播客功能更是收獲一批忠實用戶。
中國擁有全球增長最快的播客市場。2025年,中文播客聽眾的數量預計將突破1.5億。AI播客有望通過給創作者提供便利、給消費者提供豐富的收聽選擇,進一步釋放這一市場的潛力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.