現在AI語音產品超級多,已經越來越接近真人發聲了。
但總歸還是能聽出來一些,畢竟太字正腔圓和沒有變調的聲音,和真實的人類自由發音之間,差別還是很大。
國內的科大訊飛、海螺AI等,國外的ElevenLabs,等,都是AI聲音賽道的核心玩家。但是AI播客這件事,可能被Google顛覆了,還是大模型迭代能力太強了。
最近在Gemini 2.5 Pro發布后,Google利用新模型更新了一款老產品—NoteBookLM,這次加強了做AI筆記的能力,而且還順手增加了生成AI講解的能力,這個能力是兩個AI對話的形式,和播客的形式很像。
下面是鯨哥讓AI整理的“2025年AI產品的新GPT時刻”,然后讓 NoteBookLM生成了一期播客,大家可以聽聽效果。
女生還中規中矩,男生京腔的口音,是不是有點驚艷。更重要的是,整個聲音有變調和高低音,以及聲音的情緒化表達(比如AI發聲哈哈哈,一般體會不到AI開心),這是目前很多AI聲音產品達不到的效果。
當然缺點也有,因為本身并不是播客產品,所以AI生成的內容并不完全按上傳的筆記內容產生,而是AI理解后輸出的內容。
我覺得AI整體理解的不錯,但是不能修改個別話術終究有點難受。目前國內已經有創業者基于Google AI技術,生成AI播客產品,到時候可以期待下效果。
這里想到此前知名創業者,“妙鴨相機”產品負責人張月光離職創業的沐言智語,公司在成立半年內,就獲得 4 輪融資,總額近 3 億元人民幣,做的首款產品就是AI 播客 ChatPods —一款AI播客產品。
ChatPods 提供的 AI 功能包括 AI 總結、AI 章節劃分、AI 問答、AI 轉錄文字稿、AI Highlight 等。產品基于大模型對內容加工分析,然后幫助用戶選擇感興趣的內容,以及分析主題等。
雖然二者都是通過AI處理內容,讓內容更容易吸收。但二者也有很大的不同,NoteBookLM像自動擋,AI直接處理完,形成重要內容直接給你;ChatPods 像手動擋,分塊處理了內容,幫助你更好滴選擇聽哪塊內容。
背后和大廠、創業公司的思路有關,AI播客的市場Google未必在意,它只是想做知識挖掘,這是大模型擅長的領域。而張月光是想做“AI版小宇宙”,通過一款AI產品獲得一定的市場,AI理念必須是實用性為主。
所以ChatPods 在充分調研播客最大的問題,是只有10%的人聽完整一期節目,選擇讓AI做陪聽,“節目長一個小時,哪個是感興趣的。”AI分出章節后直接跳到感興趣部分聽;“剛才沒聽清,說的那個詞是什么意思?”AI問答會幫助你理解語句,給你回答。
這些功能到底有多大的市場,畢竟播客就是個小眾圈子,以及小宇宙會不會逐漸增加這些能力,都是 ChatPods 要考慮的問題。
而對于 NoteBookLM來說,屬于將筆記內容精華提煉出來,隨時給感興趣聽聲音的受眾。
在聽聲音的基礎上,你還可以繼續做筆記。筆記資料- AI聲音-筆記,有點暈。Google考慮的應該是重度用戶,大量的筆記資料輸入,然后AI整理,自己再做筆記重點梳理。
NoteBookLM現在在海外還挺火,AI產品黃叔詳細比較了這款產品和騰訊ima的區別。 NoteBookLM在輸入資料上確實更多元化,AI處理的能力也更強大,主要得益于100萬超長上下文,用戶 上傳知識庫后的內容,AI可以全部調用處理。
對于國內用戶來說,弱點也有,相比Youmind沒有插件,后者在刷推特時隨時調用,看到好玩的直接收集。騰訊ima最大優勢則是可以收集公眾號文章。
聊遠了,回到AI播客的話題。不知道 NoteBookLM會不會做播客功能,或者允許內容原封不動的生成AI對話。
這波大模型技術迭代,對于AI聲音領域推進作用有點大,模型沒有明確支持中文,京腔都這么地道,相信想做個很產品化的AI博客,技術上難題 應該也不是很大。
另外,NotebookLM 的視頻概覽都要上了,用戶上傳資料后,以后不僅可以生播客講解,甚至視頻講解都可以生成,只能勸Google你別太能搞事情了!
視頻內容推薦:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.