你好,我是唐韌。
別意外,這個開頭完全是為了配合今天這篇文章,因為你可以聽到我的聲音來朗讀全篇內容。
方式很簡單,你只需要點擊文章標題下方藍色字體后面那個耳機圖標就可以開始播放。
如果你上過我的課或者看過我的直播,可以對比一下這個聲音和我的原聲是否一致。
如果這是你第一次聽到我的聲音,也別意外,因為這就是我的聲音。
前幾天我在公眾號接入了騰訊元氣的 AI 智能體,成功創造了唐韌的 AI 分身,它可以學習我的歷史文章來回答一些讀者的問題。
現在,我每天都能在后臺收到各種各樣的提問,AI 分身回答質量目前能打個 70 多分。
騰訊總共給我送了 1 億 token,目前已經消耗了 263 萬,所以你們還可以繼續和我聊。
但是這個能力并非微信團隊自己做的,不過今天介紹的這個 AI 聲音克隆能力就是微信自家的產品了。
這個功能目前還處于灰度測試階段,在官方訂閱號助手 App 里可以選擇開啟。
讓 AI 克隆我的聲音非常簡單,只需要按照操作提示錄制一段朗讀音頻就可以。
朗讀的文案可以選擇默認的,系統也會從歷史文章里進行截取,這一步主要是采集聲音特征。
錄制結束后,AI 就會復制音色,大概幾秒鐘就完成了。
克隆成功后,我就可以在后臺選擇讓系統用我自己的聲音朗讀文章。
那么,實際效果怎么樣呢?
就我自己的聽后感受來看,能還原個 80 分左右,主要體現在音色上,但是一些咬字發音還是有不準確的情況。
這里的差異,估計跟采樣太少有關系。
不知道你們聽完后感受怎么樣,聽過我真人說話的覺得還原度高不高?
這里還有特別說一下,我在錄制階段其實嘗試過不同的錄制方法,包括語速、語調、情緒投入。
以下面這個語料為例。
在錄制這個例句時,我開始是用比較平緩的方式朗讀,結果 AI 克隆出來的聲音就有一種比較強的機械感。
接著我換一種帶起伏節奏的方式朗讀,這次 AI 克隆出來的聲音就明顯生動很多。
然后我覺得語速有點慢,又在第二種朗讀方式的基礎上加快語速錄制了一遍,也就是你們現在聽到的這個聲音。
就幾次實驗情況來看,最后錄制的這個效果是比較符合我預期的。
這里也可以看出,AI 克隆聲音并不是機械復制,就像產品提示里說的那樣,語氣和情感也會被復制。
這一點,就和傳統的 TTS 模式有很大不同。
我看了下歷史文章的朗讀數據,其實平時聽文章的人還是少數,不知道這個帶我聲音和語氣的「聽文」功能會不會提升這方面的表現。
從此,在 AI 的加持下,我的公眾號具備了用我的方式自主回答問題以及自主朗讀文章的能力,這是一個巨大的進步。
以前我也說過,我在這里寫文章就是跟讀者的一種交流,分享我的所見所聞和所思所想。
如果過去我們只能見字如面,那現在就可以做到聽聲識人。
接下來,就看微信什么時候推出 AI 數字人能力了,或許那時候我們就可以每天「見面」了。
使用 AI 克隆完我的聲音后,我讓幾個朋友試聽了一下,其中一個朋友的反饋我覺得亮了。
他說:「微信終于說人話了」。
················· 唐韌出品 ·················
安可時刻
我們計劃本周末舉辦一期線上模式的產品訓練營,不方便參加線下訓練營的產品經理抓住這次機會,只有這一次。
訓練營交付內容和線下一致,同樣包含一天的直播互動課程、一個月線上課、一對一輔導,以及簡歷優化、職業規劃和求職內推。
要報名的,可以聯系我:tangren0517
如果你想了解關于產品訓練營的詳細信息,可以讓我的 AI 分身給你介紹,你只需要讓它介紹一下產品訓練營即可。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.