最近這兩年,播客作為一種新興的音頻內(nèi)容形式,越來(lái)越熱門了,我也琢磨著把公眾號(hào)積累的上千篇原創(chuàng)文章轉(zhuǎn)化成播客形式,打開“聽”的世界。
一個(gè)好的播客應(yīng)該更有人情味,要有主持人,要能夠用對(duì)話的方式來(lái)深入探討文章的內(nèi)容,而不是機(jī)械地念稿子。這就意味著現(xiàn)有的內(nèi)容是不行的,勢(shì)必要重新創(chuàng)作。
幸運(yùn)的是,人工智能可以干這件事情,比如NotebookLM,就可以把一篇文章轉(zhuǎn)成兩人對(duì)話的語(yǔ)音,聽起來(lái)非常自然,但是它似乎只支持英文,并且無(wú)法調(diào)整各種聲音參數(shù),不靈活。
于是我就打算自己開發(fā)一個(gè)AI應(yīng)用來(lái)做這件事兒,實(shí)現(xiàn)聲音定制、生成封面,然后一鍵生成播客,但是找來(lái)找去,發(fā)現(xiàn)現(xiàn)有的AI應(yīng)用全是用對(duì)話式交互的,這種方式只適合簡(jiǎn)單場(chǎng)景,沒法滿足我的需求。
我希望能通過(guò)可視化的方式來(lái)開發(fā)AI應(yīng)用,用拖拽方式來(lái)構(gòu)建GUI界面,通過(guò)工作流實(shí)現(xiàn)業(yè)務(wù)邏輯,這樣能極大地降低工作量,每個(gè)人都能開發(fā)AI應(yīng)用。
真正的零代碼,可視化的應(yīng)用開發(fā),不得不提我一直在關(guān)注的扣子(coze.cn)平臺(tái),它在開發(fā)智能體和工作流等方面的能力讓人印象非常深刻,是國(guó)內(nèi)AI應(yīng)用開發(fā)平臺(tái)的佼佼者。
01
扣子Project IDE重磅發(fā)布
上個(gè)月,扣子發(fā)布了一個(gè)重磅新功能:Project IDE。
別的平臺(tái)都是基于大模型,再加上各種插件,用自然語(yǔ)言交互的方式來(lái)創(chuàng)建AI智能體。
但是扣子除了支持插件,工作流,知識(shí)庫(kù)之外,竟然還有一個(gè)UI Builder!
也就是說(shuō),終于不再是一輪一輪的對(duì)話了,我可以用大家熟悉的按鈕、列表、文本、圖片來(lái)構(gòu)建應(yīng)用,調(diào)用大模型了。
70后/80后可能馬上就能想到90年代的開發(fā)桌面神器:Visual Basic。
這是我當(dāng)年非常喜歡的一個(gè)開發(fā)工具,拖拽式開發(fā),基于事件的處理邏輯,應(yīng)用開發(fā)起來(lái)非常迅速。
這個(gè)扣子的Proejct IDE簡(jiǎn)直就像當(dāng)時(shí)的Visual Basic啊!
用UI Builder來(lái)設(shè)計(jì)開發(fā)界面,用工作流來(lái)調(diào)用大模型、插件、知識(shí)庫(kù),這就相當(dāng)于前后端通吃了,一個(gè)人就可以快速開發(fā)出一個(gè)AI應(yīng)用了。
02
搭建AI應(yīng)用
看到扣子的Project IDE以后,我就迫不及待地用它開發(fā)了一個(gè)AI應(yīng)用,用戶界面大概是這樣(基本的元素都有了,請(qǐng)?jiān)徱粋€(gè)程序員不怎么樣的審美):
界面的左邊可以輸入文章的鏈接,選定男聲風(fēng)格(陽(yáng)光青年/溫暖男聲)和女聲風(fēng)格(柔美女聲/高冷御姐),選定封面風(fēng)格(通用/人像/動(dòng)漫),然后點(diǎn)擊“開始”按鈕就可以轉(zhuǎn)換了。
之所以同時(shí)需要男聲和女聲,是因?yàn)椴タ筒皇菃渭兊哪钗恼拢且阅信畬?duì)話的方式進(jìn)行。
界面的右邊會(huì)用Markdown組件展示生成的音頻鏈接,用圖片組件展示播客的封面圖。
使用扣子的UI Builder,用拖拽的方式把各種UI組件放進(jìn)來(lái)就行,幾分鐘的時(shí)間就可以把這個(gè)界面給“畫”出來(lái),就像當(dāng)年的VB一樣,非常簡(jiǎn)單直觀,這里就不再花時(shí)間詳細(xì)介紹了。
先聽一下轉(zhuǎn)換好的兩人對(duì)話的播客吧:
03
開發(fā)工作流
界面的搭建比較簡(jiǎn)單,文章轉(zhuǎn)播客的邏輯實(shí)現(xiàn)也并不復(fù)雜,主要用扣子的工作流來(lái)實(shí)現(xiàn),具體的流程是這樣的:
可以看出,幾乎所有工作都是工作流調(diào)用大模型或者插件來(lái)完成的,只需要考慮輸入輸出就可以,幾乎不需要怎么編程,非程序員也能做。
扣子的工作流支持各種各樣的節(jié)點(diǎn),除了大模型和海量插件外,還可以訪問(wèn)變量、數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、文本處理、長(zhǎng)期記憶。如果邏輯確實(shí)很復(fù)雜,甚至可以寫代碼。
例如,讀取文章內(nèi)容,可以直接用“鏈接讀取”這個(gè)插件,告訴它URL就行:
生成兩人對(duì)話臺(tái)詞,就可以用豆包大模型來(lái)做,把系統(tǒng)提示詞寫好就行:
值得注意的是,“生成節(jié)目臺(tái)詞”這個(gè)節(jié)點(diǎn)的輸入就是“讀取網(wǎng)頁(yè)內(nèi)容”節(jié)點(diǎn)的輸出。
在工作流中,它們是鏈接在一起的,在下圖中可以很直觀地體現(xiàn)出來(lái)。
最后的流程是這個(gè)樣子的,看起來(lái)有些復(fù)雜,其實(shí)很快就可以設(shè)置好。
04
連接起來(lái)
當(dāng)界面和工作流開發(fā)完成以后,需要把它們連接起來(lái),這個(gè)過(guò)程也很簡(jiǎn)單,在我們的例子中,當(dāng)點(diǎn)擊“開始”按鈕時(shí),就需要調(diào)用工作流實(shí)現(xiàn)文章到音頻和封面圖的轉(zhuǎn)換。
工作流需要的輸入?yún)?shù)(文章URL、男聲風(fēng)格、女聲風(fēng)格、封面風(fēng)格)和界面上對(duì)應(yīng)的組件一一綁定即可。
工作流的輸出是音頻URL和圖片URL,同樣可以綁定到界面的對(duì)應(yīng)組件上。
接下來(lái)就可以進(jìn)行一個(gè)“試運(yùn)行”了,看看這個(gè)AI應(yīng)用怎么樣,如果沒有問(wèn)題,可以直接發(fā)布,讓大家都可以使用。
05
總結(jié)
可以看出,扣子的UI Builder可以輕松地把界面“畫出來(lái)”,再通過(guò)和工作流調(diào)用大模型和插件,就可以輕松地實(shí)現(xiàn)一個(gè)功能強(qiáng)大的AI應(yīng)用,開發(fā)起來(lái)非常輕松。
當(dāng)年Visual Basic改變了桌面應(yīng)用開發(fā),扣子也會(huì)改變AI時(shí)代的應(yīng)用開發(fā),因?yàn)樗鼧O大地降低了AI應(yīng)用開發(fā)的門檻,人人都可以開發(fā)AI應(yīng)用,現(xiàn)在限制你的只有你的想象力了,一人公司從此真正可行了。
如果你想了解更多扣子平臺(tái)相關(guān)的信息,強(qiáng)烈建議關(guān)注一下12月19日在上海舉辦的扣子開發(fā)者日。
開發(fā)者日的活動(dòng)非常精彩,可以和扣子核心團(tuán)隊(duì)面對(duì)面交流,搶先了解扣子平臺(tái)最新的功能,火熱的最新模板,內(nèi)測(cè)搶破頭的語(yǔ)音API。還可以看到資深扣子開發(fā)者實(shí)戰(zhàn)案例分享,和與會(huì)者碰撞一下,也許能碰出非常棒的創(chuàng)意,從而成功變現(xiàn)呢!如果有什么不滿,還能大膽開麥,直接吐槽。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.