在BEYOND Expo的NVIDIA Inception展區(qū),SlidesOrator是一個小而美,也頗具實用性的項目。它沒有機(jī)械臂、沒有AR眼鏡,展臺也并不花哨,但它的目標(biāo)直指每一個打工人都熟悉的場景:如何展示PPT。
用AI做PPT這件事,幾乎是伴隨著大語言模型的誕生而誕生的。SlidesOrator并不想重復(fù)前人做過的事情,他們認(rèn)為讓表達(dá)變得“自動而可信”,或許比讓AI寫出100篇PPT更重要。
SlidesOrator的體驗也很簡單,用戶只需要上傳一份PDF格式的幻燈片,它就能自動生成語音講解內(nèi)容,并通過3D虛擬數(shù)字人完成整場演示。整個過程無需真人錄音,也不依賴事先訓(xùn)練。
更重要的是,這并不只是做一場播片式的演示,數(shù)字人還可以根據(jù)PPT內(nèi)容實時回答觀眾提問,模擬一個完整、互動的“AI演講者”形象。
SlidesOrator團(tuán)隊表示,他們在多語言TTS語音、語義摘要、圖文匹配以及3D數(shù)字人驅(qū)動方面都做了深度優(yōu)化,力求在不依賴專業(yè)團(tuán)隊的前提下,讓任何人都可以快速“托管”一場講演。
目前,這套系統(tǒng)已經(jīng)應(yīng)用于教育培訓(xùn)、企業(yè)宣講、產(chǎn)品發(fā)布等場景,尤其適合內(nèi)容高度結(jié)構(gòu)化、需要多語種傳播的行業(yè)客戶。比如在跨國展會、在線公開課、初創(chuàng)路演等場合。團(tuán)隊介紹說,目前他們的服務(wù)吸引了很多發(fā)展中地區(qū)的用戶,我在他們的演示中也看到了一些來自越南、泰國等地用戶上傳的本地語言PPT。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.