“AI視頻在學習領域的應用才剛剛開始。”
來源|多知
作者|王上
只需點擊一下按鈕,AI就能將文字或者圖片轉化為視頻,這已經在學習場景落地,且成為一個重要的創業方向。
如AI視頻生成平臺Mootion、斯坦福大學生們創辦的VideoTutor、谷歌旗下的Sparkify、佛羅里達大學的初創公司Knowlify、法國專注于兒童和家庭娛樂的AI媒體公司Animaj以及中國初創公司北京波波熊科技旗下TalkingSpark……都切入了學習場景。
在“AI視頻”產品的幫助下,知識以更直觀、更個性化的視頻形式呈現,更加生動、有趣。
A視頻可以講解知識、講解題目、輸出故事、輸出概念等,不過,各家在切入點、定位上、功能上及底層技術上有一些差別。
多知獲悉,Mootion最近獲得了源碼資本、創新工場等新一輪投資,其已經有200萬注冊用戶,年化收入達到了100萬美元。當前,Mootion主要用于社交媒體博主視頻創作和教育工作者授課。阿聯酋、沙特、阿曼等海灣國家的教育工作者會用Mootion生成教學視頻,比如生成雙語對話視頻。
可以看到,在通用視頻大模型快速狂飆之外,一部分AI視頻產品進入到垂直場景,試圖解決普通人在視頻創作和學習方面的難題。
多個從業者告訴多知,AI視頻在學習領域的應用才剛剛開始,基礎性技術障礙已基本攻克,當前需要關注特定場景的適配性,更多需要的是工程上的優化與打磨。
(多知制圖)
01
AI視頻落地教育場景
聚焦AI視頻的產品愈發多了起來,且受到了教育用戶的關注。
最近,Mootion以口碑傳播的方式在阿拉伯世界火了,在阿曼,有近3萬名老師用來制作視頻,從而更好地教英語、歷史和科學。
王詠剛為Mootion創始人、CEO,他曾是創新工場AI工程院執行院長,也是人工智能與軟件工程領域專家,曾擔任谷歌主任工程師和高級技術經理,他于2022年底啟動了Mootion項目;童超為Mootion聯合創始人兼首席產品官,曾任360人工智能研究院產品及對外合作負責人。
在Mootion,戶只要輸入一句話,AI就會自動以導演的角色構思,編劇的角色制作腳本,動畫師的角色制作分鏡,然后剪輯師的身份進行剪輯,最后給到用戶一個故事、畫面、聲音都完整的視頻作品。
Mootion創始人王詠剛告訴多知:“我們一開始預設的是Social media博主做Faceless講解或故事視頻這個場景,后來推廣時,自然而然進入了教育領域。目前,Mootion用戶以social media博主為主,教育用戶約20%。”
Mootion最初全球幾個區域進行了推廣,其中,在阿拉伯語的國家以口碑傳播的方式廣為人知。后來,Mootion調研得知,教師授課使用Mootion生成對話視頻,是因為當地老師教英語時除了教材之外,其他資料匱乏。
大洋彼岸,最近,來自美國的AI視頻講解產品Knowlify獲得了創業加速器Y Combinator 的支持,今年夏天,該公司將從美國東南部佛羅里達州遷往美國北部的舊金山。
Knowlify 是由佛羅里達大學的學生Ritvik Varada 、Ritam Rana、Arjun Talati和Jonathan Maynard共同創立的。該產品正將AI與故事講述相結合,能在幾秒鐘內將任何材料、筆記或 PDF 文件轉化為類似可汗學院風格的視頻。這可以用于學習平臺、大學和入職培訓團隊,旨在讓學習變得更直觀、更吸引人、更易獲取。
Knowlify既可以to C——學生可以直接用來學習,獲得個性化的學習;也可以to B———學校、教育培訓或者企業培訓可以使用。
不過,多知發現,目前Knowlify還不能直接使用,需要加入等候名單。
此前,多知報道過斯坦福大學生們創辦的VideoTutor,由是留學生kai與斯坦福大學校友Nick和Jovan(毛靖文)等人創辦,這是專門針對K12階段開發的教育AI工具,一句話即可生成個人專屬教學/講解視頻。
VideoTutor的愿景是讓每個人都擁有自己專屬的AI導師,改變學習方式。同樣,VideoTutor既面向學生、家長、老師等C端用戶,也面向學校、教育機構等企業級用戶。
VideoTutor是從數學、物理等理科科目切入,其所生成的視頻還原了線下老師講課的場景,有動態的圖形圖表,還有清晰地語音講解,還有文字板書,語言中文、英文等可以任意選擇。
目前,VideoTutor已經開放使用,其正式上線一周即產生了近2萬的講解視頻,其可視化的方式對于理科學習很有幫助。
從VideoTutor來看,其背后有AI編程工具、大模型、數學動畫引擎,創始人Kai曾告訴多知,其最大的突破是解決了元素重疊和復雜動畫渲染的問題,其視頻流暢,講解自然。
此前,多知還曾介紹過同樣由斯坦福團隊研發的AI教育工具Gatekeep,也可以一句話生成教學視頻,不過,該產品已暫停更新。
多知還發現,谷歌也推出了可以生成教育視頻的實驗性產品Sparkify,它可以生成用戶想要的科普視頻,這種輕松有趣的方式比較適合低幼的小朋友們學習一些常識或者通用的知識以及百科等,滿足他們的好奇心。
不過,Sparkify現在只有視頻demo,用戶使用需要加入等候名單,其產品定位和功能暫未可知。
最近,總部在倫敦和巴黎的Animaj公司融資8500萬美元,該公司借助AI將部分動畫制作流程自動化了,并通過AI生產與平臺原生內容開發相結合的混合模式,將兒童IP轉變為全球性、多格式特許經營權。
Animaj收購了多個數字IP,其中,2023年6月,Animaj接手西班牙經典動畫《小P優優》 (Pocoyo ),該劇以其由斯蒂芬·弗萊配音的藍衣小男孩而聞名。該動畫片是寓教于樂的形式,結合“歡笑幽默”與“探索學習”,通過日常游戲引導兒童認知顏色、形狀、數學等基礎知識,并融入英語詞匯教學。
多知還了解到,波波熊科技公司也正在研發AI視頻產品TalkingSpark,此前其波波熊學伴AI工具是圖文的方式生成百科類的只是文章,而今,TalkingSpark希望為視頻領域或者學習領域帶來視頻解決方案。波波熊創始人劉宇龍告訴多知:“我們通過將復雜的制作流程交由 AI 處理,它將創作者從繁瑣的技術束縛中解放出來,使創作者能夠專注于創意的核心。”
針對教育場景,TalkingSpark希望可以幫助教師將復雜的歷史事件(如古羅馬的衰落)或抽象的科學概念(如人工智能的工作原理)轉化為生動的影像教材。
可以看到,目前已經有一個非常明顯的趨勢,AI視頻開始在教育領域有所應用。
自Sora出現之時,教育行業普遍認為,未來AI視頻的成熟應用將對教育行業起到重大變革作用。剛剛一年半的時間,AI視頻技術突飛猛進,垂直細分場景也有了更多可能性。
一個大背景是,這幾年,視頻逐漸成為了媒介的主流,同時,大模型到來后,視頻生產端也在革新。
2025年,國內外廠商如OpenAI(Sora)、谷歌(Veo 3)、快手(可靈AI)、阿里(通義萬相)等視頻大模型競相推出高性能模型,在視頻時長、真實感、多模態融合(如音頻同步)等方面取得突破,給應用層帶來了巨大的機會。
另一方面如愛詩科技旗下的拍我AI(PixVerse)切入到細分場景,用戶上傳一張照片即可一鍵生成短視頻,可用于娛樂、營銷、電商、私域運營內容等場景。而Mootion、VideoTutor、Sparkify、Knowlify等產品可以應用于學習場景。
值得注意的是,在垂類場景,比如在嚴肅學習方面,有很強的Know-how,通用視頻大模型還不足以完全解決問題,這也是垂類場景AI視頻的價值所在。
當下,這些新興的AI視頻工具均可以生成學習類的視頻或者講解視頻,降低制作成本和時間,并增強學習的趣味性。未來,還有望加入虛擬老師的講解和個性化的互動。
02
工程優化還需持續改進
各家在底層邏輯和技術上有一些區別。
從切入點來看,Mootion、Animaj以及TalkingSpark并非是從教育場景切入的,而VideoTutor、Knowlify明確是針對K12群體,Sparkfiy也提到是面向教育場景。
從功能上來看,Mootion將電影制作流程自動化了,還提供了各個場景的模版,用戶只要給出一句話即可快速生成一段兩分鐘以內的視頻。
用Mootion生成視頻大致可分為三步:第一,輸?提示詞,生成“故事板”;第二,系統對每個場景進?具體調整,如可選擇字幕、?樂、配音或特效等;第三,視頻自動合成并輸出完整視頻。
這背后涉及從構思到腳本到分鏡到運鏡到剪輯全流程,最終給到用戶一個完整的音畫同步的視頻片段。
而VideoTutor和Knowlify也是一句話生成視頻,但更偏向于用圖文并茂的視頻方式來講解一個知識點或講解一道題,跟秘塔的“今天學點啥”有類似之處,像PPT的視頻化,目前幾乎不涉及分鏡頭和運鏡。
Sparkify目前看不到具體功能,看起來有分鏡頭和運鏡,所涉及的教育場景看起來多元化,但更偏向科普。
總體而言,VideoTutor和Knowlify看起來比較偏理科問題的講解,優勢在于可視化且動態的圖表,而Mootion、Animaj、Sparkify、TalkingSpark以及則傾向于文科類或者創意類的視頻輸出,比較考驗打磨底層專業級的視頻工作流。
值得注意的是,這些AI視頻產品生成的產品都可以公開發表在平臺上,用戶可以直接拿來學習,有點像“知識版的抖音”。
Animaj則有更大的差異化:
在技術層面,Animaj開發了專有的GenAI制作工具,并利用數據驅動的洞察力,通過AI實現動畫流程的自動化。該流程可加快制作速度、降低成本,并使用基于人工智能的“草圖到姿勢”預測和“中間運動”層來幫助保持動畫的藝術品質。同時,保留每個角色獨特的風格和基調。
在業務層面,Animaj的目標是希望收購國際IP并將其轉化為全球特許經營權,擴大兒童IP的延展性。Animaj 的首席商務官 Gregory Dray 介紹,“獨立工作室和創作者開發了大量兒童 IP,但這些 IP 的潛力尚未充分發揮。我們希望采用現代化、平臺原生的方式,在不損害其創意 DNA 的情況下,在全球范圍內推廣這些品牌。”
不論是哪種形式的產品,在針對教育場景都需要更強的準確性和嚴謹性。目前來看,大部分AI視頻產品在一致性和細節方面仍有待提高。
有用戶提到,VideoTutor生成的視頻對于數學問題理解起來確實直觀,但是,在復雜問題上依然會有bug,或者生成的視頻有線條鋸齒。
有從業者發現,Sparkify視頻定位暫未可知,看起來很多是給孩子科普用的,但腳本中有不少術語,這對于孩子來說理解起來困難。
劉宇龍告訴多知:“目前AI視頻中會有一些和現實不符的錯誤,這是整個行業面臨的問題。”
Mootion已經深入到教育場景之中,達到了可交付的水平,但在多知體驗的過程中發現,目前Mootion暫時以插畫短視頻為主,也有些微bug,比如會出現角色形象不一致的情況。
王詠剛亦坦言Mootion還沒有及格,但他對未來有信心,他在接受硅星人Pro訪談時提到,“如果我們不相信AI能從今天的50分,最終進化到80分甚至100分,今天99%的AI創業公司也都不要做了。”
值得一提的是,多知發現,Mootion對教育場景進行了細化,比如有雙語故事、雙語對話、歷史啟蒙、兒童科普、睡前故事、60秒傳記、名人名言等模版。
從產品延展性來看,VideoTutor和Knowlify也會向文科方向演化,但最終目標或是AI老師,Mootion這類產品的場景則會更加多元,有望應用于廣告營銷、電影、動畫等領域。
總而言之,視頻輸出更穩定、更流暢,甚至更準確,這是AI視頻產品共同努力的方向。
值得注意的是,投資方的要求在提高,他們在嚴格篩選產品,更傾向于有高技術壁壘或者產品打磨得更完美的產品。
有投資人告訴多知:“80分的產品的溢價能力正逐步減弱,創業者需要把產品打磨到95分,很多產品背后有許多細節需要打磨。”
這意味著垂類的AI視頻產品一方面在工程優化方面更為突出;一方面,需要在差異化路徑上更具備獨特性,找到真正的用戶需求。
作者:王上
一本書洞察教育行業全貌,《教育科技這一年:教育+AI新紀元》火熱銷售中從業者必入,點擊小程序購買?
掃碼加入多知新書交流群,共同探討教育+AI的未來
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.