作者 | 燕辭格
編輯 | 以安
蛇年春節(jié)臨近,“AI拜年”肉眼可見(jiàn)地火起來(lái)了。
在社媒平臺(tái)上,不少博主分享出使用AI應(yīng)用拜年的經(jīng)驗(yàn),受到眾多粉絲追捧——小紅書(shū)“用AI花式拜年”詞條討論熱度居高不下,微博“當(dāng)代年輕人過(guò)年有自己的年味”詞條閱讀量近1300萬(wàn)。
年輕人用AI拜年,主打一個(gè)“輕松又驚艷”,手機(jī)上點(diǎn)一點(diǎn),完成幾個(gè)簡(jiǎn)單步驟,AI便能生成用戶(hù)的數(shù)字人形象,站在各種喜慶的場(chǎng)景里,換上一身紅紅火火的唐裝,出口成章地祝福親朋好友,表情比大多數(shù)患有“鏡頭尷尬癥”的用戶(hù)本人還要流暢自然。
數(shù)字人代勞,不怕尷尬,不辭辛苦,還有了“露臉”拜年的誠(chéng)意。咱就是說(shuō),這不是i人的春節(jié)救星是什么?正事兒做完,扭頭隨手又生成一條蒙娜麗莎、達(dá)芬奇甚至兵馬俑給自己拜年的視頻,分享到朋友圈,“整活兒”也一點(diǎn)不耽誤。
隨著用戶(hù)對(duì)AI拜年的熱情高漲,企業(yè)也是卯足了勁兒發(fā)各種應(yīng)用,普及AI拜年的便捷程度。
《一刻商業(yè)》關(guān)注到,百度、中國(guó)電信、中國(guó)移動(dòng)、中國(guó)聯(lián)通、華為、阿里、科大訊飛等公司均推出了與春節(jié)相關(guān)的AI應(yīng)用或活動(dòng)。換句話(huà)說(shuō),大模型賽道上的公司們,在春節(jié)面前基本上都按捺不住了。
百度指數(shù)數(shù)據(jù)顯示,春節(jié)前一周開(kāi)始,“AI拜年”關(guān)鍵詞熱度從0開(kāi)始迅速竄升,相比上個(gè)月環(huán)比上升38188% ,側(cè)面反映出企業(yè)集中推廣AI應(yīng)用的力度。
百度指數(shù)“AI拜年”近一個(gè)月關(guān)鍵詞熱度,圖/百度指數(shù)官網(wǎng)
蛇年為何能成為“AI味兒”最濃的一年?相比往年,當(dāng)下大模型在c端的普及程度更高了,門(mén)檻更低了,應(yīng)用更多了。另一方面,從往年的ai祝福語(yǔ)、ai一鍵變畫(huà)風(fēng),到如今的ai數(shù)字人拜年,使用AI的人更多了,用途更廣,場(chǎng)景更多元化了。
變化背后,是2024年大模型玩家們?cè)诩夹g(shù)方向、應(yīng)用上的不斷抉擇與發(fā)力,隨著深度、場(chǎng)景不斷拓寬,C端再次成為交鋒之地。順應(yīng)趨勢(shì),2025年則被業(yè)內(nèi)視為AI應(yīng)用大爆發(fā)之年。
蛇年春節(jié),為AI應(yīng)用承上啟下的流量高峰期,我們會(huì)在ai拜年中見(jiàn)證歷史嗎?
AI應(yīng)用怎么玩出“春節(jié)味兒”?
與往年不同,蛇年AI技術(shù)趨勢(shì)催生出三大“新玩法”,網(wǎng)友“整活兒”格外熱鬧。
首先是讓數(shù)字化身在視頻中“閃現(xiàn)”各種地標(biāo),妙語(yǔ)生花。
除夕夜,鄭州一位阿姨在世界各地跳廣場(chǎng)舞的視頻火爆朋友圈。視頻中,這位阿姨先是拍攝自己的廣場(chǎng)舞動(dòng)作,再配合AI技術(shù),一下子便“閃現(xiàn)”各種世界地標(biāo)。
當(dāng)晚,“鄭州大媽有自己的全世界巡舞”便登上微博熱搜,引得網(wǎng)友連連感嘆:“不得不說(shuō)鄭州大媽太有才,善用 AI 太驚艷,有沒(méi)有教程,我蹲!”
鄭州一廣場(chǎng)舞阿姨用AI拍全世界拜年視頻-1,圖/大象新聞微博視頻號(hào)
鄭州一廣場(chǎng)舞阿姨用AI拍全世界拜年視頻-2,圖/大象新聞微博視頻號(hào)
這些頗為洗腦的畫(huà)面背后,是百度的“瞬移世界拜個(gè)年”活動(dòng)。
在百度APP搜索 “瞬移世界拜個(gè)年”進(jìn)入活動(dòng)會(huì)場(chǎng),點(diǎn)擊入口打開(kāi)“拜年視頻創(chuàng)建頁(yè)面”,簡(jiǎn)單三步就能創(chuàng)建拜年視頻:先用相機(jī)錄制一段拜年視頻,再選擇背景音樂(lè),最后選擇最多四個(gè)拜年背景作為“瞬移范圍”。
有趣的是,將生成的視頻分享給親朋好友,收到分享的人會(huì)根據(jù)打開(kāi)的不同時(shí)間段的時(shí)區(qū)呈現(xiàn)不同時(shí)間段的環(huán)境畫(huà)面。
“兵馬俑”發(fā)來(lái)拜年視頻,圖/百度視頻號(hào)
百度智能云曦靈數(shù)字人小程序首頁(yè),圖/百度智能云曦靈數(shù)字人小程序
這些頗為洗腦的畫(huà)面背后,是“百度智能云曦靈數(shù)字人”微信小程序在默默“發(fā)力”。打開(kāi)小程序,用戶(hù)只需上傳一張人物照片,就能快速生成形象克隆、表情自然、唇音同步的數(shù)字人拜年視頻,用于社交分享。
早在春節(jié)前數(shù)周內(nèi),這個(gè)小程序就把“飛貼拜年”的傳統(tǒng)民俗重新帶“火了”。用戶(hù)不僅可以上傳自己的照片,還能上傳歷史文化名人照片,諸如蒙娜麗莎、兵馬俑、達(dá)芬奇,一個(gè)個(gè)都能在視頻中送上新年祝福。
不難看出,該小程序可以基于照片生成數(shù)字人,再根據(jù)輸入文案生成流暢的口播祝福語(yǔ)視頻,從而形成了眾多方便的模版,使得“生成同款”格外簡(jiǎn)單,也就有了開(kāi)頭廣場(chǎng)舞大媽“同款視頻”席卷全網(wǎng)的一幕。
其次是以文生圖發(fā)揮想象,生成獨(dú)一無(wú)二的賀卡。
與拜年視頻不同,在朋友圈、微信群中不斷傳播的ai拜年賀卡更加“腦洞大開(kāi)”。除去在皇宮、紅燈籠等喜慶背景下拜年,用戶(hù)還生成了喜馬拉雅山頂拜年、在白宮門(mén)口撒紅包等“創(chuàng)意拜年”賀卡。
通過(guò)百度搜索“ai拜年”,點(diǎn)擊搜索結(jié)果頁(yè)面中的“定制照片賀卡”,在定制頁(yè)面點(diǎn)擊“創(chuàng)意照片”中的“傳圖定制”,再配合自己上傳的圖片寫(xiě)清楚定制需求,便可生成一張“創(chuàng)意照片”,再加上祝福語(yǔ)、賀卡背景,便能擁有一張獨(dú)一無(wú)二的賀卡。
“肯德基爺爺”在麥當(dāng)勞招牌下,圖/百度ai定制拜年賀卡
《一刻商業(yè)》也嘗試生成了一張最近在小紅書(shū)上大火的“肯德基爺爺”在麥當(dāng)勞招牌下捧著炸雞塊拜年的照片,效果相當(dāng)不錯(cuò),薯?xiàng)l、炸雞、招牌、玻璃的元素都很清晰。
最后還有ai方言交互,家鄉(xiāng)話(huà)直接搜索,體驗(yàn)不同風(fēng)土人情,別具一番年味兒。
相比數(shù)字人、文生圖,ai方言交互的應(yīng)用場(chǎng)景更多,實(shí)用性更強(qiáng),真正讓用戶(hù)“出門(mén)在外靠ai”。前有“南方小土豆”暴走哈爾濱,用AI一鍵制作citywalk路線(xiàn),慶祝非遺春節(jié);后有遼寧10后小學(xué)生用文旅智能體自研中國(guó)文旅地圖,熱鬧非凡。
百度文心智能體平臺(tái)的文旅智能體,圖/百度搜索結(jié)果頁(yè)
在百度搜索“春節(jié)智能體”或“AI旅游”,便能看到文心智能體平臺(tái)上的34個(gè)省級(jí)行政區(qū)擬人文旅智能體,還能自己手動(dòng)制作家鄉(xiāng)話(huà)的智能體。這些智能體從外表到口音都是極具地域特色的“本地人”,有福建的“簪花花”、徽州的“包拯”,還有湖南的“芙小蘭”、陜西的“秦小俑”,覆蓋廣東粵語(yǔ)、安徽合肥話(huà)、遼吉黑東北話(huà)等幾十種方言。
近年來(lái),出門(mén)過(guò)除夕,春節(jié)旅行成為新潮流。文旅智能體就是春節(jié)間旅游的最佳a(bǔ)i導(dǎo)游,不僅全方位包括本地吃喝玩樂(lè)、旅游打卡的信息,還能一鍵“打電話(huà)”用方言跟用戶(hù)“嘮嗑兒”。
除去上述春節(jié)期間的新奇玩法,ai的方言交互能力還實(shí)現(xiàn)了更加樸素的關(guān)懷——為普通話(huà)不標(biāo)準(zhǔn)、打字不利索的中老年人實(shí)現(xiàn)“方言搜索功能”。打開(kāi)百度APP,點(diǎn)擊“語(yǔ)音識(shí)別”,說(shuō)出家鄉(xiāng)話(huà),融合ai技術(shù)的搜索引擎便能聽(tīng)懂方言,直接為用戶(hù)搜索。
不難發(fā)現(xiàn),在蛇年春節(jié)的三大“新玩法”背后,ai科技浪潮下春節(jié)應(yīng)用正顯示出新的特點(diǎn),它們的表現(xiàn)形式、應(yīng)用場(chǎng)景顯得更加多樣了,留給用戶(hù)的自主空間也更大了。過(guò)去十年,支付寶“集五福”,微信“搖一搖”“紅包封面”都曾是人們心中科技與春節(jié)結(jié)合的經(jīng)典記憶。如今,ai原生的春節(jié)應(yīng)用也在塑造新的記憶,將新的技術(shù)普及開(kāi)來(lái)。
多模態(tài)大模型,春節(jié)“想象力”的引擎
回顧春節(jié)期間的AI“年味兒”,本質(zhì)上是通過(guò)AI原生應(yīng)用的思路,重新聚焦春節(jié)各種場(chǎng)景做突破,應(yīng)用方向仍可歸為娛樂(lè)、陪伴、工具等幾大需求,并未脫離此前AI在c端落地驗(yàn)證的應(yīng)用范疇。
真正讓ai拜年火起來(lái)的,是2024年廠商在多模態(tài)大模型上的分化與深入。從以往春節(jié)簡(jiǎn)單的祝福語(yǔ)生成,擴(kuò)展到如今的圖片賀卡、拜年視頻、方言交互,大模型展現(xiàn)出的多模態(tài)能力格外顯眼。
百度準(zhǔn)備的“AI年貨”,圖/百度微信公眾號(hào)
其中,作為國(guó)內(nèi)ai領(lǐng)軍企業(yè)的百度,是今年春節(jié)ai應(yīng)用的主推手之一,也是當(dāng)下觀察ai拜年新風(fēng)潮的一個(gè)相當(dāng)好的樣本。從百度出發(fā),我們看到,數(shù)字人、iRAG技術(shù)、tts(text to speech)等多模態(tài)技術(shù),都成為春節(jié)期間亮眼的技術(shù)趨勢(shì)。
在百度文心智能體平臺(tái)上,開(kāi)發(fā)門(mén)檻極低的智能體成為用戶(hù)們接觸ai世界的最好方式。作為承載各類(lèi)大模型技術(shù)的泛用底座,智能體代表著當(dāng)前ai原生應(yīng)用的最主流形態(tài),讓沒(méi)有ai知識(shí)的普通人也可以將智能體作為免費(fèi)導(dǎo)游、對(duì)話(huà)達(dá)子、拜年嘴替。
一方面,憑借與數(shù)字人技術(shù)結(jié)合,智能體可以脫離純文本的對(duì)話(huà),擁有一個(gè)鮮明的數(shù)字化身,使用用戶(hù)本人、歷史名人或是原創(chuàng)形象,展現(xiàn)出更多表達(dá)方式,使得ai拜年視頻格外鮮活。
《一刻商業(yè)》了解到,百度曦靈數(shù)字人采用了“照片數(shù)字人視頻合成”技術(shù),利用大模型圖像識(shí)別算法,精準(zhǔn)地提取照片中的人臉結(jié)構(gòu),為面部關(guān)鍵特征構(gòu)建初始模型。
一張“數(shù)字人臉”,包含著多項(xiàng)模型技術(shù):面部動(dòng)作自然,背后是基于大量頭部動(dòng)作面部數(shù)據(jù)訓(xùn)練打造了動(dòng)作驅(qū)動(dòng)的算法模型;人物具有質(zhì)感,背后是會(huì)考慮光線(xiàn)、皮膚質(zhì)感的實(shí)時(shí)渲染與細(xì)節(jié)算法調(diào)整;唇部動(dòng)作不僵硬,背后是先進(jìn)的唇形驅(qū)動(dòng)算法,能夠根據(jù)識(shí)別到的聲音元素(音素)和說(shuō)話(huà)的節(jié)奏音調(diào)(韻律特征),快速生成與音頻完全同步的唇形動(dòng)作。
另一方面,承載tts技術(shù),智能體同時(shí)擁有了生動(dòng)活潑的音頻能力,用方言家鄉(xiāng)話(huà)與用戶(hù)交流,也方便了老年人使用方言搜索。
在文旅智能體的方言交互中,百度語(yǔ)音技術(shù)部研發(fā)的“語(yǔ)音大數(shù)據(jù)挖掘技術(shù)”和“方言遷移合成技術(shù)”得到充分體現(xiàn)。前者通過(guò)識(shí)別大模型,完成不同省份的方言數(shù)據(jù)的切分、降噪、識(shí)別等自動(dòng)化處理,提供了大規(guī)模的數(shù)據(jù)支持;后者利用大數(shù)據(jù)驅(qū)動(dòng),克服此前合成系統(tǒng)需要獨(dú)立的方言前端、資源耗費(fèi)大、研發(fā)周期長(zhǎng)的問(wèn)題,將普通話(huà)和方言統(tǒng)一建模,并且通過(guò)遷移技術(shù)實(shí)現(xiàn)任意音色說(shuō)任意方言。
此外,百度還針對(duì)數(shù)字人直播、ai有聲書(shū)等場(chǎng)景,進(jìn)行多項(xiàng)技術(shù)深化。
面對(duì)直播場(chǎng)景,百度搭建了面向直播業(yè)務(wù)場(chǎng)景的直播帶貨風(fēng)格的語(yǔ)音音庫(kù)建方案,大大降低定制音庫(kù)的制作成本,僅需幾分鐘數(shù)據(jù)就能達(dá)到超越真人的tts水平,日均支持9000+直播間開(kāi)播。
面對(duì)有聲書(shū)場(chǎng)景,百度搭建起小說(shuō)業(yè)務(wù)統(tǒng)一訓(xùn)練框架,實(shí)現(xiàn)基于LLM的小說(shuō)文本、人物理解技術(shù),針對(duì)十余種情感的遷移、強(qiáng)弱控制完成大笑、冷哼等“副語(yǔ)言”的精準(zhǔn)控制,實(shí)現(xiàn)具備情感和副語(yǔ)言能力的對(duì)白角色快速建庫(kù),從而讓小說(shuō)到有聲書(shū)的端到端生成成本大大降低,目前接入百度小說(shuō)及頭部第三方小說(shuō)平臺(tái)。
在數(shù)字人、tts技術(shù)之外,基于百度檢索增強(qiáng)的文生圖技術(shù)iRAG,則為“定制照片賀卡”提供了技術(shù)支撐,成功解決了大模型文生圖技術(shù)中的“幻覺(jué)”問(wèn)題。
百度2024世界大會(huì)發(fā)布iRAG技術(shù),圖/百度官方視頻號(hào)
以往的大模型行業(yè)發(fā)展中,RAG(檢索增強(qiáng)生成)技術(shù)逐步成為解決大模型幻覺(jué)的有效方法,通過(guò)結(jié)合檢索和生成,RAG可以提升生成內(nèi)容的可靠性和準(zhǔn)確性,使得大模型在生成文本、圖像、視頻等內(nèi)容時(shí)不再“指鹿為馬”“胡說(shuō)八道”。
然而,在文本生成方面已經(jīng)臻于成熟的RAG,在圖像方面尚不能達(dá)成完美效果,使得生成的圖片常常陷入“幻覺(jué)”,例如將原本3層的北京天壇生成為4層。
我們看到,百度自研的iRAG(image based RAG)技術(shù),基于百度搜索的億級(jí)圖片資源跟強(qiáng)大的基礎(chǔ)模型能力,克服了上述問(wèn)題,具備無(wú)幻覺(jué)、超真實(shí)、沒(méi)成本、立等可取的優(yōu)點(diǎn),指定特定物品、人物、背景準(zhǔn)確地結(jié)合,同時(shí)大大降低了成本。
百度給出的一項(xiàng)數(shù)據(jù)是,汽車(chē)品牌宣傳場(chǎng)景的大片宣傳海報(bào)通常需要大幾十萬(wàn),使用百度的iRAG技術(shù),可以使得創(chuàng)作成本接近于0。
可以預(yù)見(jiàn)的是,隨著多模態(tài)大模型各項(xiàng)技術(shù)的不斷成熟,AI應(yīng)用將催生出更多想象力的火花,引爆更多場(chǎng)景。
2025年,AI應(yīng)用從春節(jié)走向日常
2025,注定是ai應(yīng)用不平凡的一年。
早在2024年,諸如OpenAI的CEO Altman、紅杉資本、英偉達(dá)CEO黃仁勛、LinkedIn的創(chuàng)始人Hoffman等科技大佬,便紛紛對(duì)2025年作出預(yù)測(cè),認(rèn)為今年將是ai應(yīng)用爆發(fā)的關(guān)鍵年份。
蛇年春節(jié)ai應(yīng)用的火爆,一方面展示著大模型技術(shù)的進(jìn)展,預(yù)示著C端超級(jí)應(yīng)用誕生的可能性;另一方面也推進(jìn)ai從節(jié)日走向生活的趨勢(shì),從ai拜年到工作生活助手,由節(jié)日活動(dòng)轉(zhuǎn)變?yōu)槿粘#瑑H有一步之遙。
從行業(yè)角度來(lái)看,數(shù)年間大模型廠商卷算力的競(jìng)爭(zhēng)逐漸趨于平常,而以多模態(tài)為代表的各項(xiàng)技術(shù)深入研發(fā),針對(duì)落地場(chǎng)景的不斷優(yōu)化,成為廠商競(jìng)爭(zhēng)力的重要標(biāo)志。
在百度成立25周年的2025年全員信中,百度CEO李彥宏表示:“雖然超級(jí)應(yīng)用尚未出現(xiàn),AI的實(shí)際滲透率已經(jīng)不低,并且將在2025年繼續(xù)井噴式增長(zhǎng)。”在這樣的預(yù)判下,百度多年來(lái)一直堅(jiān)持將超20%的營(yíng)收投入到研發(fā)上,不斷把最前沿技術(shù)產(chǎn)品化。
李彥宏在百度2024世界大會(huì)圓桌訪談,圖/百度微信公眾號(hào)
李彥宏指出“近年來(lái)人工智能方面的實(shí)踐表明,重大的技術(shù)突破,顛覆式的創(chuàng)新往往是規(guī)模化應(yīng)用的結(jié)果,而不是原因”。在這樣的行業(yè)認(rèn)知下,C端便成為大模型廠商戰(zhàn)略布局的重要一環(huán)。
百度2024世界大會(huì)上,百度透露,截止2024年11月初,百度文心大模型日均調(diào)用量超15億次,相比一年前的5000萬(wàn)次增長(zhǎng)近30倍,較2024年5月的2億次增長(zhǎng)7.5倍。另一項(xiàng)數(shù)據(jù)是,百度自2013年1月成立深度學(xué)習(xí)研究院起,已經(jīng)扎根ai研發(fā)12年,期間累計(jì)投入超1700億元。
傳統(tǒng)搜索引擎巨頭轉(zhuǎn)身,AI成為百度重要增長(zhǎng)引擎。巨幅的調(diào)用量增長(zhǎng),代表著百度在C端的階段性勝利。憑借領(lǐng)先的大模型技術(shù)積累、豐富的應(yīng)用落地經(jīng)驗(yàn),百度正在押注蛇年春節(jié)這個(gè)未來(lái)AI應(yīng)用爆發(fā)的關(guān)鍵節(jié)點(diǎn)。
不過(guò),C端的競(jìng)爭(zhēng)注定是廣闊而激烈的。一方面,AI應(yīng)用將從北上廣深一線(xiàn)城市的上班族走向三四線(xiàn)甚至縣城的公務(wù)員、學(xué)生、個(gè)體戶(hù),AI應(yīng)用將重新演繹流量增長(zhǎng)時(shí)代;另一方面,在不同大模型廠商、應(yīng)用的競(jìng)爭(zhēng)之下,大模型在C端無(wú)法避免地經(jīng)歷價(jià)格戰(zhàn),重現(xiàn)互聯(lián)網(wǎng)企業(yè)的擴(kuò)張打法。
此時(shí)此刻,大模型廠商的勝負(fù)尚不可知,但或許在一個(gè)簡(jiǎn)單的春節(jié)AI應(yīng)用中,AI的未來(lái)正在誕生。
(題圖來(lái)源于百度搜索結(jié)果頁(yè)。)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.