出品|虎嗅黃青春頻道
作者|商業消費主筆黃青春
頭圖|電影《Her》
字節跳動又盯上“情感大模型”了。
虎嗅獲悉,字節跳動旗下火山方舟大模型平臺將上線一批“情感大模型”,向企業提供 API 調用、AI 對話解決方案(如客服、信息檢索服務等);豆包則在自研新“情感大模型”——與年初接入 DeepSeek 時策略一樣,字節跳動依然堅持“火山開放,豆包自研”的路線,兼顧生態與自有產品。
虎嗅就上述信息向字節方面求證,火山引擎相關負責人回應稱,有關“情感大模型”信息不實,沒有此模型計劃。
簡單來說,字節跳動之所以盯上 “情感大模型”,源于其并非普通數據處理大模型,而是以 “擬人化情感理解” 為核心,即通過技術識別、理解來模擬人類情感——去年,Hume AI 推出具有情商的對話式 AI,已經能檢測到用戶 53 種情緒,未來電影《Her》中主人公迷戀上 Samantha 的劇情或將照進現實。
不止 “聊天”,更懂 “人心”
很多讀者或許會好奇,“情感大模型”到底有什么特別之處?
區別于傳統聊天機器人機械的交互,“情感大模型”不僅追求對話能力,更注重用戶情感體驗(如接近真人的語音、可打斷對話等)——具體而言,“情感大模型”會通過分析用戶的語調、停頓、表情理解情感,從而生成符合情緒的回應,即通過“理解情緒 + 精準回應”使交互更生動、真實。
簡單概括就是:“情感大模型”不止 “聊天”,更懂 “人心”,更能 “共情”。
可別小瞧了這個隱秘的新風口:
騰訊研究院《2024大模型十大趨勢》報告顯示,“情感大模型”的發展將引領 AI 陪伴市場的快速增長,預計在接下來的2-3年內,人機陪伴市場將迎來產品和用戶數量的爆發式增長;
另據非凡產研數據,人工智能伴侶平臺的月活躍用戶數量 2018-2023 年間增長了 30 倍,全球市場規模預計將在 2023 - 2030 年間,從 3000 萬美元飆升至 1500 億美元,年均復合增長率達到236%。
“情感大模型”之所以突然成為市場關注的焦點,一個重要原因在于:它正推動 AI 從 “工具屬性” 向 “情感伴侶” 延伸,從而打開全新的應用場景。
基于此,“情感大模型”的技術演化形成了兩條路徑:一是在通用大模型的基礎上,通過增強多模態情感計算能力,催生出具有更好情感理解與響應能力的 AI 情感應用,如豆包實時語音大模型可實現端到端對話、低時延、接近真人交互。
二是專注于情感領域的生成式大模型,如 HumeAI 的移情語音界面(EVI)、祝語未來科技的 AEGMV 等,這也是字節正在布局的方向。
以 Character.AI 為例,不僅支持1對1聊天,還可以進行創作角色、發展劇情,甚至拉角色開“群聊派對”,其 7 月 5 日新發布的TalkingMachines(自回歸擴散模型)可以實時進行 AI 角色視頻互動——用戶只需要輸入一張圖片和聲音信號,該模型就能實現類似 FaceTime 的通話視覺互動。
與之對應,僅去年上半年,Character.AI 在移動端累計下載量已突破 3432 萬,網頁端單月訪問量高達 3.1 億,在相關榜單僅次于 ChatGPT。
一位大模型工程師向虎嗅解釋,“情感大模型”多以 Transformer 為基礎不斷改善網絡結構,采取全模態關聯,中間不進行模型轉換動作,而是通過小組件改善準確率。
基于這樣的技術特點,企業要如何落地應用呢?
虎嗅了解到,“情感大模型”與傳統大語言模型在參數量和算力上有差異,業內普遍做法是有更多 NLP 專家參與,采用通用加分散專家模式,相比傳統模型在算力上有所節省,但對特殊數據要求高。
與之對應,情感模型領域多采用端到端形式,不能像正常架構那樣轉換數據,否則模型效果差——有鑒于此,為保證長時間生成領域效果,訓練時所需算力比通用版本高 30%-50%。
一位大模型創業者向虎嗅分析,“現階段,國內外‘情感大模型’發展存在一定差距,國內大概比國外晚一年左右;也可以將‘情感大模型’視作通用大模型發展的一個節點,涉及到多模態多端學習和 MoE 架構(即混合專家模型,是一種新型的大模型架構,其核心思想是“術業有專攻”,通過多個“專家”模型共同協作來處理復雜的任務),國內在相關技術研究上已取得一定進展?!?/p>
聚焦到產品,開源證券研報指出,GPT-4o 等多模態大模型正加速推進 AI 情感陪伴大模型落地,提供實用性 Agent 功能。
比如,國外 Miko 公司推出第一代 AI 伴侶,初步實現 AI 與 IP 聯動;Curio 于 2023 年 12 月推出針對 3-12 歲兒童的 AI 玩具,包括 Gabbo、Grem 和 Grok 三款產品。
至于國內,FoloToy 聯合火山引擎推出“顯眼包”,躍然創新持續迭代 BubblePal(截至 2024 年 10 月已銷售數萬臺);Looi 推出可移動手機支架形態的桌面機器人,具有調整情感反應和性格特征等功能;CASIO 推出 AI 寵物機器人 Moflin,提供情感治愈價值。
字節埋“伏筆”
面對這樣的市場與技術趨勢,字節跳動如何布局?
虎嗅了解到,字節跳動計劃通過不同垂類大模型帶動豆包月活在 2025 年實現翻倍。
與之匹配的動作包括:一方面,字節會圍繞抖音等 C 端體系推進娛樂、社交、陪伴、游戲場景滲透;另一方面,字節跳動會進一步提升火山引擎在 ToB 領域的輸出能力,為企業提供 API 調用、AI 對話解決方案等服務,例如,為客服、銷售、售后等崗位提供個性化服務,還能與智能家居、音箱、耳機(比如 Ola Friend 智能體耳機主打賣點就是接入豆包 AI 大模型)等硬件結合,未來能在唱歌、作曲等領域有更好的發展。
一個有趣的切面是,“情感大模型”在語音層面學習時,會將語音、語調、面部關鍵點參數(如唇形等面部 landmark 參數)以及對應的文字以數據對形式放入模型,在語速、語調、視覺等多模態之間建立統一關聯——這不僅涉及用戶表達、短語分析,更深層次還需理解用戶真實感受,敏銳地捕捉到用戶內心愉悅、生氣、擔憂等情感狀態。
比如,Hume AI 在 2024 年發布的 EVI 能夠從用戶那里檢測到約 53 種不同的情緒,宣稱是“第一個具有情商的對話式人工智能”。
對此,Hume AI首席執行官艾倫·考恩(Alan Cowen)表示,“情商包括從行為中推斷意圖和偏好的能力——這是人工智能界面試圖實現的核心:推斷用戶想要什么并執行它。因此,從用戶真實需求層面來看,情商是人工智能界面最重要的要求?!?/p>
有鑒于此,“情感大模型”能大幅提高用戶體驗與交互效果,適用于助手類效率提升產品,在信息檢索、陪伴、知識協作、AI 玩具、社交游戲等領域有顯著優勢——更隱秘的躁動則涌向了 AI 情趣機器人,一度帶動二級市場產業上下游關聯企業股價攀升。
有從業者告訴虎嗅,通用大模型未來會融合各種細分模型,如“情感大模型”、文生視頻大模型、圖生視頻大模型等,從而變得更加全面、強大;至于大模型下一階段進化方向,行業資深從業者的共識是世界模型(媲美人腦,通過學習現實世界中的物理和因果規律,具備“物理直覺”,可在內部模擬環境變化,并基于當前環境狀態推演未來狀態,同時評估自身行為后果)。
至于市場潛力,“情感大模型”熱浪或將推動消費類機器人加速升級——群智咨詢顯示 2024 年全球機器人出貨規模約 4700 萬臺,未來 5 年復合增長率超 20%,消費類機器人占比約 81%;高盛預測 2035 年全球人形機器人市場規模達 1540 億美元。
當然,“情感大模型”現階段仍面臨諸多問題,如算力消耗非線性增長、模型長效記憶能力、數據收集與隱私安全等,這些既是大廠跑馬圈地過程中的阻礙,也能成為業務突破后的技術護城河。
#虎嗅商業消費主筆黃青春、黃青春頻道出品人,關注文娛社交、游戲影音等多個領域,行業人士交流加微信:724051399,新聞線索亦可郵件至huangqingchun@huxiu.com
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4454840.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.