近日,火山引擎FORCE原動力大會在北京盛大召開。會上,火山引擎正式發布豆包大模型1.6、豆包?視頻生成模型Seedance 1.0 pro等新模型,并升級了Agent開發平臺等AI云原生服務。這些新產品在多模態交互、復雜任務處理、內容生成等方面展現出強大功能,如豆包大模型1.6支持多模態理解和圖形界面操作,能高效處理真實世界問題;Seedance 1.0 pro可生成高品質視頻,在多項評測中位居前列。
當前,全球AI大模型市場競爭激烈,眾多企業紛紛布局。與市面上同類產品相比,火山引擎此次發布的大模型家族憑借全模態、全尺寸、高性價比的特性脫穎而出。例如在多模態能力上,相比部分僅支持單一或少數模態的模型,豆包大模型1.6實現了更廣泛的模態融合與深度理解;在成本方面,創新的定價策略也為企業用戶帶來了顯著優勢,在激烈的市場競爭中搶占先機。
大模型矩陣“再添新丁”
火山引擎的豆包大模型家族已形成豐富矩陣,涵蓋基礎語言模型、視覺模型、語音模型等,適用于智能交互、內容創作、數據分析等多元場景。基礎語言模型憑借強大的自然語言處理能力,為智能客服、文本生成等場景提供核心支持;視覺模型在圖像識別、視頻分析等領域發揮關鍵作用;語音模型則專注于語音交互、語音內容生成,滿足不同行業和業務需求。
此次大會上,豆包大模型1.6成為焦點。在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現躋身全球前列。另外,豆包1.6系列模型支持多模態理解和圖形界面操作,能夠理解和處理真實世界問題,這項能力讓豆包進一步具備“行動力”。例如,豆包1.6可以自動操作瀏覽器完成酒店預訂、識別購物小票并整理成Excel表格等復雜任務。
豆包?視頻生成模型Seedance 1.0 pro同樣表現亮眼。該模型支持文字與圖片輸入,可生成多鏡頭無縫切換的1080P高品質視頻,主體運動穩定性與畫面自然度達到行業領先水平。在國際知名評測榜單Artificial Analysis上,Seedance在文生視頻、圖生視頻兩項任務上均排名首位,超越Veo3、可靈2.0等優秀模型,為影視制作、廣告宣傳、內容創作等領域提供了高效的視頻生成解決方案。
此外,豆包?實時語音模型的全量上線以及豆包?語音播客模型的發布,也為語音交互帶來革新體驗。實時語音模型的方言演繹、悄悄話、唱歌等特色效果深受用戶喜愛;語音播客模型讓雙人對話更加自然,具備互相附和、插話、猶豫等播客節奏,可廣泛應用于語音內容創作、智能語音助手等場景,進一步完善了豆包大模型家族的全模態能力。
技術撬動“三座大山”
隨著大模型智能水平的不斷提高,Agent正逐步進入企業核心業務,然而,AI Agent在落地企業核心業務的過程中,仍存在著不少挑戰,尤其是AI Agent開發工具的全生命周期管理、多模態數據處理技術以及AI的安全與隱私保護。火山引擎聚焦這些關鍵問題,在技術層面展開多維度創新,打造出更高效、更安全的AI開發生態。
首先,在智能Agent開發工具方面,火山引擎全新發布的Agent開發套件,實現了從設計、訓練到部署的全流程技術革新。以PromptPilot智能提示工具為例,該工具能夠深度解析用戶意圖,并自動構建最優指令路徑,將用戶模糊的想法通過細致入微的轉化過程,系統性地變成AI能夠精準執行的專業指令,從而保障模型穩定地輸出高質量成果。
其次,多模態數據處理一直是企業面臨的棘手難題,火山引擎敏銳地洞察到這一痛點,重磅推出多模態數據湖解決方案,這為企業打造了新一代的AI Native數據基礎設施。該方案具備支持GPU+CPU異構計算的強大能力,在數據處理過程中,可顯著提升資源的使用效率。同時,它靈活兼容多種開源系統,并融合了Ray、Lance等前沿技術棧,極大地增強了技術實力和應用靈活性。更為關鍵的是,多模態數據湖能夠與火山機器學習平臺以及方舟平臺實現無縫對接,借助數據智能體的助力,進一步優化分析效率,為企業在數據處理與分析領域帶來前所未有的高效體驗。
同時,在語義檢索增強技術上,多模態數據湖基于向量數據庫,運用深度學習中的對比學習算法,將不同模態數據映射到統一語義空間,實現跨模態文獻檢索效率的答復提升。
第三,在AI安全與隱私保護領域,火山引擎發布的AICC密態計算技術,基于可信執行環境(TEE)技術構建。在CPU/GPU硬件層面,利用英特爾SGX、英偉達NGT等技術,創建受硬件保護的安全區域,實現模型推理全流程密文處理,有效降低了數據泄漏風險。
此外,火山引擎的大模型應用防火墻采用基于深度學習的入侵檢測技術,通過卷積神經網絡(CNN)對網絡請求數據進行特征提取,再利用循環神經網絡(RNN)分析請求序列,采用分層漏斗策略,可有效攔截各類prompt注入攻擊,提升惡意請求攔截率。
由此可見,火山引擎在智能Agent開發工具、多模態數據處理和AI安全與隱私保護方面都做出了非常全面且有效的探索和落地,不斷協助企業實現核心業務的智能化轉型。
舊場景新工具
目前,豆包大模型已在汽車、金融、教育等多個行業取得顯著應用成果,推動各領域智能化轉型。
在汽車行業,梅賽德斯-奔馳與火山引擎展開深度合作。梅賽德斯-奔馳利用火山引擎AI大模型提升智艙信息檢索能力及智艙系統反應速度。以往,用戶在車內通過語音助手查詢信息時,常常面臨檢索結果不準確、反應遲緩的問題。接入豆包大模型后,通過其強大的自然語言處理和信息檢索能力,能夠快速準確地理解用戶指令,從海量的車輛信息、地圖數據、多媒體資源等數據庫中精準篩選出用戶所需內容,提升了智艙系統的反應速度和信息檢索的準確率。此外,在智艙研發環節,借助豆包大模型的數據分析和模擬能力,梅賽德斯-奔馳中國研發團隊不斷提升“中國速度”,有效縮短了研發周期,降低了研發成本,為客戶提供超越期待的體驗。
在金融行業,海爾消金聯合火山引擎,完成了消金垂直場景下的大模型精調,構建了消費金融垂直大模型,可以滿足消費金融場景中90%以上的智能化場景需求,解決了摘錄場景下近95%的質量問題。從效率和成本的角度看,日均節約人工1-3小時,客服內容質檢率近99%,意圖識別準確率超過70%,大幅提高了業務自動化水平和個性化服務的能力,有效降低了金融風險,提升了業務收益。
在教育行業,火山引擎已經與清華大學、北京大學、浙江大學、同濟大學、南開大學等超五成985高校達成合作,聚焦大模型在教學、科研、管理和服務等核心場景應用,持續推動高等教育智能化轉型。目前,浙江大學依托HiAgent平臺,僅用7天時間就高效落地了大模型應用體系——“浙大先生”,該體系集數據整合、文獻梳理、科研信息獲取與撰寫輔助等功能于一體,為師生提供全學科、多語種、多模態數據處理支持,助力高效完成選題分析、資料查找、趨勢判斷與內容生成,全面提升科研效率與質量。此外,同濟大學依托HiAgent平臺,搭建校園AI應用創新平臺,打造專屬智能助手“同濟同學”,并基于該平臺啟動了“同心云”AI應用設計大賽,全面激發師生參與熱情,推動AI能力自主開發與場景落地。
除了上述行業內的應用落地之外,隨著大模型能力的不斷進步,字節跳動內部也已經在探索和上線AI編程產品——TRAE(“The Real AI Engineer”)。
字節跳動技術副總裁洪定坤
字節跳動技術副總裁洪定坤提到,在字節內部,超過80%的工程師在使用TRAE輔助開發,TRAE的整體月活用戶已經超過了100萬。這充分展示了火山引擎的技術在實際應用中的強大影響力和廣泛接受度。
智能Agent的三個趨勢
隨著人工智能技術的持續發展,智能Agent作為AI技術與行業應用深度融合的產物,正迎來關鍵的發展機遇期。Gartner在其2024年發布的相關報告中,將Agentic AI列為2025年十大技術趨勢之一,并預測到2028年,至少15%的日常工作決策將借助Agentic AI自主完成。由此可見,智能Agent將成為推動企業數字化轉型的核心驅動力之一,其發展將呈現出多模態融合深化、邊緣智能協同加強、自主學習與決策能力提升等顯著趨勢。
第一,多模態融合將呈現從感知到認知的跨越。當前,雖然部分AI模型已具備多模態處理能力,但在模態間信息深度融合、復雜場景理解等方面仍存在局限。有多項研究顯示,通過構建統一的多模態表征空間,結合注意力機制與圖神經網絡技術,智能Agent能夠更精準地理解不同模態信息間的關聯。未來,智能Agent將實現從“多模態感知”到“多模態認知”的跨越。例如,在智能客服場景中,Agent不僅能處理用戶的文本、語音咨詢,還可結合用戶上傳的圖片、視頻資料,甚至社交媒體上的情緒數據,提供更個性化、全面的解決方案。
第二,邊緣智能協同實現實時響應與隱私保護的平衡。隨著物聯網設備的普及,大量數據在終端產生,將所有數據傳輸至云端處理不僅面臨高延遲問題,還存在數據泄露風險。邊緣智能技術使智能Agent能夠在靠近數據源的邊緣設備上完成數據處理與決策。根據IDC預測,到2026年,全球75%的數據將在邊緣側完成處理。邊緣計算環境下的數據本地化處理,有效保障了企業核心數據的隱私安全,符合日益嚴格的數據合規要求。
第三,從被動執行到主動進化的自主學習與決策。傳統Agent多依賴預先設定的規則與訓練數據,而新一代智能Agent將結合強化學習、元學習等技術,實現動態環境下的自主學習與策略優化。DeepMind的研究顯示,通過基于環境反饋的持續學習,智能Agent在復雜游戲、機器人控制等任務中的表現不斷超越人類專家。在商業領域,智能Agent可自主分析市場動態、用戶行為數據,實時調整營銷策略,為企業創造更大價值。
在本次火山引擎FORCE原動力大會上,眾多創新成果的展示令人印象深刻。智能Agent的發展正處于技術突破與行業應用的關鍵階段,多模態融合、邊緣智能協同、自主學習與決策等趨勢將重塑各行業的發展格局。
盡管在技術成熟度、倫理規范等方面仍面臨挑戰,但隨著技術的不斷進步與生態的逐步完善,智能Agent有望為全球經濟社會發展帶來深遠變革,成為推動人類社會向智能化時代邁進的核心力量。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.