智東西AI前瞻(公眾號:zhidxcomAI)
作者 江宇
編輯 漠影
智東西AI前瞻5月30日報道,豆包APP近日推出實時視頻通話功能。用戶在電話界面開啟視頻畫面后,即可與豆包基于真實場景進行實時問答互動 。
該功能將豆包的視覺理解能力,從圖片場景擴展到視頻場景。去年底,豆包就曾上線圖片理解功能,支持上傳圖片后識別內容,包括理解梗圖等 。
此次升級以期進一步降低用戶交互門檻,提供“邊看邊聊”的體驗。
用戶在旅行過程中,可打開視頻通話,詢問所處景點的歷史背景、特色內容或路線規(guī)劃等。例如,在故宮參觀時,用戶可以通過視頻向“豆包”展示景點畫面,了解特定宮殿的歷史故事、建筑特色 。
在博物館、美術館等場景,也可以通過視頻通話功能,隨時問豆包展品的背景信息 。
此實時視頻通話功能的實現(xiàn),是基于豆包最新的視覺理解模型。該模型具備內容識別、理解推理和內容描述能力,能夠融合視覺與語言輸入,進行綜合的深度思考和創(chuàng)作。
此外,為提升對話的準確性與時效性,豆包視頻通話功能接入了聯(lián)網(wǎng)搜索能力,以獲取互聯(lián)網(wǎng)最新信息。
智東西也在深度體驗了豆包視頻通話的功能:打開豆包App后,點擊“對話”、“通話圖案”、“開啟視頻通話”。
值得一提的是,豆包電腦端也已同步開啟共享視頻通話功能,多平臺覆蓋,為用戶提供更靈活的選擇。
想知道豆包App的視頻通話功能有多強大?智東西替你先試為快。
此前的ChatGPT就在網(wǎng)絡上掀起一陣挑選“報恩”榴蓮的熱潮。那么,比起穩(wěn)定的圖片分析,在視頻通話中,豆包能否通過視頻幫你挑選出最完美的榴蓮?
在實際體驗中,豆包確實能夠通過視頻畫面給出詳細的榴蓮挑選建議,例如根據(jù)果殼上刺的特征進行判斷,推測果肉的成熟度。這為像挑選榴蓮這類需要眼力和經(jīng)驗的場景,提供了出人意料的AI輔助。
AI和人類交互的方式愈發(fā)多樣,也變得越來越有趣。更多關于豆包的新功能,用戶可以自行探索。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.