作者:王佩
來源:速途網(sootoo123)
近日,隨著騰訊元寶的大規模推廣,蘋果免費APP榜單中,DeepSeek、騰訊元寶以及豆包迅速占領了TOP10中的前三席。對于普通用戶來說,這三款類似的AI工具到底有什么差異;它們的主要功能是什么,分別適用于什么場景,以及他們的AI功能都有哪些領域側重(更專業)?今天速途網就對目前市場上最熱門的三款AI工具進行了測評。
AI工具用戶之爭,占領C位各有奇招
首先,先來說排名第一的“DeepSeek”。由于華為、聯想、OPPO以及像阿里、百度、騰訊等科技互聯網巨頭宣布接入“DeepSeek”,后續還有諸如中國移動、中國聯通、中國電信的三大運營紛紛入局接入。
“DeepSeek”可以說是唯一一款不用自己推廣,靠“友商”以及口碑傳播站上了各大下載APP的榜頂。
點開下載排名第二的“騰訊元寶”,速途網看到其除了騰訊自研的“Hunyuan”(混元模型)外,還可以選擇“DeepSeek”進行工作。
值得注意的是,騰訊除了元寶之外,如騰訊云、騰訊文檔以及微信都接入了DeepSeek-R1。為了推廣“騰訊元寶”據傳整個2025年2月份的投放金額預計將達3億元,如今在騰訊的各個產品端都有明顯的推廣入口。
在提問“豆包”的時候,它則回答是采用字節跳動公司基于云雀模型開發訓練的,而豆包的短期爆發則是通過高傭金激勵和抖音式流量投放,據傳用戶規模已達1.6億。但因為是和抖音強綁定關系,被外界質疑很多都是通過抖音跳轉的“僵尸流量”及用戶。
文本創作與商業文案測試實例
說完了上面三大AI工具的“流量密碼”,速途網就以同樣的問題給予了三者進行回答,首先是續寫《哪吒之魔童鬧海》故事。DeepSeek生成的角色性格刻畫細膩,劇情轉折自然,能根據用戶需求調整文風(如增加懸念或喜劇元素)。例如要求續寫“哪吒與敖丙聯手對抗天劫”時,會加入雙主角情感羈絆與戰斗細節描寫。
騰訊元寶(使用DeepSeek-R1模型)生成內容與DeepSeek本體接近,但部分回答可能自動整合微信生態內的公眾號、視頻號資源,會在內容創作中插入引用的“相關公眾號”來源,有些干擾閱讀體驗。
豆包則在生成同主題故事時,內容偏向短平快的“爆款”風格,大量使用網絡流行語(如“家人們”“神仙打架”),但邏輯銜接生硬,會出現“在自家院子逗著哮天犬”等突兀情節。
再進行“某手機品牌商業文案撰寫時”,騰訊元寶(混元模型)會分析某手機品牌市場數據后,生成包含SWOT模型、用戶畫像拆解、競品對比表格的結構化報告,并支持像微信、QQ、新浪微博進行分享導出。
豆包則擅長生成短視頻帶貨文案,例如為某美妝產品設計“沉浸式開箱+痛點吐槽+限時優惠”組合腳本,自動匹配抖音熱門BGM和貼紙模板。
DeepSeek生成營銷方案時更側重數據論證,例如通過爬取電商平臺評論數據,推導出“Z世代用戶更關注產品社交屬性”的結論,但缺乏可視化呈現。
金融風險及法律專業領域 專業分析VS基本內容整合
在金融風險領域,為了驗證各家大模型的金融時序數據分析與非線性風險建模能力,我們問了一個炒股人關心的問題:
輸入近十年標普500指數波動數據,要求:
(1) 識別黑天鵝事件時間節點
(2) 預測極端行情下對沖策略有效性
其中DeepSeek在回答時,會根據近十年標普500指數波動歷史,做出主要的黑天鵝時間的時間節點及原因分析,在給予對沖策略時,做出了4個有效分析,在問題分析上,可參考性更強。
騰訊元寶(混元模型)則是中規中矩的列出黑天鵝事件時間節點,給予了分散配置策略進行跨資產對沖及VIX期權對沖和反向ETF策略,并用2020、2022年的案例進行了歷史驗證。
而豆包的回答則只是整理了公開信息,給出兩種極端情況下的對沖策略,并推薦了一條說是相關,卻完全無關的抖音視頻鏈接,僅能做到公開信息整理的功能,專業性明顯不足。
圖:左側騰訊元寶、右側豆包
而在法律條文的內容測試中,速途網使用了“假設《刑法》第20條新增‘特殊防衛權’例外條款,分析其對現有正當防衛判例的影響路徑”,這種測試法律條文動態更新后的邏輯推演能力。
首先,騰訊元寶引用了10篇資料深度思考了25秒,給出了其對現有正當防衛判例的影響路徑可能體現的5個方面,并對影響量刑與罪責認定,推動司法解釋做了分析。
DeepSeek則是通過六個方向,從擴大適用范圍到潛在挑戰與平衡機制,都做了更加綜合的分析總結,并參考類似制度,如美國“不退讓法”等。不僅可以做到全面專業的分析,條理性也更強。
豆包則是引用了12篇資料作為參考,僅從“改變認定標準”及“影響舉證責任分配”兩個方面進行了回答,在專業領域與前兩者的回答都有一定差距。
借助各自資源優勢 但專業領域差距顯著
速途網發現,從底層支持的大模型層面,DeepSeek作為獨立模型,原生在復雜推理和多模態輸出上有優勢,比如數學難題、法律分析等。
公開資料顯示,DeepSeek是開源的,但依賴外部算力,受服務器負載影響。而且原生DeepSeek的數據更新到2024年7月,可能內容中會出現AI幻覺(大家常說的:大模型胡說八道)。
騰訊混元模型,特別是Turbo S版本,強調快速響應和部署成本低。而深度思考方面,混元T1模型在灰度測試中,結合了DeepSeek-R1形成雙模型架構,所以,用戶通過“騰訊元寶”可以實現兩者的優勢。
此外,騰訊元寶還能融合混元的多模態能力,讓DeepSeek具備識圖功能,這是原版沒有的。所以,騰訊元寶的優勢在于整合了不同模型,同時借助騰訊生態,比如微信入口,提升用戶體驗和覆蓋范圍。
而豆包在長文本處理上較弱,只有8k tokens,而DeepSeek-R1有32k16,在專業領域如數學、金融、法律等,會出現一些明顯的不足。
從三者的“功能定位”對比來看,豆包的核心競爭力在于短視頻生態數據+輕量化娛樂交互,官方對外強調其娛樂和輕辦公場景。
產品好和口碑好同樣重要 騰訊元寶出問題屢上熱議
而在速途網的這次評測中,盡管騰訊元寶的響應速度和穩定性更好,但在DeepSeek下載的前排評論中我們看到,有些用戶還是認為DeepSeek的輸出結果更優質,尤其是在需要深度思考的時候。
而通過采訪身邊的朋友,以及和一些用戶交流速途網發現,騰訊元寶確實好用,但是近期騰訊的“霸王條款事件”以及搜索內容含廣告鏈接等一系列問題,讓一些用戶對騰訊的產品有一定的不信任感。
據了解,騰訊元寶在此前的《用戶協議》中固定默認內容:用戶無論是否同意,上傳即默認授權騰訊無償使用內容(包括原創作品),被質疑侵犯知識產權;條款中“永久性”“不可撤銷”等表述,也引發用戶對數據控制權喪失的擔憂;用戶生成內容可直接用于騰訊“品牌推廣與宣傳”,但也未明確收益分配機制。
另外,此前有用戶在使用元寶搜索問題時,答案中出現了“58到家家政保潔保姆月嫂搬家”公眾號的廣告鏈接,被質疑騰訊AI竟然會夾帶私貨。
雖然此類問題都迅速得到了騰訊解決,但是傷害一旦形成,用戶對于一個品牌就會產生長期的不信任感,這也需要廠商在出現問題時,不僅要解決問題,更要讓用戶了解為什么會這樣,讓用戶有知情權。
最后,我們還是說回三款熱門AI工具的評測結果,速途網認為,大部分用戶,騰訊元寶可以實現全場景覆蓋(快思考+深度推理),尤其是可以快速響應和騰訊生態整合的場景,內置的DeepSeek擁有了其深度推理能力,加入了聯網功能,且免費,生態流量加持、多模態融合創新,更加適用于普通用戶。
但如果是專業用戶,特別需要DeepSeek的深度推理能力,或者對隱私特別在意,可以下載DeepSeek獨立的APP,獨立APP的輸出結果更嚴謹(如法律條文分析等),極端復雜任務穩定性更高。但需要注意的是,原生DeepSeek的數據僅更新到2024年7月,缺乏事實校驗機制,因追求“邏輯完整”易虛構細節,如前段時間知乎上的“哪吒事件”。
字節的豆包在短視頻生態數據的獨占性、娛樂化交互設計,結合了抖音平臺可以進行AI生圖、以及音樂生成等,在娛樂性上更有優勢。但是在專業場景短板明顯、長文本處理能力較弱。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.