百度在周末放了個大招,一次性發布了最新的文心 4.5 大模型和推理模型 X1。
我快速體驗了一下,同時也跟一些做產品的朋友做了些探討。
先說結論,我覺得這次百度沒讓人失望,不管是文心 4.5 還是 X1,都達到了現在能體驗到的業界一流水平。
從官方放出的性能對比測試來看,文心 4.5 在很多方面都持平甚至超過了現在的主流模型,其中包括 DeepSeek V3 和 GPT-4o。
有朋友開玩笑說,百度又行了?
說實話,我覺得百度在技術能力方面其實一直都挺行,但是做產品和做營銷差點意思。
可能你們不知道,百度在過去十幾年時間里為如今的很多互聯網大廠輸送了高級技術人才。
雖然聽起來有點唏噓,但事實卻是如此。
在 AI 技術儲備方面,百度絕對是起了個大早,但是在產品輸出上,百度也確實沒趕上好機會。
在我看來,并不是技術能力不到位,而是把技術儲備產品化的過程出了問題。
我橫向對比了文心 4.5 和 X1 與豆包、DeepSeek、騰訊元寶、通義千問在各種任務處理和問答能力,雖然各有差異,但整體區別不大。
這也說明了另一個問題,現在大多數普通人在使用大模型產品時就跟我們使用 Word 去編輯文檔一樣,只用到了其中的一小部分能力。
說白了,模型能力對大多數人來說都是過剩的。
在對比測試上面說的那幾個大模型產品時,我倒是發現了文心 4.5 勝出的一個場景。
我的需求,是讓模型把我的一張照片所穿的藍色襯衫換成棕色皮衣,原照片其實就是我頭像的彩色版。
首先登場的是字節的豆包,它的結果至少初步達到了預期,但是在人物面部和皮衣細節上有點失真。
AI 生成的這張照片,有點像過度美顏后的感覺,而且皮衣袖子部分搞得像緊身衣一樣。
接下來上場的是騰訊元寶,我選擇的是騰訊自家的 Hunyuan 模型,出來的結果直接拉垮了,不僅把我變成了外國人,整個原圖也都做了修改。
切換到 DeepSeek 模型后,因為不支持直接處理圖片,它只告訴我如何用 PS 這類工具去修改。
然后是阿里的通義千問,和 DeepSeek 一樣,都只返回了如何用工具去操作的步驟和過程,但并沒有直接生成結果。
最后就是百度的文心 4.5 模型了,注意,我用的不是推理模型 X1。
在結果輸出上,文心 4.5 直接給出了我想要的效果,不僅保持了我還是我,而且還給我穿上了棕色皮衣,甚至還提供了不同角度的照片效果。
還有一點讓我比較意外,它竟然對我的發型做了優化。
有一說一,我覺得文心給我設計的發型比我的原發型要好看,這讓我不得不考慮可以參考這個發型去理發店操作一下。
不吹不黑,經過 AI 的打造后,氣質是不是一下就上來了?
我把這張 AI 生成的照片發給朋友看,大多數人都說帥,甚至有一種雷布斯風格。
在這個場景的需求滿足上,只有文心 4.5 提供了我想要的結果。
你可能會說,其他產品其實也能做到,包括 Gemini 最新的模型甚至還能提供換裝效果。
的確,這個需求并不是大模型能力的上限,能做好的產品有很多。
但是,還是我前面說的,對于大多數普通用戶來說, 模型能力是過剩的。
在過剩的模型能力基礎上,一些碎片化需求的滿足程度直接決定了用戶對這款產品的認知。
我們之所以覺得 DeepSeek 很強,其實大多數源自于它首先展示了推理思考過程,并且在回答中去除了「AI感」。
所謂 「AI感」,就是模式化、格式化、套路化回答,沒有真人的那種松弛感和靈動性。
如果你還記得 2023 年 12 月份我第一次在文章里介紹 ChatGPT 時的測試 demo,包括去年上半年之前我們使用 AI 回答問題時的效果,那就是 「AI感」。
自從 DeepSeek 出現后, 「AI感」也隨即消失,AI 在文字表達和創意上已經達到甚至超過了人類水平。
因此,對用戶來說,決定哪一款產品好的原因并不是那款產品技術多么強,而是剛好能滿足它的需求。
最后說下百度的推理模型文心 X1,它的特別之處在于能在推理分析過程中調用工具。
并且,X1 的多模態處理并不是把其他單模型做縫合,而是原生的多模態大模型。
在分析和完成任務的過程中,X1 會根據需求去調用各種工具達成目標。
雖然具備了推理模型的基本能力,但作為用戶體驗來說,其實跟其他主流推理模型的差別不是很大。
說個不成熟的建議,我覺得百度的優勢應該聚焦在基于大模型的中文處理和需求滿足效率上,就像當年他們宣傳百度搜索引擎的廣告語一樣,「最好用的中文搜索引擎」。
百度不是不行,但它需要加速。
················· 唐韌出品 ·················
安可時刻
其實我那張藍色襯衫的照片是 2016 年拍的,到明年就 10 年了。
很久沒出鏡了,如果你想看看現在的我和照片里的我有多大區別,明晚我會開一場直播。
邀請了三位嘉賓準備了十幾個問題,一起聊聊 AI 時代產品經理的機會,包括大模型技術原理、產品落地場景、AI 產品轉型建議等。
不想錯過的可以先預約這場直播,點擊下方「預約」按鈕即可。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.