滿屏都在盛贊DeepSeek,甚至《黑神話悟空》的主創馮驥都表示“DeepSeek是國運級別的科技成果”。
2025年1月27日,DeepSeek更是超越ChatGPT,登頂蘋果美國區免費App下載排行榜第一。
有一說一,DeepSeek確實好,開源免費、簡單小巧、訓練成本低都是優點,而且會給出看似縝密的推理過程。
DeepSeek有多好,舉個例子,假如我們現在把“我是脫口秀演員何廣智,請你模仿我的風格,給我寫吃飯的段子,需要講夠5分鐘”這個問題丟給主流的幾家國產大模型,沒有哪家比DeepSeek回答得更好
不過DeepSeek也有一些明顯的不足,現在階段還不能過高評價。
1、套路化、公式化的創作,AI味還是很濃
我們閱讀文章時,經常會說這是華爾街體、虎嗅體一樣,有很明顯的創作特征。這種明顯的特征被機器學習利用后,機器會把這種特征規則化、套路化,最終呈現的內容看起來非常專業嚴謹,卻反而暴露出機器短板--一看就是機器創作。
DeepSeek的創作也是如此,充斥著更嚴謹的套路化創作。它呈現內容真的太好了,有人說“它比人還好”,這不完全是一句褒義詞,另外一層含義是,看起來還是像機器寫的。
當然,這一點要比國家其他大模型好很多。
2、低級錯誤頻發,無法對呈現內容自我校準
前兩年,主流大模型出現過“林黛玉倒拔垂楊柳”之類的張冠李戴的錯誤。現在雖然有所改進,但各種低級錯誤頻發,且一本正經呈現的案例也時有發生。
DeepSeek也不例外,這幾天我在使用時發現了大量的錯誤呈現。在我提問關于“丁道師”的內容,發現了大量非常低級的錯誤,這些錯誤按理說很容易識別,但DeepSeek還是執拗地給出了自己的答案。
比如這句話:“您提到的“丁道師”應是中國互聯網行業資深分析師、知名科技評論人丁道師(本名丁磊),他在互聯網經濟、電商、新媒體等領域有長期觀察和研究。”
實則丁道師并非丁磊,如此混淆,實在不該。
3、對因果關系理解欠佳
之前有位大佬提到過一個假設,大意是“如果我們現在到處發文章和論文,論證人可以把石頭當飯吃,長期以往,機器就以為人可以把石頭當飯吃,可能就會輸出這樣的內容。”
現在國內的幾家大模型服務,包括DeepSeek也遇到這個問題。
比如這個論述“呂梁被評為中國電商扶貧示范市”,呂梁其實從來都沒有被評為中國電商扶貧示范市,咱們國家也沒有這樣一個評選。
這種因果關系的錯亂,是這樣導致的:有作者認為呂梁可以作為一個電商扶貧示范市看待,并且把這個論述發到了多種權威媒體。結果現在被DeepSeek一通深度推理過后,就變成了“呂梁被評為中國電商扶貧示范市”。
寫在最后:總而言之,以理性的眼光看待 DeepSeek 的成果至關重要。須知,任何科技創新都需遵循科技發展的一般規律,DeepSeek 自然也不例外。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.