99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

為什么 DeepSeek 不再“聰明”?從語料貧瘠到思維貧乏!

0
分享至

  人工智能浪潮之下,大模型如雨后春筍般涌現,中文大模型領域也曾在春節前后一度熱鬧非凡,甚至曾把英偉達的市值從第一的位置拉下馬,雖然英偉達在近日又創歷史新高。

  作為國產AI的“潛力股”,DeepSeek 曾因其技術背景和宣傳攻勢,被寄予厚望。但現實是,越來越多用戶在使用后表達出強烈失望:生成內容空洞重復、邏輯混亂、審查敏感過度,“答非所問”,甚至自編自導幾乎成了常態。曾經有個知識博主分享了一個內容,DeepSeek在回答問題時所引用的三篇論文居然全部是杜撰的,基礎是假的,當然答案也肯定是不可信的。

  而隨著這種狀況的加劇,曾轟動一時的DeepSeek也徹底走下了神壇,從一枝獨秀到無人問津,用了半年的時間。

  

  它為什么“蠢”?是技術不行?還是有更深的結構性問題?

  答案可能要從“語料”和“思維”兩個層面說起。

  一、中文AI的先天缺陷:語料貧瘠

  眾所周知,大語言模型的能力高度依賴訓練數據的質量與廣度。GPT-4、Claude、Gemini 等英文模型之所以能“聰明”,是因為它們背靠海量、高質量、多樣化的語料池。以OpenAI為例,訓練數據涵蓋了 Common Crawl(全球網絡抓取)、維基百科、PubMed、arXiv、Reddit、新聞評論、技術文檔、小說劇本等幾乎所有人類語言的場景。

  而中文模型能抓取和使用的東西呢?

  根據公開研究數據,在全球前100萬個網站中,中文網站僅占1.3%,而英文網站高達59.3%。中文用戶如果只掌握中文,所能接觸的信息本就只是信息世界的冰山一角。而這“冰山一角”還充滿內容閹割、平臺審查、表達受限等問題。

  不僅量少,而且質量差。

  這幾年,中文互聯網的原創內容正加速流失。知乎、豆瓣、小紅書、微博等平臺,算法驅動下變得越來越“重復性高、情緒化強、知識性弱”。優質內容不是404了,就是“由于相關法律法規,不予顯示”,我們經常見到的優質文章消失就是這個道理。更雪上加霜的是,自媒體生態在搜索引擎上堆砌SEO、批量AI生成內容,使得網絡語料進一步失真。

  簡而言之,中文大模型要變“聰明”,它首先必須“見過世界”。但今天的中文語料,更多是“圍墻里的縮影”,而不是“世界的地圖”。

  而我們之所以剛見到DeepSeek還覺得行,是因為其是當初面世時的內容是從2023年10月份之前GPT的訓練基礎上汲取的,所以內容還比較真實,但隨著這個窗口的關閉,其現在的內容很多事從百度這樣的平臺上吸取的(百度的文件質量有目共睹),所以其最終的質量就以自由落體的速度下降了。

  

  二、語言審查帶來的二次污染

  DeepSeek 模型的訓練也繞不開一個關鍵現實:我們的AI必須面對高強度的內容審查機制。這種機制不只是應用層的“輸出審查”,更是訓練層的“語料篩選”。

  根據網傳不完全統計,我國的AI模型訓練和部署過程中,過濾詞條可能超過6.6萬組。你能想到的熱點社會話題、政治人物、歷史事件、制度性爭議,幾乎都在模型眼中“不可觸碰”,所以經常你問一個問題,DeepSeek說到一半就終止了,甚至一開始就可以規避掉,而這都是因為審查機制導致的。

  這意味著什么?

  意味著它不是“不會回答”,而是“必須回避”。

  在訓練過程中,模型缺少對現實世界中“沖突性”“對抗性”“灰色地帶”的表達與理解能力。于是我們看到,中文AI往往顯得“太干凈”“太小心”,一問深一點的問題,它就會用“我是AI助手,無法回答”來結束對話。

  它不是蠢,而是被訓練成“不敢聰明”。

  三、模型思維的扁平化:會說話 ≠ 會思考

  即使不考慮語料與審查,我們AI的另一個痛點在于:它會“模仿”,但不太會“思考”。

  GPT 模型的本質,是通過大量文本的預訓練,學習語言的統計規律,也就是“接下來最可能出現的詞是什么”。它的“聰明”不是因為它理解了世界,而是因為它見過足夠多的世界,并統計出其中的規律。

  而DeepSeek等中文模型,一方面語料有限,另一方面RLHF(基于人類反饋的強化學習)環節難以完成真實、多元、多層級的微調,最終導致模型雖然能“說人話”,但無法進行深度的思維模擬。

  舉個簡單的例子:

  你問它:“如何看待‘計劃經濟’和‘市場經濟’的對比?”
它可能會答:“兩者各有優劣,應結合國情靈活選擇。”

  再比如,你問他“如何看待朝鮮這個國家的治理體系”

  

  他給你的回答永遠模棱兩可的,沒有答案的問題,聽起來好像沒毛病,但其實什么都沒說,而且有時候,更像是人民日報的話語。

  而同樣的問題,GPT-4 可能會從歷史沿革、理論基礎、現實表現、國家案例等多維度展開,邏輯清晰、觀點明確,即使你不認同它的答案,也會承認:它確實“想過”。

  中文模型的“平庸輸出”背后,是訓練過程中對“思維路徑”的扁平化塑造。而這種扁平,歸根結底,還是數據、機制和環境決定的,不是不會思考,而是不能思考。

  四、聰明的AI,需要更聰明的語境

  DeepSeek 的局限,并不是DeepSeek一家的問題,它是整個中文AI行業共同面對的困局。
? 缺乏優質開放語料
? 內容生態持續退化
? 審查制度擠壓表達空間
? RLHF流程成本高、難以真實反饋

  這一切,最終讓中文大模型“聰明地糊涂起來”。

  當一個AI所能學習的世界,被人為劃定了邊界、屏蔽了爭議、消除了復雜性,它怎么可能成長為“有思維”的工具?它最多只能成為一個不會出錯的復讀機——但復讀機不等于智能。

  不是DeepSeek不行,是我們太“安全”了

  要讓中文AI變得真正強大,不是靠多加幾層注意力機制、擴一倍參數規模就行的,而是要面對更本質的問題:我們是否愿意為一個真正“會思考”的AI,提供一個足夠真實、足夠復雜、足夠自由的訓練土壤?而這恐怕不是幾個AI模型和企業就能解決的。

  否則,DeepSeek不會是第一個“聰明不起來”的模型,也不會是最后一個。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
支持率出爐!馬斯克的新黨太猛了,特朗普緊急發文,他情商是真高

支持率出爐!馬斯克的新黨太猛了,特朗普緊急發文,他情商是真高

傲傲講歷史
2025-07-07 09:12:52
肖華擔任軍區政委,韓先楚叫他老首長,肖:你以后說話可得注意了

肖華擔任軍區政委,韓先楚叫他老首長,肖:你以后說話可得注意了

老謝談史
2025-07-07 15:41:36
羅寧,第三次被查

羅寧,第三次被查

新京報政事兒
2025-07-07 12:02:41
保時捷女銷冠真容曝光!工作6年還生了娃,同事披露她賣車多原因

保時捷女銷冠真容曝光!工作6年還生了娃,同事披露她賣車多原因

寒士之言本尊
2025-06-05 22:08:25
李賀寫下“天若有情天亦老”200年無人能對,直到宋朝才對出下句

李賀寫下“天若有情天亦老”200年無人能對,直到宋朝才對出下句

大千世界觀
2025-07-07 20:50:31
高溫天氣,醫生苦勸高血壓患者:寧可吹吹空調,也別頻繁做6件事

高溫天氣,醫生苦勸高血壓患者:寧可吹吹空調,也別頻繁做6件事

華庭講美食
2025-07-07 18:58:26
女兒高考自己估分400,我正打算讓她讀專科,成績出來那天我傻眼

女兒高考自己估分400,我正打算讓她讀專科,成績出來那天我傻眼

白云故事
2025-07-06 07:45:08
美印談崩了,印度打響反美第一槍,通告全球,斷的就是特朗普退路

美印談崩了,印度打響反美第一槍,通告全球,斷的就是特朗普退路

博覽歷史
2025-07-07 12:08:14
在任近10年!廣東一中學原校長,被查

在任近10年!廣東一中學原校長,被查

南方都市報
2025-07-07 18:53:27
44歲阿嬌節目哭訴:正常情況我應該有個20歲的孩子,但已經沒機會

44歲阿嬌節目哭訴:正常情況我應該有個20歲的孩子,但已經沒機會

銀河史記
2025-07-05 12:59:12
26歲黃子弘凡3秒電梯救人,上百游客脫險,這才是粉絲該追的偶像

26歲黃子弘凡3秒電梯救人,上百游客脫險,這才是粉絲該追的偶像

鄉野小珥
2025-07-07 14:07:04
發廊一店員跪著給顧客洗頭,男顧客很享受,網友:感覺有些擦邊

發廊一店員跪著給顧客洗頭,男顧客很享受,網友:感覺有些擦邊

唐小糖說情感
2025-06-17 09:40:21
周總理只是讓他經商,給黨賺取經費,他卻給組織賺回一個商業帝國

周總理只是讓他經商,給黨賺取經費,他卻給組織賺回一個商業帝國

大國紀錄
2025-06-16 09:38:48
據說新款問界M7長這樣?售價水漲船高?

據說新款問界M7長這樣?售價水漲船高?

座駕參謀
2025-07-07 10:07:24
52歲金城武:無兒無女,在鄉下種田

52歲金城武:無兒無女,在鄉下種田

溫讀史
2025-07-03 15:02:03
被追繳稅款4.8億后,寧波夫妻果斷離場,將“爛攤子”留給了國資

被追繳稅款4.8億后,寧波夫妻果斷離場,將“爛攤子”留給了國資

老鵜愛歷史
2025-02-14 11:31:16
最新通報:上海一干部被查!涉嫌嚴重違紀違法

最新通報:上海一干部被查!涉嫌嚴重違紀違法

上觀新聞
2025-07-07 20:12:09
知名網紅餐飲巨頭暴雷!蟑螂成堆、病菌超2000倍,坑慘老百姓

知名網紅餐飲巨頭暴雷!蟑螂成堆、病菌超2000倍,坑慘老百姓

葡萄說娛
2025-07-07 13:48:20
晚年李銀橋坦露:毛主席對粟裕的評價,我再不說以后都沒人知道

晚年李銀橋坦露:毛主席對粟裕的評價,我再不說以后都沒人知道

深刻的歷史
2025-06-04 11:11:24
河南一女子中暑去世,發作到死亡不足10小時!別低估夏天“威力”

河南一女子中暑去世,發作到死亡不足10小時!別低估夏天“威力”

健身狂人
2025-07-07 10:40:48
2025-07-07 23:43:00
邏輯與常識 incentive-icons
邏輯與常識
通過時事分析和評論,剖析事件之后的本質和邏輯。反洗腦,真認知
186文章數 431關注度
往期回顧 全部

科技要聞

投資大佬一語扎心:中國機器人"可悲"現狀

頭條要聞

月薪8千女子挪用公款1700萬揮霍:每年買奢侈品花200萬

頭條要聞

月薪8千女子挪用公款1700萬揮霍:每年買奢侈品花200萬

體育要聞

不會再有第二個,快樂又偉大的托馬斯-穆勒

娛樂要聞

鹿晗狀態回升賬號恢復 演唱會公開表白

財經要聞

特朗普要發關稅函 美國貿易談判進展如何

汽車要聞

預售10.58萬起/6秒級加速 零跑B01將于7月下旬上市

態度原創

健康
家居
房產
數碼
公開課

呼吸科專家破解呼吸道九大謠言!

家居要聞

醺光伴讀 品質兼顧實用

房產要聞

容積率1.0,這可能是海口近三年最猛的一塊地!

數碼要聞

可折疊iPad被擱置后,蘋果卷軸式iPad專利曝光

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 晋宁县| 谢通门县| 重庆市| 吴旗县| 沙河市| 平武县| 山丹县| 余庆县| 山西省| 综艺| 涞源县| 固阳县| 厦门市| 卢氏县| 渑池县| 临泉县| 三明市| 巴彦淖尔市| 普格县| 盐亭县| 沭阳县| 昌邑市| 卢湾区| 吉林省| 肇源县| 吴桥县| 吉木萨尔县| 绥芬河市| 鄂托克前旗| 沁阳市| 界首市| 青海省| 延安市| 衡山县| 敦化市| 孟州市| 岫岩| 宜君县| 龙口市| 拜泉县| 钟山县|