被點(diǎn)名的或許只是冰山一角
撰文/孟會(huì)緣
編輯/李覲麟
排版/Annalee
在使用DeepSeek、豆包、騰訊元寶、通義等生成式AI應(yīng)用的時(shí)候,你有沒有想過這樣一個(gè)問題:
當(dāng)我們享受著它們根據(jù)我們的喜好推薦的內(nèi)容、智能生成的回復(fù)時(shí),我們的個(gè)人信息、使用習(xí)慣乃至情感傾向,這些看似無關(guān)緊要卻又能勾勒出生活輪廓的碎片化數(shù)據(jù),是否正被違規(guī)收集與分析?
近日,由官方發(fā)布的一則通報(bào)對(duì)這個(gè)問題給予了確認(rèn)的回復(fù):經(jīng)公安部計(jì)算機(jī)信息系統(tǒng)安全產(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心檢測,在騰訊旗下移動(dòng)應(yīng)用商店“應(yīng)用寶”中的35款A(yù)pp存在“違法違規(guī)收集使用個(gè)人信息”情況,檢測時(shí)間為4月16日至5月15日。
其中最引人關(guān)注的就是兩家AI大模型明星公司,即智譜華章旗下的“智譜清言”和月之暗面公司旗下的Kimi,前者存在“實(shí)際收集的個(gè)人信息超出用戶授權(quán)范圍”問題,后者則是則是“實(shí)際收集個(gè)人信息的頻率與業(yè)務(wù)功能沒有直接關(guān)聯(lián)”。
自從DeepSeek橫空出世以來,生成式AI產(chǎn)品在用戶端得到了一次大規(guī)模的普及與應(yīng)用,而該官方通報(bào)一出,立即就在用戶群體中引起了軒然大波。即使這次被直接點(diǎn)名的只是少數(shù),但在社交媒體上關(guān)于個(gè)人隱私保護(hù)的討論熱度卻空前高漲,人們對(duì)上述違規(guī)行為的擔(dān)憂與不滿,迅速蔓延至整個(gè)生成式AI領(lǐng)域。
之于生成式AI應(yīng)用行業(yè)的信任危機(jī),才剛剛開始。
“第一股”未上市就折戟?
誰能想到,這次被官方通報(bào)點(diǎn)名的智譜清言,上個(gè)月還傳出了“正啟動(dòng)上市輔導(dǎo),將成為‘大模型六小虎’中首個(gè)沖刺IPO的企業(yè)”的消息。
相關(guān)報(bào)道顯示,智譜脫胎于清華大學(xué)知識(shí)工程實(shí)驗(yàn)室,由清華教授唐杰帶領(lǐng)團(tuán)隊(duì)孵化。企查查數(shù)據(jù)顯示,智譜已完成18輪融資,投資方包括高瓴資本、啟明創(chuàng)投、君聯(lián)資本等知名PEVC,美團(tuán)、阿里、騰訊等互聯(lián)網(wǎng)公司,以及北京、杭州、珠海等國資系基金。
所謂的“六小虎”,則是指在大模型領(lǐng)域表現(xiàn)突出的六家創(chuàng)業(yè)公司,包括智譜、月之暗面、百川智能、MiniMax、階躍星辰和零一萬物。2022年末,國外的ChatGPT帶動(dòng)了國內(nèi)的大模型創(chuàng)業(yè)潮,“六小虎”大都在這一時(shí)間節(jié)點(diǎn)前后成立。
當(dāng)時(shí)間來到2025年3月,隨著DeepSeek異軍突起,百度、騰訊等互聯(lián)網(wǎng)大廠和中小企業(yè)紛紛接入和適配DeepSeek,市面上迅速涌現(xiàn)出大量基于DeepSeek技術(shù)的生成式AI產(chǎn)品,無疑對(duì)“六小虎”的生態(tài)位置形成了擠壓,行業(yè)也加速進(jìn)入到“洗牌時(shí)刻”。
從3月份的用戶端表現(xiàn)來看,AI產(chǎn)品榜數(shù)據(jù)顯示,夸克以1.48 億月活占據(jù)國內(nèi)總榜第一名,豆包以9736萬月活用戶位居第二,DeepSeek7701萬月活用戶排名第三。而智譜清言和同樣被點(diǎn)名的Kimi,其市場體量和前三差距明顯,前者以1043萬月活用戶,3月增長31.78%的成績,位居第九名,后者則以2649萬月活用戶,位列第五名。
圖源:AI產(chǎn)品榜
也因此,在大廠卡位、資本退潮的雙重夾擊下,“六小虎”被迫走向分化:有人朝著AGI義無反顧,持續(xù)融資、補(bǔ)血、深耕技術(shù),如沖刺AGI(通用人工智能)的智譜清言、階躍星辰;有人選擇掉轉(zhuǎn)船頭,把有限的資源聚焦至新的業(yè)務(wù)方向,如百川智能選擇“All in”醫(yī)療,零一萬物收縮了預(yù)訓(xùn)練團(tuán)隊(duì),全面擁抱DeepSeek;也有人依然堅(jiān)守原地,想以產(chǎn)品力搏出一條生路,如未傳出停止預(yù)訓(xùn)練信號(hào)的月之暗面、MiniMax……
“我們?nèi)诹硕嗌馘X,拿了多少收益,其實(shí)都是AGI道路上的盤纏。所謂盤纏,就是花掉這筆錢只為了通往目的地”,正如智譜CEO張鵬所說,其曾多次明確過沖刺AGI的目標(biāo)。
據(jù)虎嗅報(bào)道,受DeepSeek影響,智譜AI在今年加大了開源力度,也會(huì)繼續(xù)堅(jiān)持預(yù)訓(xùn)練。張鵬透露,該公司將自己定位成技術(shù)驅(qū)動(dòng)的公司作為基座模型廠商,預(yù)訓(xùn)練是一定會(huì)堅(jiān)持的事情,未來也會(huì)有更大參數(shù)的模型出來。
在3月31日的中關(guān)村論壇上,智譜發(fā)布了AutoGLM沉思模型。據(jù)悉,這是一個(gè)能探究開放式問題,并根據(jù)結(jié)果執(zhí)行操作的自主智能體(AI Agent),能夠模擬人類的思維過程,完成從數(shù)據(jù)檢索、分析到生成報(bào)告,展示了在法律、教育、金融等領(lǐng)域的自主操作、研究及報(bào)告生成能力……這一動(dòng)作也再一次印證著,智譜將AGI設(shè)定為終極目標(biāo)的選擇。
圖源:智譜官博
值得注意的是,生成式AI應(yīng)用因具備智能依賴與數(shù)據(jù)驅(qū)動(dòng)特性,與傳統(tǒng)手機(jī)APP相比,往往面臨更高的隱私泄露風(fēng)險(xiǎn)。
用國家數(shù)據(jù)發(fā)展研究院院長胡堅(jiān)波的話來說,人工智能大模型的發(fā)展需要“數(shù)據(jù)糧食”,特別是高質(zhì)量數(shù)據(jù)集,“高質(zhì)量數(shù)據(jù)集是人工智能大模型訓(xùn)練、推理和驗(yàn)證的關(guān)鍵基礎(chǔ),是按照特定標(biāo)準(zhǔn),經(jīng)過采集、清洗、歸類和標(biāo)注等智能化處理,具有相應(yīng)更新和維護(hù)機(jī)制的數(shù)據(jù)集合。”
可這一切的重點(diǎn)是,“數(shù)據(jù)糧食”的收集和使用,應(yīng)該在合法合規(guī)的框架內(nèi)進(jìn)行。
技術(shù)悖論和監(jiān)管困局
在被爆出違法違規(guī)收集使用個(gè)人信息后,智譜清言和Kimi至今都沒有做出過任何官方回應(yīng)。
但這些問題的存在,不僅暴露了部分智能助手APP在數(shù)據(jù)收集上的過度貪婪,更折射出整個(gè)生成式AI行業(yè)在隱私保護(hù)方面存在薄弱環(huán)節(jié)。被通報(bào)出來的違規(guī)事件,或許只是冰山一角。
從技術(shù)發(fā)展和產(chǎn)品邏輯來講,用戶的個(gè)人信息處理,實(shí)際已成為生成式AI產(chǎn)品不可或缺的一環(huán),尤其是在提升模型性能和保障用戶隱私方面,找到兩者之間的平衡點(diǎn),是相關(guān)應(yīng)用服務(wù)企業(yè)必須面對(duì)的重要課題。
一方面,技術(shù)的發(fā)展依賴大規(guī)模數(shù)據(jù)預(yù)訓(xùn)練,需要在訓(xùn)練過程中處理海量數(shù)據(jù),甚至數(shù)據(jù)量與生成結(jié)果的準(zhǔn)確性呈正相關(guān)關(guān)系。
有研究表明,在訓(xùn)練語言模型時(shí),當(dāng)數(shù)據(jù)量從百萬級(jí)提升到十億級(jí),模型生成文本的準(zhǔn)確性和連貫性會(huì)有質(zhì)的飛躍,在一些語義理解和文本生成任務(wù)中的得分會(huì)顯著提高。
另一方面,任何違反隱私保護(hù)原則的行為,都將對(duì)品牌聲譽(yù)和市場信任造成不可估量的損害,甚至可能導(dǎo)致整個(gè)行業(yè)陷入萎縮和衰退。
由于這種短視的行為會(huì)損害用戶的權(quán)益,如果涉事企業(yè)不能采取有效措施來加強(qiáng)隱私保護(hù),那么用戶必然將失去對(duì)生成式AI的信任,進(jìn)而影響到整個(gè)技術(shù)接下來的發(fā)展路徑和市場前景。
至于部分企業(yè)對(duì)個(gè)人隱私的漠視和濫用,到底是不是在追求技術(shù)創(chuàng)新和商業(yè)利益的時(shí)候,情不自禁地走了捷徑,現(xiàn)在還無法下定確切的結(jié)論,但面對(duì)這一挑戰(zhàn),像智譜清言和Kimi這樣被點(diǎn)名的AI企業(yè),沒能給出令人滿意的解決方案,的確實(shí)是不爭的事實(shí)。
當(dāng)然上述困境并非出于企業(yè)自身發(fā)展和選擇,這樣的單一原因所致。
部分用戶對(duì)個(gè)人隱私信息的保護(hù)意識(shí)不足,導(dǎo)致其在使用相關(guān)AI應(yīng)用時(shí),可能存在隨意授權(quán)、“一攬子同意”,或者對(duì)隱私政策等內(nèi)容不重視、不了解的情況,在一定程度上也助長了一些AI應(yīng)用違規(guī)收集使用個(gè)人信息的行為。
此外,現(xiàn)行的數(shù)據(jù)保護(hù)框架在面對(duì)AI技術(shù)挑戰(zhàn)時(shí)顯得力不從心,存在隱私權(quán)界定模糊,信息獲取、處理與傳遞缺乏透明度等情況,加大了隱私保護(hù)的難度。如《個(gè)人信息保護(hù)法》制定時(shí)尚未預(yù)見生成式AI的爆發(fā),現(xiàn)有法規(guī)對(duì)“告知-同意”原則的執(zhí)行存在模糊地帶,使得企業(yè)在數(shù)據(jù)收集和使用上存在一定的僥幸心理。
為了解決這一系列復(fù)雜而緊迫的行業(yè)痛點(diǎn),多維度、多層次的整改措施是不可或缺的,只有通過各個(gè)層面的共同努力和協(xié)作,才能推動(dòng)生成式AI行業(yè)的健康發(fā)展,實(shí)現(xiàn)技術(shù)與社會(huì)的和諧共生。
而最重要的還是從行業(yè)自律的角度出發(fā),AI企業(yè)承擔(dān)起更多的社會(huì)責(zé)任,主動(dòng)加強(qiáng)隱私保護(hù)措施。畢竟眾多歷史教訓(xùn)早已厘清這樣一個(gè)事實(shí)——只有懂得尊重用戶的企業(yè),才能走向真正的未來。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.