本文共計:2982字,6圖
閱讀預計:8分鐘
DeepSeek震驚印度
最近科技圈的大熱新聞應當要屬AI界的“后起之秀”DeepSeek了。這個來自中國的AI產(chǎn)品自打橫空出世,就成為了全球AI界的又一顆新星。印度各界對此也反應強烈。
政界首先老生常談地祭出“中資憂慮論”。
據(jù)路透社的報導,印度財政部已要求其員工避免使用包括DeepSeek在內(nèi)的AI工具用于官方用途,理由是它們可能對政府文件、數(shù)據(jù)的保密性構成風險。
除了所謂的“國家安全”議題外,AI涉及的版權問題也一直是印度輿論關注的焦點。
目前仍在審理中的一樁相關訴訟就頻上熱搜。訴訟的被告方是OpenAI,另一方則是印度首富穆克什·安巴尼等人控制的印度最大媒體巨頭。
后者認為前者侵犯了自己的版權,但OpenAI對這一指控提出了反駁,并認為其在印度根本沒有服務器,印度法院就不該審理這起官司。
雖然此事事發(fā)時DeepSeek還沒有引起廣泛關注,但若此案OpenAI敗訴,勢必對所有AI工具產(chǎn)生同樣的影響。
印度首富穆克什·安巴尼“對陣”O(jiān)penAI|圖源:businesstoday.in
在“限制”之余,中國在AI領域如此迅速的突破也讓印度各界感到了深深的“震驚”。
印度政府已經(jīng)表示,印度的國產(chǎn)版DeepSeek競品也即將問世。
政府目前正向初創(chuàng)公司、大學和相關研究人員提供數(shù)千塊高端芯片,以便在“不到10個月”的時間內(nèi)開發(fā)出類似的產(chǎn)品。
印度在AI領域“超中趕美”的野心似乎不難理解。
印度本身就有不錯的IT基礎。OpenAI首席執(zhí)行官Sam Altman今年2月也表示,印度目前是OpenAI的第二大用戶市場。
這證明印度對AI的市場需求也十分強勁——算算經(jīng)濟賬,在印度搞AI不可能不賺錢。
沒錢搞AI?
但即便這幾年AI之風勁吹,可似乎世界的焦點始終徘徊在中美兩大國。印度好像一直就分不到一杯羹。
這其中一個重要的原因十分殘忍:沒錢。
據(jù)BBC的調(diào)查,在2010年至2022年期間,中國和美國分別獲得了全球AI專利總量的60%和20%,而印度獲得的專利僅僅不到0.5%。
2023年,印度AI初創(chuàng)企業(yè)獲得的私人投資,同它們的美國和中國同行所獲投資相比,僅僅占一小部分。
各經(jīng)濟體AI專利數(shù)量比較|圖源:businessstandard.substack.com
募集不到民間資本,或許是因為民間確實沒錢,或許是因為投資者意識不到AI的巨大獲利空間。
但是,政府呢?印度政府總不至于沒錢?
其實政府也確實做了些事情,比如前文提及的給大家“發(fā)芯片”,另外印度也給一些AI相關項目提供了10億美元的支持。
聽起來也不算少了,但再看看中美兩國。
特朗普為“星際之門”計劃(一項在美國建設大規(guī)模AI基礎設施的計劃)撥出的金額高達5000億美元;
中國則宣布要在2030年前成為AI中心,計劃投資1370億美元。
相比之下,印度政府的這個扶植力度就讓人貽笑大方了。
但DeepSeek的成功似乎還是讓印度企業(yè)看到了一絲希望。
科技從業(yè)者們注意到了一個事實:DeepSeek以相對低廉的600萬美元預算,做出了能夠與ChatGPT這樣的尖端模型相媲美的產(chǎn)品。
盡管有聲音認為DeepSeek“背后的資金要多得多”,但它畢竟證明了,AI模型也可以在相對老一些的、便宜一些的芯片上運作。
這肯定是個好消息。畢竟就在幾個月前,AI項目還被印度各界認為實在太燒錢,真的沒法搞——GPT這只巨大的吞金獸讓現(xiàn)金流普遍不夠的印度公司感到望塵莫及。
印度官方也對此表示了肯定。
印度信息技術部長1月時稱贊道,中國初創(chuàng)公司DeepSeek憑借其較低成本的AI產(chǎn)品震撼了業(yè)界,并將其“節(jié)儉”的做法引為印度政府努力構建本土化AI模型的楷模。
印度信息技術部長Ashwini Vaishnaw|圖源:路透社
這番表達的意思是,想要政府出大錢是不可能了,但如果能“花小錢辦大事”,政府還是十分樂見其成的。
莫迪在巴黎出席全球AI峰會|圖源:tradeflock.com
多語言的困擾
花小錢能辦大事固然最好,但別人成功的經(jīng)驗也未必全能隨便復刻。印度打造本土化AI模型首先要面臨的一個巨大挑戰(zhàn),是多語言環(huán)境。
眾所周知,AI之所以能那么“像個人樣”,關鍵是因為它被通過技術手段“喂”了一堆人類的語料。
然而,《印度教徒報》就發(fā)文表示,這件事在印度挺麻煩的。因為要“創(chuàng)建一個適用于印度語言的基礎大型語言模型”仍是一個艱巨的任務。
幾十種語言并用的印度,不像“美國、中國、日本和韓國等主要為單語”的互聯(lián)網(wǎng)社會。由于各種語言的內(nèi)容實在太過博雜,竟沒有任何一種語言有絕對的代表性。
該文章說,在上述國家,“人們能夠自由互動”,因為本國的開發(fā)者愿意首先為自己所在的社會開發(fā)產(chǎn)品,可是“我們根本沒有解決這個問題。 我們?nèi)匀徊辉敢饨鉀Q這個問題。”
換言之,這是印度社會自使用互聯(lián)網(wǎng)時起就面臨的一個老問題:印度的“互聯(lián)網(wǎng)”真的不太“互聯(lián)”。
客觀來看,盡管已經(jīng)取得了一些技術進步,比如說谷歌翻譯等服務對印度各語言的翻譯質(zhì)量已明顯有所提高,但印度業(yè)內(nèi)人士依然認為,二者的可比性不大——翻譯是一項針對既有內(nèi)容的“轉(zhuǎn)換性”技術,其挑戰(zhàn)并不在于創(chuàng)建新文本,以及用特定的語言去解決問題。
要創(chuàng)建本土AI需要進行的數(shù)據(jù)收集,主要取決于印度各語言網(wǎng)上語料的“可用性”,而這就要求用戶能夠在網(wǎng)上發(fā)布更多的各類印度語言內(nèi)容。
道理很簡單:各種語言的“料”不夠多,怎么“喂”AI呢。AI無飯可吃,又怎么表現(xiàn)得像個人?
印度技術界表示,雖然印度各大社交媒體上各類文本的數(shù)量正在增加,但訓練基礎AI模型所需的內(nèi)容仍低于臨界值。
有技術人士指出,即便是名義上的官方語言印地語、在國內(nèi)地位舉足輕重的馬拉地語和泰米爾語,目前都被認為“缺乏足以訓練AI模型所需的高質(zhì)量數(shù)據(jù)”。遑論那些更小眾的語言了。
但這一現(xiàn)象也同印度網(wǎng)絡的普及率有直接關系。據(jù)印度互聯(lián)網(wǎng)和移動通信協(xié)會的一份報告,41%的印度人不經(jīng)常使用互聯(lián)網(wǎng),而在農(nóng)村地區(qū),這一比例高達51%。
這一群體很可能與非英語使用者重合。因此,也許在未來,他們能夠以某種方式參與進AI的訓練中。
但這顯然尚需時日。
人才向外跑
另外一個對印度AI構成嚴重打擊的原因是印度人才的流失。
其實印度的人才基礎并不差。印度是全球知名的IT大國,這一點早已人盡皆知。
在AI人才方面,印度也走在世界前列。據(jù)BBC的估計,全球16%的AI工作者都來自印度,印度是世界第二大AI人才儲備庫。
印度的AI人才儲備| 圖源: induqin.com
根據(jù)2024年的斯坦福人工智能指數(shù),印度在AI技能普及方面排名全球第一,得分為2.8,超過美國(2.2)和德國(1.9)。
此外,印度的AI技能滲透率為2.8——全球最高,表明其人工智能勞動力在人工智能相關能力方面的技能比全球平均水平高出2.8倍。
根據(jù)斯坦福大學的另一份統(tǒng)計數(shù)據(jù),在2016年至2022年期間,世界幾個主要經(jīng)濟體的人工智能人才庫均大幅擴充。
印度的人工智能人才增長最多,增幅高達263%。
但為何擁有這么多人才卻依然出不了好成果?原因很簡單,人才跑了——越來越多的AI人才選擇離開他們的祖國。
同樣據(jù)斯坦福大學的統(tǒng)計,印度正在經(jīng)歷全球最大的AI人才外流,每10000名擁有AI技能的印度技術人才,凈移民率為-0.76。
這一情況比以色列、韓國、意大利等同樣“往外送人才”的國家都要嚴重得多。
印度AI人才外流情況|圖源:businessstandard.substack.com
高層次領軍人才的流失,使印度大量的IT從業(yè)者“群龍無首”,自然轉(zhuǎn)型艱難,只能固守低端賽道。
如班加羅爾的IT外包行業(yè)規(guī)模達2000億美元,擁有數(shù)百萬程序員,它本應成為孵化印度本土AI的前沿陣地。
然而現(xiàn)實情況是,IT公司們從未真正將它們的業(yè)務重點從廉價的服務工作轉(zhuǎn)移到開發(fā)IT技術上。
綜合這種種“AI起不來”的原因,其實不難看出,科技創(chuàng)新是一項全局工程, 科學精神、經(jīng)濟投入、人才儲備、人文環(huán)境等都發(fā)揮著重要因素。
有印度專家就表示,印度其實已經(jīng)具備了搭上AI快車的關鍵因素,但如果不對教育、研究和國家政策等進行基本的結構性調(diào)整,印度還是無法發(fā)揮出其優(yōu)勢,成為一流的AI大國。
本文為印度通原創(chuàng)作品,任何自媒體及個人均不可以以任何形式轉(zhuǎn)載(包括注明出處),免費平臺欲獲得轉(zhuǎn)載許可必須獲得作者本人或者“印度通”平臺授權。 任何將本文截取任何段落用于商業(yè)推廣或者宣傳的行徑均為嚴重的侵權違法行為,均按侵權處理,追究法律責任。
>> 熱文索引 <<
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.