賽格特約作者 熊志
編者按
美國(guó)在基礎(chǔ)研究上積累了巨大優(yōu)勢(shì),但中國(guó)憑借超大市場(chǎng)優(yōu)勢(shì),也催生了大量應(yīng)用創(chuàng)新。在競(jìng)爭(zhēng)激烈的通信技術(shù)領(lǐng)域,中國(guó)從完全落后到發(fā)展出自己的產(chǎn)業(yè),只用了30年時(shí)間,以5G技術(shù)為代表,華為、中興等企業(yè)幫助中國(guó)在專利上建立護(hù)城河。進(jìn)入AI時(shí)代,互聯(lián)網(wǎng)企業(yè)利用場(chǎng)景優(yōu)勢(shì),繼續(xù)攻城拔寨,首次建立起超出國(guó)際水平的行業(yè)標(biāo)準(zhǔn)。本文試圖描繪,在中國(guó)這樣一個(gè)超級(jí)市場(chǎng),創(chuàng)新到底是如何發(fā)生的。
從烽火臺(tái)傳信、馬匹和飛鴿傳書,到電報(bào)的發(fā)明,拉開現(xiàn)代通信系統(tǒng)的序幕,再到移動(dòng)電話成為大眾通信工具,通信方式的變革,改變了人們的生活方式,推動(dòng)了社會(huì)的進(jìn)步。
可以說,人類文明的發(fā)展史,也是一部通信技術(shù)進(jìn)化史,一部讓信息傳輸更加高效、便捷的科技迭代史。
如今,我們已經(jīng)進(jìn)入了數(shù)字通信時(shí)代,5G、人工智能等新技術(shù)的應(yīng)用,讓通信的質(zhì)量和體驗(yàn)感不斷增強(qiáng)。
就在這兩天,新一代實(shí)時(shí)語音編碼行業(yè)標(biāo)準(zhǔn)AVS3P10即將正式發(fā)布,這是全球首個(gè)系統(tǒng)性引入人工智能應(yīng)用的技術(shù)標(biāo)準(zhǔn),解決了弱網(wǎng)環(huán)境下的語音通信質(zhì)量問題。
這一技術(shù)標(biāo)準(zhǔn)的支持下,在電梯、地庫、隧道等網(wǎng)絡(luò)很差的環(huán)境下,也能夠低延時(shí)、清晰流暢地進(jìn)行線上會(huì)議、語音通話。簡(jiǎn)單說,即便遭遇2G網(wǎng)絡(luò)環(huán)境,通話質(zhì)量也可以在很大程度上得到保障。
這項(xiàng)新標(biāo)準(zhǔn)超越了現(xiàn)有國(guó)際標(biāo)準(zhǔn)的水平,而主導(dǎo)這項(xiàng)標(biāo)準(zhǔn)的企業(yè)來自AVS內(nèi)部成員企業(yè)騰訊。AVS是“數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)”的簡(jiǎn)稱,該標(biāo)準(zhǔn)工作組由國(guó)家信息產(chǎn)業(yè)部科學(xué)技術(shù)司于2002年6月批準(zhǔn)成立,除騰訊之外,華為、阿里巴巴、字節(jié)跳動(dòng)、大疆、聯(lián)發(fā)科以及韓國(guó)三星都是其成員。
值得一提的是,在通信領(lǐng)域引入AI能力幾乎成了頭部互聯(lián)網(wǎng)企業(yè)旗下產(chǎn)品的標(biāo)配,比如阿里巴巴的釘釘會(huì)議,就在音頻算法中融入AI技術(shù),以幫助消除汽車?yán)取㈡I盤敲擊聲等噪音。字節(jié)跳動(dòng)旗下的火山引擎流媒體音頻團(tuán)隊(duì),之前也曾發(fā)布基于AI編解碼的相關(guān)研究成果。
技術(shù)上,推動(dòng)AI能力在通信領(lǐng)域的應(yīng)用落地,中國(guó)企業(yè)不僅沒有落后美國(guó)企業(yè),并且率先在技術(shù)標(biāo)準(zhǔn)上邁出了實(shí)質(zhì)性的一步。一流的企業(yè)賣標(biāo)準(zhǔn),AVS3P10的發(fā)布意義值得珍視。
中國(guó)通信產(chǎn)業(yè)的追趕:從1G到5G
1973年,摩托羅拉研制出第一部手機(jī)。不久之后,貝爾實(shí)驗(yàn)室的科學(xué)家們成功打破硬件限制,研制出具有隨時(shí)隨地通信能力的蜂窩移動(dòng)通信系統(tǒng),歐美國(guó)家的通信技術(shù)開始邁向產(chǎn)業(yè)化。
1973年9月,摩托羅拉DynaTAC 8000X正式上市,手機(jī)的重量達(dá)到1公斤,充滿電要10小時(shí),但最多只能通話半小時(shí)
通信技術(shù)的重要性不言而喻,它已成為全球研發(fā)投入最集中、創(chuàng)新最活躍領(lǐng)域之一,大國(guó)之間在通信領(lǐng)域的技術(shù)競(jìng)爭(zhēng)和博弈異常激烈。
中國(guó)的通信技術(shù)發(fā)展,早期一直處在落后狀態(tài)。直到1987年,第一代移動(dòng)通信,也就是我們熟知的1G網(wǎng)絡(luò),才借助全運(yùn)會(huì)的東風(fēng)在廣州正式開通。這一年,脫下軍裝的任正非,剛剛在深圳創(chuàng)立華為。
技術(shù)上的落后,導(dǎo)致中國(guó)的通信市場(chǎng),一度被國(guó)外廠商所壟斷。但經(jīng)過幾十年的追趕,我們實(shí)現(xiàn)了從2G跟隨、3G突破、4G同步,到5G引領(lǐng)的跨越式發(fā)展。
行駛在信息高速公路上,通信技術(shù)的應(yīng)用,早已不再局限于打電話、發(fā)短信,觀看高清網(wǎng)絡(luò)直播、實(shí)時(shí)開啟音視頻會(huì)議等等,已經(jīng)成為常見的應(yīng)用場(chǎng)景。
通信技術(shù)產(chǎn)業(yè)上的窮追猛趕,為我們的日常生產(chǎn)生活,帶來了極大的便利,也催生出華為、中興等全球領(lǐng)先的通信設(shè)備龍頭企業(yè)。據(jù)悉,到2024年5月,中國(guó)5G基站數(shù)量已超過380萬個(gè),占據(jù)全球60%以上。
憑借著強(qiáng)大的技術(shù)實(shí)力和專利積累,頭部通信企業(yè)帶動(dòng)國(guó)內(nèi)通信產(chǎn)業(yè)快速發(fā)展,同時(shí)積極參與全球通信標(biāo)準(zhǔn)的制定,提升了中國(guó)在全球通信領(lǐng)域的話語權(quán)。
通信技術(shù)作為現(xiàn)代社會(huì)的基石之一,其應(yīng)用范圍已經(jīng)遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)的通信企業(yè)和設(shè)備廠商。值得一提的是,中國(guó)通信產(chǎn)業(yè)的彎道超車背后,除了華為、中興等設(shè)備廠商,在應(yīng)用端,頭部互聯(lián)網(wǎng)科技公司,也是重要的創(chuàng)新發(fā)起者。
IPR Daily此前發(fā)布的《全球無線通信網(wǎng)絡(luò)技術(shù)發(fā)明專利排行榜(TOP100)》顯示,2021年6月1日至2023年5月31日,華為、OPPO、VIVO、中興、小米等中國(guó)企業(yè),無線通信網(wǎng)絡(luò)的專利發(fā)明量躋身前十,此外,騰訊、阿里巴巴等互聯(lián)網(wǎng)企業(yè)也入圍專利發(fā)明百?gòu)?qiáng)榜。
通信技術(shù)發(fā)展,中國(guó)不可能一直模仿
通信產(chǎn)業(yè)是國(guó)民經(jīng)濟(jì)的戰(zhàn)略性、基礎(chǔ)性、先導(dǎo)性行業(yè),在這樣一個(gè)硬核的領(lǐng)域,互聯(lián)網(wǎng)科技公司是如何參與到科技創(chuàng)新浪潮中,甚至成為引領(lǐng)者的?
一直以來,很多人對(duì)互聯(lián)網(wǎng)科技公司存在著認(rèn)知誤區(qū),認(rèn)為國(guó)內(nèi)的這些頭部大廠,擅長(zhǎng)的只是模仿,就算是創(chuàng)新,也不是底層技術(shù)的創(chuàng)新,而是局限于商業(yè)路徑的創(chuàng)新,把創(chuàng)意放在讓用戶掏錢這件事情上。
在互聯(lián)網(wǎng)行業(yè)發(fā)展的早期,“中國(guó)負(fù)責(zé)模仿”的判斷,在某種程度上確實(shí)成立。早期國(guó)內(nèi)的一些互聯(lián)網(wǎng)應(yīng)用,都能找到歐美版本的原型。比如百度之于谷歌,淘寶之于ebay,微博之于twitter等等。
但互聯(lián)網(wǎng)行業(yè)發(fā)展到今天,金字塔尖的頭部大廠,早就告別了復(fù)制模仿的低水平層次,而是正在走向引領(lǐng)創(chuàng)新的新階段。
通信技術(shù)和人工智能的融合,可以提供一個(gè)觀察視角。
比如我們進(jìn)行語音通話,或者進(jìn)行線上的視頻會(huì)議,音視頻信號(hào),往往要先轉(zhuǎn)化成數(shù)字信號(hào)進(jìn)行存儲(chǔ)和傳輸,轉(zhuǎn)換過程需要采用編碼解碼技術(shù),先壓縮去除冗余信息,再解碼重建。
其中,音質(zhì)損失和壓縮效率的平衡是巨大挑戰(zhàn)。音頻體積太大,弱網(wǎng)環(huán)境下就會(huì)導(dǎo)致通話卡頓;壓得過度,音頻質(zhì)量受損,清晰度下降,就會(huì)聽不清。
這次發(fā)布的語音編碼行業(yè)標(biāo)準(zhǔn)AVS3P10,是在傳統(tǒng)音視頻技術(shù)基礎(chǔ)上,開創(chuàng)性地引入了人工智能,借助深度學(xué)習(xí)網(wǎng)絡(luò),預(yù)測(cè)并重建語音中的細(xì)微結(jié)構(gòu),讓“聽得夠清”與“壓得夠小”實(shí)現(xiàn)兼容。
騰訊會(huì)議天籟實(shí)驗(yàn)室攜手騰訊AI Lab研發(fā)的Penguins編解碼器把經(jīng)典信號(hào)處理和最新的深度學(xué)習(xí)技術(shù)結(jié)合在一起,突破了傳統(tǒng)編碼器的天花板
讓電梯里也能實(shí)現(xiàn)清晰語音通話,AI的強(qiáng)大能力遠(yuǎn)不止于此。在實(shí)時(shí)語音傳輸領(lǐng)域,它已經(jīng)有了廣泛的應(yīng)用。
互聯(lián)網(wǎng)科技公司依托用戶需求,進(jìn)行產(chǎn)品設(shè)計(jì),以應(yīng)用為核心開展技術(shù)集成創(chuàng)新,讓人工智能在通信領(lǐng)域加速落地,成為中國(guó)下一代通信技術(shù)和標(biāo)準(zhǔn)的重要參與者。
這里有一個(gè)重要背景,那就是在捕捉用戶需求方面,以服務(wù)C端客戶起家的互聯(lián)網(wǎng)科技巨頭比傳統(tǒng)服務(wù)B端客戶的廠家更有優(yōu)勢(shì)。
畢竟,中國(guó)作為一個(gè)統(tǒng)一的超大型通信應(yīng)用市場(chǎng),一度因?yàn)樾姓蚨幱诟盍褷顟B(tài),相反,市場(chǎng)化社交通信產(chǎn)品的普及,最終將割裂的通信市場(chǎng)彌合成一張相互連接的通信網(wǎng)絡(luò)。
AI商業(yè)應(yīng)用,中國(guó)有超大應(yīng)用場(chǎng)景優(yōu)勢(shì)
一個(gè)有趣的事實(shí)是,在諸多前沿領(lǐng)域,盡管一些顛覆式創(chuàng)新的開創(chuàng)者是歐美,但是引領(lǐng)新技術(shù)率先進(jìn)入商業(yè)應(yīng)用環(huán)節(jié)的,卻往往是中國(guó)企業(yè)。
在Open AI在為通用大模型的商業(yè)化變現(xiàn)發(fā)愁時(shí),國(guó)內(nèi)已經(jīng)有很多互聯(lián)網(wǎng)科技公司,在音視頻傳輸、游戲策劃、影視制作、廣告營(yíng)銷等領(lǐng)域,將大模型率先落地,有的甚至開始賺錢了。
AVS3P10通信標(biāo)準(zhǔn)的落地,是數(shù)字技術(shù)應(yīng)用和場(chǎng)景創(chuàng)新的一個(gè)縮影,而類似的案例還有很多。
像前不久,網(wǎng)易推出首款A(yù)I游戲《逆水寒》手游,游戲內(nèi)嵌入了全自動(dòng)“AI作詞機(jī)”,游戲中的NPC,不再是固定的對(duì)話模板,而是有了接近人類智能的對(duì)話能力。
該游戲的AI引擎學(xué)習(xí)了《全宋詞》和《全宋詞補(bǔ)輯》,共計(jì)2萬余首
從落后追趕,到引領(lǐng)潮流,率先為新技術(shù)開辟?gòu)V闊的應(yīng)用天地,這一切是如何發(fā)生的?
事實(shí)上,科技創(chuàng)新從來不是簡(jiǎn)單的線性遞進(jìn)。在當(dāng)下而言,技術(shù)進(jìn)步與應(yīng)用創(chuàng)新的“雙螺旋結(jié)構(gòu)”越來越突出。簡(jiǎn)單來說,作為推動(dòng)力的技術(shù)進(jìn)步,與作為拉動(dòng)力的應(yīng)用創(chuàng)新之間的互動(dòng)推動(dòng)了科技創(chuàng)新。
中國(guó)用戶基數(shù)龐大,市場(chǎng)廣闊,新技術(shù)往往有海量的應(yīng)用場(chǎng)景,應(yīng)用創(chuàng)新的不斷涌現(xiàn),正是建立在超大規(guī)模的市場(chǎng)優(yōu)勢(shì)下。
像ChatGPT這樣的大語言模型,它的技術(shù)核心在于深度學(xué)習(xí)能力,深度學(xué)習(xí)能力的提升,建立在對(duì)海量的語料數(shù)據(jù)進(jìn)行訓(xùn)練的基礎(chǔ)上。
應(yīng)用端的市場(chǎng)越大,越多的用戶參與,給機(jī)器提供訓(xùn)練學(xué)習(xí)的數(shù)據(jù)資源,輸出結(jié)果就越準(zhǔn)確。就好比汽車行業(yè),用戶數(shù)量更多的車企,在發(fā)展智能駕駛上有先天性的優(yōu)勢(shì)。
在通信領(lǐng)域,騰訊、阿里巴巴、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)科技公司,為什么能率先實(shí)現(xiàn)人工智能的應(yīng)用創(chuàng)新?一個(gè)重要前提也在于,它們有海量的用戶,提供海量的數(shù)據(jù)資源以供技術(shù)訓(xùn)練。
像騰訊在主導(dǎo)推出AVS3P10通信標(biāo)準(zhǔn)之前,相關(guān)技術(shù)原型,在2021年起逐步落地到騰訊會(huì)議車載模式、弱網(wǎng)模式、QQ語音通話等多個(gè)產(chǎn)品場(chǎng)景中。大量的數(shù)據(jù)訓(xùn)練,AI語音信號(hào)建模更加精確,編解碼不至于造成音質(zhì)大幅損失。
更重要的是,應(yīng)用創(chuàng)新,本身是源于用戶需求。
互聯(lián)網(wǎng)科技公司貼近市場(chǎng),貼近用戶,能通過大數(shù)據(jù)、用戶反饋,更準(zhǔn)確地捕捉到用戶的痛點(diǎn),了解技術(shù)如何轉(zhuǎn)化為商業(yè)價(jià)值,并在具體產(chǎn)品中實(shí)現(xiàn)其應(yīng)用價(jià)值。這也是一種創(chuàng)新能力。
比如,提升翻譯、寫作效率的用戶需求,推動(dòng)自然語言處理的技術(shù)創(chuàng)新;復(fù)雜的路面條件駕駛的疲憊,驅(qū)動(dòng)車企在智能駕駛上持續(xù)發(fā)力;弱網(wǎng)環(huán)境下低延時(shí)、高保真度的音視頻通話需求,倒逼互聯(lián)網(wǎng)企業(yè)不斷優(yōu)化網(wǎng)絡(luò)通信技術(shù)標(biāo)準(zhǔn)……
場(chǎng)景應(yīng)用的多樣性,數(shù)據(jù)的豐富性,使得人工智能技術(shù)能夠更加準(zhǔn)確地理解用戶需求,提供更加智能化、個(gè)性化的服務(wù)。
另一方面,大規(guī)模市場(chǎng)下會(huì)有更多需求,也帶來了更廉價(jià)的解決方案,形成規(guī)模經(jīng)濟(jì)效應(yīng),解決技術(shù)落地的成本難題。
最近幾天,OpenAI宣布對(duì)中國(guó)API停止服務(wù),這對(duì)一些套殼大模型公司的確是災(zāi)難性的,但對(duì)于潛心自研的企業(yè)來說,反而提供了更廣闊的市場(chǎng)機(jī)遇。事實(shí)上在幾個(gè)月前,國(guó)內(nèi)主流的大模型廠商,都開始了不斷降價(jià)搶占用戶。
大模型降價(jià),意味著單位利潤(rùn)的下降。但它的另一面是,使用門檻降低,可以吸引更多的用戶,一起分擔(dān)AI推理的巨大成本。只要中國(guó)的大模型可以捕捉用戶真實(shí)的需求,提供有價(jià)值的服務(wù),就能形成商業(yè)與技術(shù)層面的追趕步伐。
找到應(yīng)用場(chǎng)景,創(chuàng)新就能持續(xù)發(fā)生
科技創(chuàng)新只有轉(zhuǎn)化落地,收到市場(chǎng)的正向反饋,才真正意義上實(shí)現(xiàn)了它的價(jià)值。
就像元宇宙的遇冷所折射出來的,一項(xiàng)前沿技術(shù),如果找不到應(yīng)用場(chǎng)景,遲遲無法和用戶建立鏈接,實(shí)現(xiàn)商業(yè)化的變現(xiàn),技術(shù)研發(fā)自然猶如無源之水,不可能持續(xù)。
以往很多人常說,中國(guó)的互聯(lián)網(wǎng)科技公司,只擅長(zhǎng)商業(yè)模式的創(chuàng)新,人工智能應(yīng)用突破的不斷涌現(xiàn),其實(shí)在逐漸打破這種偏見。
數(shù)據(jù)顯示,在2021年,AI領(lǐng)域的專利年度新增數(shù)量,中國(guó)的平臺(tái)企業(yè),已經(jīng)正是超過美國(guó)的平臺(tái)企業(yè),覆蓋算法優(yōu)化、數(shù)據(jù)處理、智能決策等各個(gè)領(lǐng)域。
2014年以來,國(guó)內(nèi)關(guān)鍵數(shù)字領(lǐng)域獲授權(quán)專利快速增長(zhǎng),美國(guó)先是波動(dòng)增長(zhǎng),2019年之后開始下降
它也說明,技術(shù)進(jìn)步與應(yīng)用創(chuàng)新的“雙螺旋結(jié)構(gòu)”下,基礎(chǔ)研發(fā)相對(duì)落后的中國(guó),正在走出一條不同于歐美的科技創(chuàng)新道路,也即通過應(yīng)用落地推動(dòng)反向創(chuàng)新的路徑。
依托超大規(guī)模市場(chǎng)優(yōu)勢(shì),廣大的互聯(lián)網(wǎng)科技公司,具備了強(qiáng)大的技術(shù)商業(yè)化能力。
它們以數(shù)字技術(shù)應(yīng)用和場(chǎng)景創(chuàng)新為重點(diǎn),基于用戶需求和體驗(yàn),不斷優(yōu)化產(chǎn)品的設(shè)計(jì)和研發(fā)能力,逐步向產(chǎn)業(yè)上游發(fā)展,推動(dòng)科技創(chuàng)新和產(chǎn)業(yè)創(chuàng)新融合,提升整個(gè)行業(yè)科技水平。
當(dāng)我們?cè)陔娞荨⒌貛臁⑺淼溃材軌蛄鲿车剡M(jìn)行視頻通話時(shí),背后是一個(gè)潛移默化的改變正在發(fā)生:
越來越多的中國(guó)互聯(lián)網(wǎng)科技公司,正在從依靠規(guī)模獲取利潤(rùn),轉(zhuǎn)變?yōu)樯罡夹g(shù)創(chuàng)新,以此謀求持久穩(wěn)健的發(fā)展,并崛起成為引領(lǐng)科技創(chuàng)新浪潮的領(lǐng)軍力量。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.