6月,騰訊提議啟動,并參與推進和維護的AVS3P10音頻解碼標準定稿了。
令人聳動的是,業(yè)內(nèi)人士認為,從某種意義上說,這個標準突破了在傳統(tǒng)條件下的香農(nóng)極限,從而證明了AI Codec相對傳統(tǒng)Codec可以顯著提升編碼效率,它奏響了AI改變視音頻編解碼產(chǎn)業(yè)的序曲。
AVS3P10音頻解碼標準的提出,意味著我們每個人都有機會在這個全數(shù)字時代獲得更好的溝通體驗,更意味著中國的AVS標準在和MPEG等國際標準爭奪全球音視頻領域的標準制定權(quán)的博弈中,已經(jīng)先下一城。
值得深思的則是,我們記憶中的以“產(chǎn)品為王”著稱的騰訊,是怎么開始進入從底層技術研發(fā)領域,又有什么優(yōu)勢和方法論,能夠這么快的拿出世界級的研究成果。互聯(lián)網(wǎng)產(chǎn)品的成功帶動多種通信、人工智能等技術的融合,形成質(zhì)變的路徑,對于總體來說更擅長做產(chǎn)品和應用的互聯(lián)網(wǎng)行業(yè),又有什么啟發(fā)意義?
——導語
01
字少事大
最近,騰訊發(fā)了一篇新聞稿,內(nèi)容也很簡單——新一代實時語音編碼行業(yè)標準AVS3P10即將正式發(fā)布。
該標準由騰訊提議啟動、推進和維護,以騰訊首款神經(jīng)網(wǎng)絡語音編解碼器Penguins為原型,關鍵的一句話是:“Penguins將AI與傳統(tǒng)技術緊密融合,從算法研究、工程化、產(chǎn)品化層面做了大量系統(tǒng)性創(chuàng)新,打破傳統(tǒng)香農(nóng)定律的性能極限”。
看到這里,筆者就有點坐不住了;我想,凡是學通信工程、信息學,或者對人類信息科學發(fā)展史有點概念的讀者,都坐不住了。
為什么呢?因為香農(nóng)定律在這個行業(yè)里,不,應該說在這個時代里,地位太重要啦,那就是信息工作者yyds啊。
人類從較早期文明到今天,其實也不過經(jīng)歷了四個時代——狩獵采集時代、農(nóng)業(yè)時代、工業(yè)時代和今天的信息時代。
而克勞德·艾爾伍德·香農(nóng),這位生于密歇根的一個普通家庭的科學巨匠,就是信息時代的先驅(qū)者。可以說,他以一己之力,開啟了人類溝通方式革命的大門。
1948年,香農(nóng)發(fā)表了那篇震古爍今的碩士論文——《通信的數(shù)學理論》,此文如同劃破長空的閃電,宣告了信息論開始登上歷史舞臺。
有人認為,香農(nóng)定律應該被列入“人類歷史上最重要的五個定律”之一,完全足以與牛頓的經(jīng)典力學定律、愛因斯坦的相對論等相提并論。
比如,我們今天度量和建設信息世界的最小度量單位——比特,就是香農(nóng)提出的;換言之,就算是將來整個人類都進入了元宇宙時代,那這個宇宙的度量標準也是香農(nóng)提出的。
1948年,香農(nóng)提出的信息熵,解決了電報、電話、無線電等如何計量信號信息量的問題。
但一個具體的問題是,但怎么在遠距離通信中進一步提高信道容量,也就是信息傳送速率上限在哪里,這個“哪里”就是所謂“香農(nóng)極限”。
香農(nóng)的牛就體現(xiàn)在,香農(nóng)極限不是一種假說,因為香農(nóng)給出了具體的信道容量公式,也就是“香農(nóng)公式”,幾乎所有的現(xiàn)代通信理論都是基于這個公式展開的。
必須說一下信噪比這個概念,簡單說就是,在一個通訊過程中,信號越強、噪聲越低,通信質(zhì)量就越高,俗話說就是信噪比高。
可以說,自有香農(nóng)的這個公式之后,人類通信發(fā)展的主流方向,就是圍繞著擴大帶寬和提高信噪比這兩個命題在玩。
從某種程度上,人類從1G發(fā)展到今天的5.5G,其中一個重要的原因之一就是,通過增加帶寬,我們甚至可以輕松應對小于0的信噪比。
雖然從理論上來講,帶寬為王。但是,定律歸定律,我們要面臨的真實世界,總是比實驗里復雜很多。
比如,線上會議、語音通話等實時音頻溝通,經(jīng)常面臨著在電梯、地庫、隧道等網(wǎng)絡很差的環(huán)境里持續(xù)通話的場景,類似的情況還有在快速移動的交通工具上(如高鐵、汽車),同時也包括在信號覆蓋本身就較差的地方(如郊野、偏遠地區(qū))。
你可以在一個信號較弱的地方增加信號(比如多增加一個發(fā)射塔),但是你怎么能預測到每一個人在每一次行程中遇到的每一個信號較弱的點位呢?
而以上問題,對于應用覆蓋了騰訊會議、QQ語音等場景的騰訊會議天籟實驗室的研發(fā)人員來說,可以說,每天都在解決類似的問題——這也是他們要挑戰(zhàn)香農(nóng)極限的動力。
以香農(nóng)公式為通信理論之基,通過不斷革新技術,提高信噪比、提升帶寬使用效率這是一個主方向。
但騰訊會議天籟實驗室專家研究員、Penguins項目負責人、AVS3-P10標準Editor肖瑋說:“既然真實情況是——不能保證任何時候都有足夠的帶寬,那我們就把編碼器的能力做強,反其道而行之——使得即使在很低帶寬的情況下,依靠更小的碼率,保證信息收發(fā)的正常和高品質(zhì)——當然,在帶寬足夠時,音質(zhì)跟現(xiàn)有方案仍然能打平手”。
不要以為這很簡單,從提出構(gòu)想到實現(xiàn)構(gòu)想,之間的距離不是一躍可過的。
例如,30多年前,國際電信聯(lián)盟就提出:兩個人在地球的兩端通訊,可以接受的延遲是在400毫秒以內(nèi)。
但今天6G都快來了,但人類仍然無法做到,保證任何一次遠距離通訊的延遲都保持在400毫秒之內(nèi)。
還是那句話,行業(yè)標準可以很高,但實際的帶寬環(huán)境永遠錯綜復雜。
編碼技術是一個很有意義的方向,它的核心意義是,把原始的聲音(我們可以看作是要運送的貨物)按一種特定形式打包,包如果打的足夠巧,體積就可以很小,就可以在同等運力的情況下運送更多貨物;但如果一味追求壓縮體積,就可能把貨物“壓壞”,從而同樣無法得到高質(zhì)量的語音。
騰訊會議天籟實驗室的挑戰(zhàn)是,EVS、OPUS等現(xiàn)有主流音頻編解碼標準,已經(jīng)很成熟了,應用也很廣泛,但技術的演進停留在這些標準上也已經(jīng)很久了。
肖瑋說:“我們當時開展工作的一個背景是,當碼率降低到10kbps以下時,任何一種現(xiàn)存編碼器的傳輸語音質(zhì)量都下降明顯,影響用戶體驗。這意味著我們不能僅僅是改善別人的技術,而是要在底層技術上作出變革和創(chuàng)新。”
這就是騰訊會議天籟實驗室對香農(nóng)定律的極限挑戰(zhàn),但是,這次他們多了一個隊友——騰訊AI Lab。
在傳統(tǒng)方法幾乎窮盡時,正在勃興的AI技術,到底是不是音視頻編碼新的福音?
02
有多少黑科技,就有多少的工程改造量
先說一下天籟實驗室的目標,他們的大致目標是,在保持甚至提高語音質(zhì)量的前提下,大幅度降低所需碼率。
也就是說,既然現(xiàn)在的分水嶺是10kbps,那么,新的編碼技術要在更低碼率(比如:6kbps)的條件下,語音質(zhì)量的主觀體驗仍然在4分甚至4.5分以上(滿分為5分)。
這里要介紹一下Codec這個概念,它泛指支持視頻和音頻壓縮(Encoding)與解壓縮( Decoding ) 的編解碼器或軟件。而隨著AI技術的勃興,AI Codec技術隨之興起,它指的是在AI方法論賦能下的編解碼技術創(chuàng)新。
有業(yè)者指出,AI Codec壓縮性能超越傳統(tǒng)的H.264、H.265僅使用了傳統(tǒng)方法1/6的發(fā)展時間,從1988年的H.261到2020年的H.266,相較于傳統(tǒng)編解碼器平均十年一次的迭代頻率,AI Codec的發(fā)展可謂神速。
“在AI的加持下端到端的優(yōu)化是一個系統(tǒng)工程,也是我們沒有走過的一條路”,肖瑋說:“但我們有一個很好的價值觀,使得目標明確。因為騰訊的價值觀就是用戶體驗優(yōu)先,這其實就給我們的研發(fā)排定了優(yōu)先級——首先要保證體驗大幅度改善,然后在這個前提下找具體的路徑,這使我們的一切探索都有了方向感”。
而傳統(tǒng)的音頻技術,其實已經(jīng)逼近傳統(tǒng)條件下的香農(nóng)極限,肖瑋介紹說:“如果對一個原始的信號每秒采樣率是16000個點,每個點用16bit進行表示,不做任何壓縮就是256kbps,按壓縮10倍粗估,就是24kbps,這就是傳統(tǒng)編解碼技術的香農(nóng)極限。事實上也如此,目前基于傳統(tǒng)方法的編解碼器碼率,就是在20kbps左右可以保證較好的質(zhì)量”。
“一般來說,在信息技術領域,20%幅度的效能提升就可以稱為一次迭代”,肖瑋說:“但這次等于說要把20kbps降到6kbps,優(yōu)化幅度要達到300%以上,這就非要AI這種新力量的賦能才可以做到。”
其實,對于要不要做這件事,也存在爭論。有人認為,目前的用戶帶寬水平已經(jīng)很高,24kbps其實已經(jīng)非常低了,所以繼續(xù)改進的ROI是很低的。
“但我們不這樣看,因為我們有億級用戶的真實場景”,騰訊云副總裁、騰訊會議天籟實驗室主任商世東說:“從我們的真實觀察來看,用戶遭遇弱網(wǎng)環(huán)境的案例比比皆是,這導致了即便單純從降低碼率這一個維度看,我們把技術提升到極致就已經(jīng)有很大的收益;甚至,還會有新的、意想不到的應用場景被開拓出來”。
事實上,在筆者了解Penguins誕生的過程,發(fā)現(xiàn)天籟實驗室和騰訊AI Lab的團隊聯(lián)合起來,至少解決了四個大方向上的問題,才最終催生了今天的結(jié)果。
第一個問題,就是路徑問題。
“事實上這個需求是2020年提出來的,最早提出的是解決低碼率下保證中等語音質(zhì)量的問題”,騰訊AI Lab的陽珊說:“但當時我們沒有任何既定的路線可以參考。”
經(jīng)過反復的討論,定下了引入了深度神經(jīng)網(wǎng)絡,提前進行海量學習從而進行語音建模,從而“利用AI能力在編碼時能夠抓住音頻最核心特征參數(shù),并根據(jù)重要性智能分配碼率,再借助深度學習網(wǎng)絡,預測并重建語音中的細微結(jié)構(gòu),最終生成逼真的音頻波形”的這樣一條路。
也許讀懂這段話有些吃力,那我們可以打個比喻——傳統(tǒng)的編解碼,就是只按一種固定形式打包和發(fā)運,而且如果中途有些包裹丟失了,也沒有辦法。但AI加持下,會智能的根據(jù)貨物的特征和運力的情況,靈活機動的決定最優(yōu)的打包方式,而如果預測到了可能丟失貨物,還可以自動化的補貨,從而保證了接收到的包裹被以最合適的方式處理,且損失也會實時得到補充,從而讓發(fā)貨和接收方的滿意度都大大提升。
就在次年,Pengunis就作為新一代的AI語音引擎開始服務于騰訊會議等場景,得到了大量的好評,這初步證明了騰訊會議的路,選對了。
第二個問題,無窮無盡的優(yōu)化。
為什么2021年就開始嘗試使用的技術,要到2024年才廣為人知呢,除了參與AVS的標準工作需要大量的時間之外,很具體的問題就是這個技術隨著產(chǎn)品的升級,也在不斷優(yōu)化。
“這個工作如果要鉆到細節(jié)里,可以說是無窮無盡”,陽珊說:“人耳是非常敏感的器官,聽覺是主觀的、甚至有時候是玄學。比如進行了一定程度的壓縮后,有人聽得出底噪,有人聽不出,所以我們就要按聽覺比較靈敏的那一部分人的標準去優(yōu)化,這造成了大量的算法+工程問題。”
而在同時,要求也在不斷提高,“最開始提出的目標,是滿足低碼率下中等程度的通話質(zhì)量,后來不斷提升到更低的碼率和更高的質(zhì)量”,肖瑋說:“你也可以理解為我們成功了,也可以理解為還在路上。”
“有時候優(yōu)化是很有趣的,因為完全不同的場景會產(chǎn)生不同的需求,我們要做好調(diào)優(yōu)“,QQ音視頻技術負責人劉天成說:“僅僅就QQ的語音溝通來說,如果是私人的點對點溝通,對語音的還原度要求就很高,比如呢喃細語、呼吸的聲音,都要逼真的還原;還有一種場景是連續(xù)幾小時、一整夜的通話,我們就要考慮整個過程中的功耗、設備的發(fā)熱量、省電等等,可以說,有多少黑科技,就有多大的工程改造量。”
第三個問題,模型要足夠小。
陽珊說:“我可以明確的說,這不是大模型,也不是從大模型蒸餾出來的小模型。因為我們做的是AI編解碼器,而一套語音方案中會集中很多個編解碼器,你可以理解為我們在做一個在體積、效率、功耗上都有嚴格限制的、極為精密的小模型。”
而且,由于主要是實時語音場景,所以99%都發(fā)生在智能手機上,“這要求我們不斷的降低對端側(cè)算力的需求,做到不同設備、不同網(wǎng)絡環(huán)境下的體驗一致性,用開玩笑的說法就是‘在低端手機上也要跑出風火輪的速度’,這對技術的要求非常高”。
事實上,最終的Penguins只有百K規(guī)模,陽珊說:“這體現(xiàn)了騰訊AI Lab團隊的底層技術能力,很多人提到模型就說算法,其實我們調(diào)優(yōu)的顆粒度可比算法精細多了,包括最底層的算子、甚至更低一層的函數(shù),我們都會做優(yōu)化,這也是為什么我們最終能拿出一個世界級水平的產(chǎn)品的原因,那就是底層能力的自信和掌控力”。
“綜上所述,我們解決的是一個“既要又要還要的問題”:高質(zhì)量、低碼率、低算力(其實還有低延時)。所以,真實在系統(tǒng)側(cè)設計整個解決方案時,我們又進一步將傳統(tǒng)信號處理和信息論與最新AI技術進行了緊密融合,數(shù)據(jù)驅(qū)動+領域知識,形成全新的方法論。這不是簡單的1+1過程;而是從方案頂層設計、算法細節(jié)、極致工程化等多方面端到端對問題進行閉環(huán)”,肖瑋解釋到。
如果說以上三個問題,都屬于技術層面的問題,那么,Penguins面臨的一個終極考驗是,既然做到了世界級的創(chuàng)新,那到底能不能得到世界級的認可?能不能讓這種成就廣泛的給用戶創(chuàng)造價值,而這才是最終的大問題。
所以我們下一節(jié)單講這個問題——標準化問題。
03
成為世界標準的路并不平坦
成為世界標準的路并不平坦。
2024年6月,AVS3P10實時語音編碼標準正式完成標準化工作,進入公示階段。
我們要先理解何為AVS。
簡單說,AVS(Audio Video coding Standard,音視頻編碼標準)是中國全自主知識產(chǎn)權(quán)的一個音視頻編解碼標準,它作為一個工作組織則成立于22年前,也就是2002年。
它的先進之處在于,是全球首個落地應用的面向8K及5G產(chǎn)業(yè)應用的音視頻信源編碼標準,已被正式納入國際數(shù)字視頻廣播組織(DVB)核心規(guī)范。
而對電腦比較熟悉的讀者可能會想到,自己經(jīng)常播放的音視頻的文件名后綴是*.MPEG。
沒錯,AVS的主要競合對象,就是國際標準化組織ISO與IEC(國際電工委員會)聯(lián)合成立的MPEG專家組制定的MPEG-1、MPEG-2、MPEG-4等標準。
在技術性能上,AVS與MPEG標準存在直接的競爭關系,尤其是在編碼效率、壓縮比等方面。AVS標準在保持與國際標準相當?shù)募夹g性能的同時,還具備復雜度低、實現(xiàn)成本低的優(yōu)勢。
但在市場覆蓋上,MPEG的優(yōu)勢就是歷史悠久,所以是事實上通行的國際標準。
因此,AVS和MPEG的競合,一定程度上體現(xiàn)了在數(shù)字產(chǎn)業(yè)的一個重要門類——音視頻技術市場中存在的激烈競爭。
而騰訊這次參與制定的是AVS的第三代標準AVS3中的一個模塊,即P10實時語音編碼標準。
事實上,盡管Pengunis在國內(nèi)有騰訊會議、QQ語音這樣的億級場景,但國際上基于深度學習的語音編碼方案并不只有一個,如微軟推出的Satin方案、Google推出的Lyra方案、SoundStream方案等,競爭的焦點也都在低碼率+高質(zhì)量上——如微軟提出的方案也基于6kbps,谷歌則強調(diào)性能更優(yōu)于微軟標準。
某種意義上,Pengunis是代表中國在AI Codec方面的最高水平,以參與制定標準的方式,幫助中國標準加強國際競爭力。
但這并不意味著AVS會對騰訊“開后門”,相反,騰訊要參與標準的制定,不但要主動提議并參與標準制定;同時,提交的基于Penguins的候選技術,也要經(jīng)過AVS音頻組交叉驗證后才能采納。
事實上,隨著2024年6月,AVS3P10實時語音編碼標準正式完成標準化工作,進入公示階段,此前的一些信息才逐步披露出來。
“值得一提的是,騰訊主導該標準制定的過程,也被AVS工作組評價為制定速度最快,標準交付質(zhì)量最高,測試得到充分好評的一個過程”,商世東說。
而AVS工作組也指出:“AVS3P10 實時語音編碼,作為新一代的語音編解碼技術標準,是對AVS系列標準的重要補充。該標準是當前業(yè)界的最高水平,體現(xiàn)了騰訊在語音處理、人工智能技術創(chuàng)新和用戶體驗方面的實力,將為用戶帶來更好的體驗。”
“在目前,根據(jù)公開材料來講,目前我們這套方案是業(yè)界唯一一個主觀和客觀質(zhì)量都到4分以上,甚至4.5分的,哪怕我們在5.9kbps上都有四點幾分”,肖瑋說:“在(和國際標準)的橫向比較之下,在10kbps下我們的質(zhì)量優(yōu)勢非常明顯,這意味著,它在一定程度上反映了中國標準比同期進行的國際標準的領先性。”
同時,這種領先性,也是和跟傳統(tǒng)信號處理的編碼器和先進的AI codec一起去對比的結(jié)果,肖瑋興奮的說:“從目前看,我們是代表了業(yè)界最高水平,是全球第一個系統(tǒng)性引入AI能力而形成的下一代語音編碼標準、并在實用環(huán)境中真正意義上實現(xiàn)了低碼率下高質(zhì)量的效果,所以AVS給我們作了這樣的結(jié)論,我們也倍感自豪。”
而對于為什么把自家勞心費力做好的技術拿出來做標準,商世東的看法是,這體現(xiàn)了騰訊的開放,也是為了行業(yè)的共同進步。
“我們在一個標準化組織里面,把所有新的技術框架和細節(jié)都亮出來,客觀上就等于對全行業(yè)做了開放”,商世東說:“這也是騰訊一直主張的,通過友好的合作和開放,推動整個行業(yè)在下一代語音編解碼技術里面能夠大大向前推進一步,推動這個行業(yè)可以提供更好的技術和產(chǎn)品給到所有的用戶。
而對于“公布標準和細節(jié),會不會反而削弱騰訊的競爭力”的尖銳問題,商世東的看法是:“首先,騰訊是一個業(yè)務型的公司,不會因為單一一個標準披露了,就削弱了競爭力,因為,我們的技術標準都是在億級規(guī)模的場景里先跑通,再把成熟的方案拿出來標準化,這種閉環(huán)是很難被復制的。”
事實上,筆者也認為,對于合作伙伴和生態(tài)來說,要想在最短時間內(nèi)把Penguins這種技術用起來,最好的辦法并不是拿著標準去做逆向研發(fā),而是來和騰訊合作,通過生態(tài)連接的方式,接入更多場景和創(chuàng)造更多價值。
04
產(chǎn)品與技術之辯
在導語中我們提出了一個問題——為什么騰訊這樣善于做產(chǎn)品的公司,做出了世界水平的底層技術創(chuàng)新?它的路徑優(yōu)勢和行業(yè)啟示是什么?
一個看法是,做產(chǎn)品的公司之所以更有做出技術創(chuàng)新的機會,是因為它們知道真實的痛點在哪里,因為產(chǎn)品就是給用戶用的,所以這些技術人員接觸的是技術在真實世界應用的問題,他們比在單純的實驗室里,更了解真實環(huán)境下的種種特殊情況和痛點。
我認識的一位互聯(lián)網(wǎng)大咖有個著名的判斷——中國公司在AI時代更容易出成果,因為做應用、做產(chǎn)品的企業(yè)更容易產(chǎn)生創(chuàng)新,因為它們總是先于做純研究的機構(gòu)遇到問題,而先遇到問題,就有可能在解決問題的過程中更快、更早的實現(xiàn)技術突破。
這個論斷部分解釋了,為什么是善于做產(chǎn)品的騰訊這次更早實現(xiàn)了底層技術的突破。
但我們還可以更想深一層,因為在數(shù)字產(chǎn)業(yè)里一直存在“先技術還是先產(chǎn)品”的爭論。
一種觀點認為,應該先研發(fā)技術,然后從上游向下游摸索,看可以產(chǎn)生什么有用的產(chǎn)品。
另一種觀點認為,技術的產(chǎn)品化,才是技術得以快速演進的先決條件,是產(chǎn)品給了技術面向真實用戶的機會、是產(chǎn)品化推動了“技術產(chǎn)品化-產(chǎn)品商業(yè)化-用戶反饋-技術再創(chuàng)新”的四步閉環(huán)模式,使得產(chǎn)品可以從“下游”溯流而上的推動技術發(fā)展。
舉個例子,20世紀60年代末,隨著計算技術和半導體技術的迅速發(fā)展,半導體元器件制造技術從分立器件、小規(guī)模、中規(guī)模集成電路向大規(guī)模集成電路發(fā)展。
作為這種技術趨勢的一個里程碑,1971年大規(guī)模集成電路技術的結(jié)晶--4004芯片在英特爾公司誕生。
但我們并不能認為4004問世時,就是一個產(chǎn)品,因為產(chǎn)品總是針對具體用途的,而當時包括英特爾公司的高管在內(nèi),整個硅谷都沒有人知道4004能用來干什么——其中,英特爾的創(chuàng)始人諾伊斯認為它最好的用途是可能是電子表,也有人猜測是廚房攪拌機,有人認為可以用來控制汽車的化油器。
這在某種程度上說明了,沒有產(chǎn)品化的技術,就如同沒有肉體的靈魂,只能獨自飄蕩。
比如,真正把大規(guī)模集成電路從技術變成成熟的產(chǎn)品,并發(fā)展成一個產(chǎn)業(yè)的,則是IBM公司。
不要以為大公司就是技術驅(qū)動的,IBM并沒有發(fā)明PC技術,但它通過整合英特爾的芯片和微軟公司的MS-DOS操作系統(tǒng),成功的推出了PC這個產(chǎn)品,計算機行業(yè)也由此涇渭分明的分成軟件和硬件兩個陣營,通過一代又一代的產(chǎn)品創(chuàng)新,驅(qū)動著技術工作者研發(fā)更快的處理器和更完善的軟件,這個規(guī)律一直到今天都沒有失效。
這段歷史給我們的啟示是,有時候,技術是 0-1,產(chǎn)品是 1-100,1的確很重要,但如果沒有100,單純的1就失去了意義,也不會得到進化的機會;而只有當有了100后,人們才可以有機會在后面寫上更多的零,甚至改變整個世界。
所以說,是產(chǎn)品選擇了技術、促進了技術,而不是技術選擇了產(chǎn)品。如果你只是有技術,那么,它只有很小概率被做成產(chǎn)品,更大的可能是被豎之高閣,比如日本的氫能汽車就是如此。
而先搞出產(chǎn)品,并在此之后不斷迭代,才有了勃興的產(chǎn)業(yè),并推動技術不斷進步,這可以說才是人類技術演進的主流,比如中國的新能源汽車產(chǎn)業(yè)、AI產(chǎn)業(yè)都是如此。
說的絕對一點——人類社會迄今為止,所有的技術誕生的時候,其實都不知道可以用于什么,是產(chǎn)品給技術面向用戶的機會,使得技術可以順流而下發(fā)展起來。
回過頭來看,Penguins的成功,從技術角度看,是AI的大力出奇跡聚焦在了一個單點上形成的突破。但是從產(chǎn)品角度看,如果沒有騰訊會議、QQ語音這樣擁有億級用戶的產(chǎn)品,以及這些產(chǎn)品所產(chǎn)生的真實場景和真實需求,也就不會有人意識到改造編碼標準的意義和緊迫性,更不會有人去做這樣的工作,那我們的編解碼器技術就會一直停留在前AI時代,我們也不會因此享受到更流暢并且無時無處都可以進行的高質(zhì)量語音溝通。
中國是全球唯二的AI創(chuàng)新策源地,更是全球唯一擁有10億級用戶規(guī)模的單一產(chǎn)品市場,這讓我們在后互聯(lián)網(wǎng)時代和AI時代的彎道超車成為可能,但前提是,更多的善于做產(chǎn)品的公司,應該有足夠的胸懷和抱負,有從產(chǎn)品創(chuàng)新出發(fā)、但又不止于產(chǎn)品創(chuàng)新的格局和意識。
這種情況下,騰訊這種巨頭企業(yè)主動從產(chǎn)品出發(fā)去研究底層技術,并對技術成功的分享持開放、友善的態(tài)度,這對于整個行業(yè)的進步,對每個網(wǎng)民的體驗改善,都意義重大,也樹立了一個較好的賦能范式。
同時,這也證明了,所謂的“一流的公司做標準,二流的公司才做產(chǎn)品”的觀念已經(jīng)過時了。在數(shù)字時代,技術和產(chǎn)品交相迭代,技術的完善過程中,需要大量源自產(chǎn)品和用戶的反饋來牽引技術的進步。這再次提醒我們,打造產(chǎn)品的能力值得被高度重視,它是商業(yè)文明得以發(fā)展和傳承的密碼,過于關注技術而輕視產(chǎn)品,最后往往反而會帶來資源錯配和失去市場機會。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.