當生成式AI熱起來,元宇宙仿佛歸于寂寞,有人認為這個風口已經過去了。
但事實上恰好相反。
可以說,對AI的生成能力來說,元宇宙是最大的應用場景;對元宇宙來說,生成式AI是構建元宇宙的核心要素。
現在,它們相遇了。
——筆者按
01
火熱的NeRF
簡而言之,神經輻射場技術NeRF(Neural Radiance Fields,簡稱NeRF)是一種計算機視覺技術,用于生成高質量的三維重建模型,并較之傳統的、已經非常成熟的三維重建技術有獨特的進步。
如果要用最簡單的方式概括NeRF的優點,大概你應該記住這三點:
第一,NeRF在處理有反光的場景上,比傳統的方式效率要高很多。
而現實中有反光的場景無處不在,從各種水系、玻璃建筑物外立面等等。
而NeRF應用了深度學習技術后,很大的提高了實景三維數據的采集和處理效率。相比傳統的三維重建方法,NeRF技術可以更好地處理遮擋、弱紋理和反光等問題,可以實現高逼真的虛擬環境渲染,使得可視化展示更加生動、真實和流暢。
第二,NeRF使用深度學習模型來模擬人眼對于現實世界的感知。這種模型可以捕捉到現實世界中的光線、顏色、形狀、紋理等細節,通過多視角合成計算的方式實現場景目標的三維呈現。
第三,NeRF在提供從靜態圖片生成3D場景上,自動生成更高級別的數據,減少了人工修模的成本,提升了數據生產的效率。
從技術角度來講,讀者們記住這3點也就夠了:提升效果、二維變三維、降低成本。
僅僅就憑借這些優點,計算機圖形巨頭們紛紛追加了對于NeRF的技術開發。
以英偉達為例,自發布以來,成千上萬的開發者和內容創作者正在利用其開發的Instant NeRF技術構建了令人驚嘆的3D視覺效果。
而現在,英偉達團隊已經為這個將靜態圖像轉換為真實3D場景的渲染工具增加了虛擬現實支持,亦即Instant NeRF in VR。換句話說,用戶可以從靜態圖像渲染沉浸式場景,然后通過VR頭顯虛擬地進入環境,并在3D空間中自由移動。
這相當于打通了從3D場景渲染到應用落地(VR頭顯所需要的虛擬環境)的應用路徑。
國內知名元宇宙創業公司AIRLOOK 的CTO由清圳,就此對筆者說了一番很有意思的話,他說:“將AirlookMap的既往工作,特別是在3D重建和渲染能力方面的積累,與NeRF的技術進行結合,能夠滿足許多特定應用場景的需求。”
”目前三維重建中的一些突出問題,例如對玻璃、水面等反光或透明物體的重建,最終重建的模型中可能會有孔洞、變形、細節丟失等問題,而NeRF可以合成照片級別的新視角,針對玻璃、水面等場景,重建的模型更加真實,細節更加豐富“,由清圳表示:”C端的用戶只會感覺視覺體驗更好了,但對于我們這個行業來說,這種新的技術路徑是突破性的,AIRLOOK也是國內最早試圖在NeRF方向上打開局面的企業之一。”
不過,嚴格來講,NeRF屬于AI技術的一部分,其中,國內知名企業商湯在人工智能領域擁有龐大的團隊和豐富的積累,AIRLOOK在人工智能與空間計算結合以及產業化落地方面擁有豐富的經驗,雙方就此找到了合作的基點。
02
商湯和AIRLOOK如何走到一起?
值得一提的是,商湯和AIRLOOK的合作,首先是目前AI在垂直行業落地的一個典范性的合作,其次才是一次技術層面的相互奔赴。
截止目前為止,國內外AI領域遇到的一個普遍難題是,真金白銀燒出來的AI技術在實踐中成功落地的并不算太順利,而從財務意義收回成本更尚未遙遠。
即使是目前最火熱的生成式大模型,也在遭遇到商業化落地的難題,其中一個很重要的原因,就是它們想要用AI能力進行改造的傳統行業,缺乏相關領域的人才積累、技術底蘊和優質的訓練數據集。
并非國內的千行百業不歡迎AI技術,而是在現實中存在一個具體的悖論。
那就是,越有數據積累和應用需求的企業,往往都是從信息化時代走過來的巨頭,如衛星、石油勘探、海洋研究等,他們的信息化是從二十到三十年前就開始了,雖然存量的數據資源非常豐富,但行業的技術壁壘非常高,AI企業很難擊穿這種歷史壁壘。
而在云原生、AI原生時代就開始進行數據積累的企業,則往往歷史較短,換言之其開發潛力總體上受限于有限的積累,缺乏行業標桿級的意義。
而商湯遇到的AIRLOOK,恰好兼具以上兩者之長。
一方面,AIRLOOK是一個重數據資產的企業,這和其是從無人機測繪并制作元宇宙地圖為起始點不無關系。
具體說來,AIRLOOK具備的底蘊,在創業企業中是不多見的。它們有甲級測繪資質甲級測繪資質,具有全閉環的無人機采集技術,同時也在三維重建與渲染方面擁有全新并且完整的技術體系。
另一個方面,AIRLOOK不是一家閉門造車的企業,由清圳認為,AIRLOOK持非常開放的態度歡迎能夠提升其競爭力的外在能力注入,這是使得雙方的合作得以順利開展的很重要的要素。
再一方面,AIRLOOK具有的大量真實的已落地案例,讓商湯的技術大有用武之地。
目前,AIRLOOK已經在文旅、智慧城市、元宇宙平臺等方面,有多領域的實踐。
重點在實景三維、數字孿生的相關領域展開合作。
例如,AIRLOOK將把自己多年積累的大規模實景三維數字底座,與商湯的NeRF技術進行深度融合,以實現物理世界的多級刻畫,從而高效的實現對多元場景的逼真還原。
而從技術的角度來看,目前NeRF已經和AirlookMap Studio產品完成整合對接。這將加快AIRLOOK利用NeRF的效率,在一系列重點用途上,如豐富場景重點建筑細節,還原整體場景樣貌等方面,將為文旅、建筑、工業制造、智慧城市等廣泛行業用戶提供三維數字化服務,推動三維數字化產業快速發展,未來這一整體產品將為整個行業提供一體式服務。
03
不錯失時代給予的機會
NeRF雖然目前只是在有限的領域展現出不凡之處,但它具有宏大的潛力。
來自 Google AI 和谷歌投資的自動駕駛公司 Waymo 的研究人員實踐了一個新思路,他們嘗試用 280 萬張街景照片重建出整片舊金山市區的 3D 環境。
在這次實踐中,通過大量街景圖片,谷歌的研究人員們構建了一個 Block-NeRF 網格,完成了迄今為止最大的神經網絡場景表征,渲染了舊金山的街景。
這項技術被谷歌大神Jeff Dean轉發到社交網絡后,引發了廣泛關注。
而備受關注的原因是,NeRF在早期的工作往往被視為側重于小規模和以對象為中心的重建,例如單個房間或建筑物大小的場景,而谷歌的嘗試意味著,NeRF對于重建大規模環境同樣具有潛力,突出體現在在自動駕駛、航空測量等領域具有廣泛應用前景。
不過其缺陷也很明顯:即模型需要同一個場景(scene)的多個視圖(views)作為監督學習的輸入。
簡單說就是,如果你要給一個人生成3D模型,你必須圍繞這個人拍攝很多張照片,這其實又走回了傳統3D渲染的老路。
但隨著技術的演進,新的NeRF模型需要的圖片數據越來越少,而生成質量越來越高,這顯示NeRF的主要瓶頸將被突破。
而結合AIRLOOK的業務方向,我們至少可以在兩個領域期待NeRF帶來的變化。
其中一個是AIRLOOK的實景三維數據生產及可視化可以明顯的效率提升。
實景三維數據在城市規劃、文化保護、自然資源管理等領域的應用越來越廣泛,而AIRLOOK在這些領域都有已經落地的項目,而NeRF技術的應用可以加速這些領域的應用進程。例如,在城市規劃中,NeRF技術可以提供高逼真度的城市模型,提高了規劃效率和決策準確性。
而更重要的是,對于AIRLOOK的看家本領——實景三維地圖領域,NeRF將帶來的可能是個革命性的變化。
而其中最基本的,是通過現有的實景三維數據實現更加逼真的場景重建和渲染,為地理信息行業提供更加準確、實用的數據支持,并同時降低成本。
有人把元宇宙理解為現實世界的虛擬景象,也有人更深一步的理解為利用新的技術重構人的五感后創造一個新的世界。
但無論是哪種定義,元宇宙本身就需要大量的內容(此內容是廣義上的)來填充,AI與元宇宙必將相會,必將產生疊加式創新,而這一趨勢在目前已見端倪。本文要提及的神經輻射場技術NeRF(Neural Radiance Fields)就是之一。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.