蘋果公司機(jī)器學(xué)習(xí)團(tuán)隊(duì)與南京大學(xué)及香港科技大學(xué)研究人員合作,近日發(fā)布了一款名為Matrix3D的3D人工智能模型。該技術(shù)突破性實(shí)現(xiàn)了僅需三張2D照片即可生成3D物體和場(chǎng)景的功能。
這項(xiàng)被稱為"大型攝影測(cè)量模型"的技術(shù)與現(xiàn)有流程存在顯著差異。傳統(tǒng)攝影測(cè)量需要分別使用不同模型進(jìn)行姿態(tài)估計(jì)和深度預(yù)測(cè)等步驟,而Matrix3D通過(guò)統(tǒng)一架構(gòu)一次性完成所有處理,不僅簡(jiǎn)化了工作流程,還提高了精確度。
研究人員采用了類似早期Transformer架構(gòu)的掩碼學(xué)習(xí)策略進(jìn)行模型訓(xùn)練。通過(guò)在訓(xùn)練過(guò)程中隨機(jī)隱藏部分輸入數(shù)據(jù),迫使模型學(xué)習(xí)填補(bǔ)空白的能力,這使得Matrix3D即使在小規(guī)模或不完整數(shù)據(jù)集上也能有效訓(xùn)練。
該技術(shù)成果已開源發(fā)布在GitHub平臺(tái),研究論文發(fā)表于arXiv,并建立了展示網(wǎng)站供用戶體驗(yàn)。專家認(rèn)為,這項(xiàng)技術(shù)將為蘋果Vision Pro等沉浸式頭顯設(shè)備帶來(lái)重要應(yīng)用前景。
參考鏈接:
https://9to5mac.com/2025/05/13/apple-study-3d-objects-from-images/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.