99国产精品欲av蜜臀,可以直接免费观看的AV网站,gogogo高清免费完整版,啊灬啊灬啊灬免费毛片

網易首頁 > 網易號 > 正文 申請入駐

CMU朱俊彥等上新LEGOGPT,一句話搭樂高,網友:復雜零件行不行?

0
分享至

機器之心報道

機器之心編輯部

AI 不允許有人不會搭樂高。

近日,CMU 助理教授朱俊彥團隊帶來了新研究 —— 基于文本生成 3D 樂高的大模型。

這款大模型有多強呢?比如輸入文本「基本款沙發」,一眨眼的功夫,樂高沙發就拼好了。



如果你覺得樂高沙發太簡單,可以繼續上難度,讓它生成一個復雜點的書架,只見不同大小的積木拼拼湊湊,樂高書架就完工了,整個流程像不像你在拼樂高:



不僅如此,生成的樂高還有紋理和顏色:







為了證明 AI 搭樂高的設計過程在現實生活中可用,研究人員讓機器臂組裝了由 AI 創建的 LEGO 模型,結果很完美。



接下來,我們看文章主要內容。

得益于生成模型和神經渲染技術,3D 生成模型已經取得了顯著進展,并在虛擬現實、游戲、娛樂和科學計算等領域實現了各種應用。比如,一些研究探索了從文本合成 3D 對象、為網格添加紋理以及操控現有 3D 對象和場景的形狀和外觀。

不過,應用現有方法創建現實世界中的對象仍然充滿挑戰。大多數方法側重于生成具有高保真幾何形狀和外觀的多樣化 3D 對象,但受限于兩個關鍵挑戰,這些數字設計往往無法在物理上實現。一是,這些對象可能難以使用標準組件來組裝或制作。二是,即使可以組裝,最終的結構也可能存在物理不穩定。如果沒有適當的支撐,設計的某些部分可能會坍塌、漂浮或保持分離狀態。

因此,朱俊彥團隊探討了生成物理可實現對象的挑戰,并在樂高(LEGO)設計環境中進行研究。樂高廣泛應用于娛樂、教育、藝術創作和制造原型。同時,由于所有標準組件很容易獲得,樂高可以作為可復現的研究基準。由于手動設計需要付出巨大努力,最近一些研究開發了自動化算法來簡化流程并生成了令人信服的結果。

然而,現有方法主要基于給定的 3D 對象創建樂高設計,或者專注于單一對象類別。本文的目標是開發一種方法,直接從自由格式的文本提示生成樂高設計,同時確保其物理穩定性和可搭建性。具體來說,研究者的目標是訓練一個生成模型,使其能夠生成具有以下特點的設計:

  • 物理穩定性:構建在具有強大結構完整性的樂高底板上,不會出現積木漂浮或坍塌的情況。
  • 可搭建性:與標準樂高積木兼容,并且能夠由人類或機器人逐塊組裝。

研究者提出了 LEGOGPT,其關鍵洞察在于將最初用于下一個 Token 預測的自回歸大型語言模型重新用于下一個積木預測。他們將樂高設計問題表述為一個自回歸文本生成任務,其中下一個積木的尺寸和位置用簡單的文本格式指定。而為了確保生成的結構既穩定又可搭建,研究者在訓練和推理過程中都強制執行物理感知的組裝約束。

在訓練過程中,研究者構建了一個包含物理穩定的樂高設計并配有字幕的大規模數據集。在自回歸推理過程中,研究者通過有效性檢查和物理感知回滾來執行可行性,以確保最終的 Token 符合物理定律和組裝約束。



  • 論文標題: Generating Physically Stable and Buildable LEGO? Designs from Text
  • 論文主頁:https://avalovelace1.github.io/LegoGPT/
  • arXiv 地址:https://arxiv.org/pdf/2505.05469
  • GitHub 地址:https://github.com/AvaLovelace1/LegoGPT
  • Demo 地址:https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo

實驗表明,本文生成的樂高設計穩定、多樣且視覺吸引力強,同時能夠完美契合輸入文本提示。本文方法優于預訓練的 LLM(無論是否包含上下文學習)以及以往基于網格 3D 生成的方法。

朱俊彥表示:LegoGPT 是邁向「物理對象生成制造」這一終極目標的一小步。當前版本仍存在局限:僅支持 20x20x20 的構建尺寸、21 種物體類別和基礎積木類型,但他們也在努力擴展其能力!



面對這么好玩的應用,網友紛紛求教程:



還有網友擔心,復雜的零件能不能完成啊?



方法介紹

數據集

訓練自回歸模型需要大規模數據集,因此,本文推出了 StableText2Lego,這是一個全新的大規模 LEGO 數據集,包含 47,000 多種不同的樂高結構,并涵蓋 ShapeNetCore 數據集中 21 個常見對象類別中的 28,000 多個獨特的 3D 對象。其概覽如圖 2 所示。



LegoGPT Pipeline

在實現方法上,本文提出了 LEGOGPT,這是一種能夠根據文本提示生成物理結構穩定的 LEGO 設計的方法。

該方法通過利用 LLM 的序列建模和文本理解能力,對預訓練 LLM 進行 LEGO 生成任務的微調。為了增強設計成品的結構穩定性和可搭建性,本文在推理過程中采用了逐塊拒絕采樣和物理感知回滾機制。圖 3 展示了本方法的整體框架。



模型微調:本文進一步使用自定義指令數據集對預訓練的 LLM 進行微調,該數據集包含來自 StableText2Lego 的文本提示及其對應的樂高結構。

預訓練基礎模型。本文使用 LLaMA-3.2-1B-Instruct 作為基礎模型,如圖 5 所示,基礎模型可以通過上下文學習生成類似 LEGO 的設計。

然而,生成的設計通常會遺漏某些物體部件,并且包含相交或斷開的積木,這使其在物理上不穩定且無法搭建。為了解決這些問題,本文使用數據集進一步微調了預訓練模型。



物理穩定性:盡管該模型基于物理穩定性數據進行了訓練,但有時生成的設計仍會違反物理和組裝約束。為了解決這個問題,該研究進一步將物理穩定性驗證納入自回歸推理中。

如果樂高結構在底板上搭建時不會倒塌,則該結構被認為是物理穩定的且可搭建的。為此,本文使用穩定性分析方法評估物理結構穩定性。圖 4 (a) 展示了施加在單個積木上的所有可能力。



LEGOGPT 推理算法如下:



樂高紋理和著色:顏色和紋理在創意樂高設計中也起著至關重要的作用。因此,本文提出了一種應用精細 UV 紋理或為單個積木分配統一顏色的方法。

實驗

圖 5 展示了一系列多樣化、高品質的 LEGO 設計,這些設計緊密遵循輸入提示。

本文選取 LLaMAMesh 、LGM、XCube 和 Hunyuan3D-2 作為基線方法。如表 1 所示,本方法在所有指標上均超越基線方法。圖 5 直觀展示了本方法生成的樂高結構質量顯著優于基線方案。



特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
許多非洲國家比如埃塞俄比亞、尼日爾、坦桑尼亞為何喜歡種芝麻呢

許多非洲國家比如埃塞俄比亞、尼日爾、坦桑尼亞為何喜歡種芝麻呢

金哥說新能源車
2025-05-12 14:36:21
恒安集團回應“心相印客服稱賠冥幣”:因賬號異常報警獲立案

恒安集團回應“心相印客服稱賠冥幣”:因賬號異常報警獲立案

南方都市報
2025-05-12 11:50:08
沃爾昌斯克慘烈巷戰!俄軍突擊隊被放進烏軍伏擊圈,挨個射殺

沃爾昌斯克慘烈巷戰!俄軍突擊隊被放進烏軍伏擊圈,挨個射殺

環球熱點快評
2025-05-12 08:41:54
中國最值得去的6個AAAAA景區,去過3個算合格,你去過幾個!

中國最值得去的6個AAAAA景區,去過3個算合格,你去過幾個!

晨星驛站
2025-05-10 23:00:04
中美貿易摩擦緩和,現貨黃金單日重挫3%!黃金股普跌,金飾最高跌20元/克

中美貿易摩擦緩和,現貨黃金單日重挫3%!黃金股普跌,金飾最高跌20元/克

時代周報
2025-05-12 21:24:17
二胎、三胎催生無果,國家換思路!馬光遠“新方案”得到支持

二胎、三胎催生無果,國家換思路!馬光遠“新方案”得到支持

平說財經
2025-05-07 20:59:04
大米的驚天秘密

大米的驚天秘密

霹靂炮
2025-04-25 22:54:32
外媒:多位拉美領導人和官員到訪北京

外媒:多位拉美領導人和官員到訪北京

參考消息
2025-05-12 20:04:06
河北一大型醫院破產關閉!

河北一大型醫院破產關閉!

掌中邯鄲
2025-05-12 11:03:13
國企投資的云南城投昆明婦女兒童醫院停業關門!已被限高令

國企投資的云南城投昆明婦女兒童醫院停業關門!已被限高令

小人物看盡人間百態
2025-05-12 16:33:04
土耳其專家: 法國陣風戰斗機輸給中國殲10CE,是因為沒有原代碼!

土耳其專家: 法國陣風戰斗機輸給中國殲10CE,是因為沒有原代碼!

現代春秋
2025-05-08 04:58:43
跟老公吵架吵到一半發現他是對的,該咋整?網友神操作笑不活了!

跟老公吵架吵到一半發現他是對的,該咋整?網友神操作笑不活了!

墻頭草
2025-05-12 08:59:49
外國人聽我們說英語原來是這種感受!老外:喲呵,完形填空來了!

外國人聽我們說英語原來是這種感受!老外:喲呵,完形填空來了!

特約前排觀眾
2025-05-07 00:05:08
一種很玄學的跡象:越借,越強

一種很玄學的跡象:越借,越強

詩詞中國
2025-05-12 12:46:47
從小到老都要愛護好你的前額葉,不要像我病了34年才后悔,我媽每次提起都內疚到掉淚……

從小到老都要愛護好你的前額葉,不要像我病了34年才后悔,我媽每次提起都內疚到掉淚……

二胎媽媽圈
2025-05-11 21:57:11
上海最新明確:納入醫保!51項服務可用醫保報銷,在家看病也能報

上海最新明確:納入醫保!51項服務可用醫保報銷,在家看病也能報

上觀新聞
2025-05-12 14:04:54
特朗普擬接受卡塔爾贈送豪華飛機,價值4億美元!民主黨抗議:“眾目睽睽之下的腐敗”

特朗普擬接受卡塔爾贈送豪華飛機,價值4億美元!民主黨抗議:“眾目睽睽之下的腐敗”

魯中晨報
2025-05-12 12:08:11
曼聯的痛!28歲曼聯棄將妙傳,助31歲曼聯舊將驚艷破門,太絲滑了

曼聯的痛!28歲曼聯棄將妙傳,助31歲曼聯舊將驚艷破門,太絲滑了

側身凌空斬
2025-05-12 04:13:12
印巴停了又打,七國集團急了:再打下去,解放軍真正實力將曝光!

印巴停了又打,七國集團急了:再打下去,解放軍真正實力將曝光!

凡知
2025-05-11 22:25:33
“陣風”慘敗于殲10CE,印度宣布大手筆軍購,巴鐵要買40架殲35AE

“陣風”慘敗于殲10CE,印度宣布大手筆軍購,巴鐵要買40架殲35AE

華山穹劍
2025-05-08 20:42:42
2025-05-12 21:52:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
10473文章數 142308關注度
往期回顧 全部

科技要聞

“AGI實現路徑清晰了,世界模型不遠了”

頭條要聞

中美聯合聲明互降關稅 航運從業者大呼"超預期"

頭條要聞

中美聯合聲明互降關稅 航運從業者大呼"超預期"

體育要聞

最熱鬧的國家德比,除了防守什么都有

娛樂要聞

張杰爸媽現身演唱會,親和力滿滿

財經要聞

蔚來去年平均賒賬197天 資金饑渴癥待解

汽車要聞

大眾純電版GTI采用后置后驅 動力更加激進

態度原創

房產
教育
家居
健康
軍事航空

房產要聞

??诙址浚絹碓诫y賣了!

教育要聞

【預告】5月16日 | 第17場課堂教學數字化評價項目省級教研活動

家居要聞

灰色輕奢 大氣不失優雅

唇皰疹和口腔潰瘍是"同伙"嗎?

軍事要聞

澤連斯基:將在土耳其“等候”普京

無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 盈江县| 南皮县| 白河县| 荃湾区| 平邑县| 衡东县| 宿松县| 河间市| 射阳县| 获嘉县| 长岛县| 南通市| 锦州市| 元氏县| 澜沧| 汾阳市| 墨江| 大足县| 东明县| 东海县| 浪卡子县| 襄城县| 青阳县| 盘锦市| 中江县| 赣州市| 南宫市| 福泉市| 福州市| 工布江达县| 格尔木市| 阳春市| 达拉特旗| 江孜县| 峡江县| 那曲县| 丹阳市| 龙州县| 乡宁县| 浦北县| 沿河|