2025年2月27日,百工驛舉辦了一場主題為“Al for Engineering(AI4E)大時代,AEC產(chǎn)業(yè)的大模型工程創(chuàng)新”的線下閉門活動,我們邀請了3位特邀嘉賓、30余位參會嘉賓圍繞當(dāng)下工程行業(yè)的AI創(chuàng)新機會,以及當(dāng)下產(chǎn)業(yè)中的困境問題做了交流。接下來我們會分批對不同嘉賓的觀點整理,輸出文字版本,供大家探討。
本期內(nèi)容來自Genia聯(lián)合創(chuàng)始人&CEO趙志昊。趙志昊出生于建筑世家,是一名連續(xù)創(chuàng)業(yè)者,耶魯大學(xué)工商管理碩士、賓夕法尼亞大學(xué)計算機碩士,常年活躍于北美AEC市場。Genia,建筑業(yè)的Gen AI,成立于洛杉磯,專注于AI結(jié)構(gòu)設(shè)計,近期完成數(shù)百萬美元融資,由歐洲最大的建筑科技方向風(fēng)險投資公司Pi Labs領(lǐng)投,美國硅谷風(fēng)險投資公司Amplify、Boost VC、頭部建商Suffolk Construction等跟投。
以下為趙志昊的內(nèi)容分享,經(jīng)百工驛潤色編輯:
大家下午好,我是趙志昊,今天的分享主要圍繞我在美國看到的建筑行業(yè)方向的創(chuàng)新,特別是跑的比較好的一些AI技術(shù)新應(yīng)用。我會盡量通俗易懂地解釋這些方向的具體內(nèi)容,以及一些潛在的應(yīng)用案例。
首先,大家如果從事建筑行業(yè),應(yīng)該對這張圖比較熟悉。圖中灰色的線代表的是整個行業(yè)的效率提升曲線,這其實是指從1995年到2015年,行業(yè)經(jīng)濟整體效率的變化。而最底部的線則代表建筑行業(yè)的效率提升,平均每年增長約1%。如果按實際GDP來計算,建筑行業(yè)的效率提升與二三十年前的建設(shè)方式差別不大。AI是否能夠幫助AEC行業(yè)降本增效,帶來顯著的機會,將是我們今天探討的重點。
全球制造業(yè)/建筑業(yè)生產(chǎn)率曲線圖(來源:Economist)
01 Agent與AEC創(chuàng)新
接下來是一些簡單的觀察。第一個方向叫做Agent AI。我挑選了兩個比較常見的范式。一個是AI智能體,它通過調(diào)用不同工具的API來協(xié)調(diào)和管理各種資源。這個AI智能體充當(dāng)了一個協(xié)調(diào)者的角色,最終幫助賦能終端用戶。另一個是多個AI智能體之間的聯(lián)動與協(xié)作,某些智能體可能負(fù)責(zé)整體規(guī)劃,其他的則可能負(fù)責(zé)實施階段,比如生成代碼或圖紙,最后,這些輸出可能會交給終端用戶。這種方式展示了不同AI身份的協(xié)作模式。
Agent AI的兩種范式(來源:嘉賓分享)
具體的落地案例有幾個可以分享。其中一家名為Datagrid的公司。
Datagrid這家公司搭建的是一個通用平臺,但它的解決方案在建筑行業(yè)的實際應(yīng)用中非常成功。它通過AI智能體的形式,打通了與下游工程管理平臺和各種數(shù)據(jù)平臺的連接,賦能終端用戶。
其中一個典型案例是Procore平臺,這是北美最大的建筑項目管理軟件之一,成立已有二三十年,且已上市,體量相當(dāng)于國內(nèi)的廣聯(lián)達(dá)。通過與Procore平臺的數(shù)據(jù)云平臺進(jìn)行對接,Datagrid可以從平臺中的文檔和圖紙中提取信息,從而實現(xiàn)數(shù)據(jù)賦能。
通過視頻我們可以看到,Datarid是一家提供智能 AI 平臺的企業(yè),專注于幫助用戶存儲、管理和連接多源數(shù)據(jù),并通過創(chuàng)建自定義 AI 智能體實現(xiàn)高效的數(shù)據(jù)訪問與問題解決。該平臺支持與行業(yè)專用工具(如建筑行業(yè)的 Procore)集成,允許用戶通過短信、移動設(shè)備等方式隨時隨地獲取所需信息。
Datagrid這個方向偏向于通過AI智能體提高數(shù)據(jù)的流動性和效率。
另一家公司叫Skema,它的工作重點更多是AI Agent模版化布局,降低人工重復(fù)性工作。具體而言,新項目的設(shè)計布局往往與歷史項目有許多相似之處。Skema將這些歷史項目中的可復(fù)用部分,通過AI智能體的方式進(jìn)行總結(jié)和模板化,然后用戶可以一鍵生成布局,并根據(jù)實際需求進(jìn)行修改。
例如,在一個歷史項目中,他們會將能夠復(fù)用的部分提煉出來,形成模版。在他們的軟件中,用戶可以通過這個模版快速構(gòu)建新項目的布局,而無需從頭開始設(shè)計。這種方式通過AI智能體來優(yōu)化和加速相似任務(wù)的執(zhí)行,賦能未來的工作任務(wù)。只有通過AI智能體的形式,這一新的技術(shù)才能實現(xiàn)。
第三家公司叫OpenSpace,它代表了另一種方向。OpenSpace不僅僅是軟件,它將虛擬與現(xiàn)實相結(jié)合,主要用于巡檢工作。他們會為工人佩戴一個360度的攝像頭,記錄工人的巡檢路線。在巡檢過程中,AI會自動分析工人看到的視覺影像,檢測其中可能與原始設(shè)計存在差異的地方。同時,系統(tǒng)還會自動生成項目進(jìn)展報告。這個方向通過AI與現(xiàn)實場景的結(jié)合,利用圖像數(shù)據(jù)幫助工人提高巡檢效率,減少人工檢查的時間和成本。
OpenSpace產(chǎn)品介紹(來源:嘉賓分享)
剛才提到的三個項目大多屬于傳統(tǒng)的Agentic AI形式。
02 RAG與AEC創(chuàng)新
接下來要講的是另一種技術(shù),叫做Retrieval-augmented generation (RAG)。簡單來說,RAG技術(shù)是通過結(jié)合知識庫的信息,幫助AI提供與特定領(lǐng)域相關(guān)的知識。RAG本質(zhì)上是基于某一領(lǐng)域進(jìn)行更精準(zhǔn)的搜索。利用RAG技術(shù),可以看到幾個常見的應(yīng)用場景。
RAG技術(shù)邏輯圖(來源:嘉賓分享)
第一個是名為Reviuer的公司,這是一家創(chuàng)業(yè)公司。
舉個例子,如果你查看北美的建筑規(guī)范,像加拿大的每個省都有自己的規(guī)范書,每本可能有上千頁。而在美國,盡管大家都使用一本叫IBC的建筑規(guī)范,但它本身非常厚重,而且每周根據(jù)IBC的要求,還會有一些定制化的修訂。比如加州只需要關(guān)注IBC第1-14章,而其他部分可能需要基于當(dāng)?shù)氐男薷摹栴}是,如何確保在遵循這些復(fù)雜的建筑規(guī)范要求的同時,確保工程師和建筑師在審圖時不會漏掉任何細(xì)節(jié)?
如果這項工作由人工完成,非常容易出錯,而且非常依賴經(jīng)驗。雖然優(yōu)秀的公司和建筑師有一定的把控力,但難免會忽視一些細(xì)節(jié)。Reviuer公司通過AI來解決這個問題。用戶可以將設(shè)計圖紙上傳,無論是建筑平面圖還是其他形式的設(shè)計圖,AI將這些圖紙與對應(yīng)的建筑規(guī)范庫進(jìn)行比對,審核圖紙,識別可能的問題點,并用紅色標(biāo)記出來,隨后通過批注的形式提示最終用戶哪里可能存在問題。這家公司主要專注于建筑領(lǐng)域,但類似的技術(shù)也應(yīng)用于結(jié)構(gòu)、水電、空調(diào)等領(lǐng)域。
Reviuer產(chǎn)品介紹(來源:嘉賓分享)
Trunk tools這家公司的工作方式與前述的那些案例有些相似。它的產(chǎn)品上線一年多,其CEO的個人魅力以及在社交媒體上的宣傳,使得這家公司廣受關(guān)注。
實際上,它比DataGrid更進(jìn)一步,提供了基于短信的溝通平臺,專為總包商提升溝通效率。通過短信,用戶可以快速獲取大量建筑文檔信息,并且能夠顯著提升與現(xiàn)場施工人員或管理人員的溝通效率。在國外,由于沒有微信等即時通訊工具,很多現(xiàn)場溝通還是依賴短信。因此,這家公司專注于通過短信平臺來改善這一溝通方式。他們的技術(shù)也得到了許多投資者的青睞。
03 PINN與AEC創(chuàng)新
最后一位其實也是我們正在研究的一個方向,叫 Physics-Informed Neural Network(PINN)。這個方向代表的是一類問題,不僅限于建筑領(lǐng)域,而是涉及如何在生成式AI表現(xiàn)良好的情況下,通過融入一些物理仿真規(guī)律,解決更精細(xì)的工程設(shè)計問題。
當(dāng)前的大語言模型并不擅長精準(zhǔn)繪制工程圖紙。比如,你給它一張圖,它可以大致判斷出某個區(qū)域內(nèi)可能存在的元素,但如果要求它精確到 XY 坐標(biāo)級別的設(shè)計,基本上是不可能的。基于純語言模型的方法,在目前的技術(shù)水平下難以實現(xiàn)這一點。
而傳統(tǒng)的CPU模型在處理工程圖時,也存在現(xiàn)實挑戰(zhàn)。比如,在工程領(lǐng)域,實際可用的訓(xùn)練數(shù)據(jù)(圖紙)并不多,因此,即便構(gòu)建一個基于Stable Diffusion的強大模型,也可能面臨數(shù)據(jù)匱乏的問題。此外,工程圖紙本身的特性決定了它并不需要過度的創(chuàng)意性,因為大部分空間是留白,而不是充滿設(shè)計元素。因此,我們需要另一套思路,即在物理限定的框架內(nèi),讓 AI 生成符合工程需求的設(shè)計。
關(guān)于這張圖,它很有代表性,因為學(xué)界目前主要有兩條研究思路:第一,純數(shù)據(jù)驅(qū)動方法——如果給 AI 模型提供完全符合物理規(guī)律的訓(xùn)練數(shù)據(jù),它能否自主學(xué)習(xí)并掌握這些規(guī)律?第二,物理仿真驅(qū)動方法——如果 AI 不能自主學(xué)習(xí)物理規(guī)律,是否需要在訓(xùn)練過程中加入物理仿真器,通過強化學(xué)習(xí)(RL)或代理模型的方法,把基于公式計算的物理規(guī)律反饋給 AI?
純數(shù)據(jù)驅(qū)動or物理仿真驅(qū)動思考(來源:嘉賓分享)
目前,這兩條路徑都在探索中,而我個人更傾向于第二種方法。
最近字節(jié)跳動在幾個月前發(fā)表的一篇論文,其中對比了多種視頻生成模型,探討它們在物理世界建模中的泛化能力。他們使用了一個簡單的物理引擎,模擬勻速直線運動,并在5米/秒到20米/秒的范圍內(nèi)生成訓(xùn)練數(shù)據(jù),然后用視頻生成模型進(jìn)行訓(xùn)練。最終實驗表明,即使是這種簡單的物理運動,AI也只能在訓(xùn)練數(shù)據(jù)的范圍內(nèi)泛化,比如能理解2米/秒到 40 米/秒的運動,但一旦超出這個范圍,就無法準(zhǔn)確模擬符合物理規(guī)律的勻速直線運動。
這個實驗說明了一個關(guān)鍵問題:盡管勻速運動在我們看來是簡單的,但對于沒有物理驗證機制的AI模型來說,它的理解能力是有限的。這一點在現(xiàn)有的視頻生成模型中也有所體現(xiàn),例如在模擬碰撞、重力、透視關(guān)系(近大遠(yuǎn)小)等方面,現(xiàn)有模型仍然存在明顯缺陷。如果AI僅依賴啟發(fā)式方法去擬合物理規(guī)律,其表現(xiàn)仍然受到很大限制。而在這一方向上,我們正在深入探索,并已取得一些進(jìn)展。
這個方向有一家比較有代表性的公司叫Stantec。他們通過AI訓(xùn)練了一套洪水預(yù)測模型,與美國37個州的州政府合作,幫助政府預(yù)測洪水風(fēng)險。流體力學(xué)本身有一套成熟的仿真軟件,Stantec會結(jié)合氣象信息、河流水文數(shù)據(jù)以及地理地貌等因素,向政府提供預(yù)警和風(fēng)險信號。這套系統(tǒng)目前來看在落地效果上表現(xiàn)得比較好。
Stantec產(chǎn)品介紹(來源:嘉賓分享)
04 Genia,AI結(jié)構(gòu)設(shè)計
再說回我們自己。我們通過生成式AI的方式,把建筑圖作為輸入,生成對應(yīng)的結(jié)構(gòu)工程圖。
這里涉及的物理因素包括抗風(fēng)、抗雪、抗震等建筑規(guī)范要求,這些規(guī)范都需要經(jīng)過物理驗證。如果是低層建筑,可以直接基于公式進(jìn)行結(jié)構(gòu)分析。但如果是超高層建筑,就需要通過仿真模擬進(jìn)行更復(fù)雜的結(jié)構(gòu)分析。我們正在做的事情,就是如何把這種物理仿真能力和生成式AI結(jié)合起來。
這里展示的demo分為三部分。第一部分是申請項目并上傳建筑圖紙,平臺通過生成式AI生成對應(yīng)的結(jié)構(gòu)方案。第二部分通過郵件將結(jié)果反饋給用戶。最終,我們會給用戶推薦3-5套符合物理規(guī)范、造價可控且表現(xiàn)最優(yōu)的結(jié)構(gòu)方案。整個過程看起來簡單,但背后涉及了縱向的結(jié)構(gòu)分析和多維度的成本權(quán)衡。
目前,我們的主要客戶群體是北美的建筑設(shè)計院和總包商。北美市場有兩個明顯的趨勢:一是大型總包公司內(nèi)部往往會組建自己的工程團隊,通常通過收購獨立的工程公司來完成;二是北美的建筑行業(yè)分工相對獨立,建筑設(shè)計、結(jié)構(gòu)設(shè)計、水電暖通往往由不同公司分別完成,和國內(nèi)建筑院一體化的模式差異很大。我們的產(chǎn)品主要面向結(jié)構(gòu)工程師,為他們提供賦能工具。
剛才建元基金張寧老師也提到,建筑行業(yè)整體數(shù)字化水平還比較原始,很難直接用 AI 取代人工。因此,我們最終做的也是一種Co-pilot模式,幫助工程師提升效率,而不是完全取代他們。
今天的分享就到這里,謝謝大家!
(完)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.