從上古神話里的偃師到好萊塢的終結(jié)者,從小說、電影到科學(xué)設(shè)計(jì),幾千年來,人類一直對機(jī)器人充滿無盡遐想。
然而,現(xiàn)實(shí)中的機(jī)器人卻依然與我們的想象天差地別。
不夠強(qiáng)大,更不夠智能。
現(xiàn)在,隨著人工智能技術(shù)突破,智能機(jī)器的“奇點(diǎn)時(shí)刻”,終于走進(jìn)現(xiàn)實(shí)。
7月7日,5G云端智能機(jī)器人運(yùn)營商達(dá)闥機(jī)器人公司宣布,正式推出全球首個(gè)機(jī)器人制造領(lǐng)域的多模態(tài)認(rèn)知大模型Robot GPT。
機(jī)器人進(jìn)化的一個(gè)全新紀(jì)元,可能由此開啟。
機(jī)器人要做成人的樣子,這并不困難。但要實(shí)現(xiàn)智能,卻是一個(gè)極其艱巨的任務(wù)。
以前,從我們下達(dá)指令,到機(jī)器人完成任務(wù),必須經(jīng)過以下幾個(gè)流程:
1、任務(wù)的定義與描述。比如,我們命令機(jī)器人,去做一盤清炒白菜。
2、把任務(wù)分解為動(dòng)作。從取菜,清洗、切割、烹飪到送餐,機(jī)器人的每個(gè)動(dòng)作都要詳細(xì)拆分。哪個(gè)部件,在什么時(shí)間,有什么條件,以什么功率,以什么方式,行進(jìn)什么動(dòng)作,任何一個(gè)細(xì)節(jié),都必須全部分解到位。
3、編寫程序。根據(jù)分解動(dòng)作進(jìn)行編程,為機(jī)器人編寫代碼。
4、執(zhí)行任務(wù),根據(jù)程序代碼,機(jī)器人完成控制-執(zhí)行-反饋。
這個(gè)過程中,除了最后一步是機(jī)器人完成,其他的幾個(gè)環(huán)節(jié),以前都要由工程師來實(shí)現(xiàn)。
普通人眼中再尋常的一個(gè)簡單行動(dòng),對機(jī)器人來說,都是極其復(fù)雜的工作,只能靠工程師提前規(guī)劃設(shè)計(jì),再用代碼一行行寫出來。
而且,還必須考慮到現(xiàn)實(shí)環(huán)境中的各種可能:這棵白菜大,那棵小,今天的燃?xì)庾悖蛱煨^(qū)停水,前天的菜里有蟲子,炒到一半的時(shí)候,哈士奇跑來撞到了機(jī)器人……
任務(wù)越多,環(huán)境越復(fù)雜,整個(gè)過程越耗時(shí)耗力,容錯(cuò)率也越低。
所以,直到現(xiàn)在,機(jī)器人都只能實(shí)現(xiàn)工程師預(yù)先定義的有限功能,且普遍是兩種情況:
要么,是在簡單環(huán)境中完成固定任務(wù)的專用機(jī)器工具。
要么,是展示性大于實(shí)用性的“人工智障”。
大模型人工智能的技術(shù)突破,讓我們看到了新的可能。
比如,大語言模型LLM(Large Language Model)具備了充分的基礎(chǔ)知識、良好的自然語言理解、基本可用的連續(xù)對話與持續(xù)交互、強(qiáng)大的零樣本/小樣本學(xué)習(xí)能力。
依托這些能力,以前屬于程序員的絕大部分工作,都可以交給機(jī)器人:
我們只需要告訴機(jī)器人任務(wù)是什么,機(jī)器人就會自己拆分任務(wù)動(dòng)作,生成控制指令,甚至根據(jù)實(shí)際環(huán)境變化,對行動(dòng)細(xì)節(jié)進(jìn)行實(shí)時(shí)修正。
除了前期的基礎(chǔ)底層代碼,和后期少量的修改、調(diào)優(yōu)等工作,還需要具有專業(yè)能力的人類工程師介入,其他的過程都可以基本實(shí)現(xiàn)機(jī)器人的自主運(yùn)行。
最終,伴隨大模型人工智能的逐漸完善,即使是一個(gè)不懂任何技術(shù)的普通人,也能很好地管理和使用機(jī)器人。
達(dá)闥創(chuàng)始人兼CEO黃曉慶曾說,機(jī)器人會是人類在PC和手機(jī)之后的第三臺計(jì)算機(jī)。
面向未來,機(jī)器人的本體將逐漸變成一個(gè)基礎(chǔ)設(shè)備,它具備什么樣的智力,能實(shí)現(xiàn)什么樣的功能,都由云端大腦來進(jìn)行賦能。
就像手機(jī)和電腦的應(yīng)用商店一樣,消費(fèi)者可以根據(jù)自己的需求,自由選擇定制,并且不斷升級進(jìn)化。
從這個(gè)意義上來說,大模型就是機(jī)器人從“功能機(jī)”走向“智能機(jī)”的拐點(diǎn),奠定了機(jī)器人大規(guī)模走進(jìn)千家萬戶的可能。
同時(shí),它也將帶來另一個(gè)關(guān)鍵質(zhì)變。
1963年,麻省理工學(xué)院教授理查德·赫爾德做了一個(gè)實(shí)驗(yàn)。
他準(zhǔn)備了兩只貓,一只貓被綁上腳放進(jìn)盒子里,只能觀察環(huán)境,另一只可以自己行走。
結(jié)果,在完全相同的環(huán)境下,自己行走的貓發(fā)育出了正常的視覺能力,被綁著的貓卻發(fā)育失敗。
赫爾德將這種現(xiàn)象稱為“具身”,即生物只有通過自身感知的訓(xùn)練,才能學(xué)習(xí)理解外部的環(huán)境與信息。
后來,麻省理工學(xué)院教授阿瑪文·明斯基進(jìn)一步提出,計(jì)算機(jī)無法理解人類語言,因?yàn)槿祟惥哂芯呱硇裕?jì)算機(jī)卻沒有這種能力。
如今,在大模型人工智能的支持下,具有感知、思考、學(xué)習(xí)、決策等能力,能夠與環(huán)境進(jìn)行交互的“具身智能機(jī)器人”,已經(jīng)成為可能。
事實(shí)上,這一趨勢當(dāng)下已經(jīng)成為熱潮。
不久前,英偉達(dá)創(chuàng)始人黃仁勛就曾在 ITF World 2023 半導(dǎo)體大會上表示,AI 下一個(gè)浪潮將是“具身智能”。
而上周召開的2023世界人工智能大會(WAIC 2023)上,具身智能也成為了最重要的主題之一。
但就當(dāng)下而言,大模型人工智能在機(jī)器人領(lǐng)域的應(yīng)用,還并不成熟。
從2017年,谷歌提出全新的Transformer學(xué)習(xí)框架,到近期OpenAi引發(fā)GPT熱潮,大模型人工智能的發(fā)展,目前還只是一個(gè)方興未艾的新興趨勢。
比如,語言大模型、圖像大模型以及其他多模態(tài)大模型之間,知識如何映射,能力如何鏈接,應(yīng)用如何協(xié)同,就仍然是一個(gè)未解之題。
更重要的是,機(jī)器人大模型的建立與完善,還將面臨更大挑戰(zhàn)。
其原因在于:
GPT等大模型主要進(jìn)行虛擬信息交互,不會對現(xiàn)實(shí)世界產(chǎn)生物理的影響。
而機(jī)器人擁有物理實(shí)體,它的感知、行為和交互,都要在現(xiàn)實(shí)中完成。
所以,機(jī)器人既是人工智能落地物理世界的最佳載體,也是人工智能應(yīng)用實(shí)現(xiàn)最難的領(lǐng)域。
在圖像和自然語言處理等領(lǐng)域,我們可以從網(wǎng)絡(luò)中獲取大量訓(xùn)練數(shù)據(jù),并通過人類的標(biāo)注反饋,快速低成本地完成大模型迭代訓(xùn)練。
對機(jī)器人的訓(xùn)練,樣本更少、成本更高、時(shí)間更長、難度更大。
在需求側(cè),它基于現(xiàn)實(shí)物理環(huán)境,實(shí)現(xiàn)機(jī)器人的感知、行為與反饋訓(xùn)練,需要語言、文字、視覺、運(yùn)動(dòng)等更多模態(tài)的更大規(guī)模數(shù)據(jù)集。
但在供給側(cè),當(dāng)下卻還問題重重:
可用于收集訓(xùn)練數(shù)據(jù)的機(jī)器人規(guī)模少;機(jī)器人的形態(tài)與結(jié)構(gòu)不統(tǒng)一,且還在不斷迭代;訓(xùn)練過程可能破壞環(huán)境、設(shè)施,甚至對人造成傷害;機(jī)器人訓(xùn)練流程用時(shí)更長……
所以,在欠缺優(yōu)質(zhì)數(shù)據(jù)的大背景下,包括GPT在內(nèi),當(dāng)下的幾乎所有人工智能大模型,都還無法實(shí)現(xiàn)對機(jī)器人大模型訓(xùn)練的充分支持。
“計(jì)算機(jī)控制機(jī)器人必須解決這三個(gè)問題:邏輯關(guān)系、特殊關(guān)系和時(shí)間關(guān)系。然而,現(xiàn)有的大型語言模型(LLM)等方法,只能回答其中一個(gè)維度的問題。”香港大學(xué)教授席寧說。
面向這一趨勢,達(dá)闥的Robot GPT應(yīng)運(yùn)而生。
它是一個(gè)面向復(fù)雜場景和多模態(tài)行為,專為機(jī)器人提供的交互生成型 AI模型。
與其他GPT相比, Robot GPT的核心優(yōu)勢在于:
在此之前,作為智能機(jī)器人領(lǐng)域的頭部企業(yè),達(dá)闥已經(jīng)從專利、標(biāo)準(zhǔn)、技術(shù)平臺、操作系統(tǒng)、關(guān)鍵元器件、生態(tài)平臺在內(nèi)的整個(gè)產(chǎn)業(yè)鏈條,完成了全方位的技術(shù)和產(chǎn)業(yè)布局,構(gòu)建出了一個(gè)完整的技術(shù)體系和運(yùn)營平臺。
并搭建了機(jī)器人的云端大腦操作系統(tǒng)“海睿”,以及機(jī)器人的數(shù)字孿生虛擬開發(fā)平臺“海元世界”。
任何開發(fā)者都可以根據(jù)自己的需要,依托達(dá)闥的系統(tǒng)與平臺,在虛擬世界中快速、高效、低成本地開發(fā)、訓(xùn)練和驗(yàn)證機(jī)器人。成熟后只需要將實(shí)體機(jī)器人接入云端大腦,就可以在現(xiàn)實(shí)場景中投入使用。
這個(gè)平臺上,達(dá)闥和機(jī)器人開發(fā)者都可以開放自己的訓(xùn)練模型,其他開發(fā)者根據(jù)自己需求修改、調(diào)優(yōu),即可投入使用。
同時(shí),達(dá)闥自主研發(fā)的集通信、計(jì)算、傳感于一體的智能柔性關(guān)節(jié)(SCA),也突破了智能機(jī)器人硬件標(biāo)準(zhǔn)化與集成化的局限,為未來的消費(fèi)級機(jī)器人商用鋪平了道路。
截至 2022 年底,達(dá)闥已擁有超1600多項(xiàng)專利申請,在云端機(jī)器人領(lǐng)域?qū)@麛?shù)全球第一。
目前,已有超過300個(gè)應(yīng)用合作伙伴,超過100家設(shè)備合作伙伴加入達(dá)闥產(chǎn)業(yè)生態(tài),開放超過3000個(gè)機(jī)器人技能模型,創(chuàng)造超過3500個(gè)數(shù)字孿生地圖。達(dá)闥及其生態(tài)鏈企業(yè)的機(jī)器人,也已經(jīng)在商業(yè)、通信、教育、公共安全、能源、醫(yī)療、農(nóng)業(yè)、政府、金融、環(huán)衛(wèi)等大量行業(yè)廣泛應(yīng)用。
這意味著:
1、對于機(jī)器人大模型訓(xùn)練,達(dá)闥擁有充分的技術(shù)與理解。
2、達(dá)闥和生態(tài)企業(yè)擁有海量的優(yōu)質(zhì)機(jī)器人訓(xùn)練數(shù)據(jù),并在孿生世界中實(shí)現(xiàn)更低成本、更快速度的高效訓(xùn)練。
3、達(dá)闥和生態(tài)企業(yè)能夠?qū)C(jī)器人大模型的訓(xùn)練成果,更快更便捷地進(jìn)行商用轉(zhuǎn)化,并形成相互促進(jìn)的正向循環(huán)。
【5】
面向未來,機(jī)器人與大模型人工智能的融合發(fā)展,已經(jīng)是大勢所趨,所有機(jī)器人公司都已經(jīng)向其發(fā)起沖刺。
為什么達(dá)闥能在行業(yè)內(nèi),率先成功搭建機(jī)器人大模型?
原因在于,很多廠商都是最近幾年甚至是今年GPT成功后,才開始進(jìn)行大模型的摸索。
而達(dá)闥早在很多年前,就已經(jīng)朝著這個(gè)方向持續(xù)做好了準(zhǔn)備。
過去60年來,從開發(fā)第一代機(jī)器人開始,人類一直在努力讓機(jī)器人聰明起來,但由于智能化、網(wǎng)絡(luò)化程度不高,機(jī)器人的能力始終未能走到質(zhì)變的臨界點(diǎn)。
21世紀(jì)之后,在算法、算力、數(shù)據(jù)“三駕馬車”的同步帶動(dòng)下,人工智能技術(shù)有了突破性飛躍,但問題也隨之而來。
高性能的人工智能,尤其是大模型人工智能,都對算力和數(shù)據(jù)量有嚴(yán)苛要求,比如谷歌2021年發(fā)布的超級語言模型Switch Transformer參數(shù)規(guī)模達(dá)到1.6萬億,阿里達(dá)摩院的多模態(tài)大模型M6參數(shù)更直接突破了10萬億。
所以,早在2016年成立之初,達(dá)闥就在全球率先提出了云端機(jī)器人概念:將機(jī)器人的“大腦”和“身體”分離,負(fù)責(zé)智能計(jì)算的“大腦”放在云端,負(fù)責(zé)感知、行動(dòng)和反饋的本體放在本地,通過高速安全的5G網(wǎng)絡(luò)連接,共同完成任務(wù)。
正是基于這樣的一個(gè)“云-網(wǎng)-端”架構(gòu),機(jī)器人可以突破障礙,真正變成人類的“第三臺計(jì)算機(jī)”,通過持續(xù)的訓(xùn)練和升級,實(shí)現(xiàn)智力和能力的無限擴(kuò)展。
從云端大腦“海睿”,數(shù)字孿生開發(fā)平臺“海元世界”,到如今的Robot GPT,達(dá)闥的每一步,都是在循序漸進(jìn),不斷完善。
尤其是RobotGPT,將達(dá)闥多年的技術(shù)積累,與最新的人工智能大模型技術(shù)有機(jī)融合,從而為云端機(jī)器人在更廣應(yīng)用場景中,發(fā)揮更大作用奠定了優(yōu)勢。
“在RobotGPT的支持下,云端機(jī)器人將成為通用人工智能的最佳載體。通過數(shù)據(jù)訓(xùn)練可實(shí)現(xiàn)更接近擬人化的機(jī)器人產(chǎn)品,從而有望顛覆和促進(jìn)行業(yè)發(fā)展。”黃曉慶說。
【6】
過去這些年,云端機(jī)器人的發(fā)展,大體經(jīng)過了三個(gè)階段:
一開始,是從達(dá)闥率先提出新的理念,并在技術(shù)、系統(tǒng)、元器件、運(yùn)營模式等各個(gè)方面,搭建基礎(chǔ)平臺,最終建起一個(gè)完善的云端機(jī)器人產(chǎn)業(yè)閉環(huán)。
后來,越來越多生態(tài)企業(yè)加入,與達(dá)闥一起構(gòu)成了一個(gè)繁榮的云端機(jī)器人行業(yè)生態(tài)。
而現(xiàn)在,伴隨著大模型人工智能的出現(xiàn),證明了機(jī)器人需要云端大腦,云端機(jī)器人已經(jīng)成為整個(gè)行業(yè)的大勢所趨。
2022世界機(jī)器人大會發(fā)布的《機(jī)器人十大前沿?zé)狳c(diǎn)領(lǐng)域(2022-2023)》中,達(dá)闥海睿操作系統(tǒng)、達(dá)闥“云端大腦+本地機(jī)器人”核心技術(shù),就已經(jīng)入選“2022—2023年機(jī)器人十大前沿技術(shù)”。
2022年9月,國家科技部正式批復(fù),支持達(dá)闥建設(shè)“云端機(jī)器人國家新一代人工智能開放創(chuàng)新平臺”。
這標(biāo)志著,達(dá)闥成為國內(nèi)第一家圍繞人工智能和云端機(jī)器人建設(shè)新一代人工智能開放創(chuàng)新平臺的“國家隊(duì)”企業(yè),也是目前唯一獲科技部批準(zhǔn)的新一代云端機(jī)器人 AI 開放創(chuàng)新平臺。
【7】
業(yè)界普遍認(rèn)為,未來十年,必將成為智能機(jī)器人的“黃金十年”。
尤其是在人口加速老齡化,企業(yè)“降本增效”趨勢下,智能機(jī)器人將有效地幫助我們完成大量勞動(dòng)密集型的工作。
今年1月,工信部等十七部門印發(fā)《“機(jī)器人+”應(yīng)用行動(dòng)實(shí)施方案》,提出到2025年,制造業(yè)機(jī)器人密度要較2020年實(shí)現(xiàn)翻番,服務(wù)機(jī)器人、特種機(jī)器人行業(yè)應(yīng)用深度和廣度顯著提升,機(jī)器人促進(jìn)經(jīng)濟(jì)社會高質(zhì)量發(fā)展的能力明顯增強(qiáng)。
而面向國際,機(jī)器人這個(gè)現(xiàn)代人類技術(shù)“皇冠上的明珠”,也是大國博弈的又一戰(zhàn)場。
尤其是雙足人形機(jī)器人,更是被所有人寄予厚望。
作為最接近人類的終極形態(tài),雙足人形機(jī)器人可以深入到現(xiàn)實(shí)生活中的絕大多數(shù)場景,代替人類完成各種工作。
黃曉慶甚至認(rèn)為,在未來幾年,智能機(jī)器人就將在4個(gè)D和4個(gè)C領(lǐng)域,為我們的生活帶來巨大改變:
Dull,重復(fù)性很高,無聊的工作。
Dangerous,巡夜、爬高等危險(xiǎn)工作。
Dirty,讓人感覺臟的工作,比如掃地、清潔等等。
Demeaning,比較沒有尊嚴(yán)的工作。
Conversation,與人交流。
Clean,做清潔。
Care,照顧老人,照顧小孩。
Cooking,做飯。
得益于達(dá)闥的搶先布局,在云端機(jī)器人這一領(lǐng)域,中國已經(jīng)成為行業(yè)標(biāo)準(zhǔn)的制定者與產(chǎn)業(yè)的先行者。
面向未來,達(dá)闥將有效整合關(guān)鍵企業(yè)資源、協(xié)同產(chǎn)業(yè)鏈上下游,構(gòu)建政府、產(chǎn)業(yè)界、科技界協(xié)同合作的智能機(jī)器人創(chuàng)新體系,搶占中國在智能機(jī)器人產(chǎn)業(yè)的制高點(diǎn),形成中國科技創(chuàng)新高質(zhì)量發(fā)展生態(tài),不斷提升中國在人工智能和高端制造領(lǐng)域的國際話語權(quán)。
據(jù)透露,達(dá)闥已經(jīng)布局“星鏈計(jì)劃”,首選50個(gè)不同行業(yè)的行業(yè)領(lǐng)袖級上市公司展開全面戰(zhàn)略合作;針對特定行業(yè)的 AI 及云端機(jī)器人的應(yīng)用研究和開發(fā),成立聯(lián)合研究院或?qū)嶒?yàn)室;對研發(fā)成果進(jìn)行聯(lián)合投產(chǎn)、充分市場化等,讓中國高端智造走向世界。
據(jù)悉,達(dá)闥由知識城集團(tuán)和上海國資聯(lián)合領(lǐng)投的C輪融資也已經(jīng)在進(jìn)展中,已完成交割的融資規(guī)模超過10億元人民幣。
據(jù)黃曉慶透露,新一輪資將主要用于新產(chǎn)品、技術(shù)研發(fā)以及產(chǎn)能擴(kuò)充、升級,在持續(xù)擴(kuò)大市場占有率的同時(shí),為各種服務(wù)場景開發(fā)不同的云端機(jī)器人,持續(xù)投入新產(chǎn)品研發(fā)并保持在市場上技術(shù)領(lǐng)先地位。
“在Robot GPT的支持下,以云端機(jī)器人為代表的智能服務(wù)機(jī)器人將超越手機(jī)和汽車,成為數(shù)字時(shí)代的最大產(chǎn)業(yè)。”黃曉慶說。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.