每日經濟新聞 2024-12-06 17:40:19
2024年12月6日,“2024數(shù)智科技大會”在成都召開。清華大學計算機科學與技術系教授孫富春發(fā)表關于具身智能賦能產業(yè)發(fā)展的主題演講。孫富春詳細闡述了具身智能與離身智能的區(qū)別,強調了具身智能在物理世界中的交互能力和其在制造業(yè)、醫(yī)療、智能家居等領域的廣泛應用前景。
每經記者 王晶 每經編輯 梁梟
2024年12月6日,“2024數(shù)智科技大會”在成都召開,活動以“奔向數(shù)智新時代”為主題,由成都傳媒集團指導,每日經濟新聞主辦,中央財經大學數(shù)字經濟融合創(chuàng)新發(fā)展中心提供學術支持,數(shù)智未來場景實驗室進行智略支持。
會上,清華大學計算機科學與技術系教授、中國人工智能學會副理事長孫富春圍繞“具身智能賦能產業(yè)發(fā)展”發(fā)表主題演講。他首先回顧了具身智能的起源,提到沃倫·S·麥卡洛克探討認知與身體的關系、艾倫·圖靈通過心智的發(fā)育和具身來發(fā)展智能,以及赫爾德和海因證明了主動行為與感覺反饋的互動對認知發(fā)展至關重要。
孫富春發(fā)表主題演講 圖片來源:每經記者 張建 攝
孫富春還解釋了具身智能與離身智能體的區(qū)別。“離身智能體不具備物理形態(tài),被動接受人類采集制作好的數(shù)據(jù),停留在‘紙上談兵’,而具身智能是給機器一個物理的身體或形式來與物理世界交互(如家用服務機器人、無人車等)。1963年麻省理工學院Richard Held教授用一對貓做學習訓練,一只貓放在籃子里并蒙上眼睛,另一只貓在物理世界自主行動,結果與物理世界進行感知與交互的貓學會了行走,這個例子進一步說明具身的重要性。”
然而,要實現(xiàn)真正的“智能”,具身智能系統(tǒng)需要具備場景感知、認知、多模態(tài)的連續(xù)學習等能力為機器人提供更為豐富和全面的環(huán)境理解能力。孫富春舉例稱:“人要做好一件事通常要將抽象的感知提升為認知,而認知最重要的承載是知識,把蘋果放在桌子上可以分解為三步。首先,找蘋果,這是感知技能加認知技能的結合,我們的大腦指揮頸部帶動眼睛掃描;第二步,抓住蘋果;第三步,放置蘋果。在知識引導下,機器也會如同人一樣迅速完成各類任務,并且可以根據(jù)操作對象的不同形態(tài)、大小、軟硬來完成操作。不僅如此,具身智能還體現(xiàn)在智能體做多任務和跨任務方面。”
當前,具身智能的快速發(fā)展,為眾多行業(yè)帶來了前所未有的變革機遇。在制造業(yè)領域,具身智能機器人能夠精準執(zhí)行復雜的生產任務,提高生產效率和產品質量;在醫(yī)療領域,具身智能也展現(xiàn)出了巨大的應用潛力。例如,在外科手術中,醫(yī)療機器人可以輔助醫(yī)生進行高精度的手術操作,降低了手術風險,提高了手術成功率。此外,具身智能還在智能家居、安防監(jiān)控、智慧交通等領域發(fā)揮著重要作用。
展望具身智能的未來,孫富春提出,具身智能的發(fā)展將主要圍繞四大核心要素展開:本體,具身智能體,數(shù)據(jù)、知識和場景以及學習和進化架構。
具體來看,本體作為實際的執(zhí)行者,是在物理或者虛擬世界進行感知和任務執(zhí)行的機構,具有廣泛適應性的機器人本體是非常必要的。其次,具身智能體是具身于本體之上的智能體,負責感知、理解、決策、控制等核心工作,能夠與環(huán)境進行自主交互是具身智能的核心。目前,具有通用能力的LLM(大語言模型)和VLM(視覺語言模型)等模型可以賦予具身智能體強大的泛化能力。第三,數(shù)據(jù)是泛化的關鍵,但涉及機器人的數(shù)據(jù)稀缺且昂貴。為了適應復雜環(huán)境和任務的泛化性,模型規(guī)模變得越來越大,而大規(guī)模的模型對于數(shù)據(jù)的要求更為嚴格。第四,真實物理環(huán)境的諸多方面目前往往難以模擬,如何對簡單的仿真和復雜的真實世界進行有效的Sim2Real建模,也是智能體設計的關鍵。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP