7月27日,在“大愛無疆·模塑未來”WAIC 2025大模型論壇上,商湯科技重磅發(fā)布「悟能」具身智能平臺(tái)。
「悟能」具身智能平臺(tái)以商湯具身世界模型為核心引擎,依托商湯大裝置提供端側(cè)和云側(cè)算力支持,能夠?yàn)?a href="http://www.gototw.com.cn/tag/e69cbae599a8e4baba/" target="_blank" class="keylink">機(jī)器人、智能設(shè)備提供強(qiáng)大的感知、視覺導(dǎo)航及多模態(tài)交互能力,推動(dòng)智能終端向更高層次的自主化與智能化演進(jìn)。
「悟能」具身智能平臺(tái)可賦能機(jī)器人等各種終端硬件,實(shí)現(xiàn)對世界萬物的感知理解能力,并支持嵌入到端側(cè)芯片,具有強(qiáng)大的場景適配性。
現(xiàn)場,商湯科技董事長兼首席執(zhí)行官徐立展示了搭載具身世界引擎的人形機(jī)器人,生動(dòng)講解“長安的荔枝”PPT的效果,語言自然,風(fēng)趣幽默,不僅可以自動(dòng)翻頁,還能回答各類問題,并進(jìn)行階段性小結(jié)。
商湯具身世界模型還能夠生成多視角視頻,并確保良好的時(shí)間一致性和空間一致性,讓機(jī)器能夠理解、生成、編輯真實(shí)世界,在空間層面實(shí)現(xiàn)世界交互,讓“在真實(shí)的街道場景中玩‘極品飛車’”成為可能。
商湯具身世界模型還能構(gòu)建面向人、物、場的4D真實(shí)世界。用戶僅需要輸入簡單的提示詞,比如“在廚房區(qū)域的架子上找東西”,“進(jìn)入娛樂室、向右轉(zhuǎn),然后打開通往院子的門”等等,具身世界模型就能自主進(jìn)行位姿、動(dòng)作骨架和指令的生成。
徐立表示,“商湯希望「悟能」具身智能平臺(tái)能夠幫助各種具身智能企業(yè),幫助他們完成和現(xiàn)實(shí)世界交互的夢想?!?/p>