英偉達(dá)首席執(zhí)行官黃仁勛在近期舉辦的科技盛會(huì)上宣布,機(jī)器人技術(shù)發(fā)展已邁入關(guān)鍵轉(zhuǎn)折點(diǎn),這一領(lǐng)域正迎來(lái)堪比“ChatGPT時(shí)刻”的重大突破。他指出,人工智能技術(shù)正從純粹的數(shù)字交互向具備物理感知能力的現(xiàn)實(shí)應(yīng)用加速演進(jìn),為機(jī)器人產(chǎn)業(yè)注入全新動(dòng)能。

為支撐這一技術(shù)躍遷,英偉達(dá)同步開(kāi)源了多款“物理AI”核心模型。其中Cosmos Transfer2.5與Cosmos Predict2.5作為可定制化的“世界模型”,通過(guò)構(gòu)建三維空間認(rèn)知框架,使機(jī)器人能夠解析物體的物理屬性、運(yùn)動(dòng)規(guī)律及空間關(guān)系。這些模型生成的合成數(shù)據(jù)可模擬真實(shí)場(chǎng)景中的復(fù)雜交互,為機(jī)器人提供零風(fēng)險(xiǎn)的虛擬訓(xùn)練環(huán)境,有效解決實(shí)體部署前的安全評(píng)估難題。

在決策控制層面,新發(fā)布的Cosmos Reason2視覺(jué)語(yǔ)言模型突破傳統(tǒng)AI的局限,通過(guò)整合多模態(tài)感知數(shù)據(jù),賦予機(jī)器人基于常識(shí)的邏輯推理能力。該模型可解析視覺(jué)信息中的隱含邏輯,例如通過(guò)觀察人類(lèi)動(dòng)作推斷操作意圖,或根據(jù)環(huán)境變化自主調(diào)整行為策略。這一技術(shù)突破使人形機(jī)器人領(lǐng)域取得實(shí)質(zhì)性進(jìn)展——基于Isaac GR00T N1.6模型的全新控制系統(tǒng),實(shí)現(xiàn)了對(duì)機(jī)器人全身200余個(gè)關(guān)節(jié)的毫秒級(jí)協(xié)同控制,顯著提升動(dòng)作流暢度與任務(wù)適應(yīng)性。

硬件支撐方面,搭載Blackwell架構(gòu)的Jetson T4000模組成為技術(shù)落地的關(guān)鍵載體。該模組通過(guò)優(yōu)化神經(jīng)網(wǎng)絡(luò)計(jì)算單元與內(nèi)存帶寬,將算力提升至前代產(chǎn)品的四倍,可同時(shí)處理16路高清視頻流與復(fù)雜物理引擎運(yùn)算。其低功耗設(shè)計(jì)(僅15瓦)更突破了移動(dòng)機(jī)器人的續(xù)航瓶頸,使具備自主導(dǎo)航能力的工業(yè)機(jī)器人可連續(xù)工作8小時(shí)以上。

為降低技術(shù)門(mén)檻,英偉達(dá)與開(kāi)源社區(qū)Hugging Face建立深度合作,推出從模型訓(xùn)練到實(shí)體部署的全流程工具鏈。開(kāi)發(fā)者通過(guò)單一接口即可調(diào)用物理仿真引擎、數(shù)據(jù)標(biāo)注平臺(tái)及硬件加速庫(kù),將機(jī)器人開(kāi)發(fā)周期從數(shù)月縮短至數(shù)周。目前已有超過(guò)300家企業(yè)接入該生態(tài)系統(tǒng),涵蓋物流、醫(yī)療、制造等多個(gè)領(lǐng)域。