應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

Figure AI 人形機(jī)器人多模態(tài)能力升級:“聽懂”語音指令輕松將食物放進(jìn)冰箱

2025-02-21 09:03 IT之家
關(guān)鍵詞:FigureAI人形機(jī)器人

導(dǎo)讀:機(jī)器人初創(chuàng)公司 Figure AI 推出了一種名為 Helix 的新型人工智能系統(tǒng),能夠讓人形機(jī)器人通過語音命令執(zhí)行復(fù)雜的動作。該系統(tǒng)旨在讓機(jī)器人無需針對每個物體進(jìn)行專門訓(xùn)練,就能輕松處理不同物體。

  2 月 21 日消息,機(jī)器人初創(chuàng)公司 Figure AI 推出了一種名為 Helix 的新型人工智能系統(tǒng),能夠讓人形機(jī)器人通過語音命令執(zhí)行復(fù)雜的動作。該系統(tǒng)旨在讓機(jī)器人無需針對每個物體進(jìn)行專門訓(xùn)練,就能輕松處理不同物體。

  Helix 系統(tǒng)結(jié)合了兩個關(guān)鍵的人工智能模塊。第一個模塊是一個擁有70 億參數(shù)的多模態(tài)語言模型,能夠以 7 至 9 赫茲的頻率處理語音和視覺信息,充當(dāng)機(jī)器人的“大腦”。第二個模塊則是一個擁有8000 萬參數(shù)的 AI,負(fù)責(zé)將語言模型發(fā)出的指令轉(zhuǎn)化為精確的機(jī)器人動作,頻率高達(dá) 200 赫茲。

  Helix 能夠同時控制 35 個自由度,涵蓋了從單個手指動作到頭部、軀干等多個部分的精細(xì)控制。Figure 通過一系列展示機(jī)器人如何響應(yīng)語音命令、識別物體并精準(zhǔn)抓取的演示視頻,展示了該系統(tǒng)的強(qiáng)大能力。

  官方公布的演示視頻中,兩臺機(jī)器人在一個展示廚房中合作,將食物放入冰箱,且全程無需為這些物體進(jìn)行任何特定的預(yù)先訓(xùn)練。

  Helix 系統(tǒng)只需500 小時的訓(xùn)練數(shù)據(jù),遠(yuǎn)低于同類項目的要求。它依靠機(jī)器人內(nèi)置的嵌入式 GPU 運(yùn)行,這使得該技術(shù)在商業(yè)應(yīng)用上具備了可行性。

  Figure 的首席執(zhí)行官 Brett Adcock 表示,Helix 的出現(xiàn)對家用機(jī)器人規(guī)模化至關(guān)重要。與傳統(tǒng)機(jī)器人每次執(zhí)行新任務(wù)都需要重新編程不同,Helix 能夠輕松適應(yīng)新的情境 —— 雖然它在實際應(yīng)用中的表現(xiàn)還需要進(jìn)一步驗證。

  據(jù)IT之家此前報道,F(xiàn)igure AI 近期結(jié)束了與 OpenAI 在機(jī)器人專用 AI 模型方面的合作,盡管 OpenAI 仍是其重要投資方。Adcock 在社交平臺 X 上表示,雖然大型語言模型(LLM)越來越強(qiáng)大,但它們正變得商品化,且在 Figure 的戰(zhàn)略中只占“最小的一部分”。

  目前,F(xiàn)igure 專注于開發(fā)自己的 AI 模型,旨在實現(xiàn)高速度的機(jī)器人控制,特別是在實際環(huán)境中的應(yīng)用。同時,OpenAI 重新開始招募硬件工程師,以組建新的機(jī)器人團(tuán)隊,而此前其機(jī)器人部門已被關(guān)閉。