DeepMind開發出RoboCat AI模型,能控制多種機器人執行一系列任務

it之家 發佈 2023-11-28T23:10:02.298695+00:00

IT之家 6 月 26 日消息,谷歌旗下 DeepMind 表示,該公司已經開發出一種名為 RoboCat 的人工智慧模型,可以控制不同的機器人手臂執行一系列任務。

IT之家 6 月 26 日消息,谷歌旗下 DeepMind 表示,該公司已經開發出一種名為 RoboCat 的人工智慧模型,可以控制不同的機器人手臂執行一系列任務。僅僅這一點並不特別新穎,但 DeepMind 聲稱,該模型是第一個能夠解決和適應多種任務的模型,並且使用不同的、真實世界的機器人來完成。

RoboCat 的靈感來自於 DeepMind 的另一個 AI 模型 Gato,後者可以分析和處理文本、圖像和事件。RoboCat 的訓練數據包括模擬和真實機器人的圖像和動作數據,這些數據來自於虛擬環境中的其他機器人控制模型、人類控制的機器人以及 RoboCat 自身的前期版本。

DeepMind 的研究科學家李亞歷克斯(Alex Lee)是 RoboCat 團隊的合作者之一,他在接受 TechCrunch 郵件採訪時說:「我們證明了一個單一的大型模型可以在多個真實的機器人實體上解決多樣化的任務,並且可以快速地適應新的任務和實體。」

IT之家注意到,為了訓練 RoboCat,DeepMind 的研究人員首先使用人類控制的機械臂,在模擬或真實環境中收集了每個任務或機器人的 100 到 1000 次演示。例如,讓機械臂拾取齒輪或堆疊積木等。然後,他們對 RoboCat 進行微調,在每個任務上創建一個專門的「衍生」模型,讓它平均練習 10000 次。通過利用衍生模型生成的數據和演示數據,研究人員不斷擴大 RoboCat 的訓練數據集,並訓練出新版本的 RoboCat。

最終版本的 RoboCat 在模擬和真實世界中,在總共 253 個任務上進行了訓練,並在這些任務的 141 個變體上進行了測試。DeepMind 聲稱,在觀察了幾個小時內收集的 1000 次人類控制的演示後,RoboCat 學會了操作不同類型的機械臂。雖然 RoboCat 已經在四種有兩爪臂的機器人上進行了訓練,但該模型能夠適應一種更複雜的有三指夾具和兩倍可控輸入的機械臂。

儘管如此,RoboCat 在 DeepMind 的測試中,在不同任務上的成功率也有很大差異,從最低的 13% 到最高的 99% 不等。這是在訓練數據中有 1000 次演示的情況下;如果演示次數減半,成功率也會相應降低。不過,在某些情況下,DeepMind 聲稱 RoboCat 只需要觀察 100 次演示就能學習新任務。

李亞歷克斯認為,RoboCat 可能會降低解決新任務的難度。「只要給出一定數量的新任務演示,RoboCat 就可以微調到新任務,並且可以自我生成更多數據來進一步提高。」他補充說。

未來,研究團隊的目標是減少教授 RoboCat 完成新任務所需的演示次數,使其少於 10 次。

關鍵字: