AI 系統(tǒng) Eureka,可令機器人執(zhí)行轉(zhuǎn)筆傳球等復(fù)雜工作
2023-10-23 16:48:49 來源 : IT之家????????警用裝備網(wǎng)訊:?英偉達日前公布了一個名為 Eureka 的 AI 系統(tǒng),該系統(tǒng)以 OpenAI 的 GPT-4 為基礎(chǔ),能夠讓機器人執(zhí)行例如“轉(zhuǎn)筆”、“開抽屜”、“拿剪刀”、“雙手互傳球”等 30 多種復(fù)雜動作。
英偉達推出 AI 系統(tǒng) Eureka,可令機器人執(zhí)行轉(zhuǎn)筆傳球等復(fù)雜工作
IT之家經(jīng)過查詢得知,英偉達研究院主導(dǎo)開發(fā)了 Eureka,該 AI 系統(tǒng)可令開發(fā)者配合英偉達自家物理模擬軟件 Isaac Gym 進行強化學(xué)習(xí)(reference learning)。
英偉達 AI 研究部門資深總監(jiān) Anima Anandkumar 認(rèn)為,過去 10 年以來“強化式學(xué)習(xí)”雖然有所進展,但仍存在不少挑戰(zhàn),例如“獎賞設(shè)計”等環(huán)節(jié),現(xiàn)在還停留在“試錯”階段。而目前英偉達公布的 Eureka,則是為執(zhí)行困難的任務(wù)而設(shè)計,結(jié)合生成式 AI 與強化式學(xué)習(xí)算法,進行首次嘗試。
Eureka 利用 GPT-4 生成出的“獎賞設(shè)計”方案可助力機器人的“試錯(trial-and-error)”學(xué)習(xí),并能夠起到接替 80% 人類專家的任務(wù),從而使機器人平均訓(xùn)練效率提升超過 50%。
據(jù)悉,在 Eureka 生成“獎賞設(shè)計”方案時,開發(fā)者不需要額外輸入任務(wù)提示或撰寫預(yù)定義的獎賞范本,再結(jié)合人工修正獎賞,最終使機器人動作更符合開發(fā)人員的意圖。
該 AI 系統(tǒng)配合 Issac Gym 時,可利用 GPU 加速進行模擬,并針對大量批次的候選回饋快速評估品質(zhì),從而提升訓(xùn)練效率,并根據(jù)訓(xùn)練結(jié)果的作出統(tǒng)計摘要,從而改良“獎賞方案”,在提升機器人反應(yīng)水平的同時,令 AI 系統(tǒng)適用的機器人類型更為廣泛,例如“走獸型”(四足)、“人型(兩足)”、“四軸飛行器”、手臂型等機器人都可以搭載 Eureka 系統(tǒng)。
英偉達推出 AI 系統(tǒng) Eureka,可令機器人執(zhí)行轉(zhuǎn)筆傳球等復(fù)雜工作
▲ 圖源 英偉達
英偉達推出 AI 系統(tǒng) Eureka,可令機器人執(zhí)行轉(zhuǎn)筆傳球等復(fù)雜工作
▲ 圖源 英偉達
英偉達將 Eureka 進行了“開源靈敏性標(biāo)竿測試”,在評估 20 種任務(wù)訓(xùn)練結(jié)果后,得出了令人滿意的結(jié)果。
據(jù)此,英偉達認(rèn)為 Eureka 可實現(xiàn)靈巧的機器人控制,并為動畫作者提供“生成逼真實體動作”的新方法。
新聞稿件歡迎直接聯(lián)系:QQ 34004818 微信公眾號:cpsjyzb
我要評論
0 條評論
- 還沒有人評論過,趕快搶沙發(fā)吧!
熱點榜
最新專題
更多-
-
科技助警,干貨滿載:第八屆警用無人機論壇亮點紛呈!
第八屆警用無人機創(chuàng)新 [ 詳情 ]
- 回顧第七屆世界無人機大會 07-10
- 專題:回顧2022世界無人機大會 01-13