„Microsoft Research“ atskleidžia Rho-alpha regėjimo, kalbos ir veiksmų modelį robotams

Estimated read time 4 min read

Rho-alpha sukurta siekiant padėti robotams, įskaitant humanoidus, tapti savarankiškesniems. Šaltinis: Microsoft

Kad robotai būtų naudingi dinamiškesnėje ir mažiau struktūrizuotoje aplinkoje, jiems reikia dirbtinio intelekto, išmokyto naudoti įvairius jutimo įvestis. „Microsoft Corp.“ šiandien paskelbė „Rho-alpha“ arba „ρα“ – pirmąjį robotikos modelį, sukurtą iš „Phi“ serijos regėjimo kalbos modelių.

„Microsoft“ pažymėjo, kad vizijos-kalbos-veiksmo modeliai (VLA) leidžia fizinėms AI sistemoms suvokti, mąstyti ir veikti vis labiau autonomiškai. Nauji modeliai, sukurti ant Phi, skirti padaryti robotus labiau pritaikomus ir patikimesnius, nurodė bendrovė.

„Rho-alpha verčia natūralios kalbos komandas į valdymo signalus robotinėms sistemoms, atliekančioms dvirankio manipuliavimo užduotis“, – rašė Ashley Llorens, įmonės viceprezidentas ir „Microsoft Research Accelerator“ vykdomasis direktorius. „Jį galima apibūdinti kaip VLA+ modelį, nes jis išplečia suvokimo ir mokymosi būdus, nei paprastai naudoja VLA.

Suvokimui Rho-alpha prideda lytėjimo jutimą, o „Microsoft“ teigė, kad stengiasi įtraukti tokius būdus kaip jėga. Mokydamasi bendrovė teigė, kad „Rho-alpha“ gali nuolat tobulėti pagal žmonių atsiliepimus.

Toliau pateiktame vaizdo įraše parodyta, kaip „Rho-alpha“ sąveikauja su „BusyBox“ – fizinės sąveikos etalonu, kurį „Microsoft Research“ neseniai pristatė pagal natūralios kalbos instrukcijas.

„Rho-alpha“ naudoja modeliavimą, demonstravimą ir internetą

Rho-alpha kartu treniruoja lytėjimo suvokimą fizinių demonstracijų ir imituojamų užduočių trajektorijose, taip pat žiniatinklio masto vaizdinius atsakymų į klausimus duomenis, sakė LLorens tinklaraščio įraše. „Planuojame naudoti tą patį planą, kad ir toliau plėstume modelį, kad būtų įtraukti papildomi jutimo būdai atliekant įvairias realaus pasaulio užduotis“, – pridūrė jis.

„Microsoft“ pripažino, kad trūksta keičiamo dydžio robotikos mokymo duomenų, ypač lytėjimo ir kitų mažiau paplitusių jutimo būdų. Naudodami atvirą „NVIDIA Isaac Sim“ sistemą, mokslininkai gali generuoti sintetinius duomenis daugiapakopiame procese, paremtame mokymu.

„Nors treniruočių duomenų generavimas naudojant nuotolinio valdymo robotų sistemas tapo įprasta praktika, yra daug nustatymų, kuriuose teleoperacija yra nepraktiška arba neįmanoma“, – sakė Vašingtono universiteto docentas Abhishek Gupta. “Mes dirbame su Microsoft Research, kad praturtintume iš fizinių robotų surinktus duomenų rinkinius įvairiomis sintetinėmis demonstracijomis, naudojant modeliavimo ir sustiprinimo mokymosi derinį.”

„Norint apmokyti pagrindinius modelius, kurie gali mąstyti ir veikti, reikia įveikti įvairių realaus pasaulio duomenų trūkumą“, – pastebėjo NVIDIA robotikos ir pažangaus AI viceprezidentas Deepu Talla. „Naudodama NVIDIA Isaac Sim „Azure“, kad generuotų fiziškai tikslius sintetinius duomenų rinkinius, „Microsoft Research“ paspartina universalių modelių, tokių kaip „Rho-alpha“, kurie gali atlikti sudėtingas manipuliavimo užduotis, kūrimą.

Žmonės teikia kurso korekciją Microsoft modeliams

Net ir turėdami išplėstą suvokimą, robotai vis tiek gali padaryti klaidų veikimo metu, sakė Microsoft. Jame paaiškinta, kad korekcinis grįžtamasis ryšys iš teleoperacijos įrenginių, tokių kaip 3D pelė, gali padėti Rho-alpha tęsti mokymąsi.

Žemiau esančiame vaizdo įraše „Microsoft“ rodo dvi UR5e koboto rankenas su lytėjimo jutikliais, naudojant Rho-alpha kištuką įkišti. Dešiniajai rankai sunku atlikti užduotį ir jai padeda žmogaus nurodymai realiu laiku.

„Mūsų komanda stengiasi optimizuoti „Rho-alpha“ mokymo vamzdyną ir mokymo duomenų korpusą, kad būtų užtikrintas našumas ir efektyvumas atliekant „Microsoft“ ir mūsų partnerius dominančias dvirankio manipuliavimo užduotis“, – sakė Llorensas. “Šiuo metu modelis vertinamas dėl dviejų rankų sąrankų ir humanoidinių robotų. Techninį aprašą paskelbsime artimiausiais mėnesiais.”

„Microsoft“ teigė, kad ketina bendradarbiauti su robotikos gamintojais, integratoriais ir galutiniais vartotojais, kad sužinotų, kaip tokios technologijos kaip „Rho-alpha“ ir susiję įrankiai gali padėti jiems mokyti, diegti ir nuolat pritaikyti debesyje priglobtą fizinį dirbtinį intelektą su savo duomenimis. Bendrovė pakvietė suinteresuotas šalis prisijungti prie savo tyrimų ankstyvosios prieigos programos.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus