„Ality Robotics“ sukūrė viso kūno valdymo pagrindų modelį savo skaitmeniui humanoidui. Šaltinis: judrumo robotika
Remiantis naujausiame „Agily Robotics“ tinklaraščio įraše, reikšmingiausias humanoidinio roboto pranašumas yra galimybė atlikti įvairiausias užduotis labai suvaržytame aplinkoje. Pastatytas pasaulis buvo suprojektuotas atsižvelgiant į žmones, o mašinos, kurios gali atitikti mūsų bendrąsias galimybes, bus vertingiausios.
Žinoma, tai nereiškia, kad humanoidiniai robotai turi atrodyti lygiai taip pat, kaip mes, kuriuos įmonė anksčiau apėmė.
Ši užduotis yra gana aiški, tačiau atliekant darbą kelia įvairių iššūkių. Robotas turi išlaikyti pusiausvyrą, judėti sklandžiai ir būti tvirtas iki aplinkos sutrikimų, tuo pačiu pasiekdamas, sugriebdamas ir manipuliuodamas aukštu tikslumu. Visų pirma, robotas niekada neturi kristi.
Agilumo robotika suteikia skaitmeniui „variklio žievę“
Šiuo tikslu „Agility Robotics“ sukūrė viso kūno valdymo pagrindų modelį savo skaitmeniniam humanoidiniam robotui, kad užtikrintų, jog jis išlieka saugus ir stabilus atliekant įvairias užduotis. Jis veikia panašiai kaip motorinė žievė žmogaus smegenyse, paimdamas signalus iš skirtingų smegenų dalių – skirtingo judrumo kontrolės hierarchijos lygio skaitmeninio atveju – kontroliuoti savanoriškus judesius ir smulkiosios motorikos įgūdžius.
Šis modelis yra palyginti mažas LSTM (ilgalaikė trumpalaikė atmintis) neuroninis tinklas, turintis mažiau nei 1 milijoną parametrų, kuris yra mokomas NVIDIA ISAAC SIM fizikos treniruoklyje per dešimtmečius imituotą laiką per tris ar keturias dienas.
„Digit“ variklio žievė išmokama tik modeliuojant ir perduoda nulinį šūvį į realų pasaulį. Tai gali būti paskatinta su tankia laisvos erdvės padėtimi ir orientacijos tikslais rankoms ir liemeniui pasiekti skirtingus tikslus, įskaitant vaikščiojimą ir sunkiųjų daiktų pasirinkimą. Tai gali išmokti pasroviui skirtų dekstyvių manipuliavimo įgūdžių viršuje motorinės žievės ir panašiai koordinuoja sudėtingą elgesį naudojant didelius kalbos modelius (LLM).
„Judurity Robotics“ gali paskatinti savo modelį įvairiais metodais, kad atliktų įvairius užduočių rinkinį.
Kovo mėn. Bendrovė įdiegė ankstyvą šio darbo versiją NVIDIA „GTC“ renginyje, norėdama parodyti maisto prekių skaitmenų pirkimą. Šioje demonstracinėje versijoje politika paskatino objektų aptikimą iš atvirojo vokabularinio objekto detektoriaus, pakeltos į 3D, o vykdymas buvo valdomas per valstybės mašinų planavimo kilpą:
Skaitmenis demonstruoja maisto prekių tvarkymą „NVIDIA GTC“. Šaltinis: judrumo robotika
Tai yra reikšmingas žingsnis, kai skaitmenys tampa tvirtesnis su trikdžiais, net vykdant sudėtingus manipuliavimo planus, sakė „Agilumas“. Bendrovė taip pat galėjo paskatinti motorinę žievę naudodama „Dvynių tyrimų“ peržiūrą:
https://www.youtube.com/watch?v=2LG-4MDX210
Valdiklis taip pat tvirtas renkantis labai sunkius objektus:
Šaltinis: judrumo robotika
Kodėl taip sunku?
Norint atlikti naudingą darbą, robotas turi sugebėti tvirtai padėti ir perkelti savo galutinius efektorius pasaulyje, sakė „Ality Robotics“. Fiksuotos bazės robotams tai yra gerai suprantama problema; Paprasti valdikliai, naudojantys modeliais pagrįstus algoritmus, tokius kaip atvirkštinė kinematika (IK) arba atvirkštinė dinamika (ID), buvo plačiai naudojami dideliam efektui dešimtmečiais.
Žvelgiant iš tokios sistemos vartotojo perspektyvos, reikia tik pateikti norimą galutinio efektoriaus pozą, o fiksuotos bazės robotas greitai judės, kad atitiktų tą tikslinę pozą.
„Ality“ teigė, kad nori sukurti tą pačią humanoidinių robotų sąsają: tokią, kurioje robotas yra informuojamas tiesiog dėl norimo jo galinių efektorių judesio, o robotas greitai ir efektyviai nustato save, kad pasiektų tuos tikslus.
Deja, ši galimybė nėra tokia nereikšminga ant kojinių robotų, sakė jis. Klaidingo judėjimo fizika turi du režimus: vieną, kai koja laisvai svyruoja per orą, o kita, kai koja pasodinama ant žemės ir naudoja jėgas likusiam robotui. Šie du fizikos rinkiniai yra atskirti iš idėjos, kaip sukurti ar sulaužyti „kontaktą“, kuris atsitinka, kai robotas padeda koją arba pakelia koją nuo žemės.
Šis sudėtingumas turi didelių skaičiavimo išlaidų, ir beveik visada naudojamos prielaidos, kad būtų lengviau valdyti ir planuoti. Viena iš tokių dažniausiai padarytų prielaidų yra ta, kad roboto kojos liks liečiamos su žeme, o galiniai efektoriai siekia savo taikinių ar manipuliuojančių objektų pasaulyje-iš esmės paverčiama kojų platforma fiksuotos bazės viena.
Tai yra galinga euristika, kuri yra daugelio įspūdingų pažangų, kuriomis neseniai mėgavosi humanoidinių robotikos sritis, pagrindas, tačiau taip pat yra esminis šiuolaikinių robotų atlikimo apribojimas, rašė „Ality Robotics“. Užkirsti kelią robotui dinamiškai pakoreguoti jo pėdų išdėstymą, jis apribos manipuliavimo darbo vietą ir užkirstų kelią protingai ir natūraliai reaguoti į trikdžių jėgas, su kuriomis ji gali susidurti savo darbo metu.
Labiau ideali sąsaja būtų ta, kai robotas tiesiog stebi vartotojo norimų rankų judesius, kai reikia, kai reikia, vengiant susidūrimų su aplinka ir tikrai stengiuosi nenuvertinti. Sunkumas sugeneruoti dinamiškai įmanomus viso kūno judesių planus realiuoju laiku istoriškai padarė tokią sąsają, kuri bent jau iki šiol humanoidiniams robotams buvo neįtikėtina.
Įveskite pastiprinimo mokymąsi
Gilus pastiprinimo mokymasis (RL) greitai iškyla kaip dominuojanti humanoidinių robotų kontrolės paradigma. Užuot aiškiai modeliuodami hibridinės roboto dinamikos judesio lygtis valdiklyje ar supaprastinant prielaidas apie visos sistemos kontaktinę būseną, galima išmokyti neuroninį tinklą fizikos simuliatoriuje, kad būtų galima sekti viso kūno judesį, o paskui dislokuoti tą neuroninį tinklą.
Naujausi humanoidinio viso kūno valdymo rezultatai yra įspūdingi, labai dinamiški ir reikalauja daug mažiau žinių ir pastangų, kad dirbtumėte prie aparatūros, nei naudojant tradicinius modeliais pagrįstus valdymo metodus. Tačiau didžioji šio darbo dalis sutelkta į dinaminius viso kūno judesius, tokius kaip šokiai ir nesugeba pasiekti tikslaus stebėjimo, reikalingo manipuliavimui mobiliesiems.
„Judurity Robotics“ daugiausia dėmesio skiria gebėjimui pritaikyti jėgas aplinkai abiem rankomis, taip pat ir kojomis, kad skaitmenys galėtų pakelti ir manevruoti sunkius dalykus.
Kontrolieriai turi uždengti darbo vietą
Daugelyje esamų darbo mokymo viso kūno valdiklių, skirtų humanoidiniams robotams su RL (pvz., GMT ar „Twist“), naudoja didelius, neprisijungusius žmogaus judesio duomenų fiksavimo duomenų rinkinius, tokius kaip „Amass“ ar „Lafan1“, kad būtų galima treniruoti viso kūno valdymo tinklus. Tai paskatino keletą neįtikėtinai įspūdingų ir gyvenimo būdingų rezultatų, tačiau šie trajektorijos pasiskirstymai dažnai neapima visos norimos manipuliavimo darbo vietos, stebimos judrumo robotikos.
Neišvengiamai rankos pozos taikiniai šiuose neprisijungusiuose duomenų rinkiniuose tankiai apims kai kuriuos gerai atstovaujamus darbo vietos regionus, ir jie palieka darbo vietos ar kitų pagrindinių regionų kraštutinumus. Tačiau judrumas tvirtino, kad svarbu, jog rankų taikinių mokymo paskirstymas vienodai padengtų visą darbo vietą, kad įsitikintų, jog robotas gali atlikti sudėtingas manipuliacijas, kuriomis patikimai naudojama visa jo apimtis.
Siekdama užtikrinti, kad jos variklinė žievė galėtų pasiekti bet kurį mūsų darbo vietos tašką labai tikslumu ir patikimumu, judrumas naudoja atsitiktinę atrankos schemą, kurioje atsitiktinai renkamės pozicijas ir orientacijas vienodai iš darbo vietos ir sugeneruojame atsitiktinį transliacijos ir sukimosi judėjimo greitį tarp tų taškų, kad sukurtume laiko pripažintas trajektorijas abiem rankoms ir torso torso. Jis moko savo variklio žievę pasiekti tuos taškus, naudodamas atlygio terminą, kuriame nagrinėjama transliacinė ir sukimosi paklaida tarp dabartinės rankos pozos ir tikslinės rankos pozos.
„Ality Robotics“ yra mokymo skaitmuo, naudojant viso kūno valdiklio modelį. Šaltinis: judrumo robotika
Padėtis> greitis
Siekdama išmokyti pastiprinimo mokymosi politiką, kuri įvairiais būdais galėtų tiksliai bendrauti su pasauliu, „Agility Robotics“ teigė, kad nori, jog robotas galėtų eiti į konkrečias pasaulio pareigas ir likti ten.
Tačiau didžioji dauguma literatūros apie RL taikymą kojiniams robotai moko neuroninius tinklus, kad sektų tikslinius šaknies greičius („atitiktų šį greitį ir kryptį“), o ne šaknies pozicijas („eik į šį tašką“), kaip ir greičiu, pagrįstu VMP, Amor, Falcon, ExBody2, Humanplus, GMT, R2S2, MHC, MHC VERUS COLONE CLONE CLONE2, OLPO2, OLPO2, OLPO2, OLPO2, GMT, R2S2, MHC VERUS COLONS CLONE CLONE2, OLPO2, OLPO2, OLPO.
Mokymo kontrolieriai, skirti sekti greičius, o ne pozicijas lokomotyvo tikslams, suteikia daug turtingesnį ir labiau atleidžiantį atlygio signalą, todėl dažnai tai yra pragmatiškas pasirinkimas, sakė judrumas. Be to, norint sekti šaknies padėties aparatūros padėtį bandymo metu, reikia (ne trivialiai) tam tikros rūšies odometrijos, tokios kaip plūduriuojančios bazės įvertinimo įgyvendinimas.
Tačiau lokomotyvo valdikliui, kuris yra kondicionuojamas ant tikslinio greičio, o ne tikslinės padėties, reikalauja aukštesnio lygio planuotojo objekto arba žmogaus teleoperatoriaus, kuris pateiktų nuolatines rekomendacijas, kad būtų galima ištaisyti padėties dreifą ar įvertinti padėties paklaidą. Idealiu atveju vartotojas pasakytų valdikliui, kur jis turėtų būti laisvoje erdvėje, ir jis ten naršytų ir natūraliai grįš į tą padėtį, net jei nuspaustų ar kitaip sutrikdytų.
Raginimas užduoties erdvėje yra geriau nei konfigūracijos erdvė
Kita problema yra ta, kad ankstesniame darbe viršutinės kūno dalies taikinio kontrolinės vertės dažnai parametruojamos bendroje erdvėje. Tai reiškia, kad norint iš tikrųjų naudoti viso kūno valdiklį, jums reikia arba judesio fiksavimo kostiumo, ir žemėlapių nuo žmogaus konfigūracijos erdvės iki robotų konfigūracijos vietos, arba planuotoją ar modelį, skirtą viršutinio kūno judesio planų generavimui, sakė „Ality Robotics“.
Ji pažymėjo, kad tai yra rimti apribojimai, nes reikalauja, kad aukštesnio lygio planavimo sluoksnis, žmogaus teleoperatorius ar LLM turėtų turėti roboto kinematinės būsenos modelį. Tai būtų daug patogiau scenarijui, teleoperacijai ir elgesio klonavimui, kuris kaupiasi valdiklio viršuje, jei sąsaja būtų tiesiog laisvos erdvės padėties ir orientacijos.
Tai taip pat turi pranašumą, nes yra daug arčiau reprezentacijos, naudojamos moderniausiems imitacijos mokymosi metodams, ir tai reiškia, kad mes galime numatyti objektų vietas tiesiogiai naudodamiesi tokiais modeliais kaip „Gemini“, kad pateiktume vykdymo politiką.
Judrumo robotikos sluoksniai elgsenai
„Judurity Robotics“ teigė, kad ji aktyviai kuria ir diegia intelektualius humanoidinius robotus, kurie gali atlikti naudingą darbą žmonių aplinkoje. „Digit“ „Motor Cortex“ yra šios dalis, sakė bendrovė. Tai veikia kaip „visada įjungtas“ saugos sluoksnis, leidžiantis reaktyviai ir intuityviai valdyti mūsų robotus.
„Mes galime kurti sudėtingą elgesį su šia žemesnio lygio motorine žieve, įskaitant mokymąsi nedrąsiai mobiliojo manipuliavimo elgesiu“,-pridūrė jis. „Mes manome, kad tai yra pirmasis žingsnis link saugaus ir tvirto judesio fondo modelio, skirto realaus pasaulio humanoidiniams robotams.“
Norėdami sužinoti daugiau apie šią temą, peržiūrėkite šį straipsnį iš dr. Alano Ferno, Oregono valstijos universiteto dinaminės robotikos ir dirbtinio žvalgybos laboratorijos direktoriaus: „Kylanti humanoidinė motorinė žievė: RL apmokytų valdytojų inventorius“.
Redaktoriaus pastabos: Šis įrašas yra sindikuotas iš „Ality Robotics“ tinklaraščio su leidimu.
„Pras Velagapudi“, „Ality Robotics“ vyriausiasis technologijų pareigūnas, kalbės apie „pamokas, išmoktas iš pirmųjų humanoidų dislokacijų“ „Robobusiness“ 2025 m. „Premier“ renginyje komerciniams robotikos kūrėjams ir tiekėjams vyks spalio 15 ir 16 d. Santa Klaroje, Kalifornijoje. Kalifornijoje. Jame bus skirta humanoidų, fizinių AI, įgalinančių technologijų, projektavimo ir plėtros, verslo ir verslo. Registracija dabar atidaryta.