„Rhoda AI“ atsisako slapto naudojimo su 450 mln. USD, kad mokytų robotus iš vaizdo įrašų

Estimated read time 4 min read

„Rhoda AI“ siūlo tiesioginio vaizdo veiksmo modelį, kuris performuluoja roboto politiką kaip vaizdo įrašų generavimą. | Šaltinis: Rhoda AI

„Rhoda AI“ atsirado slaptu būdu, gavęs 450 mln. USD A serijos finansavimą. Bendrovė taip pat pristatė „FutureVision“ – požiūrį į robotų intelektą, pagrįstą nuspėjamu vaizdo valdymu.

„Manome, kad ateinančiai robotikos erai reikia modelių, kurie suprastų, kaip pasaulis juda – ne tik kaip jis atrodo ar kaip tai apibūdinama kalba“, – sakė Jagdeep Singh, „Rhoda“ įkūrėjas ir generalinis direktorius. „Mokantis iš interneto masto vaizdo įrašų ir veikiant uždaru ciklu, mūsų sistemos sukurtos taip, kad prisitaikytų prie realaus pasaulio kintamumo taip, kaip sunku pasiekti įprastiniais metodais. Tikslas paprastas: robotai, dirbantys realiame pasaulyje, o ne tik kontroliuojami laboratorijos nustatymai.

Tradiciniai pramoniniai robotai gerai veikia struktūrizuotoje aplinkoje, tačiau dažniausiai apsiriboja iš anksto užprogramuotomis trajektorijomis. Naujausi AI metodai, ypač vizijos-kalbos veiksmų (VLA) modeliai, leidžia robotams mokytis iš duomenų. Tai parodė įspūdingus rezultatus laboratorijoje.

Tačiau Rhoda teigė, kad daugeliui vis dar sunku susidoroti su realaus pasaulio kintamumu, įskaitant besikeičiančius išdėstymus, anksčiau nematytus objektus ir nenuspėjamas darbo eigas. Rhoda siekia pašalinti šią spragą.

Derindama internetinio masto vaizdo išankstinį mokymą su uždarojo ciklo vaizdo nuspėjamuoju valdymu, Rhoda teigia, kad tai gali įgalinti robotus, kurie gali prisitaikyti ir savarankiškai veikti realioje aplinkoje. Bendrovė teigė, kad bendradarbiauja su pagrindiniais pramonės partneriais gamybos ir logistikos srityse.

Išsamus išankstinis mokymas ir nuolatinis stebėjimas leidžia greitai mokytis

Užuot pasikliaujęs daugiausia nuotoliniu būdu valdomomis robotų trajektorijomis, Rhoda teigė, kad iš anksto apmoko savo modelius šimtuose milijonų vaizdo įrašų, kad sukurtų tvirtą judėjimo, fizikos ir fizinės sąveikos pranašumą. Tada įmonė vėliau apmoko modelius, naudodama mažesnius robotų duomenų kiekius, kad išmoktų konkrečių įgyvendinimo variantų elgesį ir atvaizdavimą nuo vaizdo prognozių iki roboto veiksmų.

Gauta sistema nuolat stebi savo aplinką, prognozuoja būsimas būsenas kaip vaizdo įrašą, paverčia šias prognozes veiksmais, vykdo juos ir iš naujo stebi pasaulį. Tada jis pakartoja šį procesą kas kelis šimtus milisekundžių uždaru ciklu.

Rhoda šią patentuotą architektūrą vadina tiesioginio vaizdo veiksmo (DVA) modeliu, skirtu suvokimui ir kontrolei sujungti. Skirtingai nuo atvirojo ciklo metodų, kurie generuoja planus be nuolatinio grįžtamojo ryšio, „Rhoda“ teigė, kad jos DVA sistema dinamiškai atnaujina savo elgseną, kai keičiasi sąlygos, todėl realiuoju laiku galima valdyti fiziką.

Rhoda tvirtino, kad stiprus judesys, įgytas per pirminį Rodos autoregresyvų vaizdo treniruotę, leidžia modeliui efektyviai išmokti naujų užduočių, o tai dažnai reikalauja tik dešimties valandų teleoperacijos duomenų.

Sukurta pagal šią architektūrą, „FutureVision“ yra „Rhoda“ žvalgybos sluoksnis – pamatinis modelis, kuris šiandien maitina „Rhoda“ sistemas ir, tikimasi, laikui bėgant bus licencijuotas partneriams įvairiose robotų aparatinės ir programinės įrangos platformose.

Rodas įgyja realaus pasaulio patirties

„Rhoda“ technologija pademonstravo savarankišką veikimą gamybos aplinkoje, kur robotai turi tvarkyti nuolat besikeičiančias medžiagas, išdėstymą ir darbo eigą. Neseniai atlikus didelės apimties gamybos vertinimą, Rhoda teigė, kad komponentų apdorojimo darbo eigą užbaigė per mažiau nei dvi minutes per ciklą be žmogaus įsikišimo ir viršijo klientų KPI.

450 mln. USD vertės A serija rems nuolatines investicijas į mokslinius tyrimus ir inžineriją, pramoninių diegimų ir klientų pilotų plėtrą bei daugiadalykės Rodos komandos, apimančios generatyvųjį AI, kompiuterinę viziją ir robotiką, augimą.

Kompaniją remia geriausi investuotojai į technologijas, įskaitant Capricorn Investment Group, Khosla Ventures, Leitmotif, Matter Venture Partners, Mayfield, Premji Invest, Prelude Ventures, Temasek ir Xora, taip pat Silicio slėnio lyderius, tokius kaip Johnas Doerras.


2026 m. robotikos aukščiausiojo lygio susitikimo SVETAINĖS SKELBIMAS išsaugokite datą.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus