Naujasis 02 pav. Humanoidinis robotas buvo dislokuotas BMW gamykloje Sparksburg, SC | Kreditas: AI paveikslas
„Chatbots“ pastaraisiais metais sparčiai pažengė į priekį, todėl turi didelių kalbų modelius arba LLMS, kurie juos maitina. LLMS naudoja mašinų mokymosi algoritmus, apmokytus didžiuliuose teksto duomenų kiekiuose. Daugelis technologijų lyderių, įskaitant „Tesla“ generalinį direktorių Eloną Muską ir NVIDIA generalinį direktorių Jenseną Huangą, mano, kad panašus požiūris padarys humanoidų robotus, galinčius atlikti operaciją, pakeisite gamyklos darbuotojus arba per keletą trumpų metų tarnaus kaip butleriai. Kiti robotikos ekspertai nesutinka, pasak UC Berkeley robotizuotojo Keno Goldbergo.
Dviejuose naujuose straipsniuose, paskelbtuose internete žurnale Mokslo robotikaGoldbergas aprašė, kaip „100 000 metų duomenų atotrūkis“ užkirs kelią robotams įgyti realaus pasaulio įgūdžių taip greitai, kaip dirbtinio intelekto pokalbių programos įgijo kalbų sklandumą. Antrame straipsnyje vadovaujantys robotikai iš MIT, „Georgia Tech“ ir Eth-Zurichas apibendrino robotikų aršias diskusijas dėl to, ar lauko ateitis yra surinkta daugiau duomenų, kad būtų galima išmokyti humanoidinius robotus, ar pasikliauti „gera senamadiška inžinerija“, kad būtų galima atlikti robotus, kad būtų galima atlikti realaus pasaulio užduotis.
„UC Berkeley News“ Neseniai kalbėjosi su Goldbergu apie „humanoidinį hype“, kylančią paradigmos poslinkį robotikos srityje ir ar AI iš tikrųjų yra gaudoma, kad imtųsi visų darbų.
Goldbergas daugiau papasakos apie realaus pasaulio robotus „Robobusiness 2025“, kuris bus Santa Clara konferencijų centre spalio 15 ir 16 dienomis. Jis ištirs, kaip fizinio AI pažanga, sujungianti modeliavimą, armatūros mokymąsi ir realaus pasaulio duomenis.
Ar humanoidiniai robotai pralenks žmones?
Neseniai tokie technologijų lyderiai, kaip Elonas Muskas, pareiškė pretenzijas apie humanoidinių robotų ateitį, tokius kaip robotai, per ateinančius penkerius metus pralenks žmonių chirurgus. Ar sutinkate su šiais teiginiais?
Goldbergas: Ne; Sutinku, kad robotai greitai tobulėja, bet ne taip greitai. Aš galvoju apie tai kaip apie hipe, nes tai taip toli lenkia robotų galimybes, kurias šios srities tyrėjai yra susipažinę.
Prof. Kenas Goldbergas.
Mes visi esame labai gerai susipažinę su ChatGPT ir visais nuostabiais dalykais, kuriuos jis daro vizijai ir kalbai, tačiau dauguma tyrėjų labai nervina analogijos, kurią turi dauguma žmonių, tai yra tai, kad dabar, kai mes išsprendėme visas šias problemas, esame pasirengę išspręsti (humanoidinius robotus) ir tai įvyks kitais metais.
Aš nesakau, kad taip neatsitiks, bet sakau, kad tai neįvyks per ateinančius dvejus ar penkerius metus ar net 10 metų. Mes tik bandome iš naujo nustatyti lūkesčius, kad jis nesukurtų burbulo, kuris galėtų sukelti didelį atgarsį.
Kokie yra apribojimai, kurie neleis mums atlikti humanoidinių robotų, atliekančių operaciją ar artimiausiu metu tarnauti kaip asmeniniai butleriai? Su kuo jie vis dar kovoja?
Didelis yra miklumas, sugebėjimas manipuliuoti objektais. Tokie dalykai, kaip galimybė pasiimti vyno taurę ar pakeisti lemputę. Joks robotas to negali padaryti.
Tai yra paradoksas – mes tai vadiname Moraveco paradoksu – nes žmonės tai daro be vargo, todėl manome, kad robotai taip pat turėtų sugebėti tai padaryti. PG sistemos gali žaisti tokius sudėtingus žaidimus kaip šachmatai ir eiti geriau nei žmonės, todėl suprantama, kad žmonės galvoja: „Na, kodėl jie negali tiesiog pasiimti taurės?“ Atrodo, daug lengviau nei žaisti.
Bet faktas yra tas, kad norint pasiimti stiklą, reikia labai gerai suvokti, kur stiklas yra erdvėje, perkelti pirštų galiukus į tikslią vietą ir tinkamai uždaryti pirštų galiukus aplink objektą. Pasirodo, tai vis dar labai sunku.
Užpildykite atotrūkį tarp teksto ir fizinių duomenų
https://www.youtube.com/watch?v=8gfuuuzdn4q8
Naujajame dokumente aptariate, ką 100 000 metų vadinate „duomenų spraga“. Koks yra duomenų skirtumas ir kaip jis prisideda prie šio AI kalbų gebėjimų skirtumų ir realaus pasaulio humanoidų gebėjimų?
Goldbergas: Norėdami apskaičiuoti šį duomenų spragą, apžvelgiau, kiek teksto duomenų yra internete, ir apskaičiavau, kiek laiko žmogus užtruks atsisėsti ir perskaityti. Radau, kad tai užtruks apie 100 000 metų. Tai yra teksto kiekis, naudojamas LLM treniruoti.
Niekur neturime tokio kiekio duomenų, kad mokytume robotus, o 100 000 metų yra tik teksto kiekis, kurį turime mokyti kalbos modelius. Manome, kad robotų treniruotės yra daug sudėtingesnės, todėl mums reikės daug daugiau duomenų.
Kai kurie žmonės mano, kad mes galime gauti duomenis iš žmonių vaizdo įrašų, pavyzdžiui, iš „YouTube“, tačiau pažvelgti į nuotraukas, kuriose žmonės daro dalykus, jums nepasako iš tikrųjų išsamių judesių, kuriuos atlieka žmonės, ir pereiti nuo 2D iki 3D paprastai yra labai sunku. Taigi tai to neišsprendžia.
Kitas būdas yra sukurti duomenis, vykdant robotų judesių modeliavimą, ir tai iš tikrųjų gana gerai veikia robotus, veikiančius ir atliekant akrobatiką. Galite generuoti daugybę duomenų, jei robotai imituoja modeliavimą, o kai kuriais atvejais perkeliami į tikrus robotus.
Tačiau dėl miklumo – kai robotas iš tikrųjų daro ką nors naudingo, pavyzdžiui, statybininko, santechniko, elektriko, virtuvės darbuotojo ar gamyklos užduočių, daro daiktus rankomis – tai buvo labai nemandagi, ir modeliavimas, atrodo, neveikia.
Šiuo metu žmonės daro šį dalyką, vadinamą teleoperacija, kai žmonės valdo robotą kaip lėlę, kad jis galėtų atlikti užduotis. Kinijoje ir JAV yra sandėlių, kur žmonėms mokama, tačiau tai labai nuobodus.
Ir kas aštuonias darbo valandas suteikia dar aštuonias valandas duomenų. Tai užtruks ilgai, kol bus iki 100 000 metų.
Rasti teisingą humanoidinės robotikos kelią
https://www.youtube.com/watch?v=hywekersccy
Ar robotikai mano, kad įmanoma patobulinti lauką, prieš tai nesukuriant visų šių duomenų?
Goldbergas: Manau, kad robotika patiria paradigmos poslinkį, būtent tada, kai mokslas daro didelius pokyčius – pavyzdžiui, pereinant nuo fizikos prie kvantinės fizikos, ir pokytis yra toks masyvus, kad laukas suskaidomas į dvi stovyklas, ir jie tai kovoja daugelį metų. Ir mes esame tarp tokių diskusijų robotikoje.
Daugelis robotikų vis dar tiki tuo, ką aš vadinu gera senamadiška inžinerija, kuri yra beveik viskas, ko mes mokome inžinerijos mokykloje: fizika, matematika ir aplinkos modeliai.
Tačiau yra nauja dogma, teigianti, kad robotams nereikia jokių tų senų įrankių ir metodų. Jie sako, kad duomenys yra viskas, ko mums reikia, kad mus būtų visiškai funkcionuojantys humanoidiniai robotai.
Ši nauja banga labai įkvepia. Šioje naujoje stovykloje yra daug pinigų ir daug jaunesnės kartos studentų ir dėstytojų narių yra šioje naujoje stovykloje. Daugelis laikraščių, Elono Musko, Jenseno Huango ir daugelio investuotojų yra visiškai parduodami „New Wave“, tačiau tyrimų srityje vyksta siautėjančios diskusijos tarp senų ir naujų požiūrių į robotų kūrimo metodus.
Ką matote kaip kelią į priekį?
Goldbergas: Aš pasisakiau už tai, kad inžinerija, matematika ir mokslas vis dar yra svarbūs, nes jie leidžia mums atlikti šiuos robotus funkcionuojančius, kad jie galėtų rinkti mums reikalingus duomenis.
Tai būdas paleisti duomenų rinkimo procesą. Pvz., Galite gauti robotą, kad atliktumėte užduotį pakankamai gerai, kad žmonės ją nusipirks, ir tada rinksis duomenis, kaip jie veikia.
„Waymo“, „Google“ savarankiškai važiuojanti automobilių kompanija, tai daro. Tai renka duomenis kiekvieną dieną iš „Real Robotaxis“, o jų automobiliai laikui bėgant gerėja ir gerėja.
Tai taip pat yra „Ambi“ robotikos istorija, kuri daro robotus, kurie rūšiuoja paketus. Dirbdami tikruose sandėliuose, jie renka duomenis ir laikui bėgant tobulėja.
Kokius darbus paveiks AI ir robotika?
https://www.youtube.com/watch?v=2amgvk97ge
Anksčiau buvo labai daug baimės, kad robotų automatizavimas pavogs „Blue-Collar“ gamyklos darbus, ir mes matėme, kad tai nutinka tam tikru mastu. Tačiau kylant pokalbių programoms, dabar diskusija pasikeitė į LLM galimybę perimti darbo vietas ir kūrybines profesijas. Kaip manote, ar AI ir robotai paveiks tai, kokie darbai bus prieinami ateityje?
Goldbergas: Mano, kaip robotikos, „Mėlynųjų apykaklių“ darbai, sandoriai, yra labai saugūs. Nemanau, kad mes matysime robotus, kurie ilgą laiką dirba tuos darbus.
Tačiau yra tam tikrų darbo vietų – tie, kurie reguliariai užpildo formas, tokias kaip suvartojimas ligoninėje, kuris bus labiau automatizuotas.
Vienas labai subtilus pavyzdys yra klientų aptarnavimas. Kai kyla problemų, pavyzdžiui, jūsų skrydis buvo atšauktas, o jūs skambinate oro linijoms ir atsakymams į robotą, jūs tiesiog labiau nusiviliate. Daugelis kompanijų nori pakeisti klientų aptarnavimo darbus robotais, tačiau vienas dalykas, kurio kompiuteris negali jums pasakyti, yra: „Aš žinau, kaip tu jautiesi“.
Kitas pavyzdys yra radiologai. Kai kurie teigia, kad AI gali skaityti rentgeno spindulius geriau nei gydytojai. Bet ar norite, kad robotas informuotų jus, kad sergate vėžiu?
Baimė, kad robotai paleis „Amok“ ir pavogs mūsų darbą, egzistuoja šimtmečius, tačiau esu įsitikinęs, kad žmonės turi daug gerų metų – ir dauguma tyrėjų sutinka.
Šis interviu buvo redaguotas dėl ilgio ir aiškumo.