„IntBot“ dėl humanoidų ateities lažinasi dėl socialinio intelekto, o ne dėl kung fu

Estimated read time 4 min read

Registratūros informacijos konsjeržas padėjo GTC 2026 lankytojams su navigacija ir informacija apie įvykius. | Kreditas: Roboto ataskaita

Per kiek daugiau nei metus „IntBot Inc.“ nuo koncepcijos tapo viso kūno žmogeliukais, sveikinančiais tūkstančius svečių NVIDIA GTC ir viešbučių fojė. Sunnyvale, Kalifornijoje įsikūręs startuolis naudojo 24 valandas per parą, 7 dienas per parą, 7 dienas per savaitę ir nuotaikų analizę, kad išmokytų socialinio intelekto variklį, kuris yra ant lentynos parduodamos aparatinės įrangos.

„GTC 2026“ generalinis direktorius Lei Yang paskelbė, kad bendrovės „IntEng“ „bendrojo socialinio intelekto variklis“ dabar palaiko kelis humanoidinius ir paslaugų robotus iš skirtingų techninės įrangos pardavėjų. Jis teigė, kad tai buvo reikšmingas žingsnis link aparatinės įrangos agnostinio socialiai protingų robotų diegimo realioje aplinkoje.

Viso ilgio Intbot roboto vaizdas, kuriame matyti jo pėdos ir stovas.

Šiame „IntBot“ humanoido vaizde visu ūgiu matomos jo pėdos, nors robotas stovėjo vietoje ir buvo pritvirtintas prie GTC26 pagalbos tarnybos. | Kreditas: Roboto ataskaita

„IntBot“ taip pat pristatė pirmąjį NVIDIA Cosmos Reason-2 vizijos kalbos modelio (VLM) diegimą savo programinės įrangos pakete. Tiesiogiai veikiant roboto krašto skaičiavimo sistemoms, šis modelis leidžia robotams realiuoju laiku suprasti sceną, leidžiančią jiems interpretuoti sudėtingą žmonių aplinką, pavyzdžiui, perpildytas konferencijų erdves.

“Pirmosios kartos robotas buvo iš anksto užprogramuotas veiksmas. Tačiau mūsų robotui, jei esate CES ar žiūrėjote vaizdo įrašus, visos emocijos sukuriamos”, – teigė Yang. „Taigi, net jei nekalbate su robotu, robotas reaguotų kokiu nors labai natūraliu, labai subtiliu judesiu, tiesiog linktelėdamas į šoną, parodydamas „Gerai, aš klausau“ arba net tokiu judesiu, kuris parodytų „aš gyvas“. Viską lemia mūsų socialinis intelektas.

Tiesiogiai veikiant roboto krašto skaičiavimo sistemoms, šis modelis leidžia robotams realiuoju laiku suprasti sceną, leidžiančią jiems interpretuoti sudėtingą žmonių aplinką, pavyzdžiui, perpildytas konferencijų erdves.

Anot Yang, „ItBot“ robotai naudoja garso ir vaizdo sintezės formą, sujungdami tai, ką girdi, su tuo, ką mato, kad geriau suprastų, kas scenoje kalba ir kokie gali būti kalbėtojų ketinimai. Tai leidžia robotui užtikrinti natūralesnę sąveiką su žmonėmis.

„IntBot“ išlieka neutralus platformoje

Nors dauguma humanoidinių startuolių siekia vis geresnio judėjimo ir manipuliavimo, „IntBot“ sąmoningai lieka „aparatinės įrangos agnostikas“, savo programinę įrangą pozicionuodamas kaip socialinio intelekto sluoksnį, galintį įveikti bet kokias pramonės platformas.

Šiandien ši sąvoka įgalina Nilo – viso kūno humanoidą, kuris dirba 24 valandas per parą, 7 dienas per savaitę kaip daugiakalbis konsjeržas viešbučių vestibiuliuose nuo Niujorko iki Las Vegaso, derindamas suvokimą įrenginyje ir kūno kalbos generavimą su debesų LLM, kad gautų gilesnes užklausas.

„Šiuo metu jau turime tris viešbučius visoje JAV“, – sakė Yang. „(Mes esame) The Nap York Niujorke, o antrasis vadinamas Otonomous Las Vegase, o trečiasis yra „Marriott“ viešbutis Talsoje, Okloje. Ir visi šie trys robotai iš esmės veikia 24 valandas per parą, 7 dienas per savaitę. Jie dirba kartu su savo personalo nariais, tačiau „IntBot“ siūlo papildomų funkcijų, kad padidintų tai, ką gali padaryti personalas, konsjeržas.

Pirmiausia sutelkdamas dėmesį į triukšmingą, realią aplinką, pvz., CES ir judrius viešbučių vestibiulius, kur suklupo ankstesnės kioskų stiliaus sistemos ir robotai, tokie kaip Pepper, Lei Yang lažinasi, kad natūralios, daugiašalės sąveikos įvaldymas bus raktas į tai, kad humanoidai būtų priimti kasdieniais bendradarbiais, o ne tik parodose.


2026 m. robotikos aukščiausiojo lygio susitikimo SVETAINĖS SKELBIMAS išsaugokite datą.

IntEngine koordinuoja suvokimą, bendravimą realiu laiku

„Nylo“ galimybę savarankiškai veikti GTC parodos aukšte užtikrina „IntEngine“, „IntBot“ patentuota, daugiarūšė, kelių kilpų socialinio intelekto sistema. „IntEngine“ realiu laiku sujungia regėjimą, garsą ir kalbą, kad koordinuotų kalbą, veido išraišką ir gestus, todėl robotai gali suvokti socialinį kontekstą ir natūraliai reaguoti.

Ši architektūra leidžia Nylo ne tik reaguoti, bet ir nuspręsti, kada ir kaip įsitraukti, o tai, Yang teigimu, yra esminė galimybė veikti atviroje, viešoje aplinkoje.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus