„Difusedrive“ sukuria tokius fotorealistinius vaizdus iš realaus pasaulio duomenų rinkinių. Šaltinis: difuzinis
Robotams ir dirbtiniam intelektui reikia daugybės duomenų, kad būtų galima treniruotis, o jei šie duomenys yra sintetiniai, jie turi būti kuo tikroviškesni. Fiksuoti realaus pasaulio duomenis gali būti brangūs ir daug laiko reikalaujantys, o modeliavimu pagrįsti duomenys paprastai gaunami iš žaidimų variklių ir sukėlė spragas nuo SIM-TER-Real. „Difusedrive Inc.“ teigė, kad jos generacinė AI platforma įvertina esamus duomenis, nustato, ko trūksta, ir naudoja patentuotus difuzijos modelius, kad sukurtų fotorealistinius duomenis.
Fizikas Balintas Pasztoras, inžinierius, ir Fizikas Rolandas Pinteris, po susitikimo Bosche 2023 m. Įkūrė Difutsrive. Tada jie perkėlė įmonę iš Vengrijos į San Franciską.
„Anksčiau dirbome 4 lygio autonominiu vairavimu„ Porsche “, – pasakojo Pasztoras Roboto ataskaita. „Duomenų trūkumas yra trūkstamas detalė, norint išspręsti fizinio AI galvosūkį, apimantį gamybą, stebėjimą, žemės ūkį ir kosmosą.“
„Difusedrive“ įkūrėjai: CTO Roland Pinter (kairėje) ir generalinis direktorius Balintas Pasztoras (dešinėje).
PG reikia duomenų, būdingų domenui
„Pramonė nuo 2010 -ųjų pradžios naudoja tuos pačius modelius, o automobilių gamintojai ir robotikos kūrėjai neturi pakankamai realių duomenų, apimančių jų veiklos projektavimo sritis“, – sakė Pasztoras, kuris dabar yra „Difmedrive“ generalinis direktorius.
„Sintetiniai modeliavimo duomenys nebuvo pakankamai realūs saugumui ar kritinėms misijoms“,-pridūrė jis. „Mums reikėjo AI generuojamų duomenų, kurie nesiskyrė nuo realaus gyvenimo“.
Net šių metų IEEE/CVF konferencijoje dėl kompiuterinės vizijos ir modelio atpažinimo (CVPR) erdvėje esantys žmonės įvertino tik 50%, – prisiminė jis. „Jie tik spėjo“, – sakė Pasztoras.
Komercinės robotikos programos reikalauja daug svarbių duomenų. Savarankiškai važiuojančios transporto priemonės ir prekių atpažinimas dėl elektroninės komercijos rinkimo yra žinomi ir augantys duomenų rinkiniai, tačiau automatizavimas gali lanksčiai aptarnauti daug daugiau programų-jei ji yra tinkamai apmokyta.
„Difusedrive“ identifikuoja, supranta spragas užpildyti
„Difuzedrive“ gali įveikti modeliavimo ir tikroviškumo atotrūkį, sukurdamas pasiūlymus, pagrįstus verslo logika, paaiškinta Pasztor. Jis tvirtino, kad tai leidžia sukurti svarbius duomenų rinkinius dienomis, o ne mėnesiais ar metais.
„Varikliai, tokie kaip GPT ar DALI, gali generuoti modelius, tačiau jums reikia kokybės užtikrinimo (QA) sluoksnio, pavyzdžiui,„ Diffedrive ““, – sakė jis. „QA sluoksnis yra sukurtas pagal programos ar naudojimo atvejį iš aviacijos ir kt., O samprotavimo modelis supranta, kas jau buvo pateikta“.
„Difuzedrive“ naudoja tiek klasikinius, tiek naujus statistinės analizės metodus, kad kontekstiniu būdu suprastų esamus duomenis ir sukuria duomenų taškus, panašius į taškų debesį, sakė Pasztoras.
„Mes naudojame atskirą sistemą, kad suprastume tai, ką jau turi klientai, iš esmės sukūrę sprendimų medį“, – sakė jis. „Pavyzdžiui, 2 lygio autonominiam vairavimui mes sukūrėme šilumos stovėjimo scenarijų žemėlapį ir objekto vietos paskirstymą. Difuzedrive tada nustatėme, kad tam tikru metu trūksta didelių ir artimų daiktų. Patekę į platesnį duomenų paskirstymą, mes pagerinome našumą 40%.“
https://www.youtube.com/watch?v=ab5q_t2yjne
Klientai kontroliuoja nelyginius duomenis
Tuo pat metu „Difusedrive“ nesukuria srities patirties. Vietoj to, įmonė suvirškina savo klientų dokumentus ir realaus pasaulio operatyvinio projektavimo domeno (ODD) duomenis.
„Jie yra domenų ekspertai ir kontroliuoja savo reikalavimų generavimą“, – sakė A. Pasztoras. „Jie nenori, kad kas nors perimtų savo darbą, bet nori, kad mes juos padidintume“.
Kai jis turi pagrindinius duomenis, „Difusedrive“ naudoja semantinį segmentavimą, kontekstinį ir vaizdinį ženklinimą, taip pat 2D ir 3D ribojančias dėžutes. „Kiekvieną kartą sukuriant vaizdus, duomenų taško žemėlapis užpildo ne tik spragas, bet ir išplėstas keistas žinias“,-teigė Pasztoras.
Klientai kontroliuoja savo domeno duomenis, kurie vėliau greitai analizuojami dėl spragų. Šaltinis: difuzinis.
„Difusedrive“ mato rinkos galimybes
Remiantis „Grand View Research“, pasaulinė AI robotikos rinka gali patirti 38,5%, padidindama 38,5%, padidėja nuo 12,77 milijardo JAV dolerių 2023 m. Iki 124,77 milijardo dolerių iki 2030 m.
„Mūsų vizija yra galų gale turėti kiekvieną autonominę sistemą naudoti difuzinius duomenis – tai gali būti įmonė ar asmens projektas“, – sakė A. Pasztor. „Mes nusprendėme remtis savo patirtimi su automobiliais ir dronais, nes autonominėms transporto priemonėms vis dar reikia daug duomenų, o dauguma kompanijų neturi„ Tesla “masto“.
„DifusedRive“ įeina į savo trečiąją klientų bangą, sekdama dronų pilotus ir paskui autonominį vairavimo ir saugumo stebėjimą. Jie apima „Aisin“, „Continental“ ir „Denso“. Bendrovė teigė, kad ji taip pat mato gynybos, sandėliavimo, statybos ir žemės ūkio potencialą.
„CVPR kalbėjomės su 50 potencialių klientų iš„ Fortune 500 “, iš kurių keli gamina ne tik autonomines sistemas, bet ir nejudančias, tokias kaip pramoniniai robotai“, – teigė Pasztoras. „Sveikatos priežiūros žmonės taip pat buvo suinteresuoti uždaryti duomenų kilpą“.
Gegužės mėn. „Difuzedrive“ surinko 3,5 mln. USD sėklų finansavimą, padidindamas 1 mln. USD, kuriuos anksčiau gavo iš E2VC. Ji taip pat paskyrė Jordaną Kretchmerį, „Outlander VC“ vyresnįjį partnerį ir „Rapid Robotics Inc.“ įkūrėją į savo valdybą.
„Jordanija turi investicijų į robotiką patirtį, o mūsų disertacija turi būti pramoninė agnostika, pradedant gamybos programomis, tokiomis kaip QA iki pat namų ruošos robotų rinkimo“,-teigė Pasztoras. „Realistiški vaizdai turėtų greitai pasiskirstyti tarp skirtingų vertikalių, nes mes mokomės iš visų. Diferenciatorius nebėra sintetiniai duomenys; jo sukuria duomenų variklį.“
Kaip sako mano įkūrėjas: „Programinė įranga yra kuriama kartojant, tad kodėl nėra duomenų“,-padarė išvadą jis.
