Įvadas ir raida generatyvinė AI buvo tokie staigūs ir intensyviai, kad iš tikrųjų gana sunku visiškai įvertinti, kiek ši technologija pakeitė mūsų gyvenimą.
Padidinkite vos prieš trejus metus. Taip, AI tapo vis labiau paplitusi, bent jau teoriškai. Daugiau žmonių žinojo kai kuriuos dalykus, kuriuos ji gali padaryti, nors net ir tuo metu dėl AI galimybių kilo didžiulis nesusipratimas. Kažkodėl technologijai buvo suteikta vienu metu nepakankama ir per daug kredito tam, ką ji iš tikrųjų galėjo pasiekti. Vis dėlto vidutinis asmuo galėtų nurodyti bent vieną ar dvi sritis, kuriose AI buvo darbe, atlikdamas labai specializuotas užduotis Gana gerailabai kontroliuojamoje aplinkoje. Viskas, kas už tai buvo, vis dar buvo tyrimų laboratorijoje, arba tiesiog jo neegzistavo.
Palyginkite tai su šiandien. Turint nulinius įgūdžius, išskyrus galimybę parašyti sakinį ar užduoti klausimą, pasaulis yra mūsų po ranka. Mes galime generuoti vaizdus, muziką ir net filmus, kurie yra tikrai unikalūs ir nuostabūs, ir sugebėti sutrikdyti visas pramonės šakas. Mes galime įkrauti savo paieškos variklio procesą, užduodami paprastą klausimą, kuris, jei įrėmintas teisingai, gali sugeneruoti pasirinktinio turinio puslapius, pakankamai geri, kad praeitų kaip universiteto apmokytas mokslininkas … arba vidutinis trečiasis greideris, jei nurodysime POV. Nors jie kažkaip, vos per metus ar dvejus, tampa įprasta, šios galimybės buvo laikomos visiškai neįmanomos vos prieš keletą trumpų metų. Generatyvinės AI laukas egzistavo, tačiau jokiu būdu nebuvo pakilęs.
Šiandien daugelis žmonių eksperimentavo su generatyvine AI, pavyzdžiui, „ChatGpt“, „Midjournney“ ar kitomis priemonėmis. Kiti jau įtraukė juos į savo kasdienį gyvenimą. Greitis, kuriuo jie vystėsi, pūsta iki beveik nerimą keliančio taško. Ir atsižvelgiant į pastaruosius šešis mėnesius pažangą, mes, be abejo, per artimiausius kelerius metus būsime išpūsti, vėl ir vėl.
Vienas konkretus įrankis, žaidžiantis generuojančioje AI, buvo atliktas atėmimo grūdų (RAG) sistemų atlikimas ir jų sugebėjimas mąstyti ypač sudėtingose užklausose. Įvedimas Kadrai duomenų rinkinys, išsamiai paaiškintas straipsnis Apie tai, kaip veikia vertinimo duomenų rinkinys, parodo, kur dabar yra šiuolaikinė būklė ir kur jis yra nukreiptas. Net po 2024 m. Pabaigos įvedimo rėmų, nemažai platformų jau sugadino naujus įrašus apie jų sugebėjimą pagrįsti per sunkias ir sudėtingas užklausas.
Pasinerkime į tai, kokie kadrai yra skirti įvertinti ir kaip veikia skirtingi generatyviniai AI modeliai. Matome, kaip tiek decentralizacija, tiek atvirojo kodo platformos ne tik laiko savo žemę (ypač Justent pokalbis), jie leidžia vartotojams aiškiai pamatyti stulbinančius samprotavimus, kuriuos gali pasiekti kai kurie AI modeliai.
Rėmelių duomenų rinkinyje ir jo vertinimo procese daugiausia dėmesio skiriama 824 „kelių hop“ klausimams, skirtiems reikšti išvadą, loginius ryšius-taškus, kelių skirtingų šaltinių naudojimą, kad būtų galima gauti pagrindinę informaciją, ir galimybę logiškai juos sudėti, kad atsakytų į klausimą. Klausimai reikalauja nuo dviejų iki 15 dokumentų, kad būtų galima juos teisingai atsakyti, taip pat tikslingai apima apribojimus, matematinius skaičiavimus ir atskaitymus, taip pat galimybę apdoroti laiką pagrįstą logiką. Kitaip tariant, šie klausimai yra nepaprastai sunkūs ir iš tikrųjų atspindi labai realius tyrimų darbus, kuriuos žmogus gali atlikti internete. Mes visą laiką sprendžiame šiuos iššūkius ir turime ieškoti išsklaidytos pagrindinės informacijos interneto šaltinių jūroje, sujungdami informaciją, pagrįstą skirtingomis svetainėmis, sukurdami naują informaciją apskaičiuodami ir išskaičiuojant, ir suprantant, kaip sujungti šiuos faktus į teisingą atsakymą į klausimą.
Tai, ką tyrėjai rado, kai duomenų rinkinys pirmą kartą buvo išleistas ir išbandytas GenAI models turėjo būti šiek tiek tikslūs (apie 40%), kai jiems reikėjo atsakyti naudodamiesi vieno žingsnio metodais, tačiau, jei leistų rinkti visus būtinus dokumentus, kad būtų galima atsakyti į klausimą, gali pasiekti 73% tikslumą. Taip, 73% gali neatrodyti kaip revoliucija. Bet jei tiksliai suprantate, į ką reikia atsakyti, skaičius tampa daug įspūdingesnis.
Pavyzdžiui, vienas konkretus klausimas yra: „Kokie metai buvo grupės lyderis, kuris iš pradžių atliko dainą, atrinktą Kanye West's Song Power Born?“ Kaip žmogus spręstų šią problemą? Žmogus gali pamatyti, kad jiems reikia rinkti įvairius informacijos elementus, tokius kaip „Kanye West“ dainos žodžiai „Power“, o paskui galėti peržvelgti dainų tekstus ir nustatyti dainos, kuri iš tikrųjų imasi kitos dainos, tašką. Mes, kaip žmonės, turbūt galėtume klausytis dainos (net jei su ja nepažįstama) ir galėtume pasakyti, kada atrinkta kita daina.
Bet pagalvokite apie tai: ką genai turėtų atlikti, kad aptiktų kitokią nei originalą, o „klausydamasis“? Čia pagrindinis klausimas tampa puikiu tikrai intelektualios AI išbandymu. Ir jei mums pavyko surasti dainą, klausytis ir atpažinti dainų tekstus, tai yra tik 1 žingsnis. Mes vis tiek turime išsiaiškinti, koks yra dainos pavadinimas, kas yra grupė, kas yra tos grupės lyderis, ir tada kokie metai gimė.
Rėmeliai rodo, kad norint atsakyti į realius klausimus, reikia didžiulio minties apdorojimo. Čia ateina du dalykai.
Pirma, gebėjimas decentralizuotas „Genai“ modeliai, skirti ne tik konkuruoti, bet ir potencialiai dominuoti rezultatuose, yra neįtikėtini. Vis daugiau bendrovių naudoja decentralizuotą metodą, kad padidintų savo apdorojimo gebėjimus, tuo pačiu užtikrinant, kad didelei bendruomenei priklauso programinė įranga, o ne centralizuota juodoji dėžutė, kuri nesidalins savo pažanga. Tokios kompanijos kaip pasipiktinimas ir „Sentent“ vadovauja šiai tendencijai, kurių kiekviena su didžiuliais modeliais, viršijančiais pirmuosius tikslumo įrašus, kai buvo išleisti rėmai.
Antrasis elementas yra tas, kad mažesnis šių AI modelių skaičius yra ne tik decentralizuotas, bet ir atvirojo kodo. Pavyzdžiui, „Sentient Chat“ yra ir, o ankstyvieji testai parodo, koks sudėtingas gali būti jo samprotavimas, dėka neįkainojamos atvirojo kodo prieigos. Aukščiau pateiktą rėmų klausimą atsakoma naudojant tą patį minties procesą, kurį naudotųsi žmogus, su savo samprotavimais, kuriuos galima peržiūrėti. Galbūt dar įdomiau, jų platforma yra struktūrizuota kaip daugybė modelių, galinčių patobulinti tam tikrą perspektyvą ir našumą, net jei kai kurių genų modelių derinimo procesas lemia sumažėjusį tikslumą. Senių pokalbių atveju buvo sukurta daugybė skirtingų modelių. Pavyzdžiui, naujausias modelis, pavadintas „Dobby 8B“, gali aplenkti rėmų etaloną, tačiau taip pat sukurti atskirą pro-kripto ir freedomo požiūrį, kuris daro įtaką modelio perspektyvai, nes jis apdoroja informacijos elementus ir sukuria atsakymą.
Visų šių stulbinančių naujovių raktas yra greitas greitis, kuris mus čia atvedė. Turime pripažinti, kad taip greitai, kaip vystėsi ši technologija, artimiausiu metu ji vystys tik dar greičiau. Mes galėsime pamatyti, ypač su decentralizuotais ir atvirojo kodo genų modeliais, kurie yra svarbūs slenksčiai, kai sistemos intelektas pradeda viršyti vis daugiau mūsų pačių, ir ką tai reiškia ateičiai.
Source link