Mokėkite už naudojamus duomenis

Estimated read time 4 min read

Pasaulinėse AI diskusijose vyksta kažkoks esminis pokytis, ir tai vyksta JK visose vietose. Bet ne subtiliai, bet kokiu atveju. Parlamento nariai pagaliau atsisako vienos mėgstamiausių technologijų pramonės pramogų: dirbtinio intelekto algoritmų paleidimą dideliame internetinio turinio plote, labai neatsižvelgdami į tai, kam jis iš tikrųjų priklauso.

Jų sprendimas paprastas, beveik akivaizdus. Jei dirbtinio intelekto modelis yra apmokytas pagal kieno nors turinį, jis tikriausiai turėtų už tai sumokėti.

Šiuo metu JK parlamento komitetas ragina vyriausybę įgyvendinti tai, ką ji vadina „pirmiausia licencija“. Tai reikštų, kad įmonėms reikės leidimo, kad jos galėtų naudoti autorių teisių saugomus kūrinius AI modeliams mokyti. Tai apima viską nuo knygų ir žurnalistikos iki muzikos, meno ir fotografijos, iš esmės visą žiniatinklio žaliavą.

Nesunku suprasti kodėl.

Jei apskritai stebėjote AI augimą, galbūt susidūrėte su terminu „teksto ir duomenų gavyba“. Skamba neaiškiai, gal net nekenksmingai. Bet iš esmės tai reiškia tai, kas parašyta ant skardos: algoritmai, išvalantys didžiulį kiekį žiniatinklio turinio, kad suprastų modelius. Taip AI mokosi generuoti tekstą, vaizdus, ​​santraukas ir pokalbius.

Tai tikrai protingas dalykas.

Tačiau kai kurie technologijų pramonės atstovai kartais nenori aptarti lygties. Didžioji šios medžiagos dalis priklauso žmonėms, autoriams ir muzikantams, fotografams ir žurnalistams, kurie dažnai praleidžia dešimtmečius ją kurdami.

Ir, suprantama, jie nėra labai patenkinti dirbdami nemokamomis mokytojų padėjėjomis dirbtinio intelekto klasėje.

„Galima žala, kurią kūrėjams gali padaryti plačiai naudojant generatyvųjį AI be tinkamų autorių teisių leidimų ar nemokant teisingo atlygio, yra aiški ir egzistuojanti“, – perspėjo Lordų Rūmų komunikacijos ir skaitmeninis komitetas JK vyriausybei. „Jei taip atsitiks, kūrybinės industrijos, kurios vaidina tokį svarbų vaidmenį JK ekonomikos sėkmei, gali būti labai pažeistos.

Praktiškai galima išgirsti kūrėjų pasipiktinimą šia tema.

Įsivaizduokite, kad metų metus praleidžiate rašydami knygą, albumą ar fotografijos aplanką, kad pamatytumėte, jog dirbtinis intelektas kažkaip perėmė jūsų stilių. Galbūt tai nėra plagijavimas klasikine prasme, bet pakankamai arti, kad pakeltų antakius. Bet štai kas: menininkas niekada net nesužinotų.

Štai kodėl kai kurie politikos formuotojai mano, kad numatytoji nuostata turėtų būti panaikinta. AI teikėjas turėtų įrodyti, kad jis licencijavo medžiagą, kurią naudojo. Iš kur mes gavome šiuos duomenis? Kaip mes tai gavome? Padarykime tai skaidriai.

Skamba tiesiai šviesiai. Iš tikrųjų sudėtinga.

Tačiau tai idėja, kuri vis labiau populiarėja. JK nėra vienintelė šalis, kuri kovoja su šia problema. Daugelis šalių bando išsiaiškinti, kaip valdyti dirbtinį intelektą, nesmaugiant jo vystymuisi.

Tai subtilus šokis.

Pavyzdžiui, Europos Sąjunga neseniai pateikė savo pasiūlymą dėl ES dirbtinio intelekto įstatymo, kuriuo siekiama padidinti AI sistemų atskaitomybę ir skaidrumą. Tai toli gražu nėra vaistas nuo visų, tačiau tai rodo, kad vyriausybės rimtai žiūri į DI valdymą.

Bet štai kas.

Kai viena jurisdikcija tampa rimta, dažnai vadovaujasi kitos. Technologijų įmonės yra pasaulinės, jos nepaiso sienų, todėl sprendimas, priimtas Londone ar Briuselyje, gali turėti įtakos AI plėtrai Kalifornijoje, Toronte ar Singapūre.

Taigi, nors tai gali atrodyti kaip JK problema, tai iš tikrųjų yra platesnio virvės traukimo žaidimo dalis.

Jei JK galiausiai nuspręs reikalauti licencijų, AI kūrėjams gali tekti visiškai persvarstyti, kaip jie gauna mokymo duomenis. Tai galėtų sukurti visiškai naujas pramonės šakas: įmones, kurios licencijuoja duomenis, leidėjus ir naujienų organizacijas, bendradarbiaujančias su AI teikėjais, ištisas įmones, kurios atsiranda tik tam, kad aprūpintų AI medžiagą, iš kurios galima pasimokyti.

Ginčas dėl duomenų gali būti verslo galimybė.

Nenuostabu, kad technologijų bendruomenė nėra pernelyg nuoširdi dėl šios perspektyvos. Ji teigia, kad licencijų reikalavimas visai informacijai, iš kurios AI sistema mokosi, gali trukdyti naujovėms arba pabranginti. Didelių AI modelių mokymas jau yra pernelyg brangus. Kartais milijonai. Kartais milijardai. Iš dolerių.

Jei į tai įtrauksite licencijavimo mokesčius, tai gali tapti apgailėtina.

Tačiau laukinių vakarų požiūris, kai dabar surenkama kuo daugiau duomenų ir vėliau nerimaujama dėl teisinių problemų, gali baigtis.

Nepriklausomai nuo to, ar esate AI entuziastas, technologijų darbuotojas ar tiesiog smalsus žmogus, kuris kada nors susimąstė, kodėl pokalbių robotai per daug sugeba jus mėgdžioti, diskusijos apie mokymo duomenis tampa vienu iš pagrindinių AI amžiaus blyksnių.

Ir jei JK retorika yra koks nors požymis, tai kova, kuri tik prasideda.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus