Kodėl „AI Crawlers“ amžiuje gresia atviras internetas

Estimated read time 9 min read

Internetas visada buvo laisva išraiškos, bendradarbiavimo ir atvirų idėjų mainų erdvė. Tačiau, nepaisant nuolatinio dirbtinio intelekto (AI) pažangos, AI varomi žiniatinklio tikrinimo įrenginiai pradėjo keisti skaitmeninį pasaulį. Šie robotai, kuriuos dislokavo pagrindinės AI kompanijos, nuskaito internetą, renka daug duomenų, pradedant straipsniais ir vaizdais, vaizdo įrašais ir šaltinio kodu, baigiant mašinų mokymosi modeliais.

Nors šis didžiulis duomenų rinkinys padeda skatinti nepaprastą AI pasiekimą, tai taip pat kelia rimtą susirūpinimą dėl to, kas turi šią informaciją, kokia ji yra privati ​​ir ar turinio kūrėjai vis dar gali pragyventi. Kai AI tikrinimo įrenginiai išplito nepatikrintais, jie rizikuoja pakenkti interneto pagrindams, atvirai, sąžiningai ir prieinamai erdvei visiems.

Žiniatinklio tikrinimo įrenginiai ir didėjanti jų įtaka skaitmeniniam pasauliui

Žiniatinklio tikrinimo įrenginiai, dar žinomi kaip voratinkliniai robotai ar paieškos variklio robotai, yra automatiniai įrankiai, skirti tyrinėti žiniatinklį. Pagrindinis jų darbas yra rinkti informaciją iš svetainių ir indeksuoti ją tokioms paieškos sistemoms kaip „Google“ ir „Bing“. Tai užtikrina, kad svetaines galima rasti paieškos rezultatuose, todėl jos tampa labiau matomos vartotojams. Šie robotai nuskaito tinklalapius, seka nuorodas ir analizuoja turinį, padeda paieškos varikliams suprasti, kas yra puslapyje, kaip jis yra struktūrizuotas ir kaip jis gali įvertinti paieškos rezultatus.

Lankytojai daro ne tik indekso turinį; Jie reguliariai tikrina naują informaciją ir atnaujinimus svetainėse. Šis nuolatinis procesas pagerina paieškos rezultatų svarbą, padeda nustatyti sugedusias nuorodas ir optimizuoja, kaip struktūrizuojamos svetainės, todėl paieškos varikliams lengviau rasti ir indeksų puslapius. Nors tradiciniai tikrinimo įrenginiai daugiausia dėmesio skiria paieškos variklių indeksavimui, AI varomieji tikrinimo priemonės žengia tai žingsniu toliau. Šie AI varomi robotai renka didžiulį kiekį duomenų iš svetainių, kad mokytų mašinų mokymosi modelius, naudojamus natūralios kalbos apdorojant ir atpažinus vaizdą.

Tačiau AI tikrinimo priemonių kilimas iškėlė svarbius susirūpinimą. Skirtingai nuo tradicinių tikrintojų, AI robotai gali surinkti duomenis labiau beatodairiškai, dažnai, nesikreipdami į leidimą. Tai gali sukelti privatumo klausimus ir intelektinės nuosavybės išnaudojimą. Mažesnėms svetainėms tai reiškė padidėjusias išlaidas, nes jiems dabar reikia stipresnės infrastruktūros, kad būtų galima susidoroti su bot srauto padidėjimu. Pagrindinės technologijų kompanijos, tokios kaip „Openai“, „Google“ ir „Microsoft“, yra pagrindiniai AI tikrinimo priemonių vartotojai, naudojančios jas į AI sistemas tiekti didelius interneto duomenų kiekius. Nors AI tikrinimo įrenginiai siūlo didelę pažangą mokantis mašinų, jie taip pat kelia etinius klausimus apie tai, kaip duomenys renkami ir naudojami skaitmeniniu būdu.

„Open Web“ paslėptos išlaidos: naujovių suderinimas su skaitmeniniu vientisumu

Dėl AI varomų žiniatinklio tikrintojų augimo skaitmeniniame pasaulyje kilo vis didėjančių diskusijų, kuriose konfliktai konfliktuoja naujoves ir turinio kūrėjų teises. Šio leidinio esmė yra turinio kūrėjai, tokie kaip žurnalistai, tinklaraštininkai, kūrėjai ir menininkai, kurie savo darbu ilgą laiką rėmėsi internetu, pritraukia auditoriją ir užsidirba pragyvenimui. Tačiau AI varomo interneto grandymo atsiradimas keičia verslo modelius, imantis daug viešai prieinamo turinio, pavyzdžiui, straipsnių, tinklaraščio įrašų ir vaizdo įrašų ir naudojant jį mašinų mokymosi modeliams treniruotis. Šis procesas leidžia AI atkartoti žmogaus kūrybiškumą, o tai gali sukelti mažesnį originalaus darbo paklausą ir sumažinti jo vertę.

Svarbiausias turinio kūrėjų rūpestis yra tas, kad jų darbas yra nuvertinamas. Pavyzdžiui, žurnalistai baiminasi, kad AI modeliai, mokantys savo straipsnių, gali imituoti jų rašymo stilių ir turinį, nekompensuodami originalių rašytojų. Tai daro įtaką pajamoms iš skelbimų ir prenumeratų ir sumažina paskatą kurti aukštos kokybės žurnalistiką.

Kitas svarbus klausimas yra autorių teisių pažeidimas. Žiniatinklio ruožas dažnai apima turinio vartojimą be leidimo ir kelti susirūpinimą dėl intelektinės nuosavybės. 2023 m. „Getty Images“ pateikė ieškinį AI kompanijoms už tai, kad jų atvaizdų duomenų bazė be sutikimo iškasė, tvirtinant, kad jų autorių teisių saugomi vaizdai buvo naudojami mokyti AI sistemas, generuojančias meną be tinkamo mokėjimo. Šis atvejis pabrėžia platesnę AI problemą, naudojant autorių teisių saugomą medžiagą be licencijavimo ar kompensuojančių kūrėjų.

PG kompanijos teigia, kad dideliems duomenų rinkiniams nustatyti būtina tobulėjant AI, tačiau tai kelia etinius klausimus. Ar AI pažanga turėtų įvykti kūrėjų teisių ir privatumo sąskaita? Daugelis žmonių ragina AI įmones priimti atsakingesnę duomenų rinkimo praktiką, kuri gerbtų autorių teisių įstatymus ir užtikrintų, kad kūrėjams būtų kompensuoti. Dėl šios diskusijos buvo raginamos tvirtesnės taisyklės apsaugoti turinio kūrėjus ir vartotojus nuo nereglamentuojamo jų duomenų naudojimo.

AI grandymas taip pat gali neigiamai paveikti svetainės našumą. Per didelis BOT veikla gali sulėtinti serverius, padidinti prieglobos sąnaudas ir paveikti puslapio įkėlimo laiką. Turinio grandymas gali sukelti autorių teisių pažeidimus, pralaidumo vagystes ir finansinius nuostolius dėl sumažėjusio svetainių srauto ir pajamų. Be to, paieškos varikliai gali nubausti svetaines, kuriose yra kopijų turinys, kuris gali pakenkti SEO reitingams.

Mažų kūrėjų kovos AI vėžių amžiuje

Kai AI varomi žiniatinklio tikrintojai ir toliau auga, mažesni turinio kūrėjai, tokie kaip tinklaraštininkai, nepriklausomi tyrėjai ir menininkai, susiduria su dideliais iššūkiais. Šie kūrėjai, kurie tradiciškai naudojo internetą norėdami pasidalyti savo darbu ir gauti pajamų, dabar rizikuoja prarasti savo turinio kontrolę.

Šis poslinkis prisideda prie labiau suskaidyto interneto. Didelės korporacijos, turinčios didelius išteklius, gali išlaikyti tvirtą buvimą internete, o mažesni kūrėjai stengiasi pastebėti. Didėjanti nelygybė galėtų pastumti nepriklausomus balsus į maržą, o pagrindinės kompanijos turi liūto dalį turinio ir duomenų.

Reaguodami į tai, daugelis kūrėjų kreipėsi į „Paywalls“ ar „Prenumerata“ modelius, kad apsaugotų savo darbą. Nors tai gali padėti išlaikyti kontrolę, jis riboja prieigą prie vertingo turinio. Kai kurie netgi pradėjo pašalinti savo darbą iš interneto, kad sustabdytų jį nuo nugriebimo. Šie veiksmai prisideda prie uždaros skaitmeninės erdvės, kurioje keli galingi subjektai kontroliuoja prieigą prie informacijos.

Dėl AI grandymo ir darbo užmokesčio sienų kilimo gali būti sutelkta kontrolė per interneto informacijos ekosistemą. Didelės įmonės, saugančios jų duomenis, išlaikys pranašumą, o mažesni kūrėjai ir tyrėjai gali būti palikti. Tai galėtų sunaikinti atvirą, decentralizuotą žiniatinklio pobūdį, grasindamas jo, kaip platformos atviram mainui idėjoms ir žinioms, vaidmeniui.

Apsaugoti atvirą žiniatinklio ir turinio kūrėjus

Kai AI varomi žiniatinklio tikrintojai tampa vis dažnesni, turinio kūrėjai kovoja kitaip. 2023 m. „The New York Times“ pateikė ieškinį „Openai“ už tai, kad jis išrašė savo straipsnius be leidimo mokyti savo AI modelius. Teismo ieškinyje teigiama, kad ši praktika pažeidžia autorių teisių įstatymus ir kenkia tradicinės žurnalistikos verslo modeliui, leisdama AI kopijuoti turinį nekompensuodama pradinių kūrėjų.

Tokie teisiniai veiksmai yra tik pradžia. Daugiau turinio kūrėjų ir leidėjų ragina kompensuoti duomenis, kuriuos nuskaito AI. Teisinis aspektas greitai keičiasi. Teismai ir įstatymų leidėjai stengiasi subalansuoti PG plėtrą ir apsaugoti kūrėjų teises.

Įstatymų leidybos srityje Europos Sąjunga 2024 m. Pristatė AI įstatymą. Šis įstatymas nustato AI plėtros ir naudojimo ES taisykles. Prieš pradedant mokyti AI modelius, reikia gauti aiškų sutikimą. ES požiūris sulaukia dėmesio visame pasaulyje. Panašūs įstatymai aptariami JAV ir Azijoje. Šiomis pastangomis siekiama apsaugoti kūrėjus, skatinant PG progresą.

Svetainės taip pat imasi veiksmų, kad apsaugotų savo turinį. Įrankiai, tokie kaip „Captcha“, kuri prašo vartotojų įrodyti, kad jie yra žmogiški, ir Robots.txtkuris leidžia svetainių savininkams blokuoti robotus iš tam tikrų jų svetainių dalių, dažniausiai naudojami. Tokios kompanijos kaip „CloudFlare“ siūlo paslaugas, skirtas apsaugoti svetaines nuo kenksmingų tikrintojų. Jie naudoja išplėstinius algoritmus, kad blokuotų nežmogišką srautą. Tačiau, pažangai AI tikrinimo įrenginiams, šiuos metodus tampa lengviau apeiti.

Žvelgiant į ateitį, didelių technologijų kompanijų komerciniai interesai gali sukelti susiskaldytą internetą. Didelės įmonės gali kontroliuoti didžiąją dalį duomenų, todėl mažesni kūrėjai stengiasi neatsilikti. Ši tendencija galėtų padaryti internetą mažiau atvirą ir prieinamą.

AI grandymo padidėjimas taip pat galėtų sumažinti konkurenciją. Mažesnėms įmonėms ir nepriklausomiems kūrėjams gali kilti problemų prieiti prie duomenų, reikalingų naujovėms, todėl atsiranda ne toks įvairus internetas, kuriame gali pasisekti tik didžiausi žaidėjai.

Norėdami išsaugoti atvirą internetą, mums reikia kolektyvinių veiksmų. Teisinės sistemos, tokios kaip ES AI įstatymas, yra gera pradžia, tačiau reikia daugiau. Vienas iš galimų sprendimų yra etinių duomenų licencijavimo modeliai. Šiuose modeliuose AI kompanijos moka kūrėjams už naudojamus duomenis. Tai padėtų užtikrinti sąžiningą kompensaciją ir išlaikyti įvairius interneto paslaugas.

PG valdymo sistemos taip pat yra būtinos. Tai turėtų apimti aiškias duomenų rinkimo, autorių teisių apsaugos ir privatumo taisykles. Skatindami etinę praktiką, atvirą internetą galime išlaikyti ir toliau tobulindami AI technologiją.

Esmė

Plačiai paplitęs AI varomų žiniatinklio tikrinimo priemonių naudojimas kelia didelių iššūkių atviram internete, ypač mažų turinio kūrėjams, kurie rizikuoja prarasti savo darbo kontrolę. Kai AI sistemos be leidimo nuskaitytų didžiulį duomenų kiekį, tokios problemos kaip autorių teisių pažeidimas ir duomenų išnaudojimas tampa ryškesni.

Nors teisiniai veiksmai ir įstatymų leidybos pastangos, tokios kaip ES AI įstatymas, siūlo daug žadančią pradžią, reikia daugiau, norint apsaugoti kūrėjus ir palaikyti atvirą, decentralizuotą internetą. Techninės priemonės, tokios kaip „CAPTCHA“ ir „BOT“ apsaugos paslaugos, yra svarbios, tačiau joms reikia nuolat atnaujinti. Galų gale AI naujovių suderinimas su turinio kūrėjų teisėmis ir užtikrinimas, kad sąžininga kompensacija bus gyvybiškai svarbi norint išsaugoti įvairią ir prieinamą skaitmeninę erdvę visiems.


Source link

Jums tai gali patikti

Daugiau iš autoriaus