Ar girdi ateitį? „SquadStack“ AI balsas tiesiog apgavo 81% klausytojų

Estimated read time 3 min read

Įsivaizduokite, kad atsiliepėte į skambutį ir bendraujate, kad po kelių minučių sužinotumėte, kad kitame gale esantis „asmuo“ visai ne žmogus. Baisu? Įspūdingas? Galbūt šiek tiek abiejų.

Būtent taip atsitiko „Global Fintech Fest 2025“, kur SquadStack.ai sukėlė bangas teigdamas, kad jo balso dirbtinis intelektas veiksmingai išlaikė Turingo testą – senas matas, ar mašina gali įtikinamai imituoti žmogaus intelektą.

Eksperimentas buvo paprastas, bet drąsus. Daugiau nei 1500 dalyvių dalyvavo tiesioginiuose, be scenarijaus balso pokalbiuose, o 81% negalėjo pasakyti, ar jie kalba su dirbtiniu intelektu, ar su žmogumi.

Tai toks etapas, dėl kurio net skeptikai sėdi tiesiai. Girdėjome apie AI meną ir pokalbių robotus, bet tai? Tai AI kalba – tiesiogine to žodžio prasme – ir daro tai pakankamai gerai, kad sulietų tikrovę.

Tai man primena, kai OpenAI pristatė savo balso variklį – modelį, kuris gali sukurti natūralią kalbą vos iš 15 sekundžių garso.

Tada internetas siautėja dėl pasekmių – kūrybingų, etiškų ir be galo nerimą keliančių.

Atrodo, kad „SquadStack“ dabar padarė tą viziją toliau, įrodydamas, kad pokalbio niuansai yra ne tik aukštis ir tonas, bet ir laikas, emocijos ir kontekstas.

Bet trumpam stabtelkime – nes ne visi švenčia. Reguliuotojai pradėjo veržtis diržus.

Europoje politikos formuotojai jau siekia griežčiau atskleisti dirbtinio intelekto sukurtų balsų tapatybę, pakartodami didėjančią baimę dėl netikrų sukčių ir skaitmeninio apsimetimo.

Pavyzdžiui, Danija rengia įstatymo projektą dėl dirbtinio intelekto pagrįstų giliųjų balso klastočių, nurodydama atvejus, kai klonuoti balsai buvo naudojami sukčiavimui ir dezinformacijai.

Tuo tarpu verslo pasaulis džiaugiasi. Tokios įmonės kaip „SoundHound AI“ praneša apie didžiulį pajamų augimą, parodydamos, kad balso generavimas yra ne tik šauni technologija – tai geras verslas.

Jei vartotojai negali atskirti dirbtinio intelekto nuo tikrų žmonių, skambučių centrai, virtualūs asistentai ir skaitmeniniai pardavimo agentai netrukus gali atrodyti niekuo neišsiskiriantys nuo jų kolegų žmonių. Tai yra stereofoninio garso efektyvumas.

Čia taip pat yra patraukli paralelė su Subtle Computing darbu, susijusiu su AI balso izoliavimu – jie moko mašinas atsirinkti kalbą chaotiškoje aplinkoje.

Iš tikrųjų tai beveik poetiška: vienas startuolis verčia dirbtinį intelektą geriau klausytis, kitas – geriau kalbėti.

Kai šios dvi gijos susidurs, turėsime dirbtinį intelektą, kuris mus puikiai girdi, natūraliai atsilieps ir galbūt net įtikinamai ginčysis.

Žinoma, tai kelia didelį klausimą: kiek mes iš tikrųjų to norime? Man, kaip žmogui, vis dar patinka pasikalbėti su barista ir skambinti su tikrais žmonėmis, ši idėja mane jaudina ir kelia nerimą.

Be jokios abejonės, technologija yra nuostabi. Tačiau dalis manęs pasiilgsta suklupimų, nepatogių pauzių, mažų netobulumų, kurie verčia jausti žmonių balsus gyvas.

Vis dėlto sunku nesijaudinti. Nesvarbu, ar manote, kad tai žingsnis vientiso skaitmeninio pasaulio link, ar įspėjamasis ženklas apie būsimus dalykus, vienas dalykas yra neginčijamas – rytojaus balsai jau kalba. Ir jei negali pasakyti, kas kalba… na, galbūt tai ir yra esmė.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus