AI pasaulyje vyksta kažkas įdomaus – sintetiniai balsai nebėra naujovė; jie tampa tik dar vienu įrankiu rinkinyje.
Neseniai paskelbtoje ataskaitoje aprašyta, kaip sintetiniai balso modeliai keičiasi į prekybą, o tai reiškia, kad kažkada išskirtinės technologijos, naudojamos aukščiausios klasės garso laboratorijose, dabar plinta kaip ant mielių.
Pagrindinis skirtumas dabar nėra turintys balso generatorius, bet ką tu daryti su juo – duomenys, saugumas ir orkestruotė, dėl kurių tai skamba žmogiškai, o ne tuščiaviduriai.
Prisimenu, kai balso klonavimas atrodė kaip kerėjimas – brangus, paslaptingas, apie tokį dalyką, apie kurį išgirstumėte tik iš technologijų milžino demonstracinės versijos.
Tačiau tos dienos jau praėjo. Dabar kūrėjai per kelias minutes sukuria tikroviškus klonus, naudodami platformas, kurios gali beveik tobulai užfiksuoti toną, akcentą ir emocijas.
Naujausia pramonės analizė rodo, kad pasaulinė AI balso technologijos paklausa sparčiai auga, o naudojimas plinta klientų aptarnavimo, žaidimų ir skaitmeninio turinio kūrimo srityse. Sunku dėl to nesijausti ir nustebus, ir šiek tiek neramus.
Taip pat vis daugėja pokalbių apie tai, kas nutinka kada visi gali klonuoti balsą. Įsivaizduokite, kad atsiliepiate į skambutį ir išgirsite savo balsą, kuris jums siūlo paskolą.
Tai juokinga ir baisu vienu metu. Tyrėjai, tyrinėjantys AI balso klonavimo tendencijas, perspėja, kad kliūtys patekti į rinką griūva greičiau nei aplinkinės etikos sistemos.
Techniškai lenktyniaujame į priekį, bet mūsų socialiniai instinktai vis dar vejasi.
Tada yra emocinė pusė – mūsų santykis su garsu. Žmonės yra priversti pasitikėti balsais; štai kodėl sintetiniai pataiko kitaip.
Kai kurie ankstyvieji bandymai, aprašyti akademiniame darbe apie sintetinio balso aptikimą, rodo, kad žmonės linkę per daug pasitikėti tikroviškais klonais, net kai jiems sakoma, kad jie dirbtiniai.
Tai šiluma, ritmas, subtilios pauzės – dalykai, kurie mums asocijuojasi su sąžiningumu. Pastaruoju metu klausiausi kelių klonuotų balsų ir, tiesą sakant, nerimą kelia tai, kokie jie įtikinami.
Vis dėlto šiame triukšme matau galimybę. Mažiems kūrėjams ir regioninei žiniasklaidai, ypač visoje Pietryčių Azijoje, nebrangus balso generavimas atveria duris.
Įsivaizduokite, kad vietiniai internetinių transliuotojų kūrėjai kuria daugiakalbes savo laidų versijas arba nepriklausomos studijos kuria ištisas radijo dramas be brangių balso talentų.
Tačiau, kaip užsiminė pramonės lyderiai, tokie kaip „ElevenLabs“, tikras iššūkis yra ne tai, kaip gerai skamba balsas, o tai, kaip atsakingai jį naudojame.