Per pastaruosius kelerius metus AI pasaulis perėjo nuo atviro bendradarbiavimo kultūros prie tokio, kuriame dominavo atidžiai saugomos patentuotos sistemos. „Openai“-įmonė, tiesiogine prasme įkurta su „Open“ savo vardu-pasirinko savo galingiausius modelius paslaptyje po 2019 m. Tokie konkurentai kaip „Anthropic“ ir „Google“ panašiai pastatė pažangiausią AI už API sienų, prieinamą tik jų sąlygomis. Šis uždaras požiūris iš dalies buvo pateisinamas saugos ir verslo interesais, tačiau daugeliui bendruomenės daugelis apgailestavo dėl ankstyvojo atvirojo kodo dvasios praradimo.
Dabar ta dvasia tvirtina sugrįžimą. Meta Naujai išleisti „Lama 4“ modeliai Pastebėkite drąsų bandymą atgaivinti aukščiausio lygio atvirojo kodo AI-ir net tradiciškai saugomi žaidėjai atkreipia dėmesį. Neseniai „Openai“ generalinis direktorius Samas Altmanas pripažino, kad įmonė buvo „neteisingoje istorijos pusėje“, susijusi su atvirais modeliais ir Paskelbti planai Norėdami gauti „galingą naują atviro svorio“ GPT-4 variantą. Trumpai tariant, atvirojo kodo AI yra smogianti atgal, o „atviros“ prasmė ir vertė vystosi.
(Šaltinis: meta)
LLAMA 4: „Meta“ atviras iššūkis į GPT-4o, Claude ir Dvynius
„Meta“ pristatė „Llam 4“ kaip dar vieną tiesioginį iššūkį naujiems AI sunkiaatlečių modeliams, išdėstant jį kaip atviros svorio alternatyvą. „Lla 4“ yra dviejų skonių, kuriuos galima įsigyti šiandien-„Llam 4 Scout“ ir „Llam 4 Maverick“-su akį traukiančiomis techninėmis specifikacijomis. Abu yra Ekspertų mišinys (MOE) Modeliai, kurie suaktyvina tik dalį jų parametrų kiekvienoje užklausoje, įgalindami didžiulį bendrą dydį, nesugadinant vykdymo laiko išlaidų. „Scout“ ir „Maverick“ kiekvienas iš jų 17 milijardų „aktyvių“ parametrų (dalis, kuri veikia pagal bet kurį įvestį), tačiau „Moe“ dėka skautė skleidžia tuos, kurie yra iš 16 ekspertų (iš viso 109B parametrų) ir „Maverick“ iš 128 ekspertų (iš viso 400B). Rezultatas: „Llam 4“ modeliai užtikrina nepaprastą našumą – ir darykite tai su unikaliomis privilegijomis, kurių net ir kai kuriems uždarytiems modeliams trūksta.
Pavyzdžiui, „Lla 4 Scout“ gali pasigirti pramonėje pirmaujančiu 10 milijonų žetonų konteksto langu, dydžio užsakymais už daugelio konkurentų ribų. Tai reiškia, kad jis gali praryti ir pagrįsti tikrai didžiuliais dokumentais ar kodų bazėmis vienu metu. Nepaisant savo masto, skautas yra pakankamai efektyvus, kad būtų galima atlikti vieną H100 GPU, kai jis yra labai kiekybiškai įvertintas, užsimindamas, kad kūrėjams nereikės superkompiuterio, kad jis galėtų eksperimentuoti.
Tuo tarpu „Llam 4 Maverick“ yra sureguliuotas dėl maksimalaus meistriškumo. Ankstyvieji testai rodo „Maverick“ suderinimą ar viršutinių uždarų modelių sumušimą dėl samprotavimo, kodavimo ir regėjimo užduočių. Tiesą sakant, „Meta“ jau erzina dar didesnį brolį ir seserį, „Llama 4 Behemoth“, vis dar mokydamas „Lenks GPT-4.5, Claude 3.7 sonet ir„ Gemini 2.0 Pro “ant kelių kamieninių etalonų.“ Pranešimas aiškus: atviri modeliai nebėra antrosios pakopos; „Lla 4“ vertina moderniausią statusą.
Ne mažiau svarbu, kad „Meta“ „Lama 4“ iš karto buvo galima atsisiųsti ir naudoti. Kūrėjai gali patraukti skautą ir „Maverick“ iš oficialios svetainės arba Apkabinantis veidą Pagal „Llam 4“ bendruomenės licenciją. Tai reiškia, kad bet kas-nuo garažo įsilaužėlio iki „Fortune 500“ kompanijos-gali patekti po gaubtu, patobulinti modelį pagal jų poreikius ir diegti jį ant savo aparatūros ar debesies. Tai yra ryškus kontrastas patentuotoms pasiūlymams, tokiems kaip „Openai“ GPT-4O ar „Anthropic“ „Claude 3.7“, kurie patiekiami per mokamas API, neturint galimybės naudotis pagrindiniais svoriais.
„Meta“ pabrėžia, kad „Llam 4“ atvirumas yra skirtas vartotojams įgalinti: „Mes dalijamės pirmaisiais„ Llam 4 “bandos modeliais, kurie leis žmonėms sukurti labiau suasmenintą multimodalinę patirtį“. Kitaip tariant, „Llam 4“ yra įrankių rinkinys, skirtas būti kūrėjų ir tyrėjų rankose visame pasaulyje. Išleisdama modelius, kurie gali konkuruoti su „GPT-4“ ir „Claude“ galimybėmis, meta atgaivina nuostatą, kad aukščiausio lygio AI neturi gyventi už darbo dienos.
(Šaltinis: meta)
Autentiškas idealizmas ar strateginis žaidimas?
„Meta Pustes Lama 4“, beveik altruistiniu požiūriu. „Mūsų atvirojo kodo AI modelis LLAMA buvo atsisiųstas daugiau nei vieną milijardą kartų“ Generalinis direktorius Markas Zuckerbergas Paskelbta neseniaipridurdamas „Atviras įsigijimo AI modelius yra būtina norint užtikrinti, kad žmonės visur turėtų prieigą prie AI pranašumų“. Šis kadravimas dažo meta kaip demokratizuotos AI-įmonės, norinčios pasidalyti savo „Crown-Jewel“ modeliais didesniam gėriui, dalintis. Ir iš tikrųjų „Llam“ šeimos populiarumas tai patvirtina: modeliai buvo atsisiųsti stulbinančiu mastu (šokinėjant nuo 650 milijonų iki 1 milijardo iš viso atsisiuntimo vos per kelis mėnesius), ir juos jau naudoja tokios įmonės kaip „Spotify“, „AT&T“ ir „DoorDash“.
„Meta“ išdidžiai pažymi, kad kūrėjai vertina „skaidrumą, pritaikomumą ir saugumą“, kai jie gali patys paleisti atvirus modelius, kurie patys gali paleisti. „Padeda pasiekti naujus kūrybiškumo ir inovacijų lygius“ Palyginti su „Black-Box“ API. Iš esmės tai skamba taip, kaip senas atvirojo kodo programinės įrangos etosas (pagalvok „Linux“ ar „Apache“), pritaikytas AI-nedviprasmiška bendruomenės laimėjimas.
Vis dėlto negalima ignoruoti strateginio skaičiavimo dėl šio atvirumo. Meta nėra labdara, o „atvirojo kodo“ šiame kontekste yra įspėjimų. Pažymėtina, kad „Llam 4“ išleidžiama pagal specialią bendruomenės licenciją, o ne standartinę leistiną licenciją-taigi, nors modelio svorius galima laisvai naudoti, yra apribojimų (pavyzdžiui, tam tikrus didelio išteklių naudojimo atvejus gali reikėti leidimo, o licencija yra licencija „Patentuota“ ta prasme, kad jį pagamino meta). Tai ne Atvirojo kodo iniciatyva (OSI) Patvirtintas atvirojo kodo apibrėžimas, dėl kurio kai kurie kritikai paskatino teigti, kad įmonės piktnaudžiauja terminu.
Praktiškai „Meta“ požiūris dažnai apibūdinamas kaip „atviras svoris“ arba „šaltinyje prieinamas“ AI: Kodas ir svoriai yra lauke, tačiau „Meta“ vis dar palaiko tam tikrą valdymą ir visko neatskleidžia (mokymo duomenys, pavyzdžiui). Tai nesumažina vartotojų naudingumo, tačiau tai rodo meta strategiškai Atvira – laikykite tik pakankamai virvių, kad apsisaugotumėte (ir galbūt jos konkurencinį pranašumą). Daugelis firmų ploja „atvirojo kodo“ etiketes AI modeliuose, išskaičiuodamos pagrindines detales, sumažindamos tikrąją atvirumo dvasią.
Kodėl meta iš viso galėtų atsiverti? Konkurencinė aplinka siūlo įkalčius. Išleidę galingus modelius nemokamai, galite greitai sukurti plačią kūrėjų ir įmonių vartotojų bazę – Mistral, kurią turitePrancūzijos startuolis, padarė būtent su savo ankstyvaisiais atvirais modeliais, kad įgytų patikimumą kaip aukščiausios pakopos laboratoriją.
Sėdėdama rinka su lama, „Meta“ užtikrina, kad jos technologija taps pagrindine AI ekosistemoje, kuri gali sumokėti dividendus ilgalaikę. Tai yra klasikinė „Apsaugos ir pratęsimo strategija“: jei visi naudoja jūsų „atvirą“ modelį, jūs netiesiogiai nustatote standartus ir galbūt net nukreipiate žmones link savo platformų (pavyzdžiui, meta AI asistento produktų, skirtų LLAMA. Taip pat yra PR ir pozicijos elementas. Meta turi vaidinti „Open Open“. Iš dalies pabrėžia, koks efektyvus meta žingsnis.
Po to, kai sausį pasirodė novatoriškas „Kinijos atviras“ modelis „Deepseek-R1“ ir šoktelėjo ankstesniuose modeliuose, Altmanas nurodė, kad „Openai“ nenorėjo būti paliktas „neteisingoje istorijos pusėje“. Dabar „Openai“ žada atvirą modelį, kuriame ateityje yra tvirti samprotavimo sugebėjimai, Pažymėti požiūrio pokytį. Tame poslinkyje sunku nematyti meta įtakos. „Meta“ atvirojo kodo posūkis yra autentiškas ir Strateginė: Tai tikrai praplečia prieigą prie AI, tačiau tai taip pat yra išmintingas lošimas, kad būtų galima aplenkti konkurentus ir formuoti rinkos ateitį meta sąlygomis.
Poveikis kūrėjams, įmonėms ir AI ateičiai
Kūrėjams atviriems modeliams, tokiems kaip „Llam 4“, atgimimas yra gryno oro gurkšnis. Užuot buvę užfiksuoti į vieno teikėjo ekosistemą ir mokesčius, jie dabar turi galimybę paleisti galingą AI savo infrastruktūroje arba laisvai ją pritaikyti.
Tai yra didžiulis pranašumas jautrioms pramonės šakoms – galvoti apie finansus, sveikatos priežiūrą ar vyriausybę, kurios atsargiai maitina konfidencialius duomenis į kažkieno juodąją dėžę. Su „Lla 4“ bankas ar ligoninė galėjo panaudoti moderniausią kalbų modelį už savo ugniasienę, sureguliuodami jį privačiais duomenimis, nesidalijant žetono su išoriniu subjektu. Taip pat yra išlaidų pranašumas. Nors geriausių modelių API mokesčiai gali didėti, o atviras modelis neturi jokios rinkliavos-jūs mokate tik už skaičiavimo galią, kad ją paleistumėte. Verslo įmonės, kurios padidina sunkų AI darbo krūvį, žymiai sutaupo, pasirinkdami atvirą sprendimą, kurį jie gali išplėsti.
Tad nenuostabu, kad mes matome didesnį susidomėjimą atvirus įmonių modelius; Daugelis pradėjo suvokti, kad atvirojo kodo AI kontrolė ir saugumas geriau atitinka jų poreikius, nei vienodai tinkamos uždaros paslaugos.
Kūrėjai taip pat gauna naudos naujovėse. Turėdami prieigą prie modelio vidaus, jie gali tiksliai sureguliuoti ir patobulinti nišinių domenų (įstatymų, biotechnologijų, regioninių kalbų-jūs tai įvardinate) AI taip, kaip uždara API niekada nebus patenkinta. Bendruomenės skatinamų projektų, susijusių su ankstesniais „Llam“ modeliais, sprogimas-nuo pokalbių programų, tiksliai suderintų su medicininėmis žiniomis ir mėgėjų išmaniųjų telefonų programomis, kuriose veikia miniatiūrinės versijos, įrodė, kaip atviri modeliai gali demokratizuoti eksperimentus.
Tačiau atviro modelio renesansas taip pat kelia sunkių klausimų. Ar „demokratizacija“ iš tikrųjų įvyksta, jei tik tie, kurie turi reikšmingus skaičiavimo išteklius, gali paleisti 400B parametro modelį? Nors „Lla 4 Scout“ ir „Maverick“ sumažina aparatūros juostą, palyginti su monolitiniais modeliais, jie vis dar yra sunkiasvoris – kai kuriems kūrėjams neprarandant taškas, kurio kompiuteriai negali jų tvarkyti be debesies pagalbos.
Tikimasi, kad tokie metodai, kaip modelio glaudinimas, distiliavimas ar mažesni ekspertų variantai, sumažins „Llam 4“ galią į prieinamesnius dydžius. Kitas rūpestis yra netinkamas naudojimas. „Openai“ ir kiti ilgai tvirtino, kad galingų modelių išleidimas atvirai gali sudaryti sąlygas kenksmingiems veikėjams (generuoti dezinformaciją, kenkėjiškų programų kodą ir kt.).
Šie rūpesčiai išlieka: atvirojo kodo Claude ar GPT gali būti netinkamai naudojami be saugos filtrų, kuriuos įmonės vykdo savo API. Iš esmės šalininkai teigia, kad atvirumas leidžia bendruomenė Taip pat nustatyti ir išspręsti problemas, padaryti modelius tvirtesnius ir skaidresnius laikui bėgant nei bet kuri slaptoji sistema. Yra įrodymų, kad atviros modelio bendruomenės rimtai vertina saugumą, kurdamos savo apsauginius turėklus ir dalijasi geriausia praktika, tačiau tai yra nuolatinė įtampa.
Visau aiškiau yra tai, kad mes einame link hibridinio AI kraštovaizdžio, kuriame kartu egzistuoja atviri ir uždaryti modeliai, kurių kiekvienas daro įtaką kitam. Uždaryti paslaugų teikėjai, tokie kaip „Openai“, „Anthropic“ ir „Google“, vis dar turi pranašumą absoliučiame našume – kol kas. Iš tiesų, nuo 2024 m. Pabaigos siūlomi tyrimai Atviros modeliai buvo maždaug vieneri metai už geriausių uždarų modelių Galimybė. Bet tas atotrūkis greitai uždaromas.
Šiandienos rinkoje „atvirojo kodo AI“ nebe reiškia tik pomėgių projektus ar senesnius modelius-dabar tai yra AI strategijos, skirtos technologijų milžinams, ir pradedantiesiems. „Meta“ „Llam 4“ paleidimas yra stiprus priminimas apie kintančią atvirumo vertę. Tai iškart yra filosofinis požiūris į demokratizuojant technologijas ir taktinis žingsnis aukštųjų akcijų pramonės mūšyje. Kūrėjams ir įmonėms tai atveria naujas duris naujovėms ir autonomijai, net jei tai apsunkina sprendimus naujais kompromisais. O platesnei ekosistemai kelia viltį, kad AI nauda nebus užfiksuota kelių korporacijų rankose – jei Atviro kodo etosas gali išlaikyti savo žemę.
Source link