„Anthropic“ galingas „Opus 4.1“ modelis yra čia – kaip juo pasiekti (ir kodėl norėsite)

Estimated read time 3 min read

Antropic / zdnet

„ZDNET“ pagrindiniai pasirinkimai

  • „Anthropic“ išleido „Claude Opus 4.1“.
  • Modelis viršija pirmtako atlikimą atliekant sudėtingas užduotis.
  • Tai galima mokėti „Claude“ vartotojams, „Claude Code“, API, „Amazon Bedrock“ ir „Google Cloud“ viršūnių AI.

Gegužės mėn. „Anthropic“ išleido „Claude Opus 4“, kurį įmonė pavadino dar galingiausiu savo modeliu ir geriausiu kodavimo modeliu pasaulyje. Tik po trijų mėnesių „Anthropic“ dar labiau padidina ante, pradėdamas labai lauktą „Claude Opus 4.1“, kuris dabar priima savo pirmtako karūną kaip pažangiausią „Anthropic“ modelį.

„Opus“ modelių šeima yra pažangiausias bendrovės, intelektualias AI modelis, skirtas spręsti sudėtingas problemas. Todėl antradienį išleistas „Claude Opus 4.1“, kuris išsiskiria su šiomis užduotimis ir netgi gali iš naujo atlikti savo pirmtaką dėl agentų užduočių, realaus pasaulio kodavimo ir samprotavimų, teigia „Anthropic“.

Modelis taip pat atsiranda, nes pramonė tikisi netrukus pasirodyti „Openai“ GPT-5.

Taip pat: „Openai“ gali paleisti GPT -5 bet kurią minutę – ko tikėtis

Kaip veikia „Claude Opus 4.1“?

Vienas iš įspūdingiausių „Claude Opus 4“ naudojimo atvejų buvo jo našumas „SWE-Bench“ patikrintame, žmogaus filtruojamame SWE-Bench pogrupyje, etalone, kuris įvertina LLMS sugebėjimus išspręsti realaus pasaulio programinės įrangos inžinerijos užduotis, gautas iš „Github“. „Claude Opus 4“ pasirodymas „SWE-Bench“ patikrintame patvirtino teiginį, kad tai buvo „geriausias kodavimo modelis pasaulyje“. Kaip matyti aukščiau esančiame įraše, „Opus 4.1“ buvo dar aukštesnis.

„Claude Opus 4.1“ taip pat nuėmė ankstesnius savo modelius per etaloninę lentą, įskaitant MMMLU, kuris išbando daugiakalbes galimybes; „Aime 2025“, kuris bando griežtinti vidurinės mokyklos rungtynių varžybų klausimus; „GPQA“, kuris išbando rezultatus pagal absolventų lygio samprotavimus; Ir dar daugiau. Prisijunęs prie konkurentų samprotavimų modelių, įskaitant „Openai O3“ ir „Gemini 2.5 Pro“, jis pralenkia juos įvairiuose etalonuose, įskaitant patikrintą SWE-Bench.

Antropinė Claude

Antropinis

Išleidus leidimą, „Anthropic“ taip pat paskelbė savo sistemos kortelę, kurioje apibrėžiami visi saugos vertinimai ir vertinimai, kuriuos ji atliko pagal modelį, taip pat savo silpnybes, riziką ir apribojimus. Greita 22 puslapių dokumento apžvalga rodo, kad modelis buvo naudojamas naudojant AI saugos lygio 3 (ASL-3) standartą pagal atsakingą „Anthropic“ mastelio keitimo politiką (RSP) ir vis dar yra linkęs į daugumą tų pačių pažeidžiamumų.

Kaip galite pasiekti „Claude Opus 4.1“?

Jei norite išbandyti modelį patys, dabar jis prieinamas visiems per mokamus Claude'o planus, kuriuose yra „Claude Pro“ už 20 USD per mėnesį, o Claude Max – už 100 USD per mėnesį. Tai galima įsigyti „Claude Code“, „API“, „Amazon Bedrock“ ir „Google Cloud“ viršūnių AI.

Kiekvieną dieną gautuosius gautuosius gaukite gautuosiuose „Tech Today“ informacinis biuletenis.

Nuoroda į informacijos šaltinį

Jums tai gali patikti

Daugiau iš autoriaus