Sekite ZDNET: Pridėkite mus kaip pageidaujamą šaltinį „Google“.
Pagrindiniai ZDNET pasiūlymai
- MIT paskelbė geriausių AI agentų ir jų funkcijų sąrašą.
- Didžiausia dalis skirta įmonės darbo eigoms.
- Tyrimai ir informacijos sintezė yra populiariausias naudojimo atvejis.
Kurie autonominiai ar pusiau autonominiai agentai šiais laikais daro didžiausią įtaką pasauliui ir galbūt jūsų darbui? Tam tikri agentai pastaruoju metu skleidžia visas antraštes, tačiau kūrėjams ir naudotojams yra keletas konkrečioms funkcijoms skirtų agentų.
MIT CSAIL – universiteto laboratorija, skirta dirbtinio intelekto tyrimams – siekė nustatyti ir dokumentuoti šių agentų pagrindą ir galimybes, o išvados išsamiai aprašytos naujausiame AI agentų indekse. Tyrėjai atliko ekosistemos masto naujausių AI agentų analizę iš 1350 duomenų taškų.
Taip pat: DI agentai yra greiti, laisvi ir nekontroliuojami, teigia MIT tyrimas
Kokia yra pirmaujančių agentų funkcionalumas ir kilmė? Tyrėjai išsiaiškino, kad sąsajų yra gausiausia, o toliau seka įmonės darbo eigos platformos. Jie taip pat atskleidė rizikas, kurias dalijasi šie agentai, kaip ištyrė mano ZDNET kolega Tiernan Ray.
MIT indekse esantys agentai yra šie:
- Antropinis Klodas / Klodo kodas
- Google Gemini / Gemini CLI
- Manus AI
- OpenAI ChatGPT / ChatGPT agentas / Codex / AgentKit
- Sumišimas
- „Alibaba MobileAgent“.
- ByteDance agentas TARS
- Sumaišties kometa
- IBM Watsonx orkestras
- „Microsoft 365 Copilot“.
- SAP Joule studija
- „Salesforce Agentforce“.
- ServiceNow AI agentai
Čia yra trys pagrindinės tyrėjų nustatytos agentų kategorijos:
Įmonės darbo eigos agentai (13 sistemų iš 30 sistemų): Tai platformos su agentinėmis funkcijomis, skirtomis verslo užduočių automatizavimui. Pavyzdžiui, Microsoft 365 Copilot ir ServiceNow Agent.
Pokalbių programos su agento įrankiais (12 sistemų): Pasak mokslininkų, ši kategorija visų pirma apima pokalbių sąsajas su plačia prieiga prie įrankių. Pavyzdžiai apima bendrosios paskirties kodavimo priemones, pvz., „Claude Code“, taip pat agentus, įterptus į platesnius produktus, tokius kaip „Manus AI“ ir „ChatGPT Agent“.
Taip pat: leidau „Chrome“ AI agentui apsipirkti, tyrinėti ir siųsti el. paštus už mane – štai kaip viskas vyko
Naršyklėmis pagrįsti agentai (5 sistemos): Tai yra agentai, kurių pagrindinė sąsaja yra naršyklės arba kompiuterio naudojimas, su plačiais naršyklės / kompiuterio sąveikos įrankiais. „Jie skiriasi nuo pokalbių agentų, turinčių žiniatinklio paieškos galimybes – „ChatGPT“ žiniatinklio paieška, „Claude“ žiniatinklio paieška, kurios pirmiausia atlieka paiešką ir apibendrinimą“, – teigia mokslininkai. „Naršyklėmis pagrįsti agentai kelia didesnę riziką dėl foninio vykdymo, įvykių suaktyvinimo ir tiesioginių operacijų. Pavyzdžiui, „Perplexity Comet“, „ChatGPT Atlas“, „ByteDance Agent TARS“.
Kokie yra populiariausi AI agentų naudojimo būdai?
Populiariausi AI agentų naudojimo atvejai, apimantys aukščiau nurodytas kategorijas, apima tyrimus ir informacijos sintezę, kaip matyti iš 12 iš 30 aptartų agentų, apimančių ir vartotojų pokalbių asistentus, ir įmonių platformas. Už šios funkcijos yra darbo eigos automatizavimas visose verslo funkcijose, pvz., HR, pardavimas, palaikymas ir IT, kurį įgalina 11 agentų, daugiausia randamų įmonės produktuose. Agentai, orientuoti į GUI arba naršyklės galimybes, naudojami tokioms užduotims kaip formos, užsakymas ir rezervavimas, yra septyniuose modeliuose.
Taip pat: 6 priežastys, kodėl autonominės įmonės vis dar yra labiau vizija nei realybė
Mokslininkai nustatė, kad autonomijos lygiai labai skiriasi. Pirmieji pokalbių padėjėjai išlaiko mažiausią autonomijos lygį. Jie yra pagrįsti eilėmis pagrįsta sąveika ir apima Anthropic Claude, Google Gemini ir OpenAI ChatGPT, kurie „vykdo vieną veiksmų rinkinį ir laukia kito vartotojo raginimo“.
Aukštesnės autonomijos atveju naršyklės agentai siūlo daugiau „ribotų galimybių įsikišti į vidurį“. Tai apima „Perplexity's Comet“, kuri, paraginta, atlieka užduotis savarankiškai. „Kai užklausa siunčiama, vartotojai negali lengvai įsikišti ar valdyti agento, kol jis nebus baigtas.
Įmonių platformos yra padalintos, kai kalbama apie agento savarankiškumą. „Projektavimo etape vartotojai rankiniu būdu konfigūruoja paleidiklius, veiksmus ir apsauginius turėklus, naudodami vaizdines drobes“, – rašė mokslininkai. Kiti gali pasiūlyti AI pagalbą atliekant šį procesą. Įdiegti šie agentai dažnai veikia aukštesniu autonomijos lygiu, „sukelia tokius įvykius kaip naujas el. laiškas arba duomenų bazės pasikeitimas, be jokio žmogaus įsikišimo vykdant užduotį“. Tokie agentai yra „Glean“, „Google Gemini Enterprise“, „IBM watsonx“, „Microsoft 365 Copilot“, „n8n“ ir „OpenAI AgentKit“.
Taip pat: „Google Workspace“ dabar leidžia kurti AI agentus, kad automatizuotų savo darbą – kaip pradėti
Kai kurie pasiūlymai yra laikomi kūrėjo / komandų eilutės sąsajos (CLI) agentais, kuriems reikalingas aiškus patvirtinimas, kai atliekamos jautrios operacijos, pvz., failų redagavimas ir komandų vykdymas. Kai kurie agentai siūlo „žiūrėjimo režimą“, kad realiuoju laiku galėtų stebėti svarbiausius veiksmus, įskaitant „ChatGPT Agent/Atlas“ ir „Opera Neon“.
Tyrime taip pat nustatyta, kad agentų kūrėjai yra susitelkę JAV ir Kinijoje, o kituose regionuose atstovaujama nedaug.