Kūrėjų kliūtys, sumažintos, kai „Openai“ supaprastina AI agento kūrimą

Estimated read time 8 min read

Neseniai „Openai“ išleido naujų kūrėjų įrankių rinkinį, kurio tikslas – lengviau sukurti AI agentus, kurie galėtų autonomiškai atlikti sudėtingas užduotis. Paskelbta praėjusią savaitę, atnaujinime pristatomi „Responses API“, atvirojo kodo agentai SDK ir integruoti įrankiai interneto paieškai, failų paieškai ir kompiuterio valdymui-visa tai skirta supaprastinti, kaip AI sistemos sąveikauja su realaus pasaulio informacija ir programomis.

„Openai“ apibūdina šiuos agentus kaip „sistemas, kurios savarankiškai atlieka užduotis vartotojų vardu“, tai reiškia, kad jie gali vykdyti kelių žingsnių procesus, pavyzdžiui, temos tyrimą ar duomenų bazės atnaujinimą-su minimaliomis žmogaus nurodymais. Bendrovės tikslas yra sumažinti kliūtį kūrėjams ir įmonėms diegti galingus AI varomus padėjėjus ir taip išplėsti prieinamumą iki pažangių AI galimybių.

Atsakymų API: supaprastinanti agento sąveiką

„Openai“ pranešimo centre yra naujos „Responses“ API, kuri yra vieninga sąsaja kuriant AI agentus. Ši API sujungia „Openai“ pokalbių užpildymo API pokalbio sugebėjimus su ankstesnių API įrankių naudojimo funkcijomis. Praktiškai tai reiškia, kad vienas API skambutis dabar gali atlikti sudėtingas, kelių žingsnių užduotis, kurios gali būti susijusios su įvairių įrankių ar žinių šaltinių skambučiu.

„Openai“ sako, kad atsakymų API buvo sukurta siekiant supaprastinti agento plėtrą, sumažinant pasirinktinio kodo poreikį ir paskatinti sustiprinti. „Atsakymų API skirta kūrėjams, norintiems lengvai sujungti„ Openai “modelius ir įmontuotus įrankius į savo programas, be sudėtingumo integruoti kelis API ar išorinius pardavėjus“. Bendrovė savo pranešimo tinklaraščio įraše paaiškino. Anksčiau kūrėjams dažnai teko organizuoti kelis API skambučius ir rengti rengiamus raginimus, kad AI agentas galėtų padaryti ką nors naudingo, o tai buvo sudėtinga ir reikalaujanti daug laiko. Naudodamiesi nauja API, agentas, pavyzdžiui, gali užmegzti pokalbį su vartotoju, ieškoti informacijos per interneto paiešką, tada parašyti suvestinę – visa tai per vieną darbo eigą.

Pažymėtina, kad atsakymų API visiems kūrėjams prieinama be jokių papildomų išlaidų, viršijančių standartinius naudojimo mokesčius. Jis taip pat yra suderinamas su atgal: „Openai“ patvirtino, kad ji ir toliau palaikys savo populiarių pokalbių užpildymo API, kad būtų galima paprastiems naudojimo atvejams, o „Senesni asistentų API“ bus palaipsniui panaikinta iki 2026 m. Vidurio, nes jos funkcijos bus sulankstytos į atsakymų API.

Atvirojo kodo agentai SDK SPREELINES WARKFLOW ORCHESTACIJA

Paleidime taip pat yra agentų SDK, įrankių rinkinys, skirtas valdyti vieno ar net kelių sąveikaujančių AI agentų darbo eigas. Ryškiai, „Openai“ padarė šį SDK atvirojo kodo, leisdamas kūrėjams ir įmonėms apžiūrėti kodą ir net integruoti ne openai modelius į savo agentų sistemas. Šis lankstumas reiškia, kad įmonė galėtų koordinuoti agentą, kuris naudoja „Openai“ GPT-4 kartu su kitu agentu, kurį varo kitoks AI modelis, visi toje pačioje sistemoje.

Agentai SDK yra orientuotas į darbo eigos orkestravimą – iš esmės seka, ką daro agentas ir kaip jis atiduoda užduotis. Jame yra įmontuoti tokių dalykų, kaip:

  • Konfigūruojami agentai: AI agentų nustatymas su iš anksto nustatytais vaidmenimis ar instrukcijomis konkrečioms užduotims.
  • Protingi perdavimai: Užduočių perdavimas tarp kelių agentų ar procesų, atsižvelgiant į kontekstą (pavyzdžiui, vienas agentas renka duomenis, tada kitas agentas juos analizuoja).
  • Apsaugos apsaugos priemonės: apsaugos priemonės: užtikrinant, kad agentas nesikiša į tam tikras ribas, su įvesties patvirtinimu ir turinio moderavimo įrankiais, kad būtų išvengta nepageidaujamų išėjimų.
  • Sekimas ir stebėjimas: Agento veiksmų stebėjimo ir derinimo įrankiai žingsnis po žingsnio, o tai padeda kūrėjams suprasti sprendimus ir pagerinti našumą.

Anot „Openai“, šis įrankių rinkinys gali supaprastinti sudėtingus naudojimo atvejus, tokius kaip klientų aptarnavimo robotai, kelių žingsnių tyrimų padėjėjai, turinio generavimo darbo eigos, kodų peržiūros agentai ar pardavimo žvalgybos automatizavimas. Atvirai pateikdamas SDK, „Openai“ taip pat skatina bendruomenės indėlį ir priėmimą įmonių aplinkoje, kur dažnai svarbu skaidrumas ir galimybė savarankiškai šeimininkams. Ankstyvieji įvaikintojai, įskaitant tokias įmones kaip „Coinbase“ ir „Box“, jau eksperimentavo su agentais SDK, kad sukurtų AI varomus tyrimų ir duomenų gavimo įrankius.

Integruoti įrankiai padidina AI funkcionalumą

Kad AI agentai būtų funkcionalesni, „Openai“ atsakymai API pateikiami su trimis įmontuotais įrankiais, jungiančiais AI prie išorės duomenų ir veiksmų. Šios priemonės žymiai išplečia tai, ką gali padaryti agentas, pereinant ne tik generuojant tekstą.

Integruotos priemonės, kurias galima paleisti, yra:

  • Žiniatinklio paieška: Leidžia AI agentui atlikti realiojo laiko paiešką ir gauti naujausią informaciją, pateiktą su cituojamais šaltiniais. Tai reiškia, kad agentas gali atsakyti į klausimus naudodamas naujausias naujienas ar faktus iš interneto ir pateikti skaidrumo nuorodas. Šis įrankis yra naudingas kuriant agentus, tokius kaip tyrimų padėjėjai, apsipirkimo vadovai ar kelionių planuotojai, kuriems reikalinga gyva informacija.
  • Failo paieška: Leiskite agentui greitai išsijoti per dideles dokumentų ar duomenų, kuriuos pateikė kūrėjas, kolekcijas, norėdamas rasti svarbią informaciją. Tai iš esmės yra privačių žinių bazės užklausos įrankis – agentas galėtų jį panaudoti atsakydamas į klientų aptarnavimo klausimus, ieškodamas politikos dokumentų arba padedant atlikti teisinius tyrimus iš failų bibliotekos ištraukų. Šį įrankį galima panaudoti scenarijuose, tokiuose kaip klientų aptarnavimo robotai ar vidiniai įmonės padėjėjai, kuriems reikia nurodyti patentuotą informaciją.
  • Kompiuterio naudojimas: Nauja galimybė (šiuo metu atliekama tyrimų peržiūra), leidžianti AI agentui atlikti veiksmus kompiuteryje, tarsi tai būtų mašinoje valdantis žmogus. Šis įrankis, kurį maitina „Openai“ kompiuterių naudojimo agento (CUA) modelis, AI ketinimai paverčia klaviatūros ir pelės veiksmus, kad būtų galima naršyti programinę įrangą, svetaines ar kitas skaitmenines sąsajas. Iš esmės tai leidžia automatizuoti užduotis, kurios neturi lengvos API – pavyzdžiui, įvesti duomenis į seną sistemą, spustelėti žiniatinklio programą, skirtą testavimui, arba patikrinti informaciją apie grafinę sąsają.

Integruodami šias priemones, AI agentai gali ne tik apgalvoti problemą, bet ir veikti – ar tai reiškia informacijos paiešką, konkrečių duomenų gavimą ar manipuliavimą skaitmenine aplinka. Tai labai išplečia agento funkcionalumą ir daro jį daug naudingiau realaus pasaulio programoms.

„Openai“ įsivaizduoja, kad kūrėjai sujungs šias priemones pagal poreikį; Pvz., Agentas gali naudotis žiniatinklio paieška viešai informacijai rinkti ir paieškos paieškai, kad patrauktų vidinius duomenis, tada naudokite šias kombinuotas žinias, kad parengtų ataskaitą arba vykdytų užduotį. Visa tai gali būti organizuojama per atsakymų API vieningai, o ne reikalauti atskirų paslaugų ar rankinės integracijos.

Platesnis PG priėmimo ir prieinamumo padarinys

Analitikai sako, kad šis paleidimas galėtų paspartinti AI agentų priėmimą įvairiose pramonės šakose, sumažindami technines kliūtis. Verslui šių naujų įrankių patrauklumas yra galimybė automatizuoti ir mastelio procesus be plataus pasirinktinio vystymosi.

Įprastinės užduotys, tokios kaip informacijos gavimas, formų apdorojimas ar duomenų įvedimas, kuriam gali reikėti reikšmingų kodavimo ar kelių programinės įrangos sistemų, dabar gali būti naudojami AI agentai, naudojant „Openai“ statybinius blokus. Pavyzdžiui, įmontuotos paieškos įrankiai leidžia įmonėms beveik akimirksniu prijungti AI prie savo žinių duomenų bazių ar žiniatinklio, o kompiuterio naudojimo įrankis siūlo būdą, kaip sąsają su senomis programomis, kurios neturi API. Tuo tarpu Agentų SDK atvirojo kodo pobūdis suteikia įmonėms daugiau kontrolės, leisdama jiems integruoti šiuos AI agentus į savo esamą infrastruktūrą ir netgi naudoti skirtingus AI modelius, jei reikia.

„Openai“ žingsnis yra platesnių lenktynių, leidžiančių įgalinti kūrėjus, turinčius agentų kūrimo galimybes, dalis. Konkuruojančios technologijų firmos ir startuoliai išleido savo AI agentų platformas, o „Openai“ išsamus įrankių rinkinys gali padėti jam išsiskirti. Tiesą sakant, laikas ateina dėl susidomėjimo autonominių AI agentų visame pasaulyje – pavyzdžiui, Kinijos startuolis Monika neseniai patraukė dėmesį su savo agentu Manusu, tvirtindama, kad tam tikrose užduotyse tai gali aplenkti paties „Openai“ prototipą. Atrodo, kad „Openai“ reaguoja į konkurencinį spaudimą, o siūlo įmontuotus įrankius ir siūlydamas įmontuotus įrankius, taip pat skatina platesnį AI pritaikymą.

Prieinamumo požiūriu šios priemonės galėtų demokratizuoti, kas gali sukurti pažangias AI sistemas. Mažesnės įmonės ir net atskiri kūrėjai dabar gali manyti, kad įmanoma sukurti AI varomą asistentą ar darbo eigą, nereikia didelės tyrimų komandos. Integruotas požiūris (kai vienas API skambutis gali atlikti kelis veiksmus) ir galimybė gauti „Openai“ dokumentacijos pavyzdžių prieinamumą sumažinti naujokų įvesties barjerą. „Openai“ taip pat teikia stebėjimo sąsają, skirtą kūrėjams atsekti ir apžiūrėti, ką agentas daro, o tai yra labai svarbi derinimo ir pasitikėjimo AI išvesties kūrimui. Tikimasi, kad šis dėmesys pritaikomumui ir saugai (su apsauginiais turėklais ir stebėjimu) paskatins daugiau įmonių eksperimentuoti su AI agentais, žinodami, kad jie turi priežiūrą ir valdymą.

PG agentai gali tapti tokie pat įprasti ir būtini, kaip ir interneto veikla. Naujausi „Openai“ įrankiai, padaryti agentų plėtrą labiau prieinamą, galėtų padėti šią viziją paversti realybe, suteikiant daug platesnei kūrėjų ir organizacijų bendruomenei kurti savo agentus.


Source link

Jums tai gali patikti

Daugiau iš autoriaus