Agentų kūrimas su „Claude Agent SDK“

„Claude Agent SDK“ – tai dirbtinio intelekto (DI) bendrovės „Anthropic“ sukurtas agentų kūrimo programinės įrangos rinkinys, leidžiantis kurti pažangius DI agentus, veikiančius „Claude Code“ pagrindu.

Praėjusiais metais „Anthropic“ pasidalijo įžvalgomis, kaip kurti veiksmingus agentus. Nuo to laiko bendrovė pristatė „Claude Code“ – agentinį programavimo sprendimą, iš pradžių sukurtą savo vidinėms reikmėms, siekiant padidinti kūrėjų produktyvumą.

Per pastaruosius kelis mėnesius „Claude Code“ tapo gerokai daugiau nei vien programavimo įrankiu. „Anthropic“ viduje jis naudojamas išsamiems tyrimams, vaizdo įrašų kūrimui, užrašų vedimui ir daugeliui kitų užduočių, nesusijusių su programavimu.

Kitaip tariant, agentų karkasas, kuriuo remiasi „Claude Code“ (t. y. „Claude Code SDK“), gali būti taikomas ir daugeliui kitų agentų tipų. Siekdama atspindėti šią platesnę viziją, DI bendrovė jį pervadino į „Claude Agent SDK“.

Savo naujame straipsnyje „Anthropic“ teigia: „Parodysime, kaip kurti savo agentus naudodamiesi mūsų SDK.“ Tačiau pats straipsnis labiau primena trumpą disertaciją nei praktinį vadovą – keli pagrindiniai principai, kelios paprastos schemos ir prielaida, kad skaitytojai visą dieną sėdi „Bash“ terminaluose.

Perskaičius susidaro įspūdis, tarsi būtum gavęs dėžę preciziškai išdailintų detalių, bet be surinkimo instrukcijos. Nebent esate programuotojas, jau dirbantis su „Claude Code“. Nesakau, kad idėjos nepagrįstos: prieigos prie kompiuterio suteikimas, agentinio ciklo kūrimas, rezultatų tikrinimas – tai tvirti principai, tačiau man asmeniškai trūksta „įvažiavimo“.

Čia pasitelkiu eismo sistemos metaforą. „Anthropic“ rašo: „aptarsime, nuo ko pradėti“ – bet kur rasti praktinį vadovą, paprasčiausią veikiantį pavyzdį ar pirmuosius žingsnius naujokams? Agentų kūrimas apima darbo eigos projektavimą, o ne vien programų inžineriją.

Pabandykime tai paversti apčiuopiamu procesu: apibrėžkime vaidmenis, surinkime duomenis, laikykimės veiksmų sekos, atlikime patikras. Galiausiai (tikėkimės) DI agentus matysime ne kaip blizgančius naujus žaislus, o kaip realiai įgyvendinamas darbo eigas, kurias galima paleisti ir naudoti.

Prieš pateikdamas daugiau kritikos, pasistengsiu išlikti kuo objektyvesnis. „Anthropic“ iš tiesų paaiškina esminius dalykus – kaip agentai dirba, kokius įrankius jie naudoja ir kaip tikrina savo darbą. Bendrovė pateikia aiškų agento mąstymo modelį ir kelias veiksmingas idėjas, kurias turėtų žinoti kiekvienas, kuriantis DI sistemas.
Tačiau klausimas išlieka: kaip „Anthropic“ agentų koncepciją išversti į žmonėms suprantamus terminus – tokius, kuriais galėtų naudotis bet kuri Lietuvos įmonė?

Ką paaiškina „Anthropic“

Reikia pripažinti – „Anthropic“ pateikia aiškią sistemą, kaip DI agentas turėtų mąstyti ir veikti. Tai apgalvotos ir nuoseklios idėjos, atitinkančios tai, ką turi suprasti DI sistemų kūrėjai.

„Anthropic“ pradeda nuo architektūros: „Pagrindinis „Claude Code“ projektavimo principas – suteikti „Claude“ tuos pačius įrankius, kuriais kasdien naudojasi programuotojai.“ Ši viena eilutė puikiai apibendrina „Claude Agent SDK“ esmę – suteikti DI modeliui kompiuterį, kad jis galėtų dirbti kaip žmogus. Modelis turi gebėti rasti reikiamus failus kodo bazėje, rašyti ir redaguoti juos, tikrinti kodo kokybę (angl. linting), vykdyti, derinti ir taisyti kodą bei, kai reikia, kartoti šiuos veiksmus tol, kol viskas veiks tinkamai.

„Anthropic“ teigia, kad būtent tai leido „Claude“ tapti veiksmingu ir už programavimo ribų. Suteikus jam galimybę vykdyti „Bash“ komandas, redaguoti, kurti ir ieškoti failų, „Claude“ gali skaityti CSV failus, naršyti internete, kurti vizualines priemones, interpretuoti rodiklius ir atlikti daugybę kitų skaitmeninių užduočių – trumpai tariant, veikti kaip universalus agentas, turintis prieigą prie kompiuterio.

Jie taip pat apibrėžia agentinį ciklą – supaprastintą DI agento darbo procesą: surinkti kontekstą → atlikti veiksmą → patikrinti rezultatą → kartoti.
Tai naudingas būdas mąstyti apie kitus agentus ir apie tai, kokių gebėjimų jiems reikia suteikti. Kitaip tariant, SDK nustato aiškų ciklą: surinkti tinkamą kontekstą, pasitelkiant įrankius atlikti veiksmus ir prieš tęsiant – patikrinti rezultatus.

DI agentas turi gebėti savarankiškai surinkti ir atnaujinti savo kontekstą. „Anthropic“ siūlo pradėti nuo paprasto sprendimo – naudoti failų sistemą kaip paieškai pritaikytą atmintį.
„Kai „Claude“ susiduria su dideliais failais – pavyzdžiui, žurnalais ar naudotojų įkeltais dokumentais – jis pats nusprendžia, kaip juos įkelti į savo kontekstą, naudodamas „Bash“ scenarijus, tokius kaip grep ar tail. Iš esmės agento aplankų ir failų struktūra tampa tam tikra konteksto inžinerijos forma“, – teigia „Anthropic“.
Tai, ką jie vadina agentine paieška, reiškia suteikti agentui galimybę tiesiogiai naršyti aplankus ar žurnalus dar prieš pereinant prie semantinės paieškos, kuri veikia greičiau, bet yra mažiau tiksli.

Didelėms užduotims „Anthropic“ siūlo kurti pagalbinius agentus – mažesnės apimties darbininkus, turinčius savo konteksto langus ir galinčius lygiagrečiai analizuoti medžiagą bei grąžinti svarbiausią informaciją.
„Pagalbiniai agentai naudoja atskirus konteksto langus ir perduoda tik aktualią informaciją koordinuojančiam agentui, o ne visą kontekstą. Dėl to jie ypač tinka užduotims, kurioms reikia peržiūrėti didelius informacijos kiekius, kai didžioji dalis duomenų nėra naudinga“, – rašo „Anthropic“.

Surinkęs kontekstą, agentas turi gebėti imtis veiksmų, naudodamasis įrankiais. Svarbu šiuos įrankius kurti apgalvotai, kad būtų kuo efektyviau panaudojamas kontekstas. Įrankiais turėtų būti laikomi pagrindiniai veiksmai, kuriuos norite, kad agentas galėtų atlikti.

„Claude Code SDK“ suteikia įvairius agentų veikimo būdus: įrankius – kaip pagrindinius veiksmus, „Bash“ – lanksčiai automatizacijai, kodo generavimą – tikslumui užtikrinti, o MCP integracijas – jungimuisi prie tokių paslaugų kaip „Drive“ ar „Slack“, nereikalaujant iš naujo kurti autentifikavimo.

Agentinis ciklas galiausiai užsibaigia patikros etapu. Agentai, gebantys patys tikrinti ir tobulinti savo rezultatus, yra iš esmės patikimesni – jie anksti pastebi klaidas, kol šios dar nesukelia didesnių problemų ar nepersikelia į vėlesnius etapus, savarankiškai pasitaiso, kai nukrypsta nuo tikslo, ir tobulėja su kiekvienu pakartojimu.

„Anthropic“ pateikia aiškius metodus: išvesties taisyklių apibrėžimą ir kodo kokybės tikrinimą (angl. linting) tikslumui užtikrinti, ekrano nuotraukas ar atvaizdus – vizualiam grįžtamajam ryšiui, o prireikus – DKM pasitelkimą vertinimui, tikrinant toną ar kitus subtilesnius kriterijus. Žinutė paprasta: agentai turėtų gebėti patys patikrinti savo darbą.

Apibendrinus šias idėjas, susiformuoja aiškus agento mąstymo modelis: suteikite agentui kompiuterį, jo veiksmų struktūrą įgyvendinkite kaip ciklą, leiskite jam pačiam valdyti savo kontekstą ir išmokykite jį tikrinti savo darbo rezultatus. Tai tvirtas DI agentų kūrimo pagrindas – nors vis dar trūksta aiškių žingsnių, parodančių, kaip visa tai pritaikyti praktiškai.

Naujų tipų agentų kūrimas

Aptarusi agentinio ciklo ir įrankių veikimą, „Anthropic“ praplečia savo požiūrį: „Tikime, kad suteikus „Claude“ prieigą prie kompiuterio atsiveria galimybė kurti naujų tipų agentus, kurių ankstesnės versijos nebuvo tokios veiksmingos.“
Kitaip tariant, kai DI modelis geba skaityti ir įrašyti failus bei vykdyti programas, jis vis labiau tampa panašus į skaitmeninį kolegą.

Įraše pateikiami keturi pavyzdžiai, parodantys, kokios galimybės atsiveria kuriant DI agentus su „Claude Agent SDK“:

Finansų agentai, gebantys suprasti investicinį portfelį, vertinti investicijas, pasiekti duomenis per išorinius API ir atlikti skaičiavimus.
Asmeniniai pagalbininkai, galintys planuoti susitikimus ar rengti santraukas, jungdamiesi prie vidinių duomenų šaltinių, pvz., kalendorių ar užrašų.
Klientų aptarnavimo agentai, galintys tvarkyti vartotojų užklausas, rinkti ir analizuoti duomenis, siųsti atsakymus klientams ir, kai reikia, perduoti užduotis žmonėms.
Tyrimų agentai, gebantys naršyti dokumentų rinkinius, analizuoti ir apibendrinti duomenis bei rengti išsamias ataskaitas.

Kiekvienas iš šių pavyzdžių susijęs ne tiek su programavimu, kiek su darbo eigos pritaikymu – pažįstamų procesų pavertimu į etapus, kuriuos DI agentas gali atlikti.
Esmė ta, kad „Anthropic“ nepateikia paruoštų naudoti agentinių sistemų. SDK suteikia tik kūrimo blokus – o pačių agentų darbo eigą reikia projektuoti patiems.

Ko „Anthropic“ nepaaiškina

Nors „Anthropic“ pateikia aiškią ir logišką struktūrą, pasakojimas nutrūksta ties antrašte „Kaip pradėti“. Bendrovė paaiškina, ką gali „Claude Agent SDK“, bet neparodo, kaip žengti pirmuosius žingsnius. Jų pažadas – „parodysime, nuo ko pradėti ir pasidalysime geriausiomis praktikomis“ – taip ir lieka neišpildytas.

Nėra jokio „Sveikas, pasauli!“ pavyzdžio, jokios minimalios konfigūracijos ir jokių aiškių rodiklių, leidžiančių suprasti, kad DI agentas iš tikrųjų veikia. Vietoje to skaitytojui pateikiamos tik abstrakčios idėjos ir elegantiškas ciklas.
Tai galbūt netrukdo kūrėjams, jau dirbantiems „Anthropic“ SDK aplinkoje, tačiau neatveria durų kitiems besidomintiems, kurie dar nėra patyrę „Claude“ programišiai.

„Anthropic“ daro prielaidą, kad skaitytojai turi aukštą techninį raštingumą – tokį, kokio daugelis darbo eigos projektuotojų, analitikų ar vadovų paprasčiausiai neturi ir neturėtų turėti vien tam, kad sukurtų bazinį agento prototipą.

Akivaizdžiai trūksta darbo eigos struktūros. Nėra gairių, kaip apibrėžti agentų vaidmenis, perduoti jiems užduotis ar nustatyti patikros etapus – kitaip tariant, trūksta žmogiškosios infrastruktūros, kuri realiame pasaulyje leistų DI agentui tapti patikimu kolega.
Saugos priemonės paminimos, bet nepateikiamos. Ir nors straipsnyje užsimenama apie programinį vertinimą, jame nėra nei testų rinkinio, nei metodikos, kuri vertinimą paverstų pakartojamu procesu.

Neabejoju, kad „Anthropic“ agentų kūrimo technologijos yra aukščiausio lygio. Tačiau perskaičius straipsnį atsiveria komunikacijos spraga. „Anthropic“ kreipiasi tik į tik į kūrėjus, kurie jau dirba su SDK, tačiau dabar reikia specialistų, gebančių projektuoti išmanias darbo eigas – žmonių, suprantančių realius darbo procesus, o ne vienos ar kitos programavimo kalbos sintaksę. Šios spragos užpildymas – tai žingsnis, kuris padės šias technologijas perkelti iš teorijos į praktiką.

Agentų kūrimas su „Claude Agent SDK“

Ką paaiškina „Anthropic“

Naujų tipų agentų kūrimas

Ko „Anthropic“ nepaaiškina

DI agentai be iliuzijų: trijų lygmenų architektūra verslo procesams

Naujasis „Opus 4.7“ modelis ir kodėl „Anthropic“ DI įrankiai užtikrins jūsų verslo konkurencinį pranašumą

Kodėl Jūsų finansų komanda vis dar moka rankinio darbo mokestį – ir kaip tai pakeisti