Naujasis „Opus 4.7“ modelis ir kodėl „Anthropic“ DI įrankiai užtikrins jūsų verslo konkurencinį pranašumą

Vilniaus statybų bendrovės finansų vadovė trečiadienio popietę atidaro „ChatGPT“. Ji įklijuoja tris tiekėjų PDF failus ir nurodo išgauti PVM kodus, mokėjimo terminus ir netesybų sąlygas. Tai užtrunka 90 sekundžių. Šį ketvirtį ji tai atliko maždaug keturiasdešimt kartų. Apskaitoje šios 90 sekundžių kasmet virsta keliais šimtais valandų, kurių nebereikia švaistyti rankinei patikrai.

Kita vertus, finansų vadovė niekada neišbandė bendrovės „Anthropic“ sprendimo „Claude“. Savo „Google“ paskyroje ji niekada nesinaudojo „Gemini“. „Mistral“ jai tėra Prancūzijos pietų vėją primenanti frazė. Statybų bendrovė už „ChatGPT Plus“ prenumeratą moka 23 eurus per mėnesį. Prenumerata iš direktorės asmeninės paskyros į bendrovės kasdienybę įaugo taip nejučiomis, lyg iš namų atnešti kavos puodeliai, tyliai nusėdantys ant kolegų stalų. Niekas to nepatvirtino. Niekas neįvertino alternatyvų. Ir neįvertins – nebent kas nors suges ar nustos veikti.

Tai nėra pirkimų proceso klaida. Būtent taip iš tikrųjų atrodo DI diegimas daugelyje Lietuvos įmonių. Užuot priėmusios strateginį sprendimą ar samdžiusios DI konsultantą, įmonės DI įrankius tiesiog paveldi iš darbuotojų asmeninių paskyrų. Natūraliai, be jokio formalaus perdavimo akto ar pirkimo procedūros. 2026 metais šio dėsningumo kaina ima ryškėti.

Dirbtinio intelekto rinkoje šiuo metu aktualios trys bendrovės: „OpenAI“, „Anthropic“ ir „Google“. Jų vizijos iš esmės skiriasi. Dėl trijų dalykų kiekviena jų turi skirtingą strategiją: kiek DI kainuos, kaip bus valdomas jo mastas ir kas šio dešimtmečio pabaigoje išliks rinkoje.

„OpenAI“ renkasi brutalaus masto strategiją. Kertinis elementas – „Stargate“ programa: duomenų centrų tinklas, kurio viešai skelbiamas biudžetas iki 2030 metų siekia 500 milijardų dolerių. Projekto įgyvendinimas toli gražu nebuvo sklandus. Balandį buvo sustabdytas JK duomenų centro projektas, nes britų elektros kainos ir autorių teisių įstatymai jį pavertė finansiškai nepagrįstu. Šių metų pradžioje nutekintos vidinės prognozės rodo 14 milijardų dolerių nuostolį. Pranešama, kad modelio veikimo kaštai išaugo keturis kartus. „Sora“ – pagrindinė vaizdo generavimo platforma – kovo mėnesį buvo netikėtai uždaryta, o jos skaičiavimo pajėgumai nukreipti į „GPT-5.4“ modelį ir naują robotikos iniciatyvą. S. Altmanas aktyviai ruošiasi pirminiam viešam akcijų siūlymui (IPO) iki ketvirtojo ketvirčio, tačiau „OpenAI“ finansų vadovė kolegoms pripažino, kad įmonė tam nepasirengusi. Daugelis Lietuvos įmonių šiuo metu nuomojasi analitinius pajėgumus būtent iš šios įmonės – net neįvertinusios nė vienos alternatyvos.

„Anthropic“ pasirinko priešingą strategiją.  Užuot valdžiusi nuosavą duomenų centrą, bendrovė vienu metu nuomojasi pajėgumus iš trijų tiekėjų: „Amazon Trainium“ lustų, „Google TPU“ ir „Nvidia GPU“ per „Microsoft Azure“. Pagal 50 milijardų dolerių sutarties sąlygas, specializuota debesijos paslaugų teikėja „Fluidstack“ šiemet aktyvuos specialiai „Anthropic“ sukurtus skaičiavimo pajėgumus Teksase ir Niujorke. „Anthropic“ jau pradėjo kurti nuosavą procesorių architektūrą – projektas yra ankstyvoje stadijoje. Trumpalaikė kaina reali: paklausa pralenkė aparatinės įrangos pajėgumus, o balandį įvyko mažiausiai septyni paslaugų trikdžiai, įskaitant tris valandas trukusius paslaugų tiekimo pertrūkius pasauliniu mastu. Tačiau balandžio mėnesio „Ramp“ verslo klientų indeksas rodo visai kitokį signalą. „Anthropic“ šiuo metu pritraukia 70 procentų pirmą kartą perkančių verslo klientų, o rinkos dalies atsilikimą nuo „OpenAI“ sumažino iki 4,6 punkto. Trumpalaikė „Anthropic“ strategijos kaina – aparatinės įrangos trūkumas. Ilgalaikė „OpenAI“ strategijos kaina – gilus vidinis konfliktas valdyboje.  Viena problema išsprendžiama, kita – ne.

„Google“ – tas DI paslaugų operatorius, apie kurį gana retai užsimena dauguma Lietuvos verslo savininkų, nors tai vienintelė iš trijų bendrovių, kuri yra neabejotinai pelninga.  Ši bendrovė abiem konkuruojančioms pusėms tiekia bazinę infrastruktūrą: „Anthropic“ sutartis dėl 3,5 gigavato TPU pajėgumų yra „Google“ pajamų šaltinis. „Gemini 3.1 Pro“ modelis užtikrina patikimus rezultatus bendrojo pobūdžio loginėse užduotyse.  „Google Workspace“ produktus jau naudoja daugelis Lietuvos įmonių.

Darbuotojų asmeninėse paskyrose užgimusių ir versle prigijusių DI įrankių gynyba paprastai skamba taip: jie visi iš esmės vienodi, o keisti operatorių – per daug vargo. Pirmoji šio teiginio dalis 2024 metais dar buvo teisinga. 2026 metais – jau ne.

2026 m. balandį išleisto „Claude Opus 4.7“ modelio pajėgumai lyginami su „GPT-5.4“ ir „Gemini 3.1 Pro“.  Šie etaloniniai testai tiesiogiai atspindi tas užduotis, kurias su DI realiai atlieka finansų ar operacijų specialistai. Rezultatai pasiskirstę netolygiai.

Dokumentų analizės srityje (skaitant sudėtingą PDF dokumentą ir atsakant į struktūrizuotus klausimus), „OfficeQA Pro“ palyginamajame teste „Opus 4.7“ surinko 80,6 proc., „GPT-5.4“ – 51,1 proc., o „Gemini 3.1 Pro“ – 42,9 proc. 

„GDPval-AA“ palyginamajame teste – nepriklausomame ekonominės vertės vertinime finansų, teisės ir profesinių paslaugų srityse – „Opus 4.7“ pirmauja maždaug 300 punktų atotrūkiu.

Vertinant pagal „Finance Agent“ etaloną, „Anthropic“ praneša apie rinkos lyderio rezultatus. Nors atotrūkis siaurėja akademinio lygmens analitinių užduočių ir autonominės agentų paieškos srityse, dokumentų analizės, finansų ir žinių darbo srityse – kas ir sudaro intelektualinio biuro darbo esmę daugumoje įmonių – „Anthropic“ modelių atotrūkis ne siaurėja, o platėja.

Tai tik technologinių pajėgumų argumentas, ir anaiptol ne pats svarbiausias. Etaloniniai bandymai parodo, kurie DI modeliai konkrečiose užduotyse yra pranašesni. Jie nepasako, ar 2029 metais konkretus DI paslaugų operatorius į šiuos pajėgumus dar investuos. Taip pat nežinote, ar bendrovė, parduodanti jums DI modelius ir jų analitinius pajėgumus, tebeegzistuos dabartine savo forma. Ar jos finansų direktorė nebus išėjusi iš darbo. Ar produktas, kurį integravote prieš šešis mėnesius, nebus uždarytas dėl bendrovės strateginio posūkio į robotiką. Etaloniniai testai vertina DI modelius, tačiau jų prenumeratos įsigyjamos tiesiogiai iš DI paslaugų operatorius. Būtent šio vertinimo dauguma Lietuvos įmonių niekada neatliko.

Įsivaizduokite dvi darbo eigas – nes realybėje svarbu tik tai, ar gali būti kokybiškai atliekamas darbas.

Kiekvieną antradienio rytą Klaipėdos logistikos įmonės vadybininkė praleidžia išgaudama duomenis iš tiekėjų sąskaitų faktūrų, atkeliaujančių keturiomis kalbomis ir skirtingai suformatuotais PDF dokumentais. Dabartinis jos įrankis – tiesiog įtrauktas į „Microsoft“ prenumeratos paketą – juos perskaito maždaug 80 procentų tikslumu. Likusius 20 procentų ji turi suvesti į tarpinę skaičiuoklę, pavadintą „tikrinti prieš mokėjimą“, ir tai kas savaitę atima keturias valandas. Ji su tuo susitaiko, nes niekas jai nepasakė, kad 2026 metais šis 20 procentų klaidų rodiklis jau sumažėjęs iki 10 procentų.

Vilniaus kūrybinės agentūros vadovė vakarus praleidžia perrašydama pristatymo skaidres. Įrankis, kurį ji paveldėjo, patikimai tvarko rišlų tekstą. Tačiau jis neišlaiko agentūros stiliaus, netiksliai apdoroja finansines lenteles ir neišlaiko dvidešimties skaidrių konteksto apimties, o rezultatai praranda vientisumą. Vadovė tai įsisąmonino kaip natūralų dalyką. Ji tiki, kad kiti DI įrankiai būtent taip ir veikia.

Nė viena iš šių moterų neklysta vertindama savo naudojamą įrankį, tačiau abi klysta vertindamos pačius DI pajėgumus.

Kalbant apie DI darbo kokybę, „pakankamai gerai“ – tai nuolat kylanti kartelė. 2024 metais tai reiškė 40 procentų darbo apimties padengimą. 2026 metais tinkamo operatoriaus modelis gali padengti jau 70 procentų darbo apimties. Įmonė, kuri tai pastebi pirmoji, įsigyja metus konkurencinio pranašumo. Įmonė, kuri tai pastebės 2028 metais, jau bus atsilikusi visam laikui.

Finansų direktorė Vilniuje apie tai nesužinos iš savo programinės įrangos tiekėjo. Ilgainiui ji tai pamatys savo pačios rezultatuose. Skaičiuoklės langeliai, kuriuos vis dar reikia tikrinti. Sutarties punktas, kurį vis dar reikia taisyti. Antradienio popietės valanda, kurią ji vis dar skiria užduočiai, kurią turėjo automatizuoti DI įrankis.

Būtent čia atotrūkis tarp operatorių išryškėja pirmiausia – ne palyginamuosiuose testuose, ne pranešimuose apie rezultatus, o žinių darbuotojo laiko rezerve.