Kaip veikia ChatGPT ir kodėl tai svarbu Lietuvai

Dirbtinio intelekto įrankiai šiandien geba užbaigti mūsų sakinius, apibendrinti ataskaitas, parengti el. laiškus ar net kurti programinę įrangą. Iš pirmo žvilgsnio tai atrodo tarsi magija, tačiau iš tiesų – tai dešimtmečius trukusių mokslinių tyrimų rezultatas.

Dirbtinis intelektas (DI) – plati mokslo sritis, siekianti kurti sistemas, galinčias atlikti užduotis, kurios anksčiau buvo laikomos išskirtinai žmogaus gebėjimu: nuo kalbos atpažinimo iki sprendimų priėmimo.
Šioje srityje svarbiausią vaidmenį atlieka mašininis mokymasis (MM) – metodų visuma, leidžianti programoms mokytis iš duomenų, o ne vykdyti griežtai apibrėžtas taisykles.

Vienas ryškiausių šios pažangos pavyzdžių – „ChatGPT“, bendrovės „OpenAI“ sukurta pokalbių sistema, galinti generuoti žmogui artimus atsakymus pagal pateiktą užklausą.

Norint DI technologijas naudoti išmintingai, svarbu suprasti, kaip jos veikia, ką gali ir ko negali. Tai – pirmasis žingsnis į sąmoningą ir atsakingą DI naudojimą.

DI, mašininis mokymasis ir „ChatGPT“

Paprastai kalbant, dirbtinis intelektas (DI) siekia kurti sistemas, galinčias atlikti užduotis, kurios reikalauja žmogaus intelekto.

Mašininis mokymasis (MM) – tai DI posritis, leidžiantis algoritmams atpažinti dėsningumus iš didelių duomenų kiekių: kuo daugiau informacijos modelis apdoroja, tuo tikslesni jo rezultatai.

Kita, dar gilesnė šios srities šaka – gilusis mokymasis (GM), naudojantis daugelio sluoksnių neuroninius tinklus tam, kad galėtų apdoroti sudėtingus ryšius tarp duomenų.

Šiai sistemų šeimai priklauso ir „ChatGPT“ – vienas iš generatyvinio iš anksto apmokyto transformatoriaus (angl. Generative Pre-trained Transformer, GPT) modelių. Tokie modeliai mokomi numatyti kitą žodį sakinyje, remiantis milžinišku tekstų rinkiniu.

Skirtingai nei tradicinė programinė įranga, GPT modeliai pirmiausia apmokomi iš plačių knygų, straipsnių ir svetainių rinkinių, kad išmoktų bendrųjų kalbos struktūrų ir semantinių ryšių.

Jų pagrindas – transformatoriaus architektūra, kuri leidžia modeliui „sutelkti dėmesį“ į skirtingas sakinyje esančias dalis ir nustatyti, kurios jų svarbiausios kontekste.

Būtent šis dėmesio mechanizmas leidžia „ChatGPT“ kurti nuoseklius, prasmingus ir tarpiškai susietus tekstus, panašius į žmogaus rašymą.

Kaip „ChatGPT“ mokosi

„ChatGPT“ mokomas dviem etapais

Pirmiausia modelis apdorojamas su milžinišku nepažymėtų tekstų kiekiu, kad išmoktų kalbos dėsningumų. Tyrėjai taiko vadinamąjį kalbos modeliavimo principą – sistema prognozuoja kitą žodį remdamasi ankstesniais.

Šis neprižiūrimo mokymo etapas leidžia modeliui įsisavinti gramatikos, faktų ir stiliaus niuansus vien stebint, kaip natūraliai tęsiasi sakiniai.

Antrame etape modelis tobulinamas vadinamuoju tiksliojo derinimo (angl. fine-tuning) metodu, naudojant mažesnius, kruopščiai atrinktus duomenų rinkinius. Instruktoriai kuria pokalbius, vertina atsakymų kokybę ir moko modelį tinkamo tono bei naudingumo.

Šiame etape taikomi ir prižiūrimo mokymo (angl. supervised learning) metodai, kai pateikiami klausimų-atsakymų pavyzdžiai, bei stiprinamasis mokymas su žmogaus grįžtamuoju ryšiu (angl. reinforcement learning with human feedback, RLHF).

Sistema mokosi iš atlygintinų ir nepageidaujamų atsakymų – už tinkamus gauna įvertinimą, už klaidingus – „baudą“.

Šių metodų derinys galiausiai sukuria modelį, gebantį palaikyti visavertį, logišką dialogą – ne tik užbaigti sakinius, bet ir išlaikyti minties kryptį.

Pagrindiniai metodai

Kelios esminės techninės naujovės leidžia „ChatGPT“ veikti taip, kaip jis veikia:

  • Neprižiūrimas mokymas iš milžiniško duomenyno.
    • Modelis „skaito“ milijardus žodžių iš knygų, straipsnių ir svetainių. Tokia kalbos įvairovė padeda jam išmokti gramatikos, faktų ir konteksto dėsningumų.
  • Dėmesio mechanizmas.
    • Transformatoriaus architektūroje kiekvienas žodis gali „kreipti dėmesį“ į kitus žodžius, todėl modelis geba atpažinti tolimus ryšius ir subtilius semantinius niuansus.
  • Paslėptų ir sekančių žodžių numatymo užduotys.
    • Išankstinio mokymo metu modelis mokosi numatyti praleistus ar tolesnius žodžius, taip įsisavindamas natūralią kalbos tėkmę ir logiką.
  • Tikslusis derinimas pagal žmogaus dialogus.
    • Po pirminio mokymo modelis tobulinamas kruopščiai atrinktais pokalbių duomenimis.
      Žmonės-instruktoriai rodo tinkamų atsakymų pavyzdžius, vertina alternatyvas ir nukreipia sistemą link mandagaus, aiškaus bei naudingą informaciją teikiančio elgesio.

Mokymo proceso vizualizavimas

Toliau pateikta schema apibendrina visą „ChatGPT“ mokymo kelią – nuo plataus masto neprižiūrimo mokymo etapo, kai modelis mokosi iš milžiniško tekstų kiekio, iki tiksliojo derinimo, kuriame taikomi prižiūrimo ir stiprinamojo mokymo metodai.


Ką gali „ChatGPT“

Kadangi „ChatGPT“ buvo apmokytas milžinišku kiekiu tekstinių duomenų, jis geba atsakyti į klausimus, apibendrinti informaciją ir prisitaikyti prie įvairių komunikacijos stilių.

Modelis išlaiko pokalbio kontekstą per kelias sąveikas, todėl galima tęsti dialogą be poreikio kartoti tą pačią informaciją. Toliau – keli dažniausi šio įrankio naudojimo būdai:

  • Virtualus asistentas.
    • Padeda planuoti susitikimus, kurti priminimus ar rengti el. laiškų juodraščius.
  • Klientų aptarnavimo pagalbininkas.
    • Generuoja atsakymus į dažniausiai užduodamus klausimus ir automatizuoja pasikartojančių problemų sprendimą.
  • Kalbos praktikos ir vertimo įrankis.
    • Leidžia lavinti kalbos įgūdžius bendraujant anglų ar lietuvių kalba, taip pat versti trumpus tekstus.
  • Turinio kūrimo partneris.
    • Padeda generuoti idėjas tinklaraščių įrašams, socialinių tinklų antraštėms ar rinkodaros tekstams.
  • Programavimo asistentas.
    • Aiškina programavimo sąvokas, analizuoja klaidas ir pateikia kodo pavyzdžius.
  • Tyrimų pagalbininkas.
    • Gali apibendrinti straipsnius, pasiūlyti šaltinius ar padėti struktūruoti ataskaitas.

Galingiausias modelis reikalingas ne visoms užduotims

„OpenAI“ siūlo kelias „ChatGPT“ versijas – nuo pažangiausio GPT-5, skirto analitiniams ar kūrybiniams darbams, iki mažesnių, greitesnių modelių, tinkamų trumpiems atsakymams ir kasdienėms užklausoms.

Pagal numatytuosius nustatymus veikia „Auto“ režimas, automatiškai parenkantis optimalų modelį pagal užduotį. Jei siekiate gilesnės ar techninės analizės, galite pasirinkti „Thinking“ režimą, suteikiantį išsamesnius ir labiau pagrįstus atsakymus.


Apribojimai ir atsakingas naudojimas

Nors „ChatGPT“ pasižymi įspūdingomis galimybėmis, generatyvinis DI nėra neklystantis. Kadangi modelis mokosi iš dėsningumų, o ne iš faktų, jis kartais pateikia įtikinamai skambančius, bet netikslius atsakymus.

Modelis neturi prieigos prie tikralaikių duomenų ir nežino nieko, kas įvyko po jo mokymo ribos
(GPT-5 žinių riba – 2024 m. rugpjūčio mėn.). Be to, jis gali sunkiai susidoroti su labai specializuotais, techniniais ar regioniniais klausimais, kurie buvo menkai atstovaujami mokymui naudotuose duomenyse.

Jei norite, kad DI galėtų apdoroti realaus laiko informaciją, ją reikia pateikti patiems arba naudoti funkciją „Žiniatinklio paieška“.

Naudotojams verta prisiminti keletą pagrindinių taisyklių:

  • Tikrinti svarbią informaciją.
    • Visada pasitikrinkite DI sugeneruotus faktus patikimuose šaltiniuose.
  • Nesidalyti jautriais duomenimis.
    • Pokalbiai gali būti saugomi, todėl juose neturėtų būti konfidencialios informacijos.
  • Atsižvelgti į šališkumą.
    • Dideli kalbos modeliai (DKM) gali atspindėti visuomenėje esančias nuostatas ar stereotipus, aptiktus mokymo duomenyse.

Kodėl tai svarbu Lietuvai

Tokiai mažai šaliai kaip Lietuva, kurios ekonomika orientuota į eksportą, atsakingas DI diegimas gali padėti mažinti atotrūkį nuo didesnių rinkų.

Dirbtinio intelekto įrankiai, tokie kaip „ChatGPT“, padeda šalinti kalbines kliūtis: Lietuvos smulkios ir vidutinės įmonės gali rašyti laiškus tarptautiniams klientams, rengti pasiūlymus užsienio partneriams ar versti vietinę rinkodaros medžiagą.

Studentams ir specialistams DI suteikia greitesnę prieigą prie žinių – jis padeda suprasti techninių straipsnių santraukas, ieškoti paaiškinimų ir taip spartina mokymąsi.

Startuoliai DI jau taiko automatizuodami pasikartojančias užduotis – pavyzdžiui, atsakymus į klientų užklausas ar socialinių tinklų pranešimus – ir taip atlaisvina daugiau laiko kūrybai bei inovacijoms.

Tuo pat metu Lietuvai būtina investuoti į skaitmeninį raštingumą, kad darbuotojai mokėtų kritiškai vertinti DI pateiktą informaciją ir gebėtų apsaugoti asmens duomenis.

Kadangi modelių mokymui naudotuose duomenyse lietuviško turinio vis dar mažai, vietos kūrėjams gali tekti papildomai pritaikyti modelius pagal nacionalinius duomenis, kad jie tiksliau atspindėtų kalbos ir kultūros niuansus.

Į „ChatGPT“ vertėtų žiūrėti kaip į bendradarbį – įrankį, stiprinantį žmogaus kūrybiškumą, produktyvumą ir konkurencingumą tarptautinėje erdvėje.


Baigiamosios įžvalgos

„ChatGPT“ parodė, kad mašinos gali generuoti rišlią kalbą mokydamosi iš milžiniškų tekstų kiekių – remdamosi dėsningumais, o ne tikru pasaulio supratimu, kaip tai daro žmonės.

Dviejų etapų mokymo procesas – neprižiūrimas išankstinis mokymas ir tikslusis derinimas su žmogaus priežiūra – sukuria pokalbių sistemą, kuri stebina savo kalbos sklandumu ir gebėjimu išlaikyti minties nuoseklumą.

Tinkamai naudojamas, šis įrankis gali sumažinti darbo krūvį, paskatinti kūrybiškumą ir padėti tokioms mažoms ekonomikoms kaip Lietuva lengviau prisijungti prie pasaulinės žinių ekosistemos.

Svarbiausia – išlikti smalsiems ir kritiškiems. Vertinkime, ką DI gali nuveikti, pripažinkime jo ribas ir visuomet derinkime jo rezultatus su žmogiškuoju sprendimu bei įžvalga.