Jaak Vilo: Tehisintellekti Rakendamine Eesti Arengu Heaks Nõuab Koostööd

In the midst of Estonia’s technological resurgence, a vital component is emerging: artificial intelligence. As a pioneer in the field, Jaak Vilo advocates for collaboration to harness the power of AI in driving Estonia’s development. With the country poised to become a leading AI hub, Vilo’s expert insights highlight the imperative of cooperation between government, industry, and academia. In this opinion piece, he makes a compelling case for joint efforts to accelerate AI adoption, sparking a transformative journey that will propel Estonia forward as a digital pioneer on the global stage.

“Tulevik on siin, kuid ta ei ole veel ühtlaselt jaotunud” (William Gibson).

Suurte keelemudelite loogika on “lihtne” – eelnevate teksti osakeste (tähtede-sümbolite-silpide) pealt ennustatakse kõige tõenäolisemaid järgmisi sümboleid, mis ongi mudeli genereeritud vastuseks. Ennustamisel korrutatakse sisendi elemente nende tähtsust kirjeldatavate kaaludega ja siis summeeritakse. Summade alusel tehakse vahejäreldusi, näteks kas summa on piisavalt suur või mitte. Vastav tulemus edastatakse järgmistele arvutuskihtidele, kus rakendatakse juba uusi kaalusid.

Sümbolite ja sõnade abstraktne tähendus tekib ja on peidus neid kaalusid esitavates arvujadades, millel polegi tingimata inimesele mõistetavat konkreetset tõlgendust. Kuid sarnase sisuga sõnad saavad oma esituskujuks sarnased arvujadad, mis omakorda annavad võimaluse arvutil sisust “aru saada” ja luua uusi seoseid lihtsalt arve liites-lahutades-korrutades.

Sellised miljardite arvudega esitatud närvivõrgud on üllatuslikult suutnud kirjeldada väga laia spektri kogu inimkonna loodud tekstide tähendustest, pakkides internetiavaruste sisu suhteliselt väiksesse arvude hulka. Suur keelemudel valdab kokku rohkem teemasid, keeli, stiile ja “teadmisi” kui ükski inimene keskmiselt. See kõik on jätkuvalt üllatav.

Teadmised pole muidugi absoluutsed ega garanteeritult korrektsed, sest paljud sisendid sisaldavad vigu ja teksti loomisel võib mudel minna uitama juhuslikele radadele ehk hallutsineerida ka lausvalet. Kuid hoolimata sellest, on teksti, pilte, videosid, muusikat ja kõne loovad rakendused juba siin ja kasulikud paljudes uutes ja uutes rakendustes.

Tehisintellekt on samas olemuslikult väga lai mõiste ja praegune vastuseid genereeriv ehk loov tehisaru on vaid üks paljudest masinõppe, planeerimise ja optimeerimise võimalikest rakendustest. Täna arendatakse arvutusmudeleid üha uutele rakendustele. Selleks tuleb kasutada neile kohalduvaid alusandmeid ja treenida vastavaid mudeleid. Näiteks on tehisintellekt loonud täiesti uued võimalused ravimitööstusele tänu valkude kolmemõõtmelise kuju ennustamise uuele kvaliteedile. Sellele on eelnenud aastakümneid varasemat teadustööd ja andmete kogumist.

Olemuslikult on väga suure mudeli loomine veel suurema andmehulga pealt muidugi kallis tegevus, väga andme- ja arvutusmahukas. See tähendab paljusid arvuteid, aega ja raha – isegi elektriarved ulatuvad suurte mudelite treenimisel praegu kümnetesse miljonitesse eurodesse. Mudeli kasutamine on arvutuslikult vähemnõudlikum, kuid kuna kasutajaid loetakse miljonitega, siis on ka see väga ressursimahukas. Spetsiifilisematel rakendustel, mille kasutajatering on väiksem, on vaja vähem ja võibolla ka väiksemaid arvuteid. Kuid vajalik kompetents ja inimtöö maht kümne või tuhande serveri peale skaleeritud tegevuses on ikkagi sarnane.

Eesti suguses väikeriigis ei tasu tingimata päris kõike ka ise teha. Suurte kommertsiaalsete kui ka kõigile tasuta kasutuseks avatud keelemudelite probleem on kindlasti see, et Eesti spetsiifilist sisu, olgu siis seotud kas napi mahuga eesti keele, sensitiivse terviseinfo või muu vajaliku sisendiga pole nende mudelite treenimisel lihtsalt saanud kasutada. Meie õnneks on suurte mudelite jaoks võimalik neid heas mõttes peenhäälestada. Nii saab võtta aluseks suured üldised mudelid ja neid uue infoga tuunida, mis on kohati kümneid kordi odavam kui kõike algusest nullist ise teha. See pole muidugi päris selline protsess, mida igaüks suudaks teha. Eksperte on Eestis kokku pigem mõnedkümned, mitte sadu. See piirab päris uute lahenduste loomise võimekust oluliselt.

Loe rohkem: Kalle Laanet: veebipiraatluse tõkestamine on pidevalt päevakorras | Arvamus

Kuidas peaks Eesti hoolitsema, et mitte rongist maha jääda (ka paigal seismiseks peab üha kiiremini jooksma)? Kuidas aidata viia tehisintellekti põhine konkurentsieelis võimalikult laialdaselt ettevõtete ja riigi kasutusse?

Vastus on: inimesed, andmed, arvutid ja elekter. Kõige raskem on saada kompetentseid inimesi ja andmeid. Arvutid ja elekter on juba lihtsamad, neid saab raha eest poest ja energiasüsteemist.

Kompetentsete inimeste vähesus on esimene pudelikael. Mitmed ettevõtted kasutavad sisemiselt oma arendatud lahendusi, teised pakuvad hea meelega tasulisi teenuseid ka välja. Päris uute vajaduse lahendamine nõuab omajagu uurimistööd, tihti polegi teada, kui kiiresti või kui kasulik rakendus on võimalik luua. Sellised keerukamad, teaduslikku metoodikat vajavad lahendused ongi uurimisasutuste ja ülikoolide pärusmaa, kus napib omakorda vaba inimressurssi.

Eesti jaoks vajalikku tehisintellekti arengut ja rakendusi kiirendav meede oleks investeerida iga aasta kümnetesse uutesse doktorantuuri projektidesse, mis võimaldaks talendikatel noortel alustada vastavate uurimisküsimuste kallal pusimist. Tulemus on üsna garanteeritult kasulik – luuakse palju uusi rakendusi ja noored omandavad lisaks doktorikraadi. Selliselt karastunud spetsialistid on oodatud tööle nii eraettevõtete arendusüksustesse kui muidugi ka ülikoolidesse, kus on jätkuvalt puudus tehisintellekti arendavatest õppejõududest ja teadlastest.

Kui praegu peab paljudele teiste erialadega seotud koostöödele ära ütlema inimeste nappuse tõttu, võimaldaks doktorantuuri laiendamine tuua tehisintellekti eri rakendusi arendama rohkem inimesi.

Võimsate arvutite olemasolu on muutunud globaalse võidujooksu osaks. Nagu eelpool kirjeldasin, on tehisintellekti tänase ühe põhimetoodika ehk suurte arvutusmudelite treenimine ressursimahukas. Eesti on õnneks osaline paljude riikide ühises superarvutite projektis LUMI, Eesti teadlastele ja ettevõtetele on kättesaadavad maailma kiireimate hulka kuuluvad arvutid. Muidugi nõuab see omakorda kompetentse ja olulisi ülesandeid, mida üha kiiremate arvutitega lahendada. Autot juhtima õppimisel ei saa alustada vormel-1 roolist vaid peab kohapeal treenima kartide ja ringrajaautodega. Lisaks tuleb arvestada eri tüüpi tänavaliikluse, rahvarallide ja isegi põlevkivikaevanduste suurte veoautode vajadustega. Oma koht on kõigil kompetentsidel ja lahendustel. Näiteks tundlikke andmeid ei saagi üldse Eestist väljapoole tehisintellekti treenimiseks saata.

Tehisintellekti rakendamisel on lisaks kaugel olevatele superarvutitele vaja ka kohalikke arvuteid, millel juba välja treenitud mudeleid rakendada. Siin on mitu põhjust – spetsiifiline treenimise arvuti on liiga kallis ja valmis rakendused jooksevadki palju väiksematel ja odavamatel arvutitel. Samuti peab rakendus sageli olema ka erinevatel turva- ja tõrkekindluse kaalutlustel lähedal, rääkimata isikuandmete ja tundlike andmete kaitsest. Seega on vajalikud ka kohalikud teenusekeskused ja kompetentsid juurutada vajadusel ka päris lokaalseid asutuse ja ettevõttesiseseid rakendusi. Siin on abiks nii ülikoolide teadusarvutuste keskused oma kompetentside ja arvutitega, kui kindlasti tasapisi ka erasektori ja riigipilve kaudu kätte saadavad ressursid. Suurettevõtted vajavad oma “majasiseseid” lahendusi, mis tagaks piisava turvalisuse.

Kolmandaks on triviaalne, kuid vahel üllatav tõdemus, et arvuti vajab tööks elektrit. Nagu auto, mille kasutuse elutsükli hinnast maksab kütus ja hooldus kokku tunduvalt rohkem kui auto enda ostuhind, on ka arvutite suurim kulukomponent elekter ja hooldus (inimesed, kes arvuteid töös hoiavad). Näiteks LUMI superarvuti on paigaldatud puhta ja stabiilselt elektrit tootva hüdroelektrijaama kõrvale vana paberitehasse hoonetesse, mis tagab vajaliku elektri ja jahutuse.

Tehisintellekti arendamiseks ei piisa vaid arvutitest, inimestest ja elektrist. Sest vaja läheb veel ülesande spetsiifikast lähtuvaid andmeid!

Ega programmeerija ei mõtle välja kõiki maailma eri rakenduste jaoks vajalikke reegleid, mida arvutile selgeks teha. Need reeglid ja mudelid treenib arvuti talle ette näidatud andmete pealt. Nii jõuame küsimuseni, et reaalsete rakenduste loomiseks on vajalik kasutada reaalses situatsioonis tekkinud ja kasutatavaid andmeid. Nende baasil saab alles arvuti treenida “midagi analoogset” välja mõtlema.

Loe rohkem: Piret Sapp: õpetaja töö- ja palgakorraldus nõukogudeaegses kõverpeeglis | Arvamus

Andmed võivad aga valdkonnast sõltuvalt olla nii sensitiivseid, et neid saab ja tohib kasutada ainult eetikakomitee loal uurimistöös või seaduses ette nähtud juhtudel.

Andmete turvalisuse tagamiseks, näiteks saladuste ja isikuandmete lekete vältimiseks, saab ja tuleb osa keerukast andmeanalüüsi ja tehisintellekti arendamise tööst läbi viia kõrgeima turvalisusega keskkondades. Näiteks on Tartu Ülikoolis selleks loodud turvalised andmepuurid, kust andmeid mööda juhet salaja välja ei saagi saata. Nii nagu kosmosejaamas ei avata ust kohe avakosmosesse, viiakse turvapuuris andmeanalüüsi tulemused enne sellisesse lüüsi, kus need saab inimese poolt üle kontrollida ja alles siis väljastada. Nii saab treenida tehisintellekti ja keerulisemaid lahendusi turvakeskkonnas, kuid välja võtta sealt juba piisava anonüümsuse tagavaid statistilisi kokkuvõtteid või värskelt treenitud üldistusvõimega tehisintellekti mudeleid.

Sellises kontekstis, kus on hädavajalik ühelt poolt potentsiaalselt tundlike andmete kasutamine, teiseks olulises mahus uurimistööd andmete väärindamisel, sealhulgas keerukamate tehisintellekti mudelite loomiseks, on arusaadavalt kõige sobivamas rollis Eesti omad ülikoolid ja nende tippteadlaste juures töötavad uurimisrühmad. Uurimistöö annab tulemusi rahvale, riigile ja ettevõtetele; uurimistöö koolitab üliõpilasi ja doktrante, kes omakorda tulevikus arendavad üha uusi ja uusi lahendusi nii ettevõtete, riigi kui ülikoolide jaoks.

Meid ootab ees tehisintellekti edasine demokratiseerimine, selle vajalik jõudmine senisest palju enamatesse rakendustesse.

Eesti terviklikuks arenguks on vaja arendada tõmbekeskusi, kuid samas ka tasakaalustada eduka Harjumaa ja ääremaastuva ülejäänud Eesti võimalusi. Samamoodi on tehisintellekti puhul vaja tagada, et oleks olemas tugevad kompetentsikeskused, tipptasemel inimeste koolitus kui ka kasvav võimekus juurutada tehisintellekti kõikidel kohtadel, kus see abistab ettevõtteid ja majandust, haridust, riigikaitset ja tervishoidu.

Kokkuvõte: tehisintellekti edukaks juurutamiseks ettevõtete ja riigi hüvanguks on vaja:

– inimesi, kes tegeleks uute meetodite ja rakenduste välja töötamisega;
– andmeid, sest tehisintellekt nõuab selgelt rakenduse spetsiifilisi andmeid ja nende baasil uurimistööd, mis võimaldaks luua töötavaid rakendusi;
– arvuteid tehisintellekti treenimiseks ja rakendamiseks – harjutusväljakuid, superarvuteid kui rakenduskeskkondi valmis rakenduste juurutamiseks kohtadel;
– elektrit, sest arvutite suurim kulu on elektri- ja ülalpidamiskulu.

Ülikoolid, uurimiskeskused, innovaatilised ettevõtted ja riigiasutused peavad jõuliselt käima ühte jalga, et praegu kiirendatult soojendusjooksult sörgile ja tempojooksule üle minna. Paljud teised riigid on soojendusdressid juba maha visanud, investeeringud on kasvanud ulmeliselt. Eesti ei tohi jääda mahajääjate hulka.

Kuid raha polegi praegu põhiküsimus.

Kõige odavam ja olulisem on tagada Eestis, et kui tahame saavutada tehisintellekti arengut ja kasutust mõnes valdkonnas, siis peab vastava valdkonna andmed tegema vastavatele arendusüksustele ka kättesaadavaks. Siin, kohapeal, ülikoolide, ettevõtete ja riigi koostöös. Turvalised lahendused on selleks olemas, samuti on ülikoolides inimesed, kes valdkonda vastutustundlikult edasi arendavad. Meie konkurentsieeliseks peab kasvama koostöö tahe ja sujuvus.

In conclusion, Estonia’s development benefits from the application of artificial intelligence, requiring cooperation and collaboration. Jaak Vilo emphasizes the importance of joint efforts to create a strong foundation for innovation and technological progress. By combining government, industry, and academia, we can harness the potential of AI to solve complex societal challenges and drive growth. Estonia’s digital society must continue to foster a culture of cooperation and knowledge sharing to maintain its competitiveness and ensure a prosperous future.