Briti matemaatik ja ettevõtja Clive Humby ütles pea 20 aasta eest, et andmed on uus nafta. Ta pidas silmas, et andmetel on tohutu potentsiaal, kuid ainult siis, kui neid töödelda ja analüüsida, samamoodi nagu tuleb rafineerida toornaftat, enne kui sellest kütust saab. Tehisaru hüppelise arengu taustal on andmetest “kütust” saada üha lihtsam.
“Suurandmed on tohutult muutnud, kuidas andmepõhised ettevõtted oma äri ajavad,” kinnitab CGI Eesti ärijuht Ahto Luuri. Pikemas usutluses räägib ta, kui palju potentsiaali tehisintellektil tegelikult on, miks eestikeelsed vestlusrobotid veel kuhugi ei kõlba, kas on mõtet AI-d karta ning kuidas on selle kõigega seotud pea 2000 aasta tagune vulkaanipurse.
Kuidas on suurandmed muutnud ettevõtete ärimudelite kujunemist? Milliseid uusi võimalusi need loovad?
Andmetest saab välja võtta väärtust, kasutades selleks analüütikat, et saada aru, millised on näiteks turunduse trendid, klientide käitumine, kuidas meie ettevõte toimib jne. Sinna juurde tuleb loomulikult ka ennustav analüütika. See tähendab, et vaatame peale ajaloolistele trendidele, andmetele, et saada aimu, mis võiks tulevikus juhtuda.
Palju pannakse rõhku just kasutajakogemuse personaliseerimisele. Selleks võetakse arvesse kliendi eelnevat käitumist ja harjumusi. Inimmälu pole täiuslik, aga ettevõtted teavad tihti kliendist rohkem kui klient ise. Kas sina mäletad, mida sa kümme aastat tagasi tegid või ostsid? Tõenäoliselt sinu otsingumootor või sotsiaalmeedia mäletab.
See ei tähenda muidugi, et peaksime kümne aasta vanuste andmete baasilt ennustama, mida kasutaja täna teeb, aga trendid ja muutused, mida on kogutud ja mida saab automaatselt tuvastada, on tohutu väärtusega. See on üks põhjuseid, miks Google on endiselt üks väärtuslikumaid tehnoloogiaettevõtteid – ligipääs andmetele ja võimekus nendega midagi reaalselt ära teha.
Lisaks sellele, et inimesed ise ei mäleta, mida nad teinud on, jagub ka ettevõtteid, kellel on andmed olemas, aga kasutada ei oska.
On selline termin nagu “andmejärv” (ingl data lake) – tohutu hunnik struktureerimata andmeid, mis on kunagi kokku korjatud ja istub nüüd andmekeskustes serverites. Tänu tehisaru arengule ja andmeanalüütika automatiseerimisele suudame aina rohkem olemasolevaid andmeid enda kasuks tööle panna.
Lihtne näide: kui kindlustus- või laenufirmal on kliendi käitumise ajalugu, saab kasutades algoritme näha, millised mustrid esile kerkivad – mis on seotud kõrgema ja mis madalama riskiga, kellele võiks pakkuda soodsamaid tingimusi jne. Loomulikult on see eksisteerinud ka varem, aga suurte andmehulkade pealt tegelike trendide nägemine ei ole olnud kuni viimase ajani kuigi lihtne.
Paljudes tekitab see hirmu, kui klienti läbi ja lõhki tuntakse. Kas see on tegelikult ka kliendi vaatest positiivne nähe?
Loomulikult võib see tekitada hirmu, kui mingi ettevõte minu kohta väga palju teab. See on viimastel aastatel toonud kaasa erinevaid regulatsioone, nagu GDPR Euroopa Liidus, mille üks osa on õigus olla unustatud. Kui sa väga tahad, et Google sinu otsinguajaloost igaveseks loobuks, siis seaduse mõttes on neil kohustus seda teha.
Mina ütleks, et hirmudel on alati alus, aga enamike klientide jaoks toob see siiski kaasa pigem paremaid kogemusi.
Hirmudest rääkides – ka tehisaru kardetakse. Kui palju magamata öid on sinul seepärast olnud, et AI võib teha lähitulevikus rohkem halba kui head?
Sel teemal on välja toodud erinevaid stsenaariumeid. Ma eristan hetkel kahte leeri: ühed on väga optimistlikud ja arvavad, et saadav kasu on potentsiaalsetest riskidest igal juhul palju suurem. Teine, pigem skeptiline leer, keskendub sellele, et peaksime oluliselt aega maha võtma, kaardistama kõik riskid ja neid võimalikult palju maandama. Eks tõde on lõpuks kuskil vahepeal.
Ma ei usu, et meil lähima viie aasta jooksul tekib universaalne tehisintellekt, mis inimmõistust niivõrd palju ületab, et ta kuidagi kuskilt välja murrab ja maailma üle võtab. Riskid, mis on seotud tehisintellektiga, on pigem seotud läbipaistvuse ja usaldusväärsusega. Generatiivse tehisintellekti mudelid on hetkel tõenäosuslikud. Enamike kasutajate jaoks tundub, et tegu on “musta kastiga”.
Meil ei ole päris arusaama, mis andmete pealt ja kuidas AI vastuseni jõuab, lisaks on “hallutsinatsioonide” teema (kui AI-lt küsitakse küsimus, millele ta ei oska vastata, võib ta luua vastuse, mis näib usutav, kuid tegelikult on vale – toim.).
Seepärast on läbipaistev ja mõistetav tehisintellekt praegu kindlasti fookuses. Ka suured ettevõtted, kes mudeleid hetkel arendavad, on hakanud sellele rõhku panema, et kui saad mingisuguse tulemi, oleks võimalik ka kontrollida, mis infol see põhineb.
Selle kõrval kujuneb lähiaastatel üha suuremaks väljakutseks deepfake (süvavõltsing – toim.). Lisaks tekstile saame tehisaru abiga luua pilte ja videoid, mida on tulevikus aina keerulisem “päris” sisust eristada. Ma arvan, et lõppude lõpuks on lahendus olla allikakriitilisem. Tuleb kasvatada teadlikkust, mis on usaldusväärsed allikad – et me ei võtaks infot vastu kõikvõimalikest kohtadest, mis ei pruugi seda tõepäraselt väljendada. Tegelikult on see sama probleem internetis kogu aeg üleval olnud, tehisaru lihtsalt võimendab seda.
Kui palju on alust hirmul, et tehisaru võtab inimesel töö käest ära?
Mina näen väärtust selles, et suudame tehisaru abiga automatiseerida seda, mida inimene nagunii ei peaks tegema. Kunagi oli põllu peal mees adraga, siis aga mees traktoriga. Inimene ei kadunud kuhugi, aga võimsam tööriist tegi töö kordades viljakamaks. Samamoodi näen, et tehisintellekt saab inimest tohutult võimestada. Kui räägime tehnilisest tööst, siis tarkvaraprojektis sõltuvuste uuendamine, koodi refaktoreerimine – neid asju võiks tehisintellekt teha varsti sama heal tasemel kui inimene. See vabastab ressurssi, et tegeleda asjadega, millega päriselt tahame.
Ka suur osa seadusandlust, mis praegu AI-ga seoses välja tuleb, keskendub sellele, et rakendaksime AI-d inimeste teenistusse, mitte ei hakkaks seda kasutama, et inimesi asendada. Usun, et lõpuni ei ole võimalik inimest asendada nagunii.
Kas oskad jagada mõnda huvitavat näidet, mida on tehisaru abiga suudetud ära teha, mis varem tundus müstika?
Näiteid on ka enda tööst, aga toon ühe huvitavama näite, millest kuuldes olin ka ise väga üllatunud, et see on võimalik.
79. aastal purskas Itaalias vulkaan Vesuuv. Paljud linnad ja asumid jäid paksu tuhakihi alla. Muuhulgas jäid sinna tolleaegsed raamatukogud, mis koosnesid rulli keeratud papüürustest, kuhu olid kirja pandud klassikalised teosed, millest osa on tänaseks säilinud – tänu keskaegsetele munkadele, kes need ümber kirjutasid. Suur osa inimkonna teadmiste hälli infost on meile aga siiamaani kadunud.
Väljakaevamistel on leitud hunnikutes söestunud papüüruse rulle. Neli sajandit on üritatud neid söestunud rulle uurida, lahti rullida, aga see ei ole olnud võimalik. Alles viimase aasta jooksul oleme jõudnud nii kaugele, et – esiteks neid kompuutertomograafidega skaneerida ehk rulli kõrge resolutsiooniga läbi valgustada. Selle põhjal saame papüürused digitaalselt tehisintellekti abiga “lahti rullida”. Tehisaru mudelid on analüüsinud söestunud papüüruse struktuuri ja püüdnud tuvastada, kus on tint ehk tähemärgid. Mitme eri mudeli kombineerimise tulemusel oleme viimase aasta jooksul nii kaugele, et oleme lugenud 2000 tähemärki teksti. Lootus on, et varsti suudame lugeda 90 protsenti nendest rullidest. See avab kultuuri, kirjanduse ja inimkonna teadmiste mõistes täiesti uue varasalve.
Milliseid võimalusi pakuvad conversational AI lahendused ja kuhu neid integreerida annab?
Ingliskeelsed mudelid on praeguseks juba nii heal tasemel, et neid saab edukalt kasutada kasutajatoe automatiseerimiseks. Kui kuskile kirjutad või isegi helistad, suudab AI mudel sinuga tõenäoliselt suhelda praktiliselt sama hästi kui kasutajatoe spetsialist.
Mis veel ei ole nii hea, on eestikeelse toe olemasolu. Töö selles osas käib. Tartu Ülikoolis vähemalt üks töögrupp, mida juhib Mark Fišel, ja Soomes on ka vähemlevinud keeltel baseeruv keelemudel Poro. Mõlemad grupid töötavad selle nimel, et meil oleks vabavaraline, eesti keelel põhinev mudel. Enne kui seda ei ole, on keeruline pakkuda kohalikul tasandil lahendust, mis arvestaks meie kultuuriliste ja keeleliste nüanssidega ning annaks sama hea tulemuse kui inglise keeles. Ka tõlketugi läheb loomulikult aina paremaks, kuid see ei asenda kunagi algkeeles treenitud mudelit.
Loomulikult taandub see ka sellele, et eestikeelset sisu, mille baasil mudelit treenida, on oluliselt vähem. Lahendus on kas rohkem digitaliseerida või proovida sisu automaatselt genereerida treenimiseks. Kui me jõuame selle mudelini, paranevad kohalikul tasandil võimalused oluliselt.
Üsna sageli tuleb ette, et püüad kodulehelt vestlusaknast abi saada, aga vastab robot, kes jookseb kokku või suunab pärast pikka pinnimist ikkagi inimese juurde. Kas see ongi tehisintellekti lagi?
Kui me räägime chatbot’idest või vestlusrobotitest, mida keskmise ettevõtte kodulehel kasutatakse, on need valdavalt eelmise põlvkonna omad ja põhinevad kas reeglitel või vanemal mudelil. Siis tuleb kasutada trikke, et chatbot’ist n-ö välja murda ja saada rääkima päris inimesega.
Usun, et lähiaastatel see pilt oluliselt muutub, kuni lõpuks on keeruline aru saada, kas räägid roboti või inimesega. Ma leian, et kliendi suhtes oleks aus seda alati teada anda. Inimestel on ikkagi soov suhelda päris inimesega, isegi kui robot võib probleemi lõpuks sama hästi lahendada.
Kuidas näete suurandmete ja tehisintellekti tulevikku järgmise viie aasta jooksul? Milliseid suuremaid muutusi ootate?
Kui mõelda, milline on areng viimase aasta või pooleteise jooksul olnud, on praktiliselt kogu fookus olnud keelemudelite domeenil. Kuni sinna ressursse ja tähelepanu jätkub, siis sealt me ka tulemusi saame. Mina arvan, et nopime praegu veel üsna madalaid vilju. Pildi generatsioon on viimase aasta jooksul teinud tohutu hüppe. Video generatsioonis oleme lapsekingades. Ka muusika genereerimine, mis on päriselt kuulatav, on hakanud viimasel ajal tuult tiibadesse saama. See progress jätkub vähemalt lähema paari aasta jooksul. Ilmselt ei ole me pärast lühikest spurti veel platoole jõudnud.
Kui praegu suudab ChatGPT sinuga enam-vähem arutleda ja vastata küsimustele, siis tulevikus võiks igaühel olla virtuaalne mentor, kes mäletab kõiki vestluseid, mida oled temaga pidanud ning anda sulle selle baasilt uusi mõtteid ja ideid. See tähendaks, et konteksti akna suurus on lõputu. See on potentsiaalne tulem, aga kas me viie aasta sinna jõuame? Lõppude lõpuks peame lihtsalt elama ja nägema.
Artikkel ilmus 11. juunil CGI Eesti digijutud blogis Geenius DigiPro portaalis.