Pilvipalvelut ja tekoäly mielletään usein erottamattomiksi. Tämä luo julkiselle sektorille paineita erityisesti tiedon sijainnin ja sisällön suhteen, ja väitämme, että se myös hidastaa tekoälyn laajempaa hyödyntämistä. Ajatusmallia onkin mielestämme syytä purkaa, jotta voimme edistää tekoälyn käyttöä julkisella sektorilla. On tärkeää ymmärtää, että tekoälyä voidaan hyödyntää myös ilman kaupallisia pilvipalveluita ja että tiedon sijaintia ja sisältöä voidaan hallita turvallisesti koko prosessin ajan – aina tekoälyn opettamisesta sen käyttöön asti. Parhaimmillaan voimme yhdistää kaupallisen pilven ja paikallisten ratkaisujen parhaat puolet halutun lopputuloksen saavuttamiseksi.
Kaupallinen pilvi tarjoaa laskentatehoa, mutta ei aina vaatimuksenmukaisuutta
Kaupallisesta pilvestä saadaan erityisesti muskeleita eli laskentatehoa tekoälymallien opettamiseen, kunhan varmistetaan, että lähtökohtaisesti käytetään vain julkista materiaalia – kuten vaikkapa Valtionhallinnon tuore ohjeistus generatiivisen tekoälyn käytöstä korostaa (VN/6190/2025).
Esimerkiksi voimme kouluttaa mallia julkisilla aineistoilla, kuten lakiteksteillä ja erikoisalojen käsitteillä, hyödyntäen kaupallisen pilven helposti saatavilla olevia resursseja. Tuotantokäytössä tekoälylle on kuitenkin usein annettava sensitiivistä tietoja. Vaikka salausratkaisut kehittyvät, ei tekoälyratkaisua tästä huolimatta saa välttämättä ajaa kaupallisen pilven puolella, vaan se on tuotava lähemmäs omaa toimintaa, paikallisiin konesaleihin. Tämä fyysinen tietoturvaratkaisu varmistaa, että tietosuoja ja tietoturva säilyvät korkealla tasolla myös esimerkiksi erityistä henkilö- tai terveystietoja käsiteltäessä.
“Pilvipalvelut ovat hyödyllisiä tekoälymallien kouluttamiseen, mutta tuotantokäytössä sensitiivinen tieto voi vaatia paikallisia ratkaisuja.”
Tekoälyratkaisun kerrokset – mitä kannattaa tehdä missäkin?
Tekoälyratkaisun eri kerroksia ja niiden vaatimuksia voidaan havainnollistaa tarkastelemalla tyypillisen suuriin esikoulutettuihin malleihin perustuvan ohjelmiston, kuten ChatGPT:n, rakennetta (Kuva 1).
Alimmalla tasolla esikoulutettujen mallien tarjoajat, kuten Open AI, Anthropic tai Silo AI, ovat käyttäneet hyvin suuria palvelinfarmeja mallien ohjaamattomaan alkukoulutukseen. Vaihetta voidaan ajatella yleissivistävänä koulutuksena, jossa malli on itse oppinut maalaisjärkeä hyvin suuren koulutusaineiston pohjalta. Riskinä on, että esimerkiksi internetin syövereistä kerätty aineisto opettaa mallille erilaiset vinoumat ja asenteet.
Ohjaamattoman alkukoulutuksen jälkeen tekoälymalli ei vielä osaa kohdentaa osaamistaan, vaan siihen tarvitaan hienoviritystä, jonka aikana malli erikoistuu esimerkiksi keskustelemaan, koodaamaan tai tunnistamaan kuvia. Vaihe on vielä laskennallisesti raskas, ja alkukoulutuksesta poiketen, se vaatii paljon ihmisen antamaa palautetta. Tekoälytoimittajat keskittyvät tähän vaiheeseen yhä enemmän ja kehittävät tekoälyjen erilaisia ”persoonallisuuksia”.
Hienovirityksen sudenkuopat – sensitiivinen tieto hallitusti käyttöön
Hienoviritystä voidaan edelleen jatkaa hyvinkin tarkkaan toimiala- tai asiakaskohtaiseen erikoistumiseen, jolloin saadaan parhaat toimialakohtaiset tulokset. Toimialakohtaisessa hienovirityksessä säädetään vain pientä osaa mallista, ja tähän riittää jo esimerkiksi pilvipalveluista saatava väliaikainen kapasiteetti. Koska kapasiteetti maksaa ja mallien perusrakenteet kehittyvät vielä vauhdilla, on riskinä jäädä jumiin vanhentuneeseen malliarkkitehtuuriin, jos siihen tehdystä hienovirityksestä on maksettu eikä sitä ole varaa hylätä.
Hienoviritykseen liittyy myös riski, jos tekoälymalliin koulutetaan sensitiivistä tietoa, jota ei voida täysin kontrolloida. Hallusinaatiot voivat muuttua vaarallisiksi, jos ne sisältävät kriittistä toimialatietoa ilman varmennettuja faktoja. Siksi hienovirityksessä kannattaa keskittyä julkiseen erikoissanastoon ja muihin keinoihin, jotka parantavat tekoälyn ymmärrystä toimialan erityistehtävistä.
“Sensitiivisen tiedon syöttäminen tekoälymalliin voi johtaa hallitsemattomiin riskeihin, joten julkiset aineistot ja asiantuntijoiden valvonta ovat avainasemassa.”
Tietämysverkko on yksi tapa tehdä toimialakohtaista mukautusta turvallisesti
Hallittavampi tapa toteuttaa toimialakohtainen hienoviritys on tuoda sen käsitteitä ja niiden yhteyksiä kuvaava tietämysverkko osaksi mallin työmuistia eli kontekstia. Kielimalli pystyy analysoimaan suuria dokumenttimassoja ja tunnistamaan keskeiset käsitteet, jolloin tiedot saadaan rakenteiseen ja helposti visualisoitavaan muotoon (Kuva 2). Asiantuntijat voivat tarkistaa, ja tarvittaessa korjata tietämysverkon, jolloin se muodostuu tekoälyn ja ihmisen yhteistyönä.
Tarkistettu tietämysverkko ohjaa tekoälyn päättelyä oikeaan suuntaan, mikä parantaa myös keskustelun yksityiskohtien tarkkuutta. Koska tietämysverkot voidaan säilyttää ja hallita täysin paikallisesti, ne tarjoavat tietoturvallisen ja tehokkaan tavan toteuttaa luotettavaa tekoälyä oman infrastruktuurin sisällä.
Johtopäätöksemme – tekoälyratkaisujen järkevä hyödyntäminen
Yhteenvetona, tekoälysovelluksessa on edelleen tärkeää huomioida kaikki ohjelmistotuotannon perusasiat, kuten hyvä käytettävyys, tietoturva ja ylläpidettävyys. Tekoälyä voidaan hyödyntää tehokkaasti myös ilman pilviriippuvuutta, kun valitaan oikeat työkalut ja hallintamallit.
Kaikkea ohjelmiston logiikkaa ei edelleenkään kannata toteuttaa tekoälyllä, mutta mahdollisuuksia perinteisestä koneoppimisesta generatiiviseen tekoälyyn löytyy, kunhan pidetään kaikki ovet avoinna ja tarpeen vaatiessa suljettuina.