Det er ikke lenge siden IBM hevdet at 90% av all data som finnes har blitt generert de siste to årene. Med økende bruk av datagenererende tjenester, datapunkter, scannere og IoT-dingser handler mye av dataene om deg. Men hvem har dine data, og hva skal de med dem? Det er på tide å snakke litt om etikk og brukeropplevelser.
Utviklingen handler mer og mer om brukeropplevelsen og konteksten rundt hvordan data blir samlet inn og brukt. Camilla Bertelsen i CGI er spesielt opptatt av disse etiske rammene rundt hvordan vi bruker data.
– Vi har stadig mer data – som er en utfordring med tanke på personvern, spesielt i forhold til spørsmålet om hvor lenge vi kan lagre data og hva vi faktisk kan bruke disse data til. Når virksomhetene er mer digitale er det mye mer vi kan lagre data om, det er nye former for data og nye kilder som IOT-dingser. De fleste virksomheter har i tillegg store forventninger til hva det kan gi av grunnlag for tjenester og hvordan vi kan utnytte det med maskinlæring, sier Bertelsen.
Som en del av datadrevet økonomi er det en forutsetning at man blir flinkere til å dele data – og ikke bare internt i en virksomhet.
– Trenden er datautveksling, det vil si at du ikke bare bruker egne data, men henter de eksternt. Åpne datakilder blir stadig mer tilgjengelige, og det blir vanligere å utveksle data med de man samarbeider med. Det har allerede skjedd en stund i det offentlige, men private aktører har også i større grad begynt å utveksle data, gjerne i en form for dataplattform, eller det vi kaller «data økosystem».
Det er for tiden et stort fokus på å bygge dataplattformer som nærmest er selvbetjente med tanke på å kunne lagre og tilgjengeliggjøre data til ulike formål. Virksomheter sitter på mye data, men uten en god løsning for å lagre og tilgjengeliggjøre data kan det fort bli uoversiktlig med tanke på hvilke data man har, hvor man har de og hva man kan bruke dette til.
– En dataplattform med riktig arkitektur vil understøtte kundens behov og vise mulighetsrommet, i tillegg til å gi et godt grunnlag for innovasjon. Vi skreddersyr dataplattformer ved bruk av standardkomponenter. Med utviklingen ulike skyplattformene har vi fått mange flere komponenter å spille på for å skape en riktig tilpasset dataplattform. Mulighetene har vokst enormt bare de ti siste årene, forklarer Bertelsen.
Der det før var én database å forholde seg til i forhold til for eksempel rapportering og analyse er en moderne dataplattform sammensatt av mange ulike komponenter. Løsningene må fortsatt støtte historisk lagring og tung prosessering, samtidig som nye data må være tilgjengelige umiddelbart, slik at beslutningstagere raskt kan fange opp signaler og ta beslutninger.
– Komponentene må integreres på en riktig måte med tanke på sikkerhet og tilgangsstyring – slik at vi er trygge på at data tilgjengelig gjøres for sluttbrukere med riktig tilgangsnivå. På den ene siden jobber vi med å få på plass en god arkitektur for å gjøre dataene tilgjengelig. På den andre siden jobber vi med forretningen for å forstå hva de drives av, hvilke behov de har, basert på hvilke data de har – og hvilke data de kanskje mangler. I dag er det mange flere muligheter for å kunne ta i bruk dataene når du skal levere en rapport. Du kan nærmest ut av boksen koble på funksjoner for avansert analyse, maskinlæring, eller koble på automatiserte beslutningsfunksjoner eller real-time analytics, sier Bertelsen.
– Dataplattformen vil også være en god måte å tilgjengeliggjøre data for ulike brukere i organisasjonen som ønsker å utføre avansert analyse på selv. Mulighetene er enorme, det begynner å bli veldig enkelt å få det til – samtidig så krever det at vi har enda mer kontroll på de data vi da skal benytte i løsningene våre.
Camilla Bertelsen ser store muligheter for eksempel ved bruk av maskinlæring hos kunden NAV, men viser til at regler knyttet til personvern og bruk av data fort setter en stopper for hva data faktisk kan benyttes til. NAV er, som andre offentlige etater, underlagt streng regulering med tanke på hva de kan bruke sine data til.
– Der private virksomheter er mer samtykkebasert, må det ofte foreligge lovlig hjemmel for å kunne bruke dataene til ulike formål. Her gjør NAV for tiden et veldig godt arbeid med å legge til rette for riktig bruk av AI og maskinlæring innenfor de rammer de er underlagt.
Bertelsen anslår at Business Intelligence nok har hatt et lite tilbakeslag da de nye GDPR-regulativene ble innført i 2018. Tidligere handlet det mye om å samle inn og dele så mye data som mulig. Med GDPR har fokus på personvern blitt forsterket. Med det må vi ha mer kontroll på hvilke typer data vi lagrer, hvor lenge vi kan lagre de, hvor data oppstår, og hvor de brukes videre. Dagens teknologi begynner heldigvis å bli moden når det gjelder personvern.
– Verktøyene vi jobber med får stadig bedre funksjonalitet med tanke på sporbarhet på data, slik at vi lettere får kontroll på hvordan data flyter mellom ulike komponenter i arkitekturen. I tillegg begynner det å komme verktøy som hjelper oss til å avdekke om datasett faktisk inneholder personopplysninger, eller om det er en høy risiko for å identifisere en enkeltperson i datasettet. Personvern blir bare viktigere når vi får stadig flere datapunkter der vi kan hente inn personlige data, forklarer Bertelsen.
I tillegg er det et stadig større fokus på datakvalitet. Det hjelper ikke å komme opp med mange avanserte løsninger uten å forstå viktigheten av datakvalitet, og hvordan kvaliteten på dataene påvirker resultatet av for eksempel en maskinlæringsalgoritme. Er ikke kvaliteten god nok kan vi heller ikke stole på det som kommer ut av løsningene.
– Utviklingen innenfor bruken av data skjer på to fronter – både for forretningsbrukerne, og private sluttbrukere. Business Intelligence har tradisjonelt vært et innadrettet verktøy for virksomheten. Nå handler Business Intelligence også for å kunne gi brukere eller kundene en mye mer tilpasset opplevelse.
Camilla Bertelsen påpeker at som fagpersoner er det viktig å være gode rådgivere for kundene rundt områder som personvern og etisk bruk av data. Det handler ikke bare om GDPR og hva som er lov og ikke lov, men om hvordan sluttbrukerne vil oppleve hvordan vi har brukt deres data.
– Det er et økende fokus på kundeopplevelse i stadig mer konkurranseutsatte markeder. Da blir riktig bruk av data enda viktigere. Det må være en balansegang mellom å gi kundene en tilpasset og god opplevelse, og det å bli alt for tilpasset så det oppleves som ubehagelig og grenseoverskridende. Som bruker av en tjeneste forventer vi at en aktør vet noe om oss, så vi skal slippe spørsmål om ting de allerede bør vite. Men blir en løsning for tilpasset kan det fort skremme og støte vekk kundene. Dette vil være en vanskelig balansegang, og vi trenger derfor et godt etisk rammeverk for hva vi ønsker å gjøre med kundenes informasjon og data.
Diskusjonen rundt etiske rammeverk og retningslinjer om hvordan vi skal behandle persondata og hindre misbruk har pågått en stund, og blir bare viktigere.
– Dette er et spennende fagområde. Etter hvert som flere løsninger tar i bruk mer automatiserte tjenester må kundene ha en positiv opplevelse og føle de har blitt rettferdig behandlet. Det er viktig å poengtere at algoritmer ofte kan resultere i en mer rettferdig behandling enn det vi klarer manuelt, men det er likevel viktig at kundene opplever det som rettferdig. Og med det må vi også kunne forklare kundene hva beslutningene bygger på og gi de en trygghet om at vi ikke misbruker deres personlige data. Kommunikasjonen rundt det og hvordan vi designer løsningene vil være en rød tråd de nærmeste årene, avslutter Bertelsen.