Artikel Dansk Erhvervs Retail2020

De fysiske butikker halter efter nethandlen med at forstå kundernes adfærd. Nye teknologier inden for videoanalyse og neurale netværk kan hjælpe detailhandlen med at afkode kunders følelser, køn og alder ifølge oplægsholder til Dansk Erhvervs Retail2020-konference

Netbutikker har i årevis haft adgang til omfattende data om kunderne. Under hele købsrejsen fra Google-søgning til et tryk på køb-knappen i webshoppen har forretningen indsigt i brugernes adfærd.

Hidtil har denne indsigt været forbeholdt online-butikkerne, men det er kun et spørgsmål om tid. Takket være kameraer i højere opløsning, hurtigere processorkraft og mere lettilgængelige teknologier som kunstige neurale netværk, kan fysiske butikker i dag få adgang til lige så sofistikerede kundedata ifølge teknologichef for video analytics hos it-servicevirksomheden CGI, Edward Mauser.

"Det er blevet muligt at foretage de samme analyser i den fysiske verden, som man ellers kun har været i stand til inden for e-handlen — og i nogle tilfælde endda mere dybdegående" siger han og tilføjer, at videooptagelser af kunder eksempelvis kan afkode deres følelser, mens de går rundt i butikken.

"Du kan for eksempel få indblik i, hvor lang tid folk kigger på en reklame, og hvor glade de er for den. På den måde kan du lave A/B-sammenligninger, ligesom man gør det i nethandlen," siger han.

Festivalgængeres humør kortlagt med videoanalyse

Videoanalyse bliver blandt andet brugt til at kortlægge personers humør, alder og køn i stor skala. En af de mest omfattende eksempler på denne brug foregik under Ruisrock Festivalen — Finlands svar på Roskilde Festival.

Ved at opsætte kameraer ved hver af festivalens 32 indgange samt VIP-område og ved at udstyre over 10 grupper af frivillige medarbejdere med GoPro-kameraer fik festivalen adgang til over 310 millioner datapunkter om de besøgendes ansigter.

Festivalen havde ifølge Edward Mauser brug for at vide, hvem de besøgende var, og hvor glade de var for de forskellige tiltag på festivalen.

Hidtil havde festivalen kun brugt spørgeskemaer til at indsamle data om de besøgende og havde dermed haft begrænset viden på området

Ved at bruge videoanalyse i stedet kunne festivalen eksempelvis afdække, hvordan en større andel af de besøgendes humør skiftede mellem de forskellige koncerter og scener.

Samtidig spottede festivalen også en større uoverensstemmelse mellem spørgeskemaundersøgelsen og videoanalysens resultater. Førstnævnte anslog, at 79 pct. af festivalgængerne var kvinder, mens sidstnævnte kom frem til en mere ligelig kønsfordeling med 48 pct. kvinder.

"Selvom teknologien er mest præcis i opstillede omgivelser, så er den stadig præcis nok til at give et statistisk korrekt indblik i personers alder og køn i selv mere kaotiske omgivelser," siger Edward Mauser.

Mikroudtryk afslører følelser

Teknologien bag videoanalysen er baseret på såkaldt deep learning og kunstige neurale netværk — en afart af kunstig intelligens — der er raffineret henover de seneste år. Algoritmerne lærer ved hjælp af store datasæt at afkode mønstrene i folks ansigtsudtryk og vurdere, hvad alt fra smil til små rynker i panden betyder.

Resultatet kan algoritmerne kategorisere i seks forskellige grundlæggende følelser ifølge Edward Mauser: Glæde, vrede, væmmelse, frygt, sorg og overraskelse.

Og selvom man godt kan smile og være sur på samme tid, så narrer det ikke teknologien, forklarer han. Som mennesker afgiver vi instinktivt en række kortvarige mikroudtryk i ansigtet, der afslører vores sande sindstilstand, og de kan være svære at kontrollere.

"Vi kan opfange disse mikroudtryk i forbifarten ved hjælp af neurale netværk og optisk teknologi i høj kvalitet," siger han og kommer med et eksempel.

Under Ruisrock Festivalen analyserede han løbende en Youtube-bloggers ansigtsudtryk, mens vedkommende rapporterede nær en af scenerne. Under optagelserne opfangede systemet pludselig en såkaldt anomali: bloggeren smilede samtidig med, at hans mikroudtryk udviste vrede, frygt og væmmelse.

"Det viste sig, at han i det øjeblik var blevet afbrudt af andre festivalgængere, som distraherede ham fra optagelserne," siger Edward Mauser og tilføjer, at butikker på samme måde kan bruge teknologien til fx at måle, hvordan et udsalg eller en fyldt butik påvirker kundernes humør. Eller hvorvidt de forlader butikken i et andet humør, end da de kom ind.

"I en fysisk butik har du normalt meget lidt forståelse af konteksten for, hvorfor folk køber eller ej, og det kan gøre det vanskeligt at øge kundeoplevelse og loyalitet. Det kan videoanalyse være med til at forbedre," afslutter han.

FAKTA:

Hvad er kunstige neurale netværk?

Kunstige neurale netværk er matematiske modeller inspireret af den biologiske hjernes neurale netværk. Modellerne kan trænes til at finde mønstre i større datamængder, hvilket eksempelvis Google bruger til at forudsige dine søgninger, mens du skriver dem, eller Facebook bruger til at genkende dit ansigt på billeder. Inden for videoanalyse bruges neurale netværk til fx at genkende ansigter og klassificere personers følelser ud fra deres ansigtsudtryk.

Det kræver enorme datamængder og computerkraft at træne og afvikle neurale netværk, hvorfor teknologien først er modnet i løbet af de seneste år og har bragt ny interesse for feltet ‘kunstig intelligens’.