Darknet är en del av Internet där det bland annat pågår handel av illegala varor såsom vapen, droger och barnsexhandel. Med kryptering och annonser eller webbsidor som dyker upp och sedan försvinner efter ett par dagar är det en svår utmaning för de polisiära myndigheterna att hålla jämna steg med brottslingarna.
På uppdrag av ECPAT/Finanskoalitionen och CGI har studenten Hampus Adamsson vid Uppsala Universitet, som sitt examensarbete, tittat på hur maskininlärning skulle kunna användas i jakten på säljarna. Hampus har tagit fram en lösning som låter dator skanna igenom Internet i allmänhet och Darknet i synnerhet efter dessa annonser.
Sedan tidigare finns det lösningar baserade på sökspindlar som letar efter olika ord som används på dessa hemsidor. Problemet, enligt Hampus, är att det blir för många felaktiga träffar och att man hela tiden modifierar sina annonser och språkbruket för att lura sökfunktionerna.
Maskininlärning betyder att man inte enbart instruerar datorn att söka efter vissa specifika ord och fraser utan snarare lär den att känna igen mönster och strukturer. En sökfunktion som baseras på ord och fraser kan luras genom att nya påhittade ord används i stället. Men ett system som ser mönster och lär sig under arbetets gång lägger till de nya begreppen utan att en människa behöver identifiera orden åt datorn.
Men att låta datorn lära sig vartefter kan vara vanskligt. Liksom med andra AI-projekt kan det hända att utvecklingen inte fungerar, att oskyldiga begrepp markeras som förbjudna och eller missas helt av maskininlärningen. Hampus Adamsson berättar under sin presentation att det som är så enkelt och självklart för människor inte alls hänger ihop för datorn.
Vi ser med vår kognitionsförmåga en sida på Amazon med en bild på en surfplatta med en Windows-logotyp och ett pris och förstår ögonblickligen den logiska kedjan Amazon, annons, surfplatta, Microsoft. Datorer kan inte lösa uppgiften på det sättet eftersom den saknar relation mellan ord och händelser. Det vi gör, säger Hampus Adamsson, är att lära datorn att känna igen vad som hör ihop och vad som sticker ut. Hur fungerar språk? Det är inte logiskt.
När systemet har lärt sig känna igen dessa annonser och sidor så kan den med stor säkerhet avgöra om andra sidor kan vara av samma typ även om orden och fraserna inte är exakt samma. Och denna inlärning (snarare än programmering som vi annars talar om) görs förenklat i fyra steg:
- Förbehandling – ett underlag med material som man vill lära systemet att känna igen rensas och renodlas.
- Träning – materialet matas in i systemet för att maskininlärningen ska börja analysera vad det är man letar efter.
- Testning – nu testas systemet med annat material som den inte sett tidigare för att se om den har hittat sina mönster.
- Utvärdering – slutligt test i riktig miljö.
Enligt Hampus Adamsson ser vi idag en snabb utveckling inom till exempel självkörande bilar som inte bara följer en in-plottad rutt utan anpassar sig till trafiksituationen och fattar beslut när till exempel ett hinder dyker upp i vägen. Utan maskininlärning skulle detta vara omöjligt. Andra applikationer som redan används brett idag är bankkortsföretagens bedrägerikontroller där avvikande kundbeteende kan generera en flagga om att något kan vara fel.
Att använda tekniken för att hitta till exempel barnsexhandel kommer att effektivisera polisens utredningsarbete monumentalt, menar Hampus som räknar med att den typ av system som han har tittat på i sitt examensarbete inom en snar framtid kommer att underlätta arbetet genom att frigöra resurser från det tidskrävande och svåra sökandet efter annonser och material. Istället kan polisen koncentrera sina resurser på att följa upp tipsen från systemet och hitta brottslingarna bakom.