Jonas R. Land og Sander R. Jyhne, begge i innovasjonsteamet i Kartverket, har arbeidet med å finne ut hvor problematisk det kan være å bruke kunstig intelligens (KI) til å sette sammen kartdata.

Avdekker hemmeligheter i kartdata med kunstig intelligens

Norge er en digital frontløper, og våre åpne geografiske data er en kilde til innovasjon og utvikling. Men hva skjer når kunstig intelligens tar disse dataene og bruker dem på nye måter?

Publisert

Norske offentlige etater har over lang tid delt store mengder verdifull og detaljert geografisk informasjon. Kartdata, eiendomsinformasjon og flyfoto er fritt tilgjengelig for offentlig sektor, privat næringsliv og innbyggere.

Dette har lagt grunnlaget for betydelig innovasjon, bedre beredskap, banebrytende forskning og utvikling av smartere samfunn, sier Jonas R. Land og Sander R. Jyhne, begge i innovasjonsteamet i Kartverket.

– Norge har over mange år etablert noe som har blitt et av verdens beste økosystemer av åpne geografiske data. Åpne data er et verktøy for vekst, der verdien i utnyttelsen av dataene mangedobles når de tas i bruk av ulike aktører, forteller Land.

Denne veksten er ikke uproblematisk. Det som før krevde måneder med arbeid, kan nå avdekkes på få uker, med potensielt uante konsekvenser for både næringsliv og kritiske samfunnsfunksjoner. Land og Jyhne har arbeidet med å finne ut akkurat hvor problematisk det kan være å bruke kunstig intelligens (KI) til å sette sammen kartdata.

 

Mosaikkeffekten – når data avslører mer

Individuelle datasett kan fremstå harmløse og trygge hver for seg, men når flere datasett kombineres, kan de avsløre informasjon ingen ønsket å gjøre offentlig. Dette fenomenet kalles gjerne «mosaikkeffekten», og utgjør en betydelig risiko i et samfunn med stadig mer åpne data, advarer Jyhne.

– Den største risikoen med åpne datasett er ikke dataene i seg selv, men informasjonen du kan finne om du kombinerer flere datasett. Denne risikoen er ikke ny, men det som har endret seg, er analysekapasiteten, sier Jyhne, og legger til at i dag kan dette gjøres både raskere, billigere og mer automatisk enn noen gang tidligere ved hjelp av kunstig intelligens.

Aktører med onde hensikter kan utnytte denne evnen til å kartlegge sårbarheter i Norges kritiske infrastruktur, advarer Jyhne om.

 

KI som digital detektiv

En stor del av jobben med å kombinere og analysere geografiske data har tidligere vært manuell og ressurskrevende. Men nå kan KI effektivisere denne prosessen dramatisk.

Kunstig intelligens, primært store språkmodeller koblet med verktøy, kan fungere som en aktiv samarbeidspartner. Den kan foreslå analyser, identifisere nødvendige verktøy, strukturere løsninger og foreslå hvordan datakilder skal kobles.

– Vi spurte rett og slett AI hvordan disse analysene kunne gjennomføres, forteller Land om deres eksperiment.

– KI-systemene slipper logistikken rundt dagliglivet som vi mennesker har, med å hente i barnehagen, handle eller lage middag. Det betyr at de kan overvåke, analysere og sammenfatte opplysningene kontinuerlig, forklarer Land.

Dette betyr at systemer kan skaleres opp og analysere data døgnet rundt, på tvers av hele Norge, for å lete etter interessante mønstre.

 

En stor del av jobben med å kombinere og analysere geografiske data har tidligere vært manuell og ressurskrevende. Men nå kan KI effektivisere denne prosessen dramatisk.

Kartverkets KI-eksperiment: Hva ble funnet?

Kartverket gjennomførte et eksperiment for å se hva de kunne avdekke med begrenset tid og ressurser, kun ved å kombinere åpne data og kunstig intelligens. Resultatet var en trinn-for-trinn-guide fra KI-en om hvordan man kan finne sensitiv innsikt i kritisk infrastruktur i Norge. KI identifiserte datasett, interessante overlapp og foreslo analyser.

– Et konkret eksempel viste en kombinasjon av 22-kilovoltsledningsnett som endte i et sensorforbudsområde, høydedata og 5G-dekningskart. Uten å avsløre spesifikke funn, var konklusjonen klar: det ble avdekket steder av stor interesse for «ulike aktører». Hele analysen ble utført på cirka fire timer, sier Jyhne.

 

Balansen mellom innovasjon og sikkerhet

Åpne data skaper enorme verdier for samfunnet og gir næringslivet et unikt grunnlag for innovasjon. Men som Kartverkets eksperiment viser, kan kombinasjonen av data avdekke informasjon man ikke ønsker offentlig.

– Hva kan da en aktør med langt sterkere motivasjon, ubegrensede ressurser og ikke minst mer tid finne ut om vår infrastruktur hvis den utfører samme type analyse på våre åpne data? spør Jyhne.

Dette reiser et presserende spørsmål om balansen mellom å fremme innovasjon gjennom åpne data og å ivareta nasjonal sikkerhet og beskytte verdier, mener de.

– Det er nødvendig å vurdere hva som deles og med hvilke restriksjoner, spesielt når analysekapasiteten til kunstig intelligens fortsetter å øke, advarer Land.

På spørsmål om hva norske kommuner og virksomheter bør gjøre etter å ha lest saken, er svaret tydelig: Det er avgjørende å erkjenne at denne typen innsikt faktisk er mulig å utlede fra åpne data. Når data deles, må ikke bare individuelle datasett vurderes isolert – men også hvordan de kan kombineres med andre tilgjengelige datasett.

Vektor vs. Raster: Hvilke data er enklest for KI?

Når det gjelder geografiske data, skiller man grovt mellom to hovedtyper: vektordata og rasterdata. Forskjellen er viktig for hvordan KI kan utnytte informasjonen.

Vektordata lages ofte i databaser, der hvert objekt (for eksempel en kraftledning eller en bygning) kan ha flere egenskaper som størrelse, viktighet, sårbarhet eller type.

– All denne dataen blir tilbudt gjennom en database, og de har ofte funksjoner for filtrering, sortering, aggregering, kanskje også analyser, avhengig av hva slags database du bruker, som er verktøy som du da kan tilgjengeliggjøre for agenten, forklarer Land.

Dette gjør vektordata svært egnet for analyser, av blant annet KI-agenter, som kan bruke dem «out of the box».

Rasterdata er derimot et bildeformat, pikselbasert, der hver piksel har en verdi (f.eks. høyde eller temperatur). Disse dataene gir også verdifull informasjon, men er langt mer ressurskrevende for KI å utnytte.

– Det er veldig tidkrevende hvis du skal tolke hele Norge. Det blir et veldig stort bilde med masse data som vi kan skalere opp, men vil koste mye, sier Land.

Powered by Labrador CMS