Grafer kan øke gjenbrukbarheten av stordata
For å legge til rette for gode militære avgjørelser er det fordelaktig å kunne gjenbruke informasjon som allerede er samlet inn eller forberedt for andre formål.
Se for deg følgende. Et analyseteam skal støtte en pågående militær operasjon i en bestemt region. Deres oppgave er blant annet å følge med på begivenheter i regionen som kan ha betydning for operasjonen. For å gjøre dette må de ta i bruk alle tilgjengelige kilder for å skaffe en så god situasjonsforståelse som mulig. Underveis i operasjonen får de tilgang til en ny kilde med nyhetshendelser. Utfordringen blir å slå sammen sanntids nyhetsstrømmen med statisk bakgrunnskunnskap.
I en ny FFI-rapport brukte forskerne Jonas Halvorsen og Bjørn Jervell Hansen dette tenkte, men høyst reelle, scenariet på nyhetsanalyse i sanntid som utgangspunkt. Rapporten er et delresultat i prosjektet «Informasjonsintegrasjon for et moderne forsvar» der et av målene er å studere teknologier og teknikker for å håndtere store datamengder. Hensikten er å vurdere hvorvidt det er gjennomførbart å bygge en stordatainfrastruktur med egenskaper som gjør det mulig å gjenbruke data kontrollert i en militær kontekst.
Grafer er mulig løsning
Det er to hovedutfordringer knyttet til gjenbruk av stordata. For det første er det en teknisk utfordring å holde styr på format og datamodell slik at det er mulig å få lest og forstå innholdet. Videre er det en utfordring å ha verktøy som er i stand til å håndtere data som kommer raskt og kontinuerlig (strømmende data) uten å stoppe helt opp.
– Den viktigste lærdommen vi tok med oss var at det er realistisk å håndtere strømmende data i graf-form og at det virker å kunne øke gjenbrukbarheten av dataene fordi grafer er en intuitiv måte å forstå data på, forteller Hansen.
I rapporten demonstrerer forskerne hvordan det er mulig å utnytte stordatateknologier (basert på åpen kildekode) fra sivil sektor i det militære domenet for å legge til rette for økt, kontrollert datagjenbruk.
– Dette støtter hypotesen om at dette kan gjennomføres, og rapporten kan være nyttig informasjonsgrunnlag når man vurderer forskjellige tilnærminger for å håndtere informasjonsforvaltning i en militær kontekst, sier Hansen.
Forsøket forsterket også forskernes antakelser om at det eksisterer mange godt fungerende software-komponenter som relativt enkelt kan settes sammen til et verktøy som gjør en bruker (f.eks. en analytiker) i stand til å dra nytte av strømmende data fra forskjellige kilder.
De identifiserte noen software-komponenter som virker å være sentrale i sammensetting av stordata-verktøy, men antar allikevel at det i stor grad vil være slik at slike verktøy må komponeres ut fra den konkrete oppgave det skal støtte. Å sette sammen software-komponenter til et generisk stordata-verktøy virker lite realistisk.
Økt fokus på gjenbruk
Å ta gode militære avgjørelser krever et høyt nivå av situasjonsbevissthet, noe som kan forbedres ved å ha mest mulig relevant informasjon tilgjengelig. I stadig større grad vil behovet for å kunne gjenbruke informasjon være nødvendig.
Forsvaret har de siste 15 årene endret strategi fra det tradisjonelle need-to-know-regimet over til en mer åpen responsibility-to-share-strategi. Dette skiftet innebærer et større ansvar for dataeiere å tenke på gjenbruk av data og å gjøre dem tilgjengelig for andre som kan ha bruk for dem. Dette er først og fremst en policy- og kultur-utfordring, men stiller også krav til data-verktøy:
– Det må finnes verktøy som er så enkle å bruke at de som har data de ønsker å dele enkelt kan gjøre det samtidig som det er sikkert nok med tanke på tilgangskontroll slik at de tør å dele dataene. På mottakersiden trengs det også verktøy som gjør brukere i stand til å finne dataene de er ute etter, forklarer Hansen.
Forskerne planlegger et siste teknisk eksperiment med sammensetting av kompoenter til et verktøy for strømmende data der målet er å studere automatisk deteksjon av hendelser for videre analyse i en overvåkings-/etterretningssituasjon. En avsluttende rapport som oppsummerer prosjektets funn om håndtering av strømmende data kommer til høsten.