Exploring data reuse using a big data infrastructure
Om publikasjonen
Rapportnummer
20/02840
ISBN
978-82-464-3304-2
Format
PDF-dokument
Størrelse
3.9 MB
Språk
Engelsk
Å ta gode militære avgjørelser krever et høyt nivå av situasjonsbevissthet, noe som kan forbedres ved å ha mest mulig relevant informasjon tilgjengelig. Denne informasjonen kan nå en beslutningstaker via mange forskjellige veier, hvorav gjenbruk av informasjon som allerede er samlet inn eller forberedt for andre formål står sentralt.
Gjenbruk av data er anerkjent som en viktig ingrediens i prosessen med å tilfredsstille informasjonsbehovet i militære organisasjoner: Både NATO og Forsvaret har i de siste 15 årene fokusert mindre på det tradisjonelle need-to-know-regimet og mer på en mer åpen responsibility-to-share-strategi. Imidlertid er det visse forutsetninger som må på plass for at omfattende informasjonsdeling og gjenbruk skal kunne skje. En datatilbyder vil kunne kreve forsikringer om at data som deles kun blir tilgjengelig for autoriserte brukere, mens en potensiell bruker vil kunne ønske å ettergå dataenes opphav for å vurdere om kvaliteten, påliteligheten og formatet er adekvat for ønsket bruk.
Rapporten beskriver et eksperiment der formålet var å undersøke hvorvidt det er gjennomførbart å bygge en stordatainfrastruktur med egenskaper som gjør det mulig å gjenbruke data kontrollert i en militær kontekst. Eksperimentet besto i å ta utgangspunkt i en tidligere dokumentert stordatainfrastruktur bestående av åpen-kildekode-komponenter og utvide denne infrastrukturen for å fasilitere datagjenbruk. Konkret er følgende to spor utforsket:
- Publisere data som lenkede data, en strukturert datarepresentasjon som gjør det lett å knytte data sammen med andre data, for å forenkle gjenbruk og integrasjon av forskjelligartede datasett.
- Utnytte og avlede opphavshistorikk for å styre data og tilby provenansstyring og finmasket aksesskontroll i et stordata-økosystem med mange forskjellige komponenter.
Eksperimentet ble utført ved hjelp av en oppdiktet case på nyhetsanalyse i sanntid, der et tenkt team av analytikere holder oversikt over hendelser i en region til støtte for en pågående militæroperasjon. Dette tilfellet krever at informasjon fra sanntids nyhetsstrømmer blir slått sammen med statisk bakgrunnskunnskap. Rapporten beskriver den tekniske infrastrukturen som ble satt opp for å løse casen på et konseptuelt nivå, og går igjennom hvordan de behandler de skisserte problemene med hensyn til gjenbruk av data.
Som identifisert i en tidligere FFI-rapport, finnes det ikke en generisk stordatainfrastruktur som passer alle brukstilfeller: Hvilke komponenter infrastrukturen består av bør dikteres av de karakteristiske trekkene ved det problemet som skal løses. Infrastrukturen som blir utforsket i denne rapporten, er heller ikke noe unntak ettersom den ble satt sammen for å løse en bestemt nyhetsanalysecase. Rapportens viktigste bidrag er å gi et eksempel på hvordan man kan utnytte stordatateknologier (basert på åpen kildekode) fra sivil sektor i det militære domenet for å legge til rette for økt, kontrollert datagjenbruk Dette støtter hypotesen om at dette kan gjennomføres, og rapporten kan være nyttig informasjonsgrunnlag når man vurderer forskjellige tilnærminger for å håndtere informasjonsforvaltning i en militær kontekst.