Semantikkbasert informasjonsforvaltning for Forsvaret - sluttrapportering av aktiviteten på semantiske teknologier i FFI-prosjekt Informasjons- og integrasjonstjenester i INI

Date Issued
2016
Keywords
Informasjonsintegrasjon
Informasjonsinfrastruktur
Semantisk web
Kunstig intelligens
Project number
17/00012
Permalink
http://hdl.handle.net/20.500.12242/1305
Collection
Rapporter
17-00012.pdf
Size: 1M
Abstract
Rapporten oppsummerer forskningsaktiviteten på semantiske teknologier i FFI-prosjekt 1277 – Informasjons- og integrasjonstjenester i INI. Delaktivitetens oppgave var å studere hvordan semantiske teknologier kan brukes til å bidra til å løse problemet med å integrere informasjon fra heterogene kilder. Et overblikk over fagfeltet, grunnleggende konsepter og standarder blir først presentert. Her beskrives semantiske teknologier generelt, før det dykkes ned i teknologier og standarder assosiert med Semantic Web, en gruppe semantiske teknologier som har blitt lingua franca for feltet og som er bygget på web-arkitekturen. Rapporten fortsetter så med å legge frem lovende anvendelsesområder for teknologiene med tanke på bruk i forsvarssammenheng. Anvendelsene skissert er følgende: ontologibasert dataintegrasjon der ontologier fungerer som et abstraksjonslag over heterogene kilder, reaktiv hendelsesdeteksjon over strømmer av data, semantiske teknologier som stordatarammeverk, samt bruk av RDF (en standard under Semantic Web paraplyen) som metadatastrategi. Deretter skiftes fokus over til å beskrive forskningsproblemene som prosjektet konsentrerte seg om, eksemplifisert med to konkrete militære problemstillinger, henholdsvis planlegging av evakueringsflygninger i en konfliktsituasjon og et konseptuelt informasjonssystem for helse- og hendelsesregister. Fellesnevneren for eksemplene er behovet for å hente inn informasjon fra en rekke heterogene informasjonskilder. Basert på de ovennevnte problemstillingene, ble det å løse problemer relatert til innsamling av relevant informasjon fra heterogene informasjonskilder, under de særskilte behov og begrensninger som det militære domenet fordrer, prosjektets hovedfokus. Dette førte til forskningsresultater som er av teoretisk og prinsipiell natur, men som er appliserbare i en videre forstand både innenfor og utenfor det militære domenet. I tillegg ble det, basert på de teoretiske resultatene, utviklet programvare for praktisk informasjonsintegrasjon. Rapporten dokumenterer resultatene som er oppnådd samt lærdommene som ble trukket av dem. Til slutt forelegges konkrete anbefalinger med tanke på å tilrettelegge for bruk av teknologien både på kort og lang sikt. Mer konkret er det prosjektets oppfatning at dataorientering ved bruk av RDF har et stort potensial for Forsvaret. For at dette skal kunne være realiserbart, har prosjektet kommet frem til anbefalinger som dekker både strategi og retningslinjer og mer tekniske aspekter. For førstnevnte gruppe, anbefales det å utvikle en strategi for standardisert navngiving av ressurser i en dataorientert setting, samt tilhørende metadatastrategi, for bruk i Forsvaret. De mer tekniske anbefalingene er å utvikle kompetanse på grafdatabaser samt å utvikle datafederering som et alternativ til datavarehus. Grafdatabaser er nyttige teknologier som egner seg for analyse av store datamengder, mens datafederering er svært nyttig som et alternativ til datavarehus der informasjon må hentes utenifra og juridiske barrierer kan forhindre lokal lagring av data.
This document summarizes the research undertaken and recommendations produced in the FFIproject 1277 regarding semantic technologies. The mandate for the activity was to study how semantic technologies can contribute in solving the problem of integrating information from heterogeneous sources First, a high-flying overview of the subject area, the basic concepts and related standards are presented. The general field of semantic technologies is introduced before diving into the technologies and standards that are associated with the Semantic Web, a group of semantic technologies built on top of the web-architecture, that have become the lingua franca for the field. The document then proceeds to highlight some promising military application areas for the technologies. More specifically, the areas are: ontology-based data access where ontologies act as an abstraction layer over the heterogeneous sources, event detection over streaming data, semantic technologies as a big-data framework, and finally the use of RDF as a metadata strategy. The focus of the document then shifts over to describing the research questions that were in focus, exemplified by using two concrete cases from the military domain. More specifically, a case involving planning military evacuation flights in a conflict zone and a case conceptualizing an information system involving accessing medical and event-based data. The commonality between the two cases is the need to collect and integrate information from various heterogeneous sources. Based on the aforementioned, the concrete research activities undertaken focused on solving problems related to federated information gathering from heterogeneous data sources, under the distinctive constraints and requirements that the military domain imposes. This produced research results of a theoretical and principal nature, yet are applicable in a wider context both within and outside the military domain. Furthermore, software was produced that facilitates practical information integration based on the theoretical results. The results and lessons learned are subsequently documented. Finally, a set of recommendations are produced regarding what activities that should be undertaken in order to make the technology ready for use both in the short and the long term. More concretely, the project believes that a data-oriented approach, using RDF, has great potential for military use. However, in order to ensure that it is realizable, the project has produced a set of recommendations regarding strategy and best-practices, as well as technologies that that warrant further focus. With respect to the former group, it is recommended that an URI strategy for naming resources in a data-oriented setting for use in the Norwegian defence is developed, together with a matching metadata strategy. With respect to technology areas, the project recommends acquiring and developing knowledge regarding graph databases as these are well-suited for analyzing large amounts of data. Another recommendation is to develop federated information gathering and querying as an alternative to traditional data warehouse strategies, which is especially useful in situations where information must be collected from sources outside the home organization and/or judicial barriers prevents local storage of data.
View Meta Data