Kohti avointa dataa

Valtionvarainministeriön JulkICT-toiminto on käynnistänyt metatietopalveluiden esiselvityksen. Mistä on kyse ja mikä metatietopalvelu on? Kuka sitä käyttää ja miksi? Tästä saimme tietoa 14.9. pidetyssä Julkishallinnon metatietopalvelut (VATI-projekti) väliraportin esittelytilaisuudessa.

Metatieto?

Urbaani legenda väittää, että sana ”meta” tulee kreikasta ja tarkoittaa alkuperäisessä tarkoituksessaan kärryä tai muuta kuljetuslaitetta, jonka avulla tavaraa kuljetetaan. Näin ollen metatieto voidaan tulkita ”kärryksi” joka kuljettaa tietoa – toivon mukaan oikeaan aikaan, ja oikeaan paikkaan. Metatieto on määritelty eri paikoissa hieman erilailla; mm. Gilliland-Swetland (2000), Honkaranta (2003) ja Salminen ovat määritelleet metatiedon yksinkertaisimmillaan ”tiedoksi tiedosta”. Jos metatiedolla haluaa hifistellä, voi tutustua vaikkapa Lyytikäisen väitöskirjaan, jossa metatietoja on analysoitu ja luokiteltu monin tavoin.

Avoin tieto saataville

Valtionhallinnon tarjoama avoin tieto mahdollistaa uudenlaisia tietopalveluita. Kansalainen voisi esimerkiksi saada tietoa kiinnostavan tontin kaavoitus- ja rakennelupa-asioista tai lähistön kouluista yksinkertaisesti sallimalla tontilla seistessään puhelimensa paikallistaa itsensä, ja lähettämällä rakennuslupapalvelun tarjoajalle viestin: ”lähetä sijaintini kaava- ja rakennuslupa-tiedot” tai ”lähetä sijaintiini liittyvä lähin koulu ja alueen ikäjakauma”. Julkishallinnon tietojen avaaminen luo täten mahdollisuuksia uudenlaisiin höytypalveluihin kansalaisille. Edellisessä esimerkissä sijainti on sitä metatietoa, jota tarvitaan vastaustietojen koostamiseen. Koostaminen on tarpeellista siksi, koska tiedot ovat useimmiten pirstaloituneet useisiin eri lähteisiin.

Keppiä viranomaisille

Miksi viranomaiset sitten haluavat avata tietovarantonsa, ja saattaa ne sekä yritysten että organisaatioiden käytettäväksi? (Koska niiden on pakko. ;-)

  • VM periaatepäätös 3.3.2011
  • Hallitusohjelma
  • VN periaatepäätös 5.10.2011; jatketaan tietovarantojen avaamista.

Valtionhallinnon tuottamat tietovarannot on tuotettu lukuisten toimijoiden toimesta, erilaisia käsitteitä, tietomalleja ja formaatteja käyttäen. Ne sijaitsevat lukuisissa dokumenttiarkistoissa ja tietokannoissa ympäri Suomen. Vaikka viranomaiset avaisivat kaikki tietolähteensä esimerkiksi WebService-palveluina Internetiin, ei niissä oleva tieto olisi välttämättä yhteensopivaa ja helposti ohjelmallisesti hyödynnettävää. Jotta avointa tietoa voi hyödyntää ohjelmallisesti, tietovarannot tulee siis kuvailla yhtenäisiä metatietomäärityksiä käyttäen. Tämä on metatietopalvelun tarkoitus ja ydin. Metatietopalvelun laatiminen ei ole yksinkertaista, eikä myöskään ilmaista. Näin ollen metatietopalvelu jäisi ilman omistajaa ja maksajaakin, ellei laki julkisen hallinnon tietohallinnon ohjauksesta (10.6.2011/634) edellyttäisi julkisen hallinnon yhteisiä kuvauksia ja määrityksiä (ts. metatietopalvelun laadintaa) avoimen tiedon yhteentoimivuuden toteuttamiseksi.

VATI-esiselvityksen alustavia tuloksia

Julkisten tietovarantojen avaamiseen liittyvästä julkishallinnon metatietopalvelusta eli VATI-projektista ollaan nyt esiselvitysvaiheessa. Esiselvityksestä on julkaistu väliraportti, jossa otetaan kantaa metatietopalvelun arkkitehtuuriin ja metatietopalvelua kehittäviin ja ylläpitäviin tahoihin.

Metatietopalvelu itsessään sisältää avoimen tiedon kuvailussa käytettäviä metatietomäärityksiä (sanastoja ja normeja). Se ei siis sisällä varsinaisia yksittäisten tietokohteiden metatietoja.

Jotta metatietomäärityksistä saadaan yhtenevät, tarvitaan erityyppisiä ts. erilaisia sisältötyyppejä ja tietovarantoja kuvailevia metatietomäärityksiä. Näitä on jo lukuisia, joten metatietopalvelu pyrkii koostamaan ne yhteen, ei luomaan uusia. Alla olevassa kuvassa on havainnollistus metatietopalvelun alustavasta arkkitehtuurista[1].

Metadata

Ontologioilla tarkoitetaan käsitteiden ja käsitteiden välisten suhteiden määrityksiä. Esimerkkejä ontologioista löytyy esimerkiksi ONKI-ontologiapalvelusta. Metatietomäärityksistä tunnetuimpia (Suomessa) ovat esimerkiksi DublinCore (wikipedia), Sähke II ja JHS 143. Näiden lisäksi tarvitaan erilaisia luokituksia ja tunnisteita (kuten esim. verkko-osoitteen yksilöivä URI, tai asiakirjan yksilöivä OID). Kuva siis havainnollistaa erilaisten metatietomääritysten ja luokitusten (esiselvityksessä laaditun tyypityksen mukaisia) metatietomääritystyyppejä, joita palvelussa käytetään, ei yksittäisiä metatietomäärityksiä.

Metatietopalvelun esiselvityksen väliraporttiin voi tutustua osoitteessa: http://www.hare.vn.fi/mAsiakirjojenSelailu.asp?h_iId=17792&a_iId=190076

[1] (Lähde: Julkishallinnon metatietopalvelun esiselvitys, keskustelutilaisuus 14.9.2012 aineisto).

dokumentinhallinta
Anne Honkaranta | Johtava konsultti

Anne Honkaranta | Johtava konsultti

Anne on taklannut prosessien ja asioinnin digitalisoinnin haasteita jo parinkymmenen vuoden ajan. Dokumenttienhallinnasta alkanut innostus on ajan myötä laajentunut kokonaisarkkitehtuureihin (erit. Togaf, JHS 179), sähköiseen asiointiin, tietoturvaan ja -suojaan, ja erityisesti tietoarkkitehtuureihin. Teknisistä ratkaisuista tuttuja ovat mm. XML sisällöntuotanto, M-Files, CaseManager, SharePoint ja WebCenterContent sekä joiltain osin FileNet. Työnkuva sisältää konsultointia, määrittelyä, tarjooma- ja myynnintukityötä, joka on Annen mielestä mukava ”cocktail”. Vapaa-ajalla touhua riittää kahden pienen terrierin kanssa. Rauha löytyy vaeltelemalla islanninhevoskyydillä pitkin metsäpolkuja.

Kirjoittajan kaikki blogitekstit

Tilaa blogikirjoitukset sähköpostiisi


Viimeisimmät kirjoituksetSeuraa meitä somessa

LinkedIn Twitter Facebook YouTube YouTube