Skip to content

Tietämyksen lisääminen avoimen datan avulla tapahtuu yrityksen ja erehdyksen kautta

Julkista dataa hyödynnetään vielä vähän vaikka tietovarastoja onkin jo tarjolla. Julkisen datan saaminen liiketoiminnan käyttöön ei ole ylitsepääsemättömän vaikeaa, vaikka datan jalostamisessa onkin omat haasteensa.

Erilaisiin julkisiin tietovarastoihin kerätyn datan määrä on valtava. Vaikka näihin datavarastoihin pääsee yhä helpommin käsiksi, on niiden käyttö liiketoiminnan tukena yhä varsin vähäistä. Merkittävää on, että yritykset saattavat jättää hyödyntämättä kriittisen kilpailuedun avoimen datan kohdalla.

Rohkeimmat ja ennakkoluulottomimmat ovat aloittaneet julkisten tietovarastojen hyödyntämisen omien tietojensa ohella. Haasteitta se ei yleensä onnistu, mutta yritysten ja erehdysten kautta dataa on jo saatu hyödynnettyä osana liiketoimintaa.

Toisin kuin yhtiöiden sisäisissä projekteissa, julkisen datan hyödyntämisessä ei normaalisti pääse vaikuttamaan datalähteeseen tai datan muotoon/sisältöön. Yleensä data on kerätty toista tarkoitusta varten. Lisäksi varsinkin ihmisiin liittyvä data on usein anonyymisoitu.

Tämä tuo omat haasteensa datan jalostamiselle. Data saattaa olla valmiiksi summattua, kun tarve olisi rivitason datalle. Datassa saattaa olla merkittäviä rajoitteita, jotka pahimmassa tapauksessa estävät datan käyttämisen toivotun tiedon tuottamiseen. Onneksi tilanne on vain harvoin näin toivoton.

Julkisen datan hyödyntäminen on iteratiivinen prosessi

Miten julkinen data sitten saadaan liiketoiminnan käyttöön? Prosessi alkaa kuten muutkin raportointiprojektit: Määritellään tarve ja mietitään mistä tieto tähän olisi saatavilla. Potentiaalisen lähteen löydyttyä tutustutaan dataan ja mietitään sisältääkö se jossain muodossa haluttua tietoa. Ensisilmäyksellä tieto voi jäädä huomaamatta tai sitä lähtee hakemaan aivan väärällä tavalla.

Työ tässä vaiheessa on iteratiivista: datan käsittely avaa sitä uusin tavoin ja opettaa katsomaan sisältöä erilaisista näkökulmista. Usein tämä vie tilanteeseen, jolloin datasta löydetään yllättävää tietoa. Mahdottomaksikin tuomitut tietotarpeet saatetaan yhtäkkiä pystyä täyttämään. Tässä vaiheessa ei kannata luovuttaa ensimmäisen vastoinkäymisen kohdalla, vaan antaa datalle toinen mahdollisuus.

Datan liittyvän ymmärryksen kerryttyä voidaan aloittaa seuraava iteraatiokierros: Mietitään oliko alkuperäinen tietotarve riittävä vai kannattaako tarvetta myös muokata. Tätä iterointia helpottaa erittäin paljon esimerkiksi Microsoft Power BI:n mahdollistama nopea visualisointi. Ideoiden implementointi onnistuu vaivatta, vaikka kesken ideariihen. Kun liiketoiminta näkee ensimmäisen raakavisualisoinnin tiedosta, on heidän helpompi tehdä päätöksiä tiedon tarpeellisuudesta. Tämä nopeuttaa iteraatiokierrosta ja vähentää työmäärää. Valmista tulee nopeammin sekä usein myös halvemmalla.

Tässä vaiheessa loppukäyttäjälle on tarjolla lähes valmis raportointikokonaisuus. Tieto on saatu esiin datamassasta ja se pitää asettaa sopivaan muotoon. Tehdään siis perinteisen raportointiprojektin viimeinen vaihe eli iteroidaan loppukäyttäjien kanssa raportin ulkoasu ja käytettävyys. Toki layout ja mittarit ovat aiemmissa vaiheissa saaneet paljon rakennetta valmiiksi ympärilleen, joten tyhjästä ei yleensä olla lähdössä liikkeelle.

Power BI:llä avoin data saadaan käyttöön

Prosessin taustalle kuuluu normaalisti myös voimanlähteen kehitys, jolla avoimen datan käyttö tehdään mahdolliseksi. Avointa dataa käsitellään yleensä rajapintojen sekä integraatioiden kautta ja sitä kerätään tietovarastoihin tai -altaisiin. Näiden ratkaisujen avulla dataa voidaan hyödyntää laaja-alaisesti analytiikan ja raportoinnin toteutuksiin. Vaihtoehtona rajapinnoille ja integraatioille voi olla myös datan tilaaminen. Tällöin ratkaisuissa tulee ottaa huomioon tiedostojen lähettäminen sekä mahdollinen yhteistyö omistajatahojen kanssa. Mitä enemmän datan hankintaan kuuluu manuaalisia vaiheita, sitä suurempi mahdollisuus on virheille.

Power BI:n kaltaiset raportointiratkaisut ovat tuoneet tehokkaan ja käytännöllisen keinon luoda informaatiota, kun avoin data on taustalla käytettävissä. Pystymme tekemään nopeasti PoC:n ja käsittelemään konseptien sijaan aitoa käyttöliittymää jopa aloituspalaverista alkaen. Voimme keskittyä miettimään luovatko ratkaisut arvoa käyttäjille. Kehitystä on helppo moduloida ja kasata silti yhdeksi lopputuotteeksi käyttäjille. Olemme olleet jo mukana luomassa täysin uusia palveluita tätä kautta asiakkaillemme.

Power BI on erinomainen työkalu datan visualisoimiseksi eri päätelaitteille, kuten infotaululle tai puhelimeen. Se on täydellinen väline korkeamman analytiikan tulosten kokoamiseen käyttäjille tai pistemäiseen datan seuraamisen Iot-kokonaisuuksissa. Kaiken keskiössä on datan kerääminen käytettäväksi, jonka jälkeen sitä voidaan keskittyä hyödyntämään.

Kirjoittajat: Joni Ville Asikainen & Ville Qvist

 

Tilaa blogikirjoitukset sähköpostiisi