Tietovarastot ja analytiikka datan laadun parantajana

Analytiikka sopii raportointitarpeiden ratkaisemisen lisäksi mainiosti myös datan laadun parantamiseen.

data_tietovarasto.jpg

Analytiikkaa myydään usein erilaisten raportointitarpeiden ratkaisijana. Raportointi ja tiedon analysointimahdollisuudet ovat varmastikin tärkein syy toteuttaa analytiikkaprojekti. Vähintään yhtä tärkeä, mutta harvoin mainittu syy on myös organisaation datan laadun tutkiminen analytiikan avulla.

Joskus tietovarasto- ja analytiikkaprojekteissa nähdään seuraava tapahtumaketju: Ensin siirretään organisaation eri osista data tietovarastoon. Tämän jälkeen data haetaan analytiikkatyökaluun. Analysoinnin yhteydessä havaitaan enemmin tai myöhemmin, että itse asiassa merkittävä osa datasta on niin huonolaatuista, että joko raportointitarpeet pitää miettiä uusiksi tai usean lähdejärjestelmän osalta datan laatuun pitää kiinnittää huomiota ihan eri tavalla kuin aiemmin on tehty.

Päätös, joka tehdään huonolaatuisen datan pohjalta, on huonolaatuinen päätös.

Vaikka edellä kuvattu tilanne saattaa olla organisaatiolle ikävä yllätys ja jopa järkytys, usein tämän tyyppinen lopputulos on itse asiassa paras asia mitä olisi voinut tapahtua. Pahempi asia on se, ettei datan huonolaatuisuutta havaita ja sen antamia tuloksia käytetään päätöksenteossa. Päätös, joka tehdään huonolaatuisen datan pohjalta, on huonolaatuinen päätös.

Tietovarastot ovat huonon datan pelastus

Miten sitten lähteä parantamaan datan laatua? Usein ensimmäinen ajatus on, että data konvertoidaan parempilaatuiseksi suoraan lähdejärjestelmässä eli siellä missä data on tuotettu. Se ei yleensä ole kuitenkaan mahdollista. Ongelmaksi tulee, että useimpia järjestelmiä ei ole suunniteltu niin, että huonolaatuista dataa voisi jälkikäteen saada paremmaksi.

Kyseessä ei ole pelkästään järjestelmän heikkous. Usein lainsäädäntö asettaa rajoituksia datan muokkaamiselle jälkikäteen. Näin tapahtuu esimerkiksi toiminnanohjausjärjestelmissä. Tietojen pitää säilyä järjestelmässä alkuperäisenä ja tällöin myös virheet joudutaan säilyttämään.

Tehokkaat tekniset ratkaisut eivät auta, mikäli ei tiedetä miltä osin data on huonolaatuista.

Koska datan laadun parantamisessa lähdejärjestelmämuokkaukset ovat usein poissuljettu vaihtoehto, jää hyväksi ratkaisumalliksi datan laadun parantaminen esimerkiksi tietovarastossa.

Hyvin toteutetuissa tietovarastoissa on riittävän joustavat ja tehokkaat tiedonsiirto- ja hallintaratkaisut, jotta datan laadun parantaminen voidaan ottaa osaksi prosessia. Tämä ei kuitenkaan usein riitä. Tehokkaat tekniset ratkaisut eivät auta, mikäli ei tiedetä miltä osin data on huonolaatuista.

Miten sitten havaitaan huonolaatuinen data? Tietovarastoratkaisujen lisäksi siinä auttaa riittävän laaja-alainen analytiikkaratkaisu. Erittäin hyvä tapa on antaa loppukäyttäjälle mahdollisuus tutkia dataa analytiikkatyökalussa tapahtumatasolla ja mahdollisimman useiden kenttien osalta.

Toinen hyvä tapa on antaa loppukäyttäjälle mahdollisuus suodattaa dataa esimerkiksi lähdejärjestelmäkohtaisesti.Ylipäänsä monipuoliset suodatusmahdollisuudet auttavat datan laadun selvittämisessä.

Kolmanneksi on tärkeää tarjota mahdollisuuksia siirtää dataa myös ulos analytiikkatyökalusta jatkotutkimuksia varten, esimerkiksi Exceliin.  Näillä ratkaisuilla huonolaatuinen data ikään kuin pomppaa käyttäjän silmille ja datan laadun parantamisprosessi voi alkaa.

 

Tutustu myös Markus Määttälän aiempaan kirjoitukseen "Kumman valitset, huonon ohjelmiston vai huonon datan?".

New Call-to-action

analytiikka




Markus Määttälä | Vanhempi konsultti

Markus Määttälä | Vanhempi konsultti

Markus työskentelee Digialla vanhempana analytiikkakonsulttina. Kokemusta löytyy erityisesti talouspuolen tietovarasto-, integraatio- ja analytiikkaprojekteista. Jos asia liittyy dataan, hän on aiheesta kiinnostunut, sekä suunnittelun että toteutuksen näkökulmasta. Toteutuksen osalta hänen tärkeimmät tavoitteensa ovat ratkaisun selkeys, yksinkertaisuus ja ylläpidettävyys, suorituskykyä unohtamatta. Markus on siis eräänlainen ohjelmistoprojektien datatyömies. Harrastukset ovat hänellä aina liittyneet erityyppisiin peleihin, kuten jalkapallo, tietokone- ja mobiilipelit, vakioveikkaus ja pokeri. Edellä mainittuihin harrastuksiin verrattuna kuitenkin itse elämä on vaikein peli, koska sitä ei kukaan voi hallita täydellisesti. Se tekee elämästä mielenkiintoista.

Kirjoittajan kaikki blogitekstit

Tilaa blogikirjoitukset sähköpostiisi


Viimeisimmät kirjoitukset



Seuraa meitä somessa

LinkedIn Twitter Facebook YouTube YouTube