Sami Laineen kuva

Tiedon laadunhallinnan parhaat käytännöt

Tietojen laadunhallinta on digitalisoituvan maailman suurimpia haasteita. Heikkolaatuinen tieto aiheuttaa valtavasti turhaa työtä, virheellisiä johtopäätöksiä, realisoituneita riskejä ja menetettyjä mahdollisuuksia. Toisaalta alustatalouden ohjelmistoyritykset luovat ennen näkemättömiä varallisuuksia lähes pelkästään tietoaineistoja hyödyntämällä. Heille tieto on arvokkainta pääomaa. Sitä johdetaan arvontuottoperusteisesti ja itsenäisenä tuotteena.

Tiedon laatu riippuu käyttötarkoituksesta

Tiedon laadunhallinnasta keskusteltaessa pitää tietysti määritellä mitä tarkoitetaan tiedon laadulla. Akateemisessa tutkimuksessa ja käytännön ammattilaisten keskuudessa on vakiintunut määritelmä, että tieto on laadukasta kun ’se soveltuu käyttötarkoitukseensa’. Sama tieto voi olla riittävän laadukasta yhteen tarkoitukseen mutta liian huonoa toiseen tarkoitukseen. Tiedon laatu riippuu siis aina asiayhteydestä ja käyttötarkoituksesta eikä tiedon laadulle ole kyetty tähän päivään mennessä määrittelemään kaikenkattavia mittayksiköitä tai edes täysin yhtenäistä käsitteistöä.

Tiedon käyttötarkoitus on tiedosta tehtävä tapauskohtainen johtopäätös, jonka perusteella voidaan priorisoida toteutettava käytännön toimenpide. Ilman tällaista käyttötarkoitusta laadunhallinnan soveltaminen muuttuu usein hitaaksi, kalliiksi ja jopa haitalliseksi toiminnaksi. Tämä johtuu siitä että laadunhallinnan toimenpiteitä voi tehdä loputtomasti käytännössä tarpeettomienkin yksityiskohtien optimoimiseksi ja toisaalta yhtä käyttötarkoitusta varten tehdyt toimenpiteet saattavat haitata toisia käyttötarkoituksia. Tämän vuoksi yksittäiselle tietotuotteelle, kuten tilastoraportin luvulle tai tietokantataulun yksittäiselle arvolle, tulee aina tunnistaa selkeä käyttötapaus johtopäätöksineen.

Esimerkiksi henkilöiden painoa ei useinkaan tarvitse käsitellä mikrogramman tarkkuudella. Asiakkaan henkilötunnuksen vaatiminen kaikissa kontaktitilanteissa parantaa henkilötiedon varmuusastetta mutta se myös haittaa tarpeettomasti myyntiprosessia sekä lisää tietosuojariskejä. Tiedon laadunhallinnan asiantuntijoiden tuleekin tämän vuoksi aina pyrkiä ymmärtämään yhä laajemmin ja syvällisemmin tiedon hyödyntäjien tarpeita sekä tunnistamaan heidän tavoittelemiaan johtopäätöksiä. Tämän jälkeen loputtomilta vaikuttavat laadunhallinnan toimenpiteet kyetään priorisoimaan tukemaan näiden tärkeimpien johtopäätösten oikeellisuutta.

Tietoa tulee johtaa tuotekehityksenä

’Tietoa tulee johtaa tuotteena’-ajatusta korostettiin jo maailman arvostetuimman teknillisen korkeakoulun MIT:in 90-luvun tiedon laatu tutkimuksissa [1]. Tämä päätelmä on noussut uudelleen esiin myös käytännön ammattilaisten puolella. Tutkimuslaitos Gartner nosti saman huomion yhdeksi tärkeimmistä suosituksistaan liiketoiminnan uudistamista ja arvontuottoa tavoitteleville Chief Data Officereille (CDO)[2].

Tietotuotteet tuottavat liiketoiminta-arvoa ja kilpailuetua vasta kun niiden tuottamista johdetaan näistä näkökulmista – eikä esimerkiksi IT-palvelun alaisena tukitoimintona tai toiminnan sivutuotteena. Vuonna 2016 Gartner esitti vielä miten CDO (2.0) johtaa konsernin tiedonhallinnan parhaiden käytäntöjen ja analytiikan yhteistyön kehittämistä. Nyt vuonna 2020 Gartner kuvaileekin miten kehittyneimpien organisaatioiden CDO:t (4.0) ohjaavat organisaatioiden tuottoja ja kuluja liiketoimintaperusteisesti arvioitavilla tietotuotteilla. Tiedon laadunhallinta on noussut digitalisoituvissa huippuyrityksissä liiketoiminnan ytimeen ja strategisen johtamisen keskiöön.

Tietotuotteen johtamiseksi tarvitaan siksi liiketoiminnan näkökulmasta tietopääomia johtava organisaatio. Tämä organisaaatio koordinoi ja ohjaa tietoa tuottavien yksiköiden, sitä jalostavien yksiköiden ja sitä hyödyntävien yksiköiden kokonaisuutta ylitse yksittäisten siilojen. Tiedon laadunhallinnassa pätee yhä neljä periaatetta[1]:

  • tiedon tulee perustua hyödyntäjien käytännön tarpeeseen,
  • tietotuotteen hallinta tulee toteuttaa järjestelmällisenä tuotantoprosessina,
  • tietoa tulee hallita koko elinkaaren ajan syntyhetkestä tuhoamiseen asti, ja
  • se tarvitsee koko tuotantoprosessin ylittävän vastuullisen omistajan.

Yllä mainittua mukaillen tiedonhallinnan ammattilaisten yhdistys DAMA International määritteleekin tiedon laadunhallinnan toiminnan olevan ’laatujohtamisen menetelmien soveltamista tietotuotteiden suunnittelussa, toteutuksessa ja hallinnassa, jotta varmistetaan tiedon soveltuvuus hyödyntäjien tarpeisiin ja käyttötarkoituksiin’ [3]. Näiden menetelmien lähtökohtana on aina jatkuvan parantamisen laatuympyrä: suunnittelu, toteutus, arviointi, parantaminen (Kuva 1). Tietotuotteen tapauksessa tätä sykliä tulee soveltaa kokonaisvaltaisesti koko sosio-teknisen järjestelmän osalta tiedon syntyhetkestä sen kaikkien käsittelyprosessien läpi ja aina lopulliseen käyttötarkoisuukseensa asti.

Kuva 1: Teollisten tuotantoprosessien jatkuvan parantamisen laatuympyrä tunnetaan monilla nimillä kuten Deming-sykli. Harva tietää että käsitteen popularisoinut Deming lainasi laatuajatteluunsa aikaisempia väestönlaskennan eli tiedon laadunhallinnan oppeja.

Laadunhallinnan asiantuntijan työnkuva vaihtelee valtavasti

Tiedon laadunhallinnan asiantuntijat työskentelevät organisaatioiden kehittämisen kaikilla tasoilla strategisesta johtamisesta operatiivisen toiminnan kehittämiseen asti. Strategisella tasolla he ajavat organisaatiopoliittisia muutoksia ja tasapainoilevat ylimmän johdon kanssa liiketoiminnan eri näkökulmien kesken. Operatiivisella tasolla he joutuvat perehtymään moniin käytännön yksityiskohtiin, joissa nivoutuvat toisiinsa niin tietotekniset ratkaisut kuin inhimillisen toiminnan haasteet. Tiedon laadunhallinnan ammattilaisten työssä haastavinta onkin laajojen strategisten kokonaisuuksien ja pienten käytännön yksityiskohtien keskinäisten vuorovaikutussuhteiden tunnistaminen sekä näiden yhteyksien kommunikointi eri sidosryhmille: liiketoimintaedustajille, IT-ammattilaisille, ylimmälle johdolle ja jopa ulkoistetuille alihankkijoille.

Tietojen laadunhallinnan tuleekin aina perustua tiedon hyödyntämisen kontekstiin ja tiedon yksittäisiin käyttötarkoituksiin. Aihepiirin asiantuntijoiden tulee ymmärtää tiedon hyödyntäjien ajattelumalleja sekä todellisia tietotarpeita – vaikka he eivät osaisi niitä aina suoraan kertoakaan. Tämän vuoksi tiedon laadunhallinnan asiantuntijat joutuvat tekemään ensikäden analyysejä kovasta datasta ympäri organisaatioiden lukemattomia tietojärjestelmiä. He etsivät niistä faktoja, joita kukaan ei osaa kertoa tai ei ole vielä edes huomannut. Heidän tulee ymmärtää tietoaineistojen tekniset yksityiskohdat, liiketoiminnalle merkityksellisten asiayhteyksien semanttiset vivahteet ja näiden muodostamien yhteyksien monitahoiset vaikutukset käytännön toimintaan. Tämä kaikki aiemmin mainittu pitäisi vielä kääntää jatkuvaksi kehittämiseksi, jossa pääpaino on löydettyjen käytännön ongelmien ratkaiseminen niin vuosien strategisella kuin arkipäivän päivittäiselläkin rytmillä.

Edellä mainitun johdosta on selvää, että tiedon laadunhallinta on erittäin haastavaa, sillä siihen liittyy usein viheliäisiä ongelmia ja toisaalta oleellisia yksityiskohtia. Pienen ongelman korjaaminen saattaa maksaa valtavasti tai toisaalta aiheuttaa valtavia haittoja muualla. Tiedon laadunhallinnassa toisen harmi on usein toisen hyöty. Tämän vuoksi sanotaankin usein että tiedon laadussa ei kannata eikä voikaan pyrkiä täydellisyyteen.

Käytännön ammattilaisten keskuudessa on kehitetty lukuisia erilaisia prosessimalleja tiedon laadunhallinnan toteuttamiseksi. Yksi suosituimmista on ’Ten Steps to Quality Data and Trusted Information’. Kirja kuvaa hyvin miten aluksi tunnistetaan liiketoiminnan tarpeet ja tavoitteet, tämän jälkeen tutkitaan ympäristön tietoaineistot sekä lopulta parannetaan toimintaa tiedon laatuongelmia ehkäisevillä, tunnistavilla ja korjaavilla ratkaisuilla.

Perinteinen 10 askeleen prosessimalli soveltuu hyvin ohjaamaan niin suurempia kuin pienempiäkin kokonaisuuksia, mutta sen soveltamisessa on muutamia merkittäviä haasteita. Projektimuotoinen etenemistapa jää helposti kertaluontoiseksi projektiksi eikä jalkaudu osaksi jatkuvaa arkipäivän toimintaa. Toisaalta hyödyt jäävät vähäisiksi jos projektit muuttuvat byrokraattisiksi dokumentointiprojekteiksi tai toisaalta teknisesti raskaiksi ohjelmistoprojekteiksi. Usein nämä edellä mainitut haasteet vahvistavat toisiaan. Liiketoiminnan puutteellisen tuen vuoksi projekti saattaa keskittyä tarpeettomaan laatumittarien dokumentointiin tai toisaalta puutteellisten työtapojen ja -välineiden vuoksi ongelmien ratkaisemisen IT-kulut nousevat liian suuriksi.

Laadunhallinta hyötyy ohjelmistoautomaatiosta

Tiedon laadunhallintaan on olemassa erilaisia ohjelmistoja, joiden käyttötarkoitukset ja ominaisuudet vaihtelevat valtavasti. Perinteisesti tiedon laadunhallinnan välineiksi käsitetään englantilaisittain ’DQ platform’-tyyppiset ohjelmistot. Ne ovat pääosin eräajopohjaisia ohjelmistoja, jotka liitetään valvomaan ja korjaamaan tietoaineistoja. Mikäli laadunhallintaan on tarvittu reaaliaikaista tietojen korjaamista, niin näiden sijaan onkin hankittu esimerkiksi ’MDM Platform’-ohjelmisto tai ’Data Service’-palvelu.

Mikäli yllä mainittuja ohjelmistoja ei ole hankittu valmistuotteina, niin niitä vastaavia toimintoja on ohjelmoitu paikallisesti esimerkiksi ETL- ja BI-välineillä. Hiemankin laajemmissa ja tietointensiivisemmissa tarpeissa tämä ei ole kuitenkaan kustannustehokasta. Tämän vuoksi niin Gartnerin kaltaiset tutkimuslaitokset kuin asiaan erikoistuneet palveluyrityksetkin suosittelevat kehittyneitä laadunvalvonnan automaatiovälineitä. Parhaat välineet nopeuttavat tyypillisimpien käyttötapauksien toteuttamista kuukausista viikkoihin tai jopa päiviin, mutta vain rajatulla toiminta-alueella ja kyseiselle välineelle ominaisille käyttötarkoituksille.

Nykyään yleistyvät Data Governance-, Data Catalog-, ja Data Preparation-ohjelmistot voivat olla myös hyödyllisiä ohjelmistoja tiedon laadunhallinnan jalkauttamiseksi liiketoiminnan arkipäivän toiminnaksi. Näistä ohjelmistoista löytyy kyvykkyyksiä esimerkiksi laadunhallinnan työnkulkujen hallintaan, tietoaineistojen automaattiseen dokumentoimiseen ja sisällön valvontaan sekä tietoaineistojen käsittelyyn ja rikastamiseen. Monien ohjelmistotoimittajien tuotekokonaisuudet yhdistelevätkin eri tavoilla useampia yllä mainittuja tuotetyyppejä.

Tiedon laadunhallintaan tarkoitettuja ohjelmistotuotteita hankkiessa kannattaakin siis huomata, että ne ovat hyvin erilaisia jopa saman kategorian sisällä – DQ-ohjelmisto A voi olla ihan eri asia kuin DQ-ohjelmisto B. Tämän vuoksi erilaisia ohjelmistoja kannattaakin aina koekäyttää etukäteen ja vertailla miten niiden kanssa toimitaan oikeasti aidoilla tietoaineistoilla. Tärkeintä on selvittää miten ne ratkaisevat juuri itselle oleellisimmat liiketoimintahaasteet. Yksittäisen temppuradan lisäksi kannattaa ehdottomasti huomioida myös ohjelmistojen kustannustehokkuus pitkällä aikavälillä. Tiedon laadunhallinnan todelliset kustannukset syntyvät arkipäivän jatkuvan parantamisen käytännöissä, kun liiketoiminnan tietoaineistot ja toimintaprosessit muuttuvat ja laadunhallinnan tukena olevan ohjelmiston toiminnallisia sääntöjä pitää lisätä, muokata ja kommunikoida eri sidosryhmien kesken yhä kiihtyvällä tahdilla ja laajempiin käyttötarkoituksiin.

Sami Laine, puheenjohtaja, DAMA Finland ry

Artikkeli on julkaistu ensimmäisenä Sytyke-lehdessä 3/2020 Tiedon hallinta – hypetystä tervejärkisesti

[1] Wang, R. Y., Lee, Y. W., Pipino, L. L. and Strong, D. M. (1998) “Manage Your Information as a Product.” Sloan Management Review, 39, 4, pp. 95-105.

[2] Duncan, A. D., Clougherty Jones, L., Rollings, M. (2020) “Applied Infonomics: 7 Practices for Chief Data Officers to Monetize Information Assets.” Gartner Inc.

[3] DAMA-DMBOK: Data Management Body of Knowledge: 2nd Edition by DAMA International.