Arkisto: 3/2009

OLAP ei ole kuutio

25.3.2009

OLAP liitetään usein Business Intelligencestä puhuttaessa kuutioiden pyörittämiseen ja lataukseen. OLAP, Online Analytical Processing – termi ei kuitenkaan pidä sisällään mitään viittausta taustalla käytettäviin tekniikoihin. Termi kertoo oivallisesti keskeisen asian, eli kyse on onlinenä tapahtuvasta analyyttisestä prosessoinnista.

Erilaisten määritelmien keskeiset ja melko yhteiset kantavat teemat ovat näkökulmien vaihtamisen mahdollisuus monien ulottuvuuksien välillä, tarkempaan tietoon porautuminen sekä datan manipulaatio. Määritelmissä harvoin sanellaan tiedon tallentamismuodoista mitään.

Loppukäyttäjän kannalta ei pitäisikään olla millään tavalla merkityksellistä millä lailla järjestellyistä tietolähteistä tieto tulee, kuutiosta, kartiosta vai juuttisäkistä… Kuten ei väliä ole myöskään sillä, tehdäänkö analysointia OLAP-palvelimen muistissa, oman työaseman muistissa vai missä. Kunhan oikea lopputulos ja tehokkuus saavutetaan loppukäyttäjälle helpolla tavalla, ei käytettävä menetelmä ole käyttäjälle mitenkään oleellinen.

Pikemminkin, analyyttiseen käsittelyyn pitäisi saada tietoa useista tietolähteistä ja ajantasaisena. Esimerkiksi asiakastietoa pitäisi pystyä lennosta yhdistelemään laskutus-, tilaus- ja tuotantojärjestelmistä saatavaan ajantasaiseen tietoon. Tätä tietoa pitää pystyä pilkkomaan ja pyörittämään analysoinnin tueksi ilman, että se pitää ladata johonkin tiettyyn, ennalta määrättyyn muotoon, jota voidaan käyttää vain tietyillä välineillä. Teknologian kehittyminenhän on poistanut rajoitteet tietomassojen pyörittelystä vain tietyllä tavalla.

Määriteltyjen kuutioiden pitääkin olla vain yksi monista analysoinnin muuttuvista tietolähteistä, ei ainoa mahdollinen. Tietojen ei myöskään pidä olla vain luettavissa, mutta usean käyttäjän päivitettävissä ja käytettävissä.

Analysoinnin pitää myös olla päätelaitteeseen sitomatonta. Jos tukeudutaan asennettavaan työkaluun, ollaan väistämättä rajoitettu käyttömahdollisuuksia. Aina ei BI-hankkeissa kuitenkaan muisteta, että liiketoimintatiedon hallinnassa lähestymisen pitää lähteä liiketoiminnan tarpeiden ja halujen ratkaisemisesta, ei tuotteista tai työkaluista.

Hankkeissa kannattaa pitää mielessä se, että loppukäyttäjät tarvitsevat tietoa jotakin liiketoiminnan ratkaistavaa ongelmaa varten, eivät tietorakennemallia.

Vai keksiikö joku pakottavaa tarvetta, miksi OLAPin pitäisi olla esim. kuutiomuotoon sidottu?

Mikko Muurinen

Linkkitiistai 3.3.2009

03.3.2009

Maaliskuun alun linkkeinä on kirjoituksia, joissa käsitellään Business Intelligencen kulutuksen helppoutta, reaaliaikaisen tiedon hyödyntämistä, data-integraation nykymahdollisuuksia sekä R tilasto-ohjelmistoa.

Claudia Imhoff kirjoittaa BeyeNETWORKin blogissa kuinka Business Intelligencen ei tulisi olla vain helppokäytöistä, vaan myös helposti kulutettavaa. BI-hankkeissa tulisi keskittyä myös siihen, miten, missä ja kuinka ihmiset hyödyntävät iformaatiota, eikä vain kuinka valitaan aineisto, muotoillaan raportti, luodaan graafi jne.

Doug Henschen kirjoittaa InformationWeekissä kuinka reaaliaikaista tietoa ja analyyttistä näkemystä voidaan käyttää ratkaisemaan todellisia liiketoiminnan ongelmia. Tuottava teollisuus ja jälleenmyyjät ovat tarttumassa uudenlaiseen kysynnän ennustamiseen, jonka takia ajantasaisen ja yksityiskohtaisen tiedon tarve on kasvamassa huomattavasti. BusinessWeekin artikkelissa puolestaan käsitellään BI-ratkaisuiden kykyä auttaa yrityksiä analysoimaan tietojaan kustannusten säästämiseksi tai myyntimahdollisuuksien luomiseksi.

Data-integraation imago-ongelmaa käsitellään Information Managementin Rick Shermanin kolumnissa. Data-integraatio mielletään vain ETL:n synonyymiksi, joka puolestaan on rinnastettu tietovarastointivälineeksi. Nykyiset mahdollisuudet integroida tietoja kaikkiin yrityksen liiketoimintatilanteisiin ja tarpeisiin usein unohdetaan. Shermanin mukaan yritykset ovat haaskanneet paljon mahdollisuuksia jättämällä informaatioonsa aukkoja. Tietojen integroinnin ja puuttuvan tiedon paikkaamisen kustannukset ovat olleet siilo-ajattelun takia kovia.

Hub Solution Designsin blogissa katsotaan, miten yksi informaation hallinan pala, master-tiedon hallinta, MDM, sopii yritysten arkkitehtuureihin, varsinkin SOA-mielessä. Saman blogin vanha kirjoitus kymmenestä parhaasta MDM-ratkaisun käytännöstä on tässä yhteydessä vielä oikein hyvin ajan tasalla.

Lopuksi vielä hieman Open Source -tilasto-ohjelmisto R:stä. Data Evolution -blogissa referoidaan paneelikeskustelua R-ohjelmiston käytöstä muutamissa suurissa R-käyttäjäyrityksissä, kuten Google ja Facebook. Kirjoituksessa on hyvin vedetty yhteen R:n vahvuudet ja heikkoudet yrityskäytössä.

Mikko Muurinen