Pilotin kohteena oli Herman IT:n varmuuskopiointijärjestelmä ja sen lokien analysointi. Tavoite oli löytää tapahtumia, jotka viittaisivat tulevaan vikaantumiseen. Järjestelmässä ilmenee aika ajoin lukittautumisia, jotka johtuvat ohjelmistossa jossakin piileviin virheisiin. Onneksi järjestelmä tallentaa tapahtumia useisiin erilaisiin lokitiedostoihin, mm.
- aktiviteettiloki, jossa on kaikki järjestelmän tapahtumat,
- virheloki, josta löytyvät järjestelmän havaitsemat virheet,
- web-liikenteen loki ja
- käyttäjän tekemien toimenpiteiden loki. Pilotissa siis yritetään luoda malli lokitietojen historiasta vikaa ennakoivista tapahtumista. Malliin syötetään jatkuvana virtana lokitietoja ja se antaa varoituksen, kun virheen syntymisen todennäköisyys ylittää asetetun kynnysarvon.
Pilotti toteutettiin tavanomaisin, tällaisen tehtävän toimenpitein:
- Saatettiin lokien data sellaiseen muotoon, että sitä kyettiin käyttämään vian mallintamiseen.
- Kokeiltiin erilaisia malleja olemassa olevalla datalla toimivimman mallin löytämiseksi.
- Kokeiltiin valittua mallia käytännössä järjestelmän tuottamalla datalla. Haasteiksi osoittautui raakadatan saattaminen mallintamisen mahdollistamaan muotoon ja varmuuskopiointijärjestelmän luotettavuus! Käytettävissä olleena ajan jaksona syntyi hyvin vähän vikatilanteita. Luotettavamman mallin aikaansaamiseksi tarvitaan jatkossa
- Paljon lisää dataa, jotta vikaantumisiakin saadaan enemmän,
- lisää eri lokidatan muuttujia ja malleja kokeiluun ja
- myös muita datalähteitä mallin luotettavuuden parantamiseksi. Data-analyysin tässä yhteishankkeessa teki CSC, mutta KAMK sai pilotista kokemusta ja tietotaitoa, kuten hankkeen tavoitteissa määriteltiin.

