Palvelimen häiriötilojen ennakointi

Palvelimen häiriötilojen ennakointi

Mistä kyse?

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Phasellus semper porta odio, vitae commodo dui iaculis vehicula. Duis eget arcu id ante facilisis luctus. Vivamus eros nisi, malesuada et diam at, scelerisque posuere felis. Etiam lobortis fringilla sodales. Donec consequat ipsum justo, hendrerit blandit lectus dapibus eu.

work, typing, computer

Pilotin kohteena oli Herman IT:n varmuuskopiointijärjestelmä ja sen lokien analysointi. Tavoite oli löytää tapahtumia, jotka viittaisivat tulevaan vikaantumiseen. Järjestelmässä ilmenee aika ajoin lukittautumisia, jotka johtuvat ohjelmistossa jossakin piileviin virheisiin. Onneksi järjestelmä tallentaa tapahtumia useisiin erilaisiin lokitiedostoihin, mm.

  • aktiviteettiloki, jossa on kaikki järjestelmän tapahtumat,
  • virheloki, josta löytyvät järjestelmän havaitsemat virheet,
  • web-liikenteen loki ja
  • käyttäjän tekemien toimenpiteiden loki. Pilotissa siis yritetään luoda malli lokitietojen historiasta vikaa ennakoivista tapahtumista. Malliin syötetään jatkuvana virtana lokitietoja ja se antaa varoituksen, kun virheen syntymisen todennäköisyys ylittää asetetun kynnysarvon.

Pilotti toteutettiin tavanomaisin, tällaisen tehtävän toimenpitein:

  1. Saatettiin lokien data sellaiseen muotoon, että sitä kyettiin käyttämään vian mallintamiseen.
  2. Kokeiltiin erilaisia malleja olemassa olevalla datalla toimivimman mallin löytämiseksi.
  3. Kokeiltiin valittua mallia käytännössä järjestelmän tuottamalla datalla. Haasteiksi osoittautui raakadatan saattaminen mallintamisen mahdollistamaan muotoon ja varmuuskopiointijärjestelmän luotettavuus! Käytettävissä olleena ajan jaksona syntyi hyvin vähän vikatilanteita. Luotettavamman mallin aikaansaamiseksi tarvitaan jatkossa
  • Paljon lisää dataa, jotta vikaantumisiakin saadaan enemmän,
  • lisää eri lokidatan muuttujia ja malleja kokeiluun ja
  • myös muita datalähteitä mallin luotettavuuden parantamiseksi. Data-analyysin tässä yhteishankkeessa teki CSC, mutta KAMK sai pilotista kokemusta ja tietotaitoa, kuten hankkeen tavoitteissa määriteltiin.
Vieritä ylös