Succesvol gebruik monitoringtool

Gepubliceerd op 12 januari 2023 Leestijd : 4 minuten

Als je een IT omgeving van enige omvang beheert dan is het inzetten van een monitoringtool een must om in control te blijven over jouw IT omgeving.  

Door de ontwikkelingen van de afgelopen jaren is je IT-infrastructuur een samenhangend geheel van hardware, software en services geworden. Je bent continu aan het internet verbonden. Dit brengt ook gevaren met zich mee als je systemen niet up to date zijn of als je onvoldoende inzicht hebt in de gezondheid van je IT-infrastructuur. Een monitoringtool is een systeem dat jou handvatten geeft om vroegtijdig afwijkingen op het spoor te komen en waarmee je analyses kunt maken die jou helpen om in te kunnen spelen op de veranderende behoeften binnen je organisatie.  

Er zijn vele parameters te bedenken. In ons geval, als Internet Service Provider, is het monitoren van de status van de BGP peering en transit partners van belang. Het buiten de gewenste bandbreedte zijn van een ondersteunende meting leidt niet direct tot een verstoring van de dienstverlening maar is wel een signaal dat er gekeken of ingegrepen moet worden. Ondersteunende metingen zorgen ervoor dat problemen voorkomen kunnen worden.  

Onze ervaring leert dat je in de loop der tijd wel helder krijgt wat er gemeten moet worden.Binnen ROOT onderscheiden we twee verschillende types monitoring, verder in dit blog lees je er meer over.  

Wie is verantwoordelijk voor wat?

Bij alarmeringen is het vooral belangrijk hoe je deze afhandelt.

Wij hebben ooit voor een relatie een monitoringtool ingericht waarbij wij de vraag kregen om alle ‘alarmen’ naar het hele IT team van de relatie te sturen. Dit leidde tot een situatie waarin niemand iets met een ‘alarm’  deed want er was vast wel iemand anders (een collega) die het ‘alarm’ oppakte. Met als gevolg dat men het een slechte monitoringtool vond  zonder te kijken naar het correct inregelen van het proces.

Het is dus noodzakelijk om de verantwoordelijkheid, aangaande de afhandeling van alarmen, eenduidig te definiëren. Met andere woorden wie is ervoor verantwoordelijk en wie doet wat?  

ROOT alarmeringen 

Zoals aan het begin van dit blog is aangegeven, onderscheiden wij twee types alarmeringen. 

Type 1: er is echt iets mis ófwel de omgeving biedt niet meer de functionaliteit die gewenst is of een gemeten parameter loopt zover buiten de gewenste bandbreedte dat het gemonitorde systeem elk moment kan uitvallen.  

In een dergelijk geval gaat er automatisch vanuit de monitoringtool een telefoontje naar het mobiel van de beschikbaarheidsdienst. Degene die beschikbaarheidsdienst heeft is verantwoordelijk voor het aannemen van ‘alarmen’ en maakt ook de inschatting, als er één of meerdere alarmen optreden, of hij het zelf kan afhandelen of dat hij er collega’s bij moet betrekken.  

Type 2: het tweede type alarm is wanneer een gemeten parameter ver buiten de gewenste bandbreedte dreigt te raken. Onmiddellijke actie is niet nodig maar er zal wel op korte termijn moeten worden ingegrepen.  

In dit geval worden er mailtjes gestuurd naar een gedeelde systeembeheer-folder en er verschijnen meldingen in ons monitoring dashboard.  Ook hier is degene die de beschikbaarheidsdienst heeft verantwoordelijk voor het afhandelen van dit type alarmen. Die medewerker kan dat delegeren.  

NB: Indien niet tijdig wordt ingegrepen dan zal dit alarm, als de trend zich doorzet, bijvoorbeeld wanneer de schijf verder vol loopt, vanzelf leiden tot het eerste type alarm!  

Onze beschikbaarheidsdienst mobiel rouleert over de pool van medewerkers die mee draaien in de beschikbaarheidsdienst. De periode loopt van maandag tot maandag. Wat we veel zien gebeuren is dat gedurende de dag of avond de mobiel tussen medewerkers wordt overgedragen, bijvoorbeeld i.v.m. een afspraak waarbij de medewerker niet gestoord kan worden. Met het overdragen van de mobiel wordt ook de verantwoordelijkheid overgedragen. Om dit makkelijk te maken hebben we twee mobiele toestellen. Je hoeft dan niet bij elkaar te zijn om de dienst over te dragen. 

24x7 Bereikbaarheid 

ROOT is 24x7 bereikbaar. De 24x7 bereikbaarheid hebben we gerealiseerd door ons servicedesknummer buiten kantoortijd door te schakelen naar de beschikbaarheidsdienst mobiel.  Het kan natuurlijk zijn dat onze monitoring een verstoring niet opmerkt. Op deze wijze kun jij de beschikbaarheidsdienst bereiken en ervoor zorgen dat je storing toch wordt opgepakt. Een niet door onze monitoring geconstateerde storing leidt vaak tot het verbeteren van onze monitoring.  

Voor vele relaties van ons hebben wij ingeregeld dat onze monitoring hen direct alarmeert op het moment dat er iets mis gaat op een omgeving waar zij zelf mee aan de slag moeten. In dit soort gevallen merken we op dat het soms toch handiger is om de alarmen toch naar ons te laten gaan. Waarom? Wij zijn ingericht op 24x7 alarmering terwijl voor vele relaties dit een uitdaging is met als gevolg dat een alarm niet altijd adequaat wordt afgehandeld.  

Wil je met ons hierover in gesprek? Wij helpen je graag met het inregelen van monitoring en delen onze kennis er ervaring met het bouwen, inregelen en gebruiken van monitoring, zowel technisch als procesmatig.