RPO en RTO in een Disaster Recovery Plan

Gepubliceerd op 4 februari 2019 Leestijd : 3 minuten

Wanneer er door een onvoorzien incident of calamiteit op uw ICT-infrastructuur data verdwijnt, wilt u zo snel mogelijk de verloren data terug kunnen halen uit een back-up. Om hier adequaat te kunnen handelen helpt een Disaster Recovery Plan waar u vooraf weloverwogen keuzes hebt gemaakt. In een Disaster Recovery Plan is het van belang om aan te geven welke hersteltijd, en hoeveelheid dataverlies acceptabel is. Dit wordt samen gevat in zgn. RPO en RTO objectives.

RTO Recovery Time Objective

Kortweg wordt hiermee aangeduid hoe lang het kan (of mag) duren om de situatie vanuit de back-up of een failover systeem weer online te krijgen. Dit kan variëren van de tijd die benodigd is om handmatig een database slave als master te promoten, tot de tijd die nodig is om hardware te vervangen. In het eerste geval kan de RTO kort zijn, mogelijk binnen een half uur, in het laatste geval kan de RTO zelfs dagen in beslag nemen. Vooral als er naar klanten toe een SLA (Service Level Agreement) wordt afgegeven, is het goed om van een worst-case scenario uit te gaan.

RPO Recovery Point Objective

Hiermee wordt aangegeven hoeveel data er verloren kan (of mag) gaan bij een disaster. Meestal is het maximum de interval tussen back-up, replicatie of synchronisatie. Toch kunt u hiermee voor een verrassing komen te staan.

Voorbeeld

Stel, u maakt 1x per dag een back-up van alle data. Dan bent u geneigd te denken dat uw RPO in een worst-case scenario maximaal 24 uur is. Meestal is dat zo, maar wat als het incident zich binnen de back-up cyclus voordoet en de back-up op dat moment corrupt is. Een wekelijkse full-back-up kan uren duren (we hebben voorbeelden van volledige server back-ups die 12 uur of meer in beslag nemen). Als aan het einde van de back-up zich een ernstige server crash, een disaster, voordoet, dan is naar verwachting de laatste full-back-up corrupt geraakt en kan niet voor de restore gebruikt worden. In dat geval zal naar de voorlaatste, incrementele, back-ups worden teruggegrepen tot aan de vorige volledige server back-up.

Dit is niet alleen van invloed op uw RPO, u bent mogelijk tussen de 24 en 36 uur aan data kwijt, maar ook op uw RTO, de restore vanuit incrementele back-ups kan veel langer duren van vanuit één full-back-up.

Houd rekening met een worst-case scenario

Houd met het maken van een Disaster Recovery Plan dus altijd rekening met een worst-case scenario. Hardware kan kapot gaan, de back-up kan niet beschikbaar zijn, de vervangende server kan langzamer zijn, een restore van data overdag kan langer duren dan een back-up ‘s nachts enz.

Rekening houden met worst-case scenario’s kan de pijnlijke plekken binnen uw ict infrastructuur blootleggen en u helpen deze zo in te richten dat de gewenste RPO en RTO in geval van een disaster ook werkelijk gehaald kunnen worden. Zoals wel vaker het geval is geldt hier ook: hoe korter de RPO en RTO, hoe duurder uw ict oplossing wordt.

Bij ROOT helpen we onze klanten graag het bepalen van een acceptabele RPO en RTO en het opstellen van een Disaster Recovery Plan.