Is honderd procent uptime voor iedereen het hoogste goed?
Dinsdagavond kampte Amazon Web Services met een ernstige storing waardoor wereldwijd heel wat sites en apps niet of nauwelijks te bereiken waren. Falende IT kost geld en tijd. Maar hoeveel? En is honderd procent uptime de heilige graal, of mag het wat minder zijn?
Het antwoord op die vraag is niet eenvoudig. Om een antwoord te kunnen geven, moet je zowel de kost van uptime als de kost van downtime goed in kaart brengen. Die verschilt van bedrijf tot bedrijf, van website tot applicatie. Als Facebook een uur onbereikbaar is, vinden wij dat als gebruiker vervelend en roepen we moord en brand, maar wat verliezen wij werkelijk? Voor Mark Zuckerberg is dat anders: hij verliest veel geld tijdens dat uur. Als daarentegen de website van slagerij Vermeulen om de hoek een halve dag niet werkt, verkoopt die wellicht geen 100 gram charcuterie minder.
Een goede indicatie is de Service Level Agreement (SLA). Die wordt meestal in een percentage uitgedrukt: de oplossing werkt minstens dat percentage van de totaal beschikbare tijd. Die SLA wordt zelden of nooit gegeven voor de interne IT, terwijl die nochtans vaak minstens even essentieel zijn. Daar sluimert al het eerste gevaar. SLA’s gelden als garantie wanneer je IT uitbesteedt in de vorm van (managed) IaaS of SaaS. Dan is het de belofte dat je, wanneer de bepaalde norm niet wordt gehaald, een wiedergutmachung krijgt. Net zoals met je wasmachine die een garantie heeft van twee jaar. Ben je zeker dat die de eerste twee jaar nooit stuk gaat en altijd beschikbaar is? Neen, maar in dat geval wordt ze wel gratis gerepareerd.
Honderd procent uptime is onhaalbaar, maar ook niet nodig.
Zo is het ook met de SLA’s in de IT-sector. Het is dan ook belangrijk dat je kijkt wat er tegenover staat als de belofte niet wordt gehaald. Meestal gaat het om een boeteclausule, waardoor bijvoorbeeld een deel van de maandelijkse fee wordt terugbetaald. Dat is een goede stok achter de deur voor uw leverancier, maar vaak dekt die fee de werkelijke kosten niet. Ga daarom ook na of in de SLA sprake is van hoe snel men een probleem zal oplossen. Het is fijn te weten dat je wasmachine zal worden gerepareerd, maar hoe lang zal je de was bij je moeder moeten langsbrengen? Spreekt men van een Mean Time to Repair – een gemiddelde tijd waarop dus heel wat schommelingen kunnen zitten – of krijg je een Solution Goal: een tijdstip waarop er een oplossing of workaround zal zijn?
Stel dat je een boekhoudkantoor hebt en de server met het boekhoudpakket valt stil: hoeveel van je medewerkers zitten dan met hun duimen te draaien en paperclipslingers te maken?
Een belangrijke aanvulling: wanneer je een werkelijke verbetering wil van de garantie op uptime, dan staat daar veel werk tegenover. Een stijging van enkele procentpunten van de SLA betekent daardoor vaak dat de kostprijs significant stijgt. Dan brengt ons dus terug bij onze initiële vraag: rendeert dat? Dat weet je alleen als je de werkelijke kosten van downtime kent, die van bedrijf tot bedrijf verschillen.
Wat mag je zeker niet vergeten wanneer je die berekening maakt?
- Het verlies aan inkomsten. Dit is makkelijk in te schatten wanneer je werkelijk inkomsten genereert via je website, bijvoorbeeld bij e-commerce, maar een pak moeilijker als het gaat om interne applicaties. In dat geval kijk je naar het verlies aan productiviteit. Stel dat je een boekhoudkantoor hebt en de server met het boekhoudpakket valt stil: hoeveel van je medewerkers zitten dan met hun duimen te draaien en paperclipslingers te maken?
- Het verlies aan sales. Dit ligt hoger wanneer de downtime ervoor zorgt dat er geen offertes kunnen worden gemaakt, maar er is ook reputatieschade die ertoe leidt dat twijfelende prospects liever hun eieren in een andere mand leggen.
- Het verlies aan klanten. Reputatieschade of vertraging in levering kan klanten kosten, wat betekent dat je een extra verlies hebt plus een extra inspanning dient te leveren om nieuwe klanten te werven om dit gat op te vullen.
- Herstelkosten. Wat kost het om terug up and running te raken? Hoeveel manuren moeten er worden gespendeerd aan het herstellen van gegevens?
Het loont de moeite om deze oefening eens te maken voor de (cruciale) applicaties in je bedrijf. Een online downtime cost calculator kan je daarbij helpen. Je zal ontdekken dat je niet op één globale SLA uitkomt. Wellicht zijn er onderdelen van je IT die minder essentieel zijn, terwijl andere onderdelen, die rechtstreeks voor je core business zorgen, wat meer aandacht mogen krijgen. Al is je conclusie wellicht dat honderd procent uptime niet alleen onhaalbaar is, maar ook niet nodig.
Fout opgemerkt of meer nieuws? Meld het hier