Oppetid vs. Tilgængelighed
tirsdag, 27. maj 2008, 07:48
Skrevet under: Arbejde

For noget tid siden læste jeg PHKs indlæg omkring 99.9999%, og ikke mindst de dertil hørende kommentarer.

Over de sidste par måneder har jeg læst en del på den oppetid/tilgængelighed nogle af vores udbydere tilbyder, de fordeler sig både over at være leverandør på nogle af de tjenester vi sælger til vore kunder, samt leverandør af hosting faciliteter.

I begge dele er deres nedetid kritisk for vores forretning. Ganske kort fordeler deres oppetid sig således:

1 x 99,7 %

2 x 99,9 %

1 x 99,999 %

De har alle med undtagelse af den første haft nedetid i år. Den sidste har dog først nu gået ud offentligt og sagt at de tlbyder en 99,999 %

99,7 %

Den første leverandør som er ganske ny i gårde, tilbyder 99,7 %, det vil man jo ikke antage er særlig meget. Men alligevel, vil jo vurdere dem til at have stor tilgængelighed.

De beskriver selv deres 99,7%, som målt over 1 måned, hvor 2 nedbrud på under 2 minutter dog ikke med regnes.

Dette giver en mulig nede tid pr. måned på 134 minutter.

Det lidt mere interessant er der deres drift. De lover at varsle drift vinduer med minimum 5 dage, og de udføres mellem 23:00 og 7:00.

Eftersom vores peak time jo er mellem 08:00 og 22:00 normalt er dette jo dejligt for os. Derudover vil drift der ikke er korrekt, og tager mere end 30 sekunder, blive påregnet som nedetid.

Sist men ikke mindst er der en tilbagebetalingsmodel, såfremt de ikke overholder deres Oppetid.

99,9% #1

En af vore leverandører lover 99,9% nedetid målt over et år.

De havde sidst i Januar et netbrud, der kun giver dem en mulig nedetid resten af året på 30 minutter.

Grunden til nedebruddet skyldes en hardware fejl, altså må man antage at de ikke har tænkt i et backup system, eller også tager det for lang tid at sætte i drift.

De var ikke særlig informative omkring nedbruddet, og vi måtte efter flere timer, og gentagne opkald, erfare at de på deres kontor ikke engang var klar over hvad problemet var, men at en teknikker arbejdede på det.

Der er ikke rigtig nogen plan for hvad der skal ske hvis de ikke overholder deres 99,9%, så dermed vil jeg jo antage at produktet i det hele ikke lever op til dets forventninger, og at der derfor er tale om en 100% refusion såfremt den ikke overholdes, ergo, de har ikke engang tænkt tanken at de behøves skrive sig ud af det.

Der er heller ikke nogen plan over varsling af drift, eller om de tæller med som nedetid. Så det må de jo gøre.

99,9% #2

Vores anden 99,9 leverandør, havde ganske kort efter vi begyndte at bruge dem et kedeligt nedbrud på 4 timer.

Deres 99,9% er målt over 1 år.

Dette viste sig at være fejl i en core router, hvor backupen ikke var konfigureret, så det tog flere timer at sætte den op.

Informationen omkring problemet var som sådan okay, vi vidste rimelig hurtigt hvad der var galt, og at der blev arbejdet på det.

Men igen er der ingen plan over hvad der sker hvis 99,9 ikke overholdes, og der er ingen plan over service vinduer.

99,999%

Imponerende, andet kunne jeg ikke sige da jeg så det.

Og det er endda målt over måneder. Hvad kan man sige, det er da til at stole på, lidt over 2 et halv minut over et halvt år, det er da noget der batter de må virkelig have styr på deres ting.

Tjaeh, hvis det ikke lige var fordi at de har været plaget af en serie af uheld, før de går ud og lover dette. De har i de første par måneder af i år haft nedbrud der vrede flere timer.

Og det er jo ikke bare en 99,999% oppetid udover drift, nej de skriver direkte “platform availability”.

Det er igen meget fint, når det er noget man skriver man har, men ikke “gider” få skrevet ind i kontrakter m.m.

Så kan det jo være godt det samme.

Derudover har de allerede brudt den.

Hvad kan vi så lære af dette ?

Tjaeh, vi skal bare være bedre.

Vores fremtidsplaner, er at vores rendundante setup for fremtiden skal spreders over 2 geografisk adskilte hosting centre, med forskellige levrandører på tingene.

Derudover har vi længe haft flere en en udbyder på f.eks. SMS, så vi i tilfælde af nedbrud kan sende trafikken via en anden udbyder.

Sidst men ikke mindst vil jo også godt påpege at jeg selv har mest tillid til 99,7% leverandøren.

Det er muligt at 2,5 time i måneden er meget nedetid, men det virker tilgængæld som om de har tænkt over hvad de lover, og når tiden er målt på månedsbasis, skulle det undre mig om de når så meget nedetid hver måned, så det samle set skulle overstige 26 timer hvert år.

Og når de gider planægge deres service udenfor vores peak tid, er det jo perfekt, det er noget man kan forholde sig til, og ikke mindst virker det realistisk.

Så alt-i-alt er Oppetid ikke nøgleordet, men tilgængelighed er, som en af kommentarene til PHKs indlæg siger:

“Oppetid er ikke så interessant - tilgængelig er væstentlig mere interessant. Jeg vil hellere have 3 udfald af 2 minutter end et langt på 6 minutter.”

Hvordan er jeres oplevelser med SLA’er hos udbydere ?