Teknikken bag missionskritiske servere


En anden måde at tænke på

"If it ain't broken, dont fix it," siger et ordsprog. I forlængelse af den tanke, har amerikanske Stratus Technologies vendt ideen bag de eksisterende missionskritiske systemer på hovedet. Hvorfor overhovedet bygge en server, der kan gå ned, og koncentrere al udvikling, penge og kræfter på at redde flest mulige data - og derefter få den op at køre igen?

Standard Intel system
Hvorfor ikke udvikle en server med udgangspunkt i billige Intel-processorer, og lade to computere køre parallelt i den samme server. Det der kaldes redundans, hvor diskene og processorerne er synkroniseret præcist ned på hver eneste CPU clockcyclus - og lade de to parallelle systemer løse præcist de samme opgaver. Hvis den ene står af, kører den anden jo stadig. Uden afbrydelse.

Online overvågning - automatisk reparation
Tanken førte til det legendariske Lockstep patent. Et realtidssystem, der konstant overvåger og analyserer driftsfejl i serveren - for hver enkelt CPU cyklus. Er fejlen alvorlig, kalder systemet automatisk op til et døgnbemandet support center, der analyserer fejlen og eventuelt sender en ny enhed med posten. Imens kører serveren naturligvis stadig - på "det ene ben." Stratus kalder det ft-servere (Fejl Tolerante servere), fordi de kan tåle at fejle uden at gå ned. Harddiske og CPU'er i ft-servere kan naturligvis også skiftes ud i takt med, der kommer nye produkter på markedet.

Den lille forskel - programmerne kører uden tilretning
Traditionelle cluster baserede server løsninger kræver som oftest, at alle applikationer bliver rettet til. Det er dyrt. Samtidig er teknologien sårbar overfor tab af transaktion data, når en server i clusteret fejler. Online data i hukommelsen går som regel tabt, når en server bryder ned i et cluster system, og den efterfølgende fejlanalyse risikerer at blive dyr og tidskrævende.

Synkroniseringen af diskene og processorerne i en ft-server ligger på niveauet under applikationerne, så alle standard applikationer kører uden justeringer af softwaren. Alle standard Windows programmer kan installeres og afvikles direkte uden modifikationer.

De fem ni-taller - næsten perfekt oppetid
Drømmen er naturligvis at konstruere servere, der bare kører og kører. 100 procent hele tiden. Men i praksis er målet de legendariske fem ni-taller altså en oppetid på 99,999 procent, som udviklere af computere i årtier har drømt om.
Men målingerne fra overvågningen af Stratus-servere kloden over, viser en samlet og generel oppetid på mere end 99,999 procent. Det svarer til, at systemet er nede 5,25 minutter i løbet af et år. Nu er det kun den fjerde decimal, der mangler...

Vi har scoret den fjerde decimal
Men Stratus Tecnologies og PC Instruments tilbyder et såkaldt Perfect Performance serviceprogram, der napper den fjerde decimal. Vi garanterer hundrede (100) procent oppetid. Bedre bliver det vist ikke.


Home