7.9. 21:45-23:55: Ausfall beim Rechenzentrum - Alle Foren waren betroffen

#1 von Petra-Andreas , 08.09.2009 18:23


Miteilung vom Forenbetreiber MiranusGmbH · Homepagemodules.de · Dynamicboard.de

Gestern waren gegen 21:45 bis ca. 0:00 Uhr alle Foren aufgrund eines Total-Ausfalls des Rechenzentrums nicht erreichbar.

Nach aktuellen Informationen kam es gegen 21:45 zu einem Stromausfall in großen Teilen von Berlin, u.A. in Tempelhof, wo die Foren in einem modernen und mehrfach redundant abgesicherten Rechenzentrum untergebracht sind. Selbstverständlich sind die Server so über USV und Dieselgeneratoren redundant auch gegen einen längeren Stromausfall abgesichert - soweit die Theorie. Über die genauen Umstände, weswegen auch das gesamte Rechenzentrum inkl. mehrere Tausend Server ausgefallen ist, können wir derzeit nur spekulieren und werden entsprechende Informationen nach reichen, sobald wir diese von unserem Rechenzentrums-Betreiber erhalten haben.

Hier nun weitere Details zum Stromausfall im Rechenzentrum:


So, wie es aussieht kam es um 21.45 Uhr zu einem flächendeckenden Stromausfall bei Vattenfall. Beim Zusammenbrechen des Netzes kam es zu etlichen Spannungspitzen und folgenden Zusammenbrüchen der Spannung.

- Die Zeit war jeweils zu kurz für den Dieselgenerator, aber die USVen haben die Last problemlos übernommen. Der vorletzte Zusammenbruch, dauerte aber lange genug, um den Diesel einzuschalten und dies geschah offensichtlich zeitgleich mit einer letzten hohen Spitze bevor die Spannung des Stromnetzes endgültig zusammenbrach.

[...] es sieht so aus, als ob der kommende Diesel und Vattenfall für einen Bruchteil einer Sekunde gleichzeitig viel Last auf die USVen gegeben haben. Daraufhin hat sich eine verabschiedet und nur noch aus den Batterien die Server gespeist.

-Die Batterien waren dann irgendwann leer, obwohl der Diesel im Hintergrund lief und die Stromversorgung auch für diese Netzsegmente hätte bedienen können. Eine USV hat den Strom des Diesel einfach geblockt und nicht mehr durchgelassen und so ein großes Netzsegment komplett blockiert.

-Die USV ließ sich auch nicht mehr manuell in den Bypass schalten. Abschalten ging nicht. Garnichts ging. Immer nur die monotone Meldung, dass die Batterien runter sind.

- Hat nur geholfen die USV komplett vom Netz zu trennen und dann die Server schön wieder von Hand hochzufahren. Und da in der USV oder den Batterien irgendwas durch ist, gab es natürlich auch noch einen Feueralarm durch die OTC Sniffer. Man hat also gerochen, dass da was nicht in Ordnung ist.

Genaue Fehleranalyse folgt, sobald wir wissen, was da abgerauscht ist.


Liebe Grüsse Petra

Kalorien sind kleine Tierchen, die nachts die Kleidung enger nähen.

 
Petra-Andreas
Chefchen/Administrator
Beiträge: 9.115
Registriert am: 16.04.2007


   

Probleme beim Seitenwechsel - neue Beiträge werden nicht angezeit
Forum Anbieter hat ein paar technische Probleme

Xobor Erstelle ein eigenes Forum mit Xobor
Datenschutz