Forum

You are not logged in.

#1 13-04-2010 01:56:57

@Cyril
Staff
From: Paris
Registered: 06-02-2007
Posts: 5,560
Website

Indisponibilité du serveur http5 dans la nuit du 13 avril 2010

Les faits

Le serveur http5, hébergeant une partie de nos clients, a été totalement indisponible de 0h24 à 1h46. Les mails et les accès distants (SSH, FTP, WebDAV) ont également été indisponibles pour ces mêmes clients.

Les explications

Un simple redémarrage du serveur était planifiée. Ce genre d'opération, relativement fréquente et normale dans la vie d'un serveur (pour différentes raisons, par exemple pour appliquer des correctifs de sécurité sur le noyau), est normalement relativement indolore : cela prend typiquement 2 à 3 minutes durant lesquelles le serveur est indisponible. Nous faisons toujours ces opérations en début de nuit pour minimiser le dérangement.

Aujourd'hui, le serveur a refusé de redémarrer. Après une intervention humaine, la carte mère a été retrouvée hors service, et a donc été changée. Le serveur a ensuite pu démarrer normalement et reprendre son activité.

En théorie, tous nos serveurs sensibles sont redondés en temps réel dans un autre datacenter. Ce serveur http5 est toutefois un serveur « temporaire », mis en place suite aux problèmes de début février. En conséquence, ce serveur intérimaire n'était pas redondé. Il est d'ailleurs prévu qu'il soit mis hors service avant la fin du mois, remplacé par un nouveau serveur définitif.

Si ce genre de mésaventure était arrivé en temps normal, l'indisponibilité aurait été d'environ 10 minutes, puisque le trafic aurait été immédiatement basculé sur le serveur secondaire.

Offline

Board footer

Powered by FluxBB