Un serveur qui ne démarre plus

Article maintenant hébergé sur nos serveurs

https://www.informatiquerimouski.com/blogue/2017/07/17/un-serveur-qui-ne-demarre-plus/

La comptable d’une organisation dont j’étais en charge est passée sur son lieu de travail un dimanche après-midi pour vérifier une simple information qui lui trottait en tête.
Cela faisait quelques temps qu’on faisait affaire et leur parc informatique était globalement en santé. J’avais ramassé ce contrat en or car leur ancien pourvoyeur de service avait changé de branche. Le genre de client fidèle tant qu’on le sert bien.

« Sylvain, excuse-moi de t’appeler un dimanche, mais l’écran du serveur est noir et je n’y ai pas accès. »


Bon. C’est peut-être juste un redémarrage que ça prend. Je préfère traiter ça un dimanche qu’un lundi en panique avec une dizaine d’employés qui n’auront pas accès à leur données. Je m’entends bien avec elle alors c’est un plaisir.


J’arrive sur place et là le drame :
Disk boot Faillure

Ouch. Le serveur est planté au niveau des disques durs, ce qui implique les données… Heureusement ils ont une routine de sauvegarde, mais quand même ça va être de la job.

Je trouve ça tout de même étrange, c’est un serveur et je me rappelle y avoir vu 2 disques durs lors d’une maintenance. Normalement il y avait une redondance pour justement éviter ce genre de problèmes.

En regardant comme il faut; dans le BIOS le RAID est activé et configuré pour permettre la redondance, mais seulement un des disques est détecté. J'investigue côté matériel, un des disques dur n’était pas branché.

La frustration monte en moi. Depuis combien de temps fonctionnent-il sans redondance? Pourquoi je n’ai pas vu ça avant? Je m’étais fier sur la bonne santé générale de l’informatique de l’organisation et n’avait pas effectué de vérifications diligentes lorsque j’ai ramassé le contrat. 
Zen.

On a les données en backup.

Je me suis dit avec le recul que l’erreur est humaine. L’ancien service technique avait fait cette erreur de juste débrancher un disque dur défectueux sans jamais venir le remplacer, mais la mise en place de la stratégie de sécurité était bonne et m’aura permis de remonté leur serveur dans la nuit avec 2 nouveaux disques durs en RAID1. Le lendemain à 8h00 je suis arrivé pour remettre le serveur en place. La personne en charge de l'informatique était contente.


« Parle-moi de ça une crise bien géré, le temps qu’on me l’explique, c’est déjà réglé. »


J’ai aussi prit moi-même le temps de souligné et félicité la personne responsable de la sauvegarde d’avoir été assidu dans sa responsabilité, sinon ça n'aurait pas pu aussi bien finir!

Commentaires

Posts les plus consultés de ce blog

Soudage électronique

Perte et récupération de données

Reconnaitre les signes d'une batterie usé