On 20 Jan 2016, at 13:32, Nicolas GORALSKI nicolas+ml.frsag@goralski.fr wrote:
On 20 Jan 2016, at 09:42, H Kif h_kif@hotmail.com wrote:
bonjour la liste,
Nous souhaiterions dans une équipe d'exploitation d'un datacenter mettre en place une "trousse de secours". L'idée est qu'en cas de grosse panne (typiquement un arrêt électrique brutal) avoir sur place tout le matériel soft et hard nécessaire aux équipes pour redémarrer, diagnostiquer et réparer si besoin l'infrastructure.
Voici les premières idées que j'ai et je serais intéressé par vos retours d'expériences.
Merci par avance et bonne journée Vincent
Désolé je suis mal poli, bonjour la liste et Vincent.
Un jeu de CD avec les derniers firmware / bios validé par les équipes (pratique quand tu dois remplacer un équipement HS) Les install des OS aussi au cas ou ... Les dernières confs des équipements, vous savez celle qui se trouvent sur le serveur qui est down.. Les backups si c’est sur du media amovible et les clés de restaurations c'est chiffré (celles qui sont aussi sur le serveur down). Les contrats de maintenance des équipements avec le numéro de support. Une personne qui se charge de prendre les appels ca évite de se faire déranger pendant qu’on a les mains dans le cambouis par les clients. De la monnaies pour le café ou les jetons car la nuit / journée va être longue. Les procédures (électroniques ou papier) de redémarrage des équipements et de leur ordres / priorités.
Liste de diffusion du FRsAG http://www.frsag.org/