Nous souhaiterions dans une équipe d'exploitation d'un datacenter mettre en place une "trousse de secours". L'idée est qu'en cas de grosse panne (typiquement un arrêt électrique brutal) avoir sur place tout le matériel soft et hard nécessaire aux équipes pour redémarrer, diagnostiquer et réparer si besoin l'infrastructure.
Voici les premières idées que j'ai et je serais intéressé par vos retours d'expériences.