Bonjour,
Merci pour vos réponses.
Pour récapituler voici les différents éléments que j'ai listé qui peuvent servir aux équipes d'interventions:
Doc:
procédure d’arrêt d'urgence des différentes briques (électricité, clim, etc.) procédure de redémarrage environnemental du DC procédure de redémarrage des serveurs Procédure de reboot des différents équipements Schéma réseau Schéma physique (installation dans les baies) Doc sur les rails des différents constructeurs carnet téléphonique contact technique et support pour l'escalade Liste des bauds des matériels
Mobilier et matériel:
chaises pliantes table clé passe partout baies ecran/clavier sur roulette (type http://www.ergotron.com/ProductsDetails/tabid/65/PRDID/320/language/fr-FR/De... ) kvm usb laptop (type http://www.startech.com/Server-Management/KVM-Switches/Portable-USB-PS-2-KVM... ) rallonge électrique + multiprise tournevis Cruciforme tournevis torx Gros tournevis plat clef a molette (petite) (switch avec des écrou...) un petit aimant sur tige (peut étre utile pour récupérer les vis qui s'échappent dans la baie) protections auditives
HardWare:
clé usb laptop préconfiguré boitier HDD pour pouvoir booter des ISO (type Zalman ZM-VE4000) chargeur laptop HP chargeur téléphone adaptateur usb -> série cable console multimetre, pour voir si une prise du PDU est pas HS. testeur de cable Jarretière Disque dur SFP(+)/QFP, ... RJ45 Ram modem 4g ( passerelle 4g wifi ) Cordons séries ( par type d'équipement)
SoftWare:
system rescue cd (sur clé usb) client ssh serveur tftp soft communication série minicom java 6 et 7 VM préconfigurée sur clef USB (VirtualBox ? KVM ?) contenant tous les softs préconfigurés (Firefox, Java...,outils DCIM)
Bonne journée Vincent
2016-01-20 13:35 GMT+01:00 Nicolas GORALSKI nicolas+ml.frsag@goralski.fr:
On 20 Jan 2016, at 13:32, Nicolas GORALSKI nicolas+ml.frsag@goralski.fr
wrote:
On 20 Jan 2016, at 09:42, H Kif h_kif@hotmail.com wrote:
bonjour la liste,
Nous souhaiterions dans une équipe d'exploitation d'un datacenter
mettre en place une "trousse de secours". L'idée est qu'en cas de grosse panne (typiquement un arrêt électrique brutal) avoir sur place tout le matériel soft et hard nécessaire aux équipes pour redémarrer, diagnostiquer et réparer si besoin l'infrastructure.
Voici les premières idées que j'ai et je serais intéressé par vos
retours d'expériences.
Merci par avance et bonne journée Vincent
Désolé je suis mal poli, bonjour la liste et Vincent.
Un jeu de CD avec les derniers firmware / bios validé par les équipes
(pratique quand tu dois remplacer un équipement HS)
Les install des OS aussi au cas ou ... Les dernières confs des équipements, vous savez celle qui se trouvent
sur le serveur qui est down..
Les backups si c’est sur du media amovible et les clés de restaurations
c'est chiffré (celles qui sont aussi sur le serveur down).
Les contrats de maintenance des équipements avec le numéro de support. Une personne qui se charge de prendre les appels ca évite de se faire
déranger pendant qu’on a les mains dans le cambouis par les clients.
De la monnaies pour le café ou les jetons car la nuit / journée va être
longue.
Les procédures (électroniques ou papier) de redémarrage des équipements
et de leur ordres / priorités.
Liste de diffusion du FRsAG http://www.frsag.org/