On 15/11/2017 23:57, Olivier Calzi wrote:
Bonsoir à tous,
Après l'OVHGATE qui pour moi semble ne pas avoir été au infos (pour ma part je n'ai rien vu sur mon journal télévisé du soir), je voulais sonder vos réflexion.
Pouvons nous dire qu'il y a un avant et un après OVHGATE dans le monde de l'entreprise FR ? ou la technique de l'autruche es-t’elle en application ? Les dossiers de DRP/PRA sont'ils remis en avant dans les SI ? Comment parler vous de cet incident ?
Je me pose ces question après avoir observer par mois même ou à distance via les réseau l'application de la stratégie de l'autruche.
Je ne veux ici n'attaquer nullement les équipes d'OVH qui ont fais un boulot énorme avec ce qui leurs est tombée dessus, je sais qu'une merde cela arrive à tout le monde.
Pour moi cela est juste une bonne piqûre de rappel de certains principes/faits :
- la loi de murphy existe, le pire scénario arrivera toujours. - OVH reste un hébergeur low-cost. Je m'explique : - la panne de SBG est "normale". Deux câbles d'arrivés électriques n'assurent pas une redondance. Ceci est clairement expliqué d'ailleurs dans le mail d'Octave. Une vrai redondance c'est deux chaînes d'alimentations (cables, onduleurs, groupes) complètement séparés qui vont jusqu'aux serveurs. - la panne de RBX était prévisible. Une seule infra optique, sans OOB, avec du matos d'un seul constructeur pas spécifiquement réputé pour ces matériels de réseaux optiques, c'était un choix low-cost/simple. - il n'y a pas de miracle les prix bas d'OVH se ressentent nécessairement sur l'infra. Ceci dit on peut quand même admirer la transparence dans la communication, ce qui pour moi n'a pas de prix. - héberger toutes son infra chez un seul acteur (qu'il soit OVH, AWS ou autre) même sur du multi-DC/région, c'est prendre un risque. C'est un calcul financier à faire, car un DRP/PRA cela coûte cher (et cela ne marche pas forcement le jour ou on en a besoin). Si ton buisness ne supporte pas d'avoir 2H de coupure tous les 4 ans c'est tendu, car les vrais archis multi providers qui résistent ne sont pas évidente à mettre en place (shared nothing).
Ce genre d'incident réveille peut être les décideurs coupé de la technique ? qui auront oublié dans deux semaines.
-- Raphael Mazelier