Bonjour,
Julien Bailhache, employé chez Axel Springer/Aufeminin/SmartAdServer depuis fin 2007, en charge de notre parc de serveurs répartis sur 3 datacenters parisiens. Je viens du monde de l'édition logicielle via mon précédent poste d'assurance Qualité à ILOG, que j'ai quitté peu avant son rachat par IBM.
Au quotidien, mes tâches s'appliquent à assurer la stabilité et la performance de la plateforme dans son ensemble, selon différents angles: monitoring hardware, indicateurs métiers, base de données. Et régler les incidents ponctuels quand il y en a.
A propos, je ne sais pas si je suis hors sujet dans cette liste, mais nous avons été victimes très récemment d'un test d'alarme incendie, avec dégagement de gaz non prévu. En 5 minutes, une quinzaine de nos serveurs Dell utilisant des disques SAS en direct attach sont tombés. Une fois sur place nous nous sommes aperçus que les disques des ces serveurs avaient été pour une majeure partie déconnectés de leur carte RAID. Certains ont pu être remontés, d'autres non, et la configuration RAID ne nous a pas véritablement protégés contre cet événement exceptionnel.
En cherchant sur le web, je suis tombé sur cet article: http://www.availabilitydigest.com/public_articles/0602/inergen_noise.pdf
Pour ma part, je n'étais absolument pas au courant de telles limitations, avez-vous un retour d'expérience ou un avis à partager?
Merci,