On Fri, Aug 04, 2017 at 11:16:31AM +0000, jr--- via FRsAG wrote:
C'est assez étrange comme problème car cette solution est la pour s'affranchir de ce type de panne. Un host tombe, un autre reprend la main de manière transparente, les baies de disques sont répliquées sur plusieurs points physiques pour éviter les interruptions de service. Coté réseau OVH a été victime de plusieurs attaques mais gère plutôt bien les DDOS
Sans vouloir les défendre, je trouve que le point fort d'OVH c'est la gestion des serveurs dédiés, comparé avec un AWS ou Google Cloud, le rapport qualité/prix est bien meilleurs.
Est-ce que tu fais une bonne utilisation du service, comme ne pas avoir de disque en local sur les serveurs, ou faire un grand volume d'écriture/lecture sur des disques SATA au lieu de SSD ?
Bof, j'ai vu des baies de disques d'un dedicated cloud pas en prod tomber plusieurs fois l'année dernière (juste arrêter de répondre). J'imagique que c'est comme tout et y a un peu de malchance là dedans, mais bon ça arrive.
Je pense que de toute façon y a un truc qui loupe pas, leur doc est même prévue pour : https://pccdocs.ovh.net/pages/viewpage.action?pageId=1441870
"Par default sous linux le timeout des device scsi est à 30 secondes. [...] Il est recommandé d'augmenter cette durée à 3600 secondes."
Ils conseillent 3600 secondes de timeout pour les disques, hem.