Salut,
J'ai qqs ST4000DM000 dans mon NAS:
for each in 'Model Number' 'Realloc' 'Power_On_Hours' 'Raw_Read_Error_Rate' 'Seek_Error_Rate'; do grep -e "$each" sd[abcdefg]*;echo '---';done sda.hdparm-I: Model Number: ST4000DM000-1F2168 sdb.hdparm-I: Model Number: ST4000DM000-1F2168 sdc.hdparm-I: Model Number: ST4000DM000-1F2168 sdd.hdparm-I: Model Number: ST4000DM000-1F2168 sde.hdparm-I: Model Number: ST4000DM000-1F2168 sdf.hdparm-I: Model Number: ST4000DM000-1F2168 sdg.hdparm-I: Model Number: ST4000DM000-1F2168 --- sda.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdb.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdc.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdd.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sde.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdf.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdg.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 --- sda.smartctl-a: 9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 1471 sdb.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12944 sdc.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12939 sdd.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12938 sde.smartctl-a: 9 Power_On_Hours 0x0032 087 087 000 Old_age Always - 12157 sdf.smartctl-a: 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9353 sdg.smartctl-a: 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9353 --- sda.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 138171480 sdb.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 118 099 006 Pre-fail Always - 171586584 sdc.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 111 099 006 Pre-fail Always - 37861664 sdd.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 107 099 006 Pre-fail Always - 14619096 sde.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 221885256 sdf.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 118 099 006 Pre-fail Always - 175070216 sdg.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 153520088 --- sda.smartctl-a: 7 Seek_Error_Rate 0x000f 063 060 030 Pre-fail Always - 1954928 sdb.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 26178432 sdc.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 25777593 sdd.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 25679755 sde.smartctl-a: 7 Seek_Error_Rate 0x000f 072 060 030 Pre-fail Always - 16374796 sdf.smartctl-a: 7 Seek_Error_Rate 0x000f 070 060 030 Pre-fail Always - 12335778 sdg.smartctl-a: 7 Seek_Error_Rate 0x000f 070 060 030 Pre-fail Always - 12404036
Le seul vrai compteur fiable à prendre en compte c'est le Realloc; les Error_Rate sont complètement inexploitables, je confirme...
Benoît
-------- Message d'origine-------- De: FRsAG de la part de Thomas Constans Date: mar. 03/11/2015 11:07 À: Etienne R.; Jacques Belin Cc: French SysAdmin Group Objet : Re: [FRsAG] info smartctl non fiable, faute à pas de chance ...
Étienne, Jacques et les autres, merci !
Je viens de lire cette doc et et refaire les maths (pour info, pour avoir les valeurs brutes en hexa d'un attribut smart donné:
smartctl -v 1,hex48 -v 7,hex48 -a /dev/sdc # 1 et 7 étant l'id de l'attribut)
En conclusion : mes disques sont clean, les infos smart ne sont pas un modèle de fiabilité et mes problèmes de charge viennent d'ailleurs.
PS: j'ai quand même fait accepter un SEAGATE au SAV constructeur sur la base de ces valeurs ....
++
Le 03/11/2015 04:44, Etienne R. a écrit :
Le 1 novembre 2015 14:28, Jacques Belin jbelin@oryva.net a écrit :
C'est "normal" si c'est un Seagate, ils ont toujours fait ça, quelque soit le modèle. Et la valeur est affichée est totalement inexploitable d'ailleurs, puisqu'elle est remise à zéro quand elle atteint +/- 240 millions. Ce qui arrive plusieurs fois par jour pour des disques qui sont assez solicités...
Il y avait une bonne explication concernant ces valeurs sur les forums de Seagate, maintenant disparus... Heureusement quelqu'un en a fait une archive texte, merci Google : http://skeena.net/kb/Seagate%27s%20Seek%20Error%20Rate,%20Raw%20Read%20Error...
Concrètement, pour le Seek Error Rate, Seagate utilise les 4 octets de poids faible comme un compteur de lecture, et les 2 octets de poids fort comme compteur d'erreurs. En passant la valeur en hexa on y voit immédiatement plus clair ! :) Pour la valeur brute de Raw Read Error Rate, c'est effectivement un compteur de secteurs lus, qui se remet à zéro à 250 millions...
Cordialement.
_______________________________________________ Liste de diffusion du FRsAG http://www.frsag.org/