-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA256
Bonjour la liste,
Il y a quelques semaines, en recherchant la cause de problèmes de montée en charge sur mon pc perso, je me suis aperçu que mon disque dur principal ( 5 mois d'âge) présentait un nombre de "Raw_Read_Error_Rate" et "Seek_Error_Rate" particulièrement important.
Je l'ai fait partir au SAV. À son retour j'en achète un 2eme histoire de monter un raid.
1 mois plus tard (maintenant), même symptômes (montée en charge aléatoires, iowait important malgré une activité disque inexistante).
Et smartctl me donne ça:
sudo smartctl -a /dev/sda
smartctl 6.4 2015-06-04 r4109 [x86_64-linux-4.1.7-200.fc22.x86_64]
=== START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.14 (AF) Device Model: ST2000DM001-1ER164 Serial Number: Z4Z31Z99 LU WWN Device Id: 5 000c50 07bb6661e Firmware Version: CC25 User Capacity: 2 000 397 852 160 bytes [2,00 TB] Sector Sizes: 512 bytes logical, 4096 bytes physical Rotation Rate: 7200 rpm
...
1 Raw_Read_Error_Rate 0x000f 114 099 006 Pre-fail Always - 75528664 3 Spin_Up_Time 0x0003 098 098 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 6 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 076 060 030 Pre-fail Always - 48710577 9 Power_On_Hours 0x0032 100 100 000 Old_age Always - 692
J'ai les même résultats sur /dev/sdc (le 2ème disque)
Les valeurs Seek_ERror et Raw_Read_Error augmente à vue d'oeil.
Puis-je me fier aux résultats de smartctl et conclure que mes disques sont en carton, ou c'est autre chose ?
Merci de votre retour
- -- Thomas Constans gpg: 0xBA19745F80410541
Si tu as une connectique défectueuse, tu aura des erreurs qui ne seront pas dues au disque dur, mais smartctl ne pourra pas faire la différence.
smartcl est efficace pour comparer une évolution dans le temps.
j'ai un ordi portable dont la connectique SATA présente des faux contacts, certains résultats renvoyés par smartcl sont alarmant, mais il n'y a pas d'évolution si je ne déplace pas l'ordinateur.
Le 01/11/2015 11:26, err404@free.fr a écrit :
Si tu as une connectique défectueuse, tu aura des erreurs qui ne seront pas dues au disque dur, mais smartctl ne pourra pas faire la différence.
smartcl est efficace pour comparer une évolution dans le temps.
j'ai un ordi portable dont la connectique SATA présente des faux contacts, certains résultats renvoyés par smartcl sont alarmant, mais il n'y a pas d'évolution si je ne déplace pas l'ordinateur.
je plussoie.
Un autre paramètre important est "Reallocated_Sector_Ct", le nb de secteurs defectueux (et donc réalloués par l'electronique du disque). Et ca ne dépend pas de la connectique externe du disque.
là tu est déjà à 10 sectors réalloués ?
Des erreurs logguées (cf "smartctl -l error /dev/sda") ?
Pierre
Bonjour,
Je vais voir la connectique (sachant que c'est un desktop fixe, et que j'ai un autre disque, plus vieux - power_on_hour à 32000 qui a un raw_read_error propre).
Coté smartctl -l error, je n'ai rien.
Et je n'est pas de secteur réalloués (10 c'est la valeur du seuil).
Cordialement
Le 01/11/2015 11:58, Pierre Bourgin a écrit :
Le 01/11/2015 11:26, err404@free.fr a écrit :
Si tu as une connectique défectueuse, tu aura des erreurs qui ne seront pas dues au disque dur, mais smartctl ne pourra pas faire la différence.
smartcl est efficace pour comparer une évolution dans le temps.
j'ai un ordi portable dont la connectique SATA présente des faux contacts, certains résultats renvoyés par smartcl sont alarmant, mais il n'y a pas d'évolution si je ne déplace pas l'ordinateur.
je plussoie.
Un autre paramètre important est "Reallocated_Sector_Ct", le nb de secteurs defectueux (et donc réalloués par l'electronique du disque). Et ca ne dépend pas de la connectique externe du disque.
là tu est déjà à 10 sectors réalloués ?
Des erreurs logguées (cf "smartctl -l error /dev/sda") ?
Pierre
_______________________________________________ Liste de diffusion du FRsAG http://www.frsag.org/
Hello Thomas,
Je vais voir la connectique (sachant que c'est un desktop fixe, et que j'ai un autre disque, plus vieux - power_on_hour à 32000 qui a un raw_read_error propre).
Coté smartctl -l error, je n'ai rien.
Et je n'est pas de secteur réalloués (10 c'est la valeur du seuil).
Ton Seagate est un disque "desktop", c'est à dire qu'il n'est PAS prévu pour des usages type NAS / Serveur what ever.
D'ailleurs si tu regarde sur le site de seagate, tu verra qu'il n'est garantis que 1ans.
Si tu veux de la fiabilité je te conseilles de prendre les NAS edition ou ES. Qui eux sont garantis 3 ans et n'ont pas de pb.
A noter que des fois l'alim de certains desktop / nas peuvent etre moisies et faire des erreurs smart sur ces disques.
Xavier
Bonjour,
Le 1 novembre 2015 11:26, err404@free.fr a écrit :
Si tu as une connectique défectueuse, tu aura des erreurs qui ne seront pas dues au disque dur, mais smartctl ne pourra pas faire la différence.
Les soucis de connectique sont assez facilement visibles par une augmentation de la valeur brute du champ UDMA_CRC_Error_Count. Souvent signe d'une nappe SATA foireuse ! :) Effectivement les autres compteurs peuvent augmenter aussi à cause du soucis de connectique, mais une fois ce soucis réglé le nombre de UDMA_CRC_Error_Count ne devrait plus augmenter.
Cordialement.
Bonjour,
Cela ne va pas forcément t’aider dans l’immédiat, mais depuis quelques années la très grosse majorité des problèmes de disques que je rencontre viennent de disques seagate. Par exemple le dernier laptop que j’ai dû démonter est celui d’une amie à qui j’ai changé de disque car le seagate qui était dedans n’était plus montable. Actuellement, dans mon desktop j’ai trois disques, le seul qui a un smart qui hurle est un seagate. Un ami a récemment perdu un seagate également. Etc., etc.
Je préfère donc éviter cette marque maintenant. Pour le reste, dernièrement j’ai vu un hitachi mort (mais il avait 70000 heures de vol et était dans une baie de disque utilisée pour un hyperviseur).
Le dimanche 1 novembre 2015 10:51:54, Thomas Constans thomas@opendoor.fr a écrit:
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA256
Bonjour la liste,
Il y a quelques semaines, en recherchant la cause de problèmes de montée en charge sur mon pc perso, je me suis aperçu que mon disque dur principal ( 5 mois d'âge) présentait un nombre de "Raw_Read_Error_Rate" et "Seek_Error_Rate" particulièrement important.
C'est "normal" si c'est un Seagate, ils ont toujours fait ça, quelque soit le modèle. Et la valeur est affichée est totalement inexploitable d'ailleurs, puisqu'elle est remise à zéro quand elle atteint +/- 240 millions. Ce qui arrive plusieurs fois par jour pour des disques qui sont assez solicités...
Si c'est une autre marque, là il y a peut-être effectivement un problème.
A+ Jacques.
Le 1 novembre 2015 14:28, Jacques Belin jbelin@oryva.net a écrit :
C'est "normal" si c'est un Seagate, ils ont toujours fait ça, quelque soit le modèle. Et la valeur est affichée est totalement inexploitable d'ailleurs, puisqu'elle est remise à zéro quand elle atteint +/- 240 millions. Ce qui arrive plusieurs fois par jour pour des disques qui sont assez solicités...
Il y avait une bonne explication concernant ces valeurs sur les forums de Seagate, maintenant disparus... Heureusement quelqu'un en a fait une archive texte, merci Google : http://skeena.net/kb/Seagate%27s%20Seek%20Error%20Rate,%20Raw%20Read%20Error...
Concrètement, pour le Seek Error Rate, Seagate utilise les 4 octets de poids faible comme un compteur de lecture, et les 2 octets de poids fort comme compteur d'erreurs. En passant la valeur en hexa on y voit immédiatement plus clair ! :) Pour la valeur brute de Raw Read Error Rate, c'est effectivement un compteur de secteurs lus, qui se remet à zéro à 250 millions...
Cordialement.
Étienne, Jacques et les autres, merci !
Je viens de lire cette doc et et refaire les maths (pour info, pour avoir les valeurs brutes en hexa d'un attribut smart donné:
smartctl -v 1,hex48 -v 7,hex48 -a /dev/sdc # 1 et 7 étant l'id de l'attribut)
En conclusion : mes disques sont clean, les infos smart ne sont pas un modèle de fiabilité et mes problèmes de charge viennent d'ailleurs.
PS: j'ai quand même fait accepter un SEAGATE au SAV constructeur sur la base de ces valeurs ....
++
Le 03/11/2015 04:44, Etienne R. a écrit :
Le 1 novembre 2015 14:28, Jacques Belin jbelin@oryva.net a écrit :
C'est "normal" si c'est un Seagate, ils ont toujours fait ça, quelque soit le modèle. Et la valeur est affichée est totalement inexploitable d'ailleurs, puisqu'elle est remise à zéro quand elle atteint +/- 240 millions. Ce qui arrive plusieurs fois par jour pour des disques qui sont assez solicités...
Il y avait une bonne explication concernant ces valeurs sur les forums de Seagate, maintenant disparus... Heureusement quelqu'un en a fait une archive texte, merci Google : http://skeena.net/kb/Seagate%27s%20Seek%20Error%20Rate,%20Raw%20Read%20Error...
Concrètement, pour le Seek Error Rate, Seagate utilise les 4 octets de poids faible comme un compteur de lecture, et les 2 octets de poids fort comme compteur d'erreurs. En passant la valeur en hexa on y voit immédiatement plus clair ! :) Pour la valeur brute de Raw Read Error Rate, c'est effectivement un compteur de secteurs lus, qui se remet à zéro à 250 millions...
Cordialement.
_______________________________________________ Liste de diffusion du FRsAG http://www.frsag.org/
Salut,
J'ai qqs ST4000DM000 dans mon NAS:
for each in 'Model Number' 'Realloc' 'Power_On_Hours' 'Raw_Read_Error_Rate' 'Seek_Error_Rate'; do grep -e "$each" sd[abcdefg]*;echo '---';done sda.hdparm-I: Model Number: ST4000DM000-1F2168 sdb.hdparm-I: Model Number: ST4000DM000-1F2168 sdc.hdparm-I: Model Number: ST4000DM000-1F2168 sdd.hdparm-I: Model Number: ST4000DM000-1F2168 sde.hdparm-I: Model Number: ST4000DM000-1F2168 sdf.hdparm-I: Model Number: ST4000DM000-1F2168 sdg.hdparm-I: Model Number: ST4000DM000-1F2168 --- sda.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdb.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdc.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdd.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sde.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdf.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 sdg.smartctl-a: 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 --- sda.smartctl-a: 9 Power_On_Hours 0x0032 099 099 000 Old_age Always - 1471 sdb.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12944 sdc.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12939 sdd.smartctl-a: 9 Power_On_Hours 0x0032 086 086 000 Old_age Always - 12938 sde.smartctl-a: 9 Power_On_Hours 0x0032 087 087 000 Old_age Always - 12157 sdf.smartctl-a: 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9353 sdg.smartctl-a: 9 Power_On_Hours 0x0032 090 090 000 Old_age Always - 9353 --- sda.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 138171480 sdb.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 118 099 006 Pre-fail Always - 171586584 sdc.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 111 099 006 Pre-fail Always - 37861664 sdd.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 107 099 006 Pre-fail Always - 14619096 sde.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 119 099 006 Pre-fail Always - 221885256 sdf.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 118 099 006 Pre-fail Always - 175070216 sdg.smartctl-a: 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 153520088 --- sda.smartctl-a: 7 Seek_Error_Rate 0x000f 063 060 030 Pre-fail Always - 1954928 sdb.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 26178432 sdc.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 25777593 sdd.smartctl-a: 7 Seek_Error_Rate 0x000f 074 060 030 Pre-fail Always - 25679755 sde.smartctl-a: 7 Seek_Error_Rate 0x000f 072 060 030 Pre-fail Always - 16374796 sdf.smartctl-a: 7 Seek_Error_Rate 0x000f 070 060 030 Pre-fail Always - 12335778 sdg.smartctl-a: 7 Seek_Error_Rate 0x000f 070 060 030 Pre-fail Always - 12404036
Le seul vrai compteur fiable à prendre en compte c'est le Realloc; les Error_Rate sont complètement inexploitables, je confirme...
Benoît
-------- Message d'origine-------- De: FRsAG de la part de Thomas Constans Date: mar. 03/11/2015 11:07 À: Etienne R.; Jacques Belin Cc: French SysAdmin Group Objet : Re: [FRsAG] info smartctl non fiable, faute à pas de chance ...
Étienne, Jacques et les autres, merci !
Je viens de lire cette doc et et refaire les maths (pour info, pour avoir les valeurs brutes en hexa d'un attribut smart donné:
smartctl -v 1,hex48 -v 7,hex48 -a /dev/sdc # 1 et 7 étant l'id de l'attribut)
En conclusion : mes disques sont clean, les infos smart ne sont pas un modèle de fiabilité et mes problèmes de charge viennent d'ailleurs.
PS: j'ai quand même fait accepter un SEAGATE au SAV constructeur sur la base de ces valeurs ....
++
Le 03/11/2015 04:44, Etienne R. a écrit :
Le 1 novembre 2015 14:28, Jacques Belin jbelin@oryva.net a écrit :
C'est "normal" si c'est un Seagate, ils ont toujours fait ça, quelque soit le modèle. Et la valeur est affichée est totalement inexploitable d'ailleurs, puisqu'elle est remise à zéro quand elle atteint +/- 240 millions. Ce qui arrive plusieurs fois par jour pour des disques qui sont assez solicités...
Il y avait une bonne explication concernant ces valeurs sur les forums de Seagate, maintenant disparus... Heureusement quelqu'un en a fait une archive texte, merci Google : http://skeena.net/kb/Seagate%27s%20Seek%20Error%20Rate,%20Raw%20Read%20Error...
Concrètement, pour le Seek Error Rate, Seagate utilise les 4 octets de poids faible comme un compteur de lecture, et les 2 octets de poids fort comme compteur d'erreurs. En passant la valeur en hexa on y voit immédiatement plus clair ! :) Pour la valeur brute de Raw Read Error Rate, c'est effectivement un compteur de secteurs lus, qui se remet à zéro à 250 millions...
Cordialement.
_______________________________________________ Liste de diffusion du FRsAG http://www.frsag.org/