Salut,
Le 17 octobre 2016 à 18:04, Julien Escario escario@azylog.net a écrit :
Bonsoir, Un disque d'un zpool est mort (jusque là, rien d'exceptionnel).
J'ai ajouté un disque, rebooté la machine (impossible de faire détecter le nouveau disque via l'outil de la carte RAID). Un serveur de backup, rien de bien grave.
Le soucis c'est qu'en rebootant le disque mort est revenu en ligne (je me demande si ce n'est pas un soucis de backplane d'ailleurs).
J'ai gaiement fait un : # zpool replace backuppool wwn-0x50014ee208b4df37 /dev/disk/by-id/wwn-0x50014ee0aed608b3
Ca semblait bien sur le papier : root@backup03:~# zpool status pool: backuppool state: ONLINE status: One or more devices is currently being resilvered. The pool will continue to function, possibly in a degraded state. action: Wait for the resilver to complete. scan: resilver in progress since Mon Oct 17 17:56:46 2016 12,4G scanned out of 14,4T at 39,8M/s, 105h16m to go 2,25G resilvered, 0,08% done config:
NAME STATE READ WRITE CKSUM backuppool ONLINE 0 0 0 mirror-0 ONLINE 0 0 0 wwn-0x5000cca07323a834 ONLINE 0 0 0 wwn-0x5000cca07320be08 ONLINE 0 0 0 mirror-1 ONLINE 0 0 0 wwn-0x5000cca05d53c77c ONLINE 0 0 0 wwn-0x5000cca05d53b824 ONLINE 0 0 0 mirror-2 ONLINE 0 0 0 replacing-0 ONLINE 57 0 19 wwn-0x50014ee208b4df37 ONLINE 124 0 40
(resilvering) wwn-0x50014ee0aed608b3 ONLINE 0 0 110 (resilvering) wwn-0x50014ee25f450bb1 ONLINE 0 0 0 mirror-3 ONLINE 0 0 0 wwn-0x50014ee2b4933588 ONLINE 0 0 0 wwn-0x50014ee209501544 ONLINE 0 0 0 mirror-4 ONLINE 0 0 0 wwn-0x50014ee209316d16 ONLINE 0 0 0 wwn-0x50014ee209f33449 ONLINE 0 0 0 mirror-5 ONLINE 0 0 0 wwn-0x50014ee25e8699ee ONLINE 0 0 0 wwn-0x50014ee2b3dc5d66 ONLINE 0 0 0
Le soucis, c'est qu'il semblerait que ca incrémente tout doucement les valeurs de READ et CKSUM. J'imagine que ce sont des erreurs lecture et checksum.
Ca ne m'embêterait pas si à chaque fois que c'est incrémenté, le resilvering ne repartait pas à zéro ...
Du coup, j'ai l'impression que mon resilver ne finira jamais (il tourne depuis quelques jours déjà).
Une idée sur la façon dont je peux m'en sortir ? C'est un serveur de backup donc je peux mettre hors ligne quelques heures mais si je perds les données, ça va me prendre DES PLOMBES à tout remettre, sans compter la période de fonctionnement sans backup 'sec'.
Merci pour vos lumières,
Le bug suivant semble te concerner : https://github.com/zfsonlinux/zfs/issues/840 Tu peux essayer : #1 la dernière release ZoL (0.6.5.8) si ça ne passe pas, c'est que le patch proposé n'a pas été intégré dedans, et donc il va te falloir compiler ZoL avec :
https://github.com/zfsonlinux/zfs/commit/d14fa5dba1ad0e68e803435ac48ec1ea781...
De quoi occuper ta soirée :p
Olivier