Salut,



Le 17 octobre 2016 à 18:04, Julien Escario <escario@azylog.net> a écrit :
Bonsoir,
Un disque d'un zpool est mort (jusque là, rien d'exceptionnel).

J'ai ajouté un disque, rebooté la machine (impossible de faire détecter le
nouveau disque via l'outil de la carte RAID). Un serveur de backup, rien de bien
grave.

Le soucis c'est qu'en rebootant le disque mort est revenu en ligne (je me
demande si ce n'est pas un soucis de backplane d'ailleurs).

J'ai gaiement fait un :
# zpool replace backuppool wwn-0x50014ee208b4df37
/dev/disk/by-id/wwn-0x50014ee0aed608b3

Ca semblait bien sur le papier :
root@backup03:~# zpool status
  pool: backuppool
 state: ONLINE
status: One or more devices is currently being resilvered.  The pool will
        continue to function, possibly in a degraded state.
action: Wait for the resilver to complete.
  scan: resilver in progress since Mon Oct 17 17:56:46 2016
    12,4G scanned out of 14,4T at 39,8M/s, 105h16m to go
    2,25G resilvered, 0,08% done
config:

        NAME                          STATE     READ WRITE CKSUM
        backuppool                    ONLINE       0     0     0
          mirror-0                    ONLINE       0     0     0
            wwn-0x5000cca07323a834    ONLINE       0     0     0
            wwn-0x5000cca07320be08    ONLINE       0     0     0
          mirror-1                    ONLINE       0     0     0
            wwn-0x5000cca05d53c77c    ONLINE       0     0     0
            wwn-0x5000cca05d53b824    ONLINE       0     0     0
          mirror-2                    ONLINE       0     0     0
            replacing-0               ONLINE      57     0    19
              wwn-0x50014ee208b4df37  ONLINE     124     0    40  (resilvering)
              wwn-0x50014ee0aed608b3  ONLINE       0     0   110  (resilvering)
            wwn-0x50014ee25f450bb1    ONLINE       0     0     0
          mirror-3                    ONLINE       0     0     0
            wwn-0x50014ee2b4933588    ONLINE       0     0     0
            wwn-0x50014ee209501544    ONLINE       0     0     0
          mirror-4                    ONLINE       0     0     0
            wwn-0x50014ee209316d16    ONLINE       0     0     0
            wwn-0x50014ee209f33449    ONLINE       0     0     0
          mirror-5                    ONLINE       0     0     0
            wwn-0x50014ee25e8699ee    ONLINE       0     0     0
            wwn-0x50014ee2b3dc5d66    ONLINE       0     0     0

Le soucis, c'est qu'il semblerait que ca incrémente tout doucement les valeurs
de READ et CKSUM. J'imagine que ce sont des erreurs lecture et checksum.

Ca ne m'embêterait pas si à chaque fois que c'est incrémenté, le resilvering ne
repartait pas à zéro ...

Du coup, j'ai l'impression que mon resilver ne finira jamais (il tourne depuis
quelques jours déjà).

Une idée sur la façon dont je peux m'en sortir ? C'est un serveur de backup donc
je peux mettre hors ligne quelques heures mais si je perds les données, ça va me
prendre DES PLOMBES à tout remettre, sans compter la période de fonctionnement
sans backup 'sec'.

Merci pour vos lumières,


Le bug suivant semble te concerner : https://github.com/zfsonlinux/zfs/issues/840
Tu peux essayer : 
#1 la dernière release ZoL (0.6.5.8)
si ça ne passe pas, c'est que le patch proposé n'a pas été intégré dedans, et donc il va te falloir compiler ZoL avec : 

https://github.com/zfsonlinux/zfs/commit/d14fa5dba1ad0e68e803435ac48ec1ea78121699

De quoi occuper ta soirée :p

Olivier