Le 14/09/2010 16:23, Karim AZAIZIA a écrit :
J'ai utilisé pdt 5 ans un FAS3020C et n'ai eu qu'un crash disque pendant cette période. La seule fois ou j'ai recontré un crash, cela provenait de la version 7.2P6 de DataONTAP si mes souvenirs sont bons. Je suis donc passé sur une version (n-2) 7.3.2P1 et le problème n'est jamais réapparu.
Il me semble que Netapp fournit des outils pour mesurer les perfs de ton filer : "perfstat". Je l'ai utilisé une fois sur un problème justement de réparition I/O.
Pour infos le FAS3020 embarquait "seulement" 2go de RAM ce qui est juste si on l'utilise pour la gestion d'un FS assez volumineux (beaucoup de fichiers dans beaucoup trop de répertoire). Le filer passait son temps à traiter les metadatas.
impact => systat indiquait que les disques constamment utilisés à 100%.
on a repensé l'organisation des FS + répartition correctes des volumes par aggrégat en fct du nombre de disques et tout est revenu dans l'ordre.
T'as une idée sur l'origine du crash ? ton filer est-il à jour (version -b) ? etc....
sysstat -sux 1 pour vérifier le bon cycle d'écriture/lecture& le taux utilisation cache + disque
normalement : sync toutes les 10 sec (à confirmer)
Le filer écrit dans le cache puis synchronise toutes les n secs les disques.
Tiens-bon& bon courage !!!!
Merci si tu veux bien m'aider, parce que le support la... donc déjà j'ai repassé mes cluster sql sur des disques locaux :p pour le debug :
netapp01> version -b 1:/x86_elf/kernel/primary.krn: OS 7.3.1P3 1:/backup/x86_elf/kernel/primary.krn: OS 7.2.6.1 1:/x86_elf/diag/diag.krn: 5.3.6 1:/x86_elf/firmware/deux/firmware.img: Firmware 3.1.0 1:/x86_elf/firmware/SB_XIV/firmware.img: BIOS/NABL Firmware 3.0 1:/x86_elf/firmware/SB_XIV/bmc.img: BMC Firmware 1.2 netapp01> sysstat -sux CPU NFS CIFS HTTP Total Net kB/s Disk kB/s Tape kB/s Cache Cache CP CP Disk FCP iSCSI FCP kB/s iSCSI kB/s in out read write read write age hit time ty util in out in out 17% 9 6 0 15 52 23 4263 1317 0 0 3 96% 11% T 87% 0 0 0 0 0 0 17% 2 1 0 3 6 8 4140 1230 0 0 2s 96% 8% T 86% 0 0 0 0 0 0 18% 12 29 0 41 80 15 4753 2358 0 0 3 96% 14% Tf 87% 0 0 0 0 0 0 21% 10 45 0 55 74 31 4315 1776 0 0 2s 96% 20% T 88% 0 0 0 0 0 0 18% 1 35 0 36 12 15 4262 1386 0 0 2s 96% 10% T 87% 0 0 0 0 0 0 41% 11 44 0 55 108 41 4238 1227 0 0 4 97% 11% T 87% 0 0 0 0 0 0 23% 12 30 0 42 83 73 4660 2897 0 0 3 96% 20% T 89% 0 0 0 0 0 0 20% 7 1 0 8 47 17 4214 1433 0 0 2s 96% 12% T 87% 0 0 0 0 0 0
L'utilisation des disques me parrait violente car normalement le netapp ne fait plus rien ??