[FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery

Joel DEREFINKO joel.derefinko at 118218.fr
Mer 9 Oct 18:02:16 CEST 2019


Hello,

A vérifier/tester, mais tu peux peut-être forcer le serveur à ventiler plus par défaut
https://serverfault.com/questions/847323/how-can-i-control-the-fan-speed-of-hp-dl380p-gen-8-server-running-esxi

Tu peux garder ça en tête au cas où, pour l’été prochain…

Joël

De : FRsAG <frsag-bounces at frsag.org> De la part de Pi Droid
Envoyé : mercredi 9 octobre 2019 15:47
À : French SysAdmin Group <frsag at frsag.org>
Objet : Re: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery

Hello,

Voici mes dernières avancées :
- J'ai eu l'occasion de mettre le serveur sur un traitement qui coûtait en CPU et en accès disque sur une durée de 6h. Au fur et à mesure que la ventilation augmente afin de répondre aux besoins de refroidissement CPU notamment (quelques % tout au plus), la P822 est descendu jusqu'à 70°C. A contrario, sur de l'accès disque intense sans vraiment de CPU/RAM, la ventilation s'adapte avec pour cible entre 85°C et 90°C pour la P822. Cela confirme ce qui était évoqué précédemment, 85°C est bien la température nominal de la P822 et la ventilation du serveur s'adapte si celle-ci monte.
- La solution d'une ventilation supplémentaire (Noctua NF-A4x20 en 5v) est abandonnée, manque d'espace et trop galère à mettre en place. J'y réfléchirai à nouveau l'été prochain si ça s'avère vraiment nécessaire.

Bref, sujet résolu ! Merci à tous pour vos aides :)

A+

Pidroid

Le dim. 6 oct. 2019 à 20:51, Pi Droid <pidroid.b at gmail.com<mailto:pidroid.b at gmail.com>> a écrit :
Merci Christophe !

Mon niveau d'anglais n'est plus ce qu'il était, j'en perds mon latin entre les différentes doc HPE
J'avais trouvé également celles là :
http://h20628.www2.hp.com/km-ext/kmcsdirect/emr_na-c03257410-9.pdf
http://h20628.www2.hp.com/km-ext/kmcsdirect/emr_na-c03251598-13.pdf
Je suppose que cette histoire de boucle est pour assurer une redondance des câbles (l'idée m'a été suggéré sur irc, pas réussi à trouver confirmation dans les docs)

Pour l'instant :
- J'ai refait la pâte thermique de la P822 (ils avaient mis une mousse autour du chip qui s'est un peu déchirée, j'imagine que la sonde de température est externe au chip du coup). Après test, je suis monté à 90°C pour redescendre à 85°C, ventilations du serveur au mème niveau que précédemment (bref pas de changement visible, au moins ce point est vérifié)
- j'ai branché sur la P822 ma baie 2.5" + mon LTO externe et à priori ça tourne bien selon les tests réalisés (pas fait de gros tests de charge encore, mais la ventilation s'adapte à la température et jamais dépassé 90°C).
- Pour la P822, j'ai commandé un Noctua NF-A4x20 en 5v, les attaches laissent un espace qui ne devrait pas gêner la ventilation d'origine si ce dernier tombait en panne.
- Enfin, sur le plan théorique, une fois les VMs remises en place la ventilation devrait augmenter significativement et du coup mieux refroidir la P822.

Ca fait un peu bidouille (et brouillon), mais ça devrait augmenter un peu la résilience le temps que je fasse plus de CA et que je puisse avoir un serveur plus récent et hébergé :p
Je vous tiens au courant.
Merci pour tous vos retours !

PS : je reste toujours ouvert à d'autres suggestions si vous en avez bien entendu.

---------- Forwarded message ---------
De : Christophe BARRY <cbarry at groupe-ara.com<mailto:cbarry at groupe-ara.com>>
Date: dim. 6 oct. 2019 à 18:40
Subject: FW: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery

Hello
Je ne pense pas qu’il soit impossible de placer des LFF et des SFF sur une même chaîne SAS de ton contrôleur.
En revanche, tu ne pourras pas créer d’Array avec des disques de types et/ou de ref différents.
https://support.hpe.com/hpsc/doc/public/display?docLocale=en_US&docId=emr_na-c01608507&withFrame

A+
Christophe
---------- Forwarded message ---------
De : Pi Droid <pidroid.b at gmail.com<mailto:pidroid.b at gmail.com>>
Date: ven. 4 oct. 2019 à 22:07
Subject: Re: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery
To: French SysAdmin Group <frsag at frsag.org<mailto:frsag at frsag.org>>

Merci pour vos retours !
Au moins, je peux faire tourner le serveur en attendant de trouver une solution \o/

Visiblement c'est donc bien une température normale...
Aie... Ça ne m'arrange pas tout cela.
Je vois que la P420[i] consomme max 14W alors que la P822 max 31W, j'imagine que cela dépend surtout de comment je les charges (autrement dit changer ma P822 par une P420 ne changera pas le problème)

Les choix qui s'offrent donc à moi sont :
- accepter cette température et espérer que cela passe l'été prochain (tester en montant artificiellement la température de la pièce à 35°c... pour voir ? suis pas vraiment à l'aise avec cette option :s )
- refaire la pâte thermique (suis pas sur d'avoir un gros gain à la vue de la chaleur évacuée mais ça ne prends pas longtemps a faire)
- modder la carte
     > ajout d'un ventilateur avec les risques en terme de modification de flux d'air (je vois que d'autres y ont déjà pensés : https://www.ebay.fr/itm/HP-P822-SATA-RAID-SAS-Card-Cooler-60mm-Cooling-Fan-Mount-Bracket-Clip-Adaptor/253905243817 )
     > changer pour un radiateur plus grand mais faut trouver
- trouver une autre carte RAID compatible avec ILO/ssacli (c'est bien pratique) plus économe en énergie à pas cher (si quelqu'un a des suggestions je suis preneur !)

Une autre option peut être envisageable... J'avoue que la documentation HPE est incompréhensible sur le sujet (et que je ne connais vraiment pas le fonctionnement du SAS)...
Actuellement ma P420i dispose de 2 cables SAS allant vers les 2 baies LFF et fait une boucle ( P420i--cable SAS--Bay1--cable SAS--Bay2--cable SAS--P420i) et j'ai cru comprendre que l'on ne pouvait pas mélanger LFF et SFF sur une même carte (ce point reste à confirmer).
Si cela s'avère faux... et que je décide de retirer un des cables SAS pour le brancher vers la bay SFF et ainsi mettre en place ce schéma ( P420i--cable SAS--Bay1--cable SAS--Bay2 et P420i--cable SAS--BaySFF) cela peut fonctionner ? ou être tester ?
La question parait peut être très bête mais j'en ignore complètement la réponse  (et voudrai surtout pas tout cramer... :p )

Merci d'avance,


---------- Forwarded message ---------
De : Christophe BARRY <cbarry at groupe-ara.com<mailto:cbarry at groupe-ara.com>>
Date: ven. 4 oct. 2019 à 18:35
Subject: Re: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery
To: Pi Droid <pidroid.b at gmail.com<mailto:pidroid.b at gmail.com>>

Oui, tu peux réintégrer, j’ai merdu au premier tour
Les LFF sont générateurs de chaleur mais la densité des SFF revient au même résultat lorsque les baies sont pleines.
SFF/LFF même combat : solides en rotation due à un moteur électrique. Les SSD sont donc fort logiquement moins gourmands.

Mais plus généralement, les carcasses de ML sont bien plus aérées que celles des DL, tu devrais donc avoir une évolution faible si une carte ‘accessoire’ monte en température.

Je viens de faire quelques mesures sur l’un de nos DL360 G8 de production (bi pro donc tous les fans actifs) et les P420i sont ‘onboard’ sur ces machines.
J’ai 52C° mesuré, alors que je n’ai aucun disque dessus ( !) (ce sont des Esxi dont les Hd sont sur un SAN)

Sur un dl380G8, plein de 12 LFF 600Go 15k, qui tourne en production aussi, la température du chip p420i est à 85°C avec les mêmes seuils que les tiens. Notre hébergeur maintient environ 26° en allée froide (28° mesuré en front sur les DL).
Les instances de Bdd qui tournent dedans ne consomme quasi rien, mais nous n’avons jamais eu d’alarme de température sur ces deux types de serveurs, en période d’utilisation soutenue.

Donc, in fine, je dirais que la situation est … normale. Les ML/DL sont des bêtes de somme, robustes et fiables.
A+
Christophe

Ci-dessous une image avec le point de mesure et sa valeur au bout des flèches vertes

Le ven. 4 oct. 2019 à 19:16, Christophe Pujol <chpujol at gmail.com<mailto:chpujol at gmail.com>> a écrit :
Pour moi, le Contrôleur devrais avoir une pâte thermique changé, vérifier le dimensionnement du radiateur et de la fixation.

Un pistolet thermomètre avec un pointeur laser serait un plus pour capter les températures du radiateur et proche du controleur

Christophe
CV Web<https://www.doyoubuzz.com/christophe-pujol_0>


Le ven. 4 oct. 2019 à 17:50, Pi Droid <pidroid.b at gmail.com<mailto:pidroid.b at gmail.com>> a écrit :
Voici les relevés de températures (via ssacli, ilo me remonte les températures de cartes avec 3 à 5 °C de moins)

Smart Array P420i in Slot 0 (Embedded) >> LFF 10HDD
   Controller Temperature (C): 62
   Cache Module Temperature (C): 33
   Capacitor Temperature  (C): 25

Smart Array P822 in Slot 3 >> SFF 4 SSD
   Controller Temperature (C): 88
   Cache Module Temperature (C): 43
   Capacitor Temperature  (C): 26

Les températures semblent très stables (hors mise sous tension, ces valeurs sont atteintes jusqu'à 1h après le démarrage généralement)
Je n'ai pas encore fait de gros accès sur la P822 (seul l'OS tourne dessus pour l'instant)
La température des batteries semble identique et normale.

Merci

Le ven. 4 oct. 2019 à 17:06, Christophe Pujol <chpujol at gmail.com<mailto:chpujol at gmail.com>> a écrit :
Bonjour,

Est-ce que la batterie est a une température alarmante ?

Christophe PUJOL
CV Web<https://www.doyoubuzz.com/christophe-pujol_0>

Le ven. 4 oct. 2019 à 16:20, Pi Droid <pidroid.b at gmail.com<mailto:pidroid.b at gmail.com>> a écrit :
Bonjour,

Je rencontre des températures qui me semblent anormalement élevées avec une carte contrôleur HPE P822 fraîchement installée : 85°C sans activité sur les disques associés (le "Caution" étant à 100°c sous ILO4).

Le tout semble très bien fonctionner et la ventilation du serveur oscille entre 24% et 27% (il est assez peu sollicité en ce moment)

Ce que j'ai fait (ou tenté de faire...) :
- Mise à jour du firmware en v8.32 (la dernière version je crois)
- J'ai essayé de mettre la carte sur les ports PCIE 4 puis 3
- J'ai rangé à max les cables afin de faciliter la circulation d'air
- L'air qui ressort du serveur à ce niveau est effectivement assez chaud, j'en déduis que je peux écarter les problèmes de sonde de température et de dissipation thermique

Je ne suis plus sous contrat de support avec HPE et peine à trouver ce que je veux sur leur site (404, difficulté de recherches etc...)

Bref, est-ce que ces 85°C vous semble normal ?
Connaissez-vous un moyen de redescendre de manière significative cette température (autre qu'un bricolage de ventilo sur le rad de la carte ou d'une ventilation du serveur en mode bourin) ?
Ou avez vous une alternative à me proposer ? (carte RAID pas chère et qui consomme peut, 8 SSD max à gérer via baie connectée par deux ports SAS)

Pour ceux qui veulent connaître le contexte :
J'ai upgradé récemment mon serveur, un ML350p Gen8 avec une baie supplémentaire :
Contexte :
- 2x6LFF existant + ajout : 1x8SFF
- 10HDD en LFF + ajout : 4 SSD en SFF
-  LFF géré par P420i (embarqué)
- Ajout d'une carte RAID P822 2GB + batterie (ensemble acheté 45€ neuf et scellé) pour la gestion de la baie SFF (port 4 puis 3 testés)
- La pièce dans laquelle est le serveur n'est pas climatisée (je démarre mon activité, je fais avec très très peu de moyens... dans ces conditions je n'ai pas hâte à l'été prochain)
- Je suis très débutant côté hardware serveur (je passe donc peut être à côté de quelques évidences ^^)

Merci d'avance !

Pidroid
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/
_______________________________________________
Liste de diffusion du FRsAG
http://www.frsag.org/
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://www.frsag.org/pipermail/frsag/attachments/20191009/90a341f0/attachment-0001.html>


Plus d'informations sur la liste de diffusion FRsAG