[FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822 2GB FBWC + Battery

Pi Droid pidroid.b at gmail.com
Mer 9 Oct 15:46:59 CEST 2019


Hello,

Voici mes dernières avancées :
- J'ai eu l'occasion de mettre le serveur sur un traitement qui coûtait en
CPU et en accès disque sur une durée de 6h. Au fur et à mesure que la
ventilation augmente afin de répondre aux besoins de refroidissement CPU
notamment (quelques % tout au plus), la P822 est descendu jusqu'à 70°C. A
contrario, sur de l'accès disque intense sans vraiment de CPU/RAM, la
ventilation s'adapte avec pour cible entre 85°C et 90°C pour la P822. Cela
confirme ce qui était évoqué précédemment, 85°C est bien la température
nominal de la P822 et la ventilation du serveur s'adapte si celle-ci monte.
- La solution d'une ventilation supplémentaire (Noctua NF-A4x20 en 5v) est
abandonnée, manque d'espace et trop galère à mettre en place. J'y
réfléchirai à nouveau l'été prochain si ça s'avère vraiment nécessaire.

Bref, sujet résolu ! Merci à tous pour vos aides :)

A+

Pidroid

Le dim. 6 oct. 2019 à 20:51, Pi Droid <pidroid.b at gmail.com> a écrit :

> Merci Christophe !
>
> Mon niveau d'anglais n'est plus ce qu'il était, j'en perds mon latin entre
> les différentes doc HPE
> J'avais trouvé également celles là :
> http://h20628.www2.hp.com/km-ext/kmcsdirect/emr_na-c03257410-9.pdf
> http://h20628.www2.hp.com/km-ext/kmcsdirect/emr_na-c03251598-13.pdf
> Je suppose que cette histoire de boucle est pour assurer une redondance
> des câbles (l'idée m'a été suggéré sur irc, pas réussi à trouver
> confirmation dans les docs)
>
> Pour l'instant :
> - J'ai refait la pâte thermique de la P822 (ils avaient mis une mousse
> autour du chip qui s'est un peu déchirée, j'imagine que la sonde de
> température est externe au chip du coup). Après test, je suis monté à 90°C
> pour redescendre à 85°C, ventilations du serveur au mème niveau que
> précédemment (bref pas de changement visible, au moins ce point est vérifié)
> - j'ai branché sur la P822 ma baie 2.5" + mon LTO externe et à priori ça
> tourne bien selon les tests réalisés (pas fait de gros tests de charge
> encore, mais la ventilation s'adapte à la température et jamais dépassé
> 90°C).
> - Pour la P822, j'ai commandé un Noctua NF-A4x20 en 5v, les attaches
> laissent un espace qui ne devrait pas gêner la ventilation d'origine si ce
> dernier tombait en panne.
> - Enfin, sur le plan théorique, une fois les VMs remises en place la
> ventilation devrait augmenter significativement et du coup mieux refroidir
> la P822.
>
> Ca fait un peu bidouille (et brouillon), mais ça devrait augmenter un peu
> la résilience le temps que je fasse plus de CA et que je puisse avoir un
> serveur plus récent et hébergé :p
> Je vous tiens au courant.
> Merci pour tous vos retours !
>
> PS : je reste toujours ouvert à d'autres suggestions si vous en avez bien
> entendu.
>
> ---------- Forwarded message ---------
> De : Christophe BARRY <cbarry at groupe-ara.com>
> Date: dim. 6 oct. 2019 à 18:40
> Subject: FW: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822
> 2GB FBWC + Battery
>
>
>
> Hello
>
> Je ne pense pas qu’il soit impossible de placer des LFF et des SFF sur une
> même chaîne SAS de ton contrôleur.
>
> En revanche, tu ne pourras pas créer d’Array avec des disques de types
> et/ou de ref différents.
>
>
> https://support.hpe.com/hpsc/doc/public/display?docLocale=en_US&docId=emr_na-c01608507&withFrame
>
>
>
> A+
>
> Christophe
> ---------- Forwarded message ---------
> De : Pi Droid <pidroid.b at gmail.com>
> Date: ven. 4 oct. 2019 à 22:07
> Subject: Re: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822
> 2GB FBWC + Battery
> To: French SysAdmin Group <frsag at frsag.org>
>
>
> Merci pour vos retours !
> Au moins, je peux faire tourner le serveur en attendant de trouver une
> solution \o/
>
> Visiblement c'est donc bien une température normale...
> Aie... Ça ne m'arrange pas tout cela.
> Je vois que la P420[i] consomme max 14W alors que la P822 max 31W,
> j'imagine que cela dépend surtout de comment je les charges (autrement dit
> changer ma P822 par une P420 ne changera pas le problème)
>
> Les choix qui s'offrent donc à moi sont :
> - accepter cette température et espérer que cela passe l'été prochain
> (tester en montant artificiellement la température de la pièce à 35°c...
> pour voir ? suis pas vraiment à l'aise avec cette option :s )
> - refaire la pâte thermique (suis pas sur d'avoir un gros gain à la vue de
> la chaleur évacuée mais ça ne prends pas longtemps a faire)
> - modder la carte
>      > ajout d'un ventilateur avec les risques en terme de modification de
> flux d'air (je vois que d'autres y ont déjà pensés :
> https://www.ebay.fr/itm/HP-P822-SATA-RAID-SAS-Card-Cooler-60mm-Cooling-Fan-Mount-Bracket-Clip-Adaptor/253905243817
> )
>      > changer pour un radiateur plus grand mais faut trouver
> - trouver une autre carte RAID compatible avec ILO/ssacli (c'est bien
> pratique) plus économe en énergie à pas cher (si quelqu'un a des
> suggestions je suis preneur !)
>
> Une autre option peut être envisageable... J'avoue que la documentation
> HPE est incompréhensible sur le sujet (et que je ne connais vraiment pas le
> fonctionnement du SAS)...
> Actuellement ma P420i dispose de 2 cables SAS allant vers les 2 baies LFF
> et fait une boucle ( P420i--cable SAS--Bay1--cable SAS--Bay2--cable
> SAS--P420i) et j'ai cru comprendre que l'on ne pouvait pas mélanger LFF et
> SFF sur une même carte (ce point reste à confirmer).
> Si cela s'avère faux... et que je décide de retirer un des cables SAS pour
> le brancher vers la bay SFF et ainsi mettre en place ce schéma (
> P420i--cable SAS--Bay1--cable SAS--Bay2 et P420i--cable SAS--BaySFF) cela
> peut fonctionner ? ou être tester ?
> La question parait peut être très bête mais j'en ignore complètement la
> réponse  (et voudrai surtout pas tout cramer... :p )
>
> Merci d'avance,
>
>
> ---------- Forwarded message ---------
> De : Christophe BARRY <cbarry at groupe-ara.com>
> Date: ven. 4 oct. 2019 à 18:35
> Subject: Re: [FRsAG] Temperature elevee sur controleur SAS RAID : HPE P822
> 2GB FBWC + Battery
> To: Pi Droid <pidroid.b at gmail.com>
>
>
> Oui, tu peux réintégrer, j’ai merdu au premier tour
>
> Les LFF sont générateurs de chaleur mais la densité des SFF revient au
> même résultat lorsque les baies sont pleines.
>
> SFF/LFF même combat : solides en rotation due à un moteur électrique. Les
> SSD sont donc fort logiquement moins gourmands.
>
>
>
> Mais plus généralement, les carcasses de ML sont bien plus aérées que
> celles des DL, tu devrais donc avoir une évolution faible si une carte
> ‘accessoire’ monte en température.
>
>
>
> Je viens de faire quelques mesures sur l’un de nos DL360 G8 de production
> (bi pro donc tous les fans actifs) et les P420i sont ‘onboard’ sur ces
> machines.
>
> J’ai 52C° mesuré, alors que je n’ai aucun disque dessus ( !) (ce sont des
> Esxi dont les Hd sont sur un SAN)
>
>
>
> Sur un dl380G8, plein de 12 LFF 600Go 15k, qui tourne en production aussi,
> la température du chip p420i est à 85°C avec les mêmes seuils que les
> tiens. Notre hébergeur maintient environ 26° en allée froide (28° mesuré en
> front sur les DL).
>
> Les instances de Bdd qui tournent dedans ne consomme quasi rien, mais nous
> n’avons jamais eu d’alarme de température sur ces deux types de serveurs,
> en période d’utilisation soutenue.
>
>
>
> Donc, in fine, je dirais que la situation est … normale. Les ML/DL sont
> des bêtes de somme, robustes et fiables.
>
> A+
>
> *Christophe*
>
>
>
> Ci-dessous une image avec le point de mesure et sa valeur au bout des
> flèches vertes
>
> Le ven. 4 oct. 2019 à 19:16, Christophe Pujol <chpujol at gmail.com> a
> écrit :
>
>> Pour moi, le Contrôleur devrais avoir une pâte thermique changé, vérifier
>> le dimensionnement du radiateur et de la fixation.
>>
>> Un pistolet thermomètre avec un pointeur laser serait un plus pour capter
>> les températures du radiateur et proche du controleur
>>
>> Christophe
>> CV Web <https://www.doyoubuzz.com/christophe-pujol_0>
>>
>>
>> Le ven. 4 oct. 2019 à 17:50, Pi Droid <pidroid.b at gmail.com> a écrit :
>>
>>> Voici les relevés de températures (via ssacli, ilo me remonte les
>>> températures de cartes avec 3 à 5 °C de moins)
>>>
>>> Smart Array P420i in Slot 0 (Embedded) >> LFF 10HDD
>>>    Controller Temperature (C): 62
>>>    Cache Module Temperature (C): 33
>>>    Capacitor Temperature  (C): 25
>>>
>>> Smart Array P822 in Slot 3 >> SFF 4 SSD
>>>    Controller Temperature (C): 88
>>>    Cache Module Temperature (C): 43
>>>    Capacitor Temperature  (C): 26
>>>
>>> Les températures semblent très stables (hors mise sous tension, ces
>>> valeurs sont atteintes jusqu'à 1h après le démarrage généralement)
>>> Je n'ai pas encore fait de gros accès sur la P822 (seul l'OS tourne
>>> dessus pour l'instant)
>>> La température des batteries semble identique et normale.
>>>
>>> Merci
>>>
>>> Le ven. 4 oct. 2019 à 17:06, Christophe Pujol <chpujol at gmail.com> a
>>> écrit :
>>>
>>>> Bonjour,
>>>>
>>>> Est-ce que la batterie est a une température alarmante ?
>>>>
>>>> Christophe PUJOL
>>>> CV Web <https://www.doyoubuzz.com/christophe-pujol_0>
>>>>
>>>>
>>> Le ven. 4 oct. 2019 à 16:20, Pi Droid <pidroid.b at gmail.com> a écrit :
>>>>
>>>>> Bonjour,
>>>>>
>>>>> Je rencontre des températures qui me semblent anormalement élevées
>>>>> avec une carte contrôleur HPE P822 fraîchement installée : 85°C sans
>>>>> activité sur les disques associés (le "Caution" étant à 100°c sous ILO4).
>>>>>
>>>>> Le tout semble très bien fonctionner et la ventilation du serveur
>>>>> oscille entre 24% et 27% (il est assez peu sollicité en ce moment)
>>>>>
>>>>> Ce que j'ai fait (ou tenté de faire...) :
>>>>> - Mise à jour du firmware en v8.32 (la dernière version je crois)
>>>>> - J'ai essayé de mettre la carte sur les ports PCIE 4 puis 3
>>>>> - J'ai rangé à max les cables afin de faciliter la circulation d'air
>>>>> - L'air qui ressort du serveur à ce niveau est effectivement assez
>>>>> chaud, j'en déduis que je peux écarter les problèmes de sonde de
>>>>> température et de dissipation thermique
>>>>>
>>>>> Je ne suis plus sous contrat de support avec HPE et peine à trouver ce
>>>>> que je veux sur leur site (404, difficulté de recherches etc...)
>>>>>
>>>>> Bref, est-ce que ces 85°C vous semble normal ?
>>>>> Connaissez-vous un moyen de redescendre de manière significative cette
>>>>> température (autre qu'un bricolage de ventilo sur le rad de la carte ou
>>>>> d'une ventilation du serveur en mode bourin) ?
>>>>> Ou avez vous une alternative à me proposer ? (carte RAID pas chère et
>>>>> qui consomme peut, 8 SSD max à gérer via baie connectée par deux ports SAS)
>>>>>
>>>>> Pour ceux qui veulent connaître le contexte :
>>>>> J'ai upgradé récemment mon serveur, un ML350p Gen8 avec une baie
>>>>> supplémentaire :
>>>>> Contexte :
>>>>> - 2x6LFF existant + ajout : 1x8SFF
>>>>> - 10HDD en LFF + ajout : 4 SSD en SFF
>>>>> -  LFF géré par P420i (embarqué)
>>>>> - Ajout d'une carte RAID P822 2GB + batterie (ensemble acheté 45€ neuf
>>>>> et scellé) pour la gestion de la baie SFF (port 4 puis 3 testés)
>>>>> - La pièce dans laquelle est le serveur n'est pas climatisée (je
>>>>> démarre mon activité, je fais avec très très peu de moyens... dans ces
>>>>> conditions je n'ai pas hâte à l'été prochain)
>>>>> - Je suis très débutant côté hardware serveur (je passe donc peut être
>>>>> à côté de quelques évidences ^^)
>>>>>
>>>>> Merci d'avance !
>>>>>
>>>>> Pidroid
>>>>> _______________________________________________
>>>>> Liste de diffusion du FRsAG
>>>>> http://www.frsag.org/
>>>>
>>>> _______________________________________________
>>>> Liste de diffusion du FRsAG
>>>> http://www.frsag.org/
>>>
>>> _______________________________________________
>>> Liste de diffusion du FRsAG
>>> http://www.frsag.org/
>>
>>
-------------- section suivante --------------
Une pièce jointe HTML a été nettoyée...
URL: <http://www.frsag.org/pipermail/frsag/attachments/20191009/29c10595/attachment-0001.html>


Plus d'informations sur la liste de diffusion FRsAG