2013/5/14 Greg <greg-frsag@duchatelet.net>
ton serveur de fichier avec un load de 30 doit tout de même servir les fichiers plus lentement, non ?
Pour moi, un serveur qui délivre lentement _est_ surchargé, même s'il fonctionne parfaitement et qu'il ne plantera pas car il sait gérer cette situation.


D'après mon expérience, un load élevé indique toujours un problème, même si parfois un problème de surcharge n'implique pas forcément un load élevé ;)

Ça n'est pas si automatique, mais les exceptions sont rares en effet. Tu prends un simple desktop mono-core qui fait tourner un jeu pas bien codé qui balance des FPS sans limite. Ton CPU sera à 100% tout le temps, donc un load average à 1 (on imagine qu'il a chargé ses images, donc il n'y a plus d'I/O par la suite). Or tu as pour un même load average deux cas : ton FPS est > 30 ou pas. Dans un premier cas ça va, dans l'autre non.

Bon cet exemple est boiteux, mais il est surtout là pour illustrer qu'en fait ce qui est important c'est ce qu'on attends des applications en terme de débit et latence. Genre ton serveur de fichiers, il est peut être directement serveur de fichier pour les user, ou serveur de fichier pour un outil de reporting. Dans le premier cas, un user qui attends plus de 5s l'ouverture de son .doc va crier au meurtre, dans le second ça les utilisateurs savent qu'un outil de reporting n'aura pas une bonne latence, et qu'il va devoir attendre pour avoir ses informations (c'est de moins en moins vrai, mais bon...). De même dans le premier cas, soit l'utilisateur est dans une période calme, là ça va il va juste marmonner et puis c'est tout, mais dans une période de clôture comptable? Là il va prendre son téléphone avant même que le fichier s'ouvre...

L'évolution de l'indicateur est sa vraie valeur, et seul un admin qui a un peu d'expérience avec ce serveur saura si ça dérive trop ou pas. Mais en valeur absolue il n'y a aucune règle "facile" genre ne nombre de cpu ou même cpu+nombres d'axes I/O. C'est un gros soucis qu'on a en matière de supervision d'ailleurs, car bon courage pour choisir une valeur par défaut pour cet indicateur bien particulier  :p



Jean

Ps: oui je repompe allégrement des exemples de l'article que j'avais cité, mais l'auteur est d'accord :)