par curiosité, combien de temps tu as passé pour déployer tout ça ?
Le 24/08/2017 à 17:24, Michel Blanc a écrit :
Le 24/08/2017 à 16:51, ML a écrit :
tout à fait d'accord concernant promethus / grafana / influxDB ça s'approche plus de la métrologie que du monitoring server.
Sur ce point en fait je ne vois rien de rédhibitoire.
En fait, j'ai carrément abandonné le monitoring, pour ne faire que de la métrologie avec des seuils sur les métriques appropriées (disk free, taux de 5xx, you name it). Tant qu'à emmerder les serveurs pour savoir s'ils vont bien, autant mesurer et collecter des métriques. On peut tout transformer en chiffre mesurable (nombre de noeuds dans un cluster, RTT avec un serveur) et alerter si les métriques n'arrivent plus.
J'ai quelques stacks qui sont surveillées par influx/grafana et jusqu'à présent, je n'ai jamais ressenti le besoin de (re)mettre en service un outil de monitoring dédié. IMHO, c'est bien plus souple en utilisant la métrologie pure. C'est pluggué sur email/slack/sms et ça va plutôt bien.
Par contre, pour le coup, il faut monitorer la métrologie :D Un uptimerobot/statuscake/pingdom suffisent pour ça.
Si vous avez un contre exemple de truc ou un monitoring est nécessaire et ne peut être remplacé par la métrologie, je suis preneur (ce n'est pas un troll, c'est une vrai question).
A+
-- M
Liste de diffusion du FRsAG http://www.frsag.org/