Reno.
Bonjour,
On a tenté de remplacer Nagios / Munin / Observium par Prometheus / Grafana, dans les faits ce sont deux approches complètement différentes et certaines actions ne sont tout simplement pas possibles.
Du coup on a automatisé notre Nagios, il se base sur les mêmes informations que Prometheus (qu'il ne serait pas viable de faire à la main). Je pense effectivement comme toi à tous les checks de ports, de connexion smtp, imap, https, vérification de certificats, de contenu dans des pages web, vérification de crontabs, ...
Et au final ça marche très bien, ça consomme très peu de cpu / ram (Nagios est mine de rien sacrément optimisé pour encaisser beaucoup de charge).
Et puis le problème des agents Zabbix on le retrouve également avec les métrics Prometheus que beaucoup d'équipements / logiciels n'implémentent pas encore. Quand c'est logiciel on les a codé, quand c'est équipement tu peux rien faire. Donc même la partie métrologie n'est pas complètement remplacé encore.
Concernant l'automatisation, pas besoin d'API, c'est plus simple de fabriquer en IaC les fichiers de configuration et gérer les changements et faire un reload. Alors que vérifier par API que tout est comme tu le veux sur une infras conséquente ça fait tout de suite énormément de requêtes API qui vont durer des plombes pour vérifier la conformité.
Voilà notre point de vue.
Le 26/07/2022 à 17:32, Mickael MONSIEUR a écrit :
Bonjour, Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..) Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof. Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS. Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible. Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java. Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
_______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/