Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael
Hello, Tu sais que avec nagios XI a 2k/ans il y a une API :-) Baptiste
Le mar. 26 juil. 2022 à 17:33, Mickael MONSIEUR mickael.monsieur@gmail.com a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Bonjour,
On a tenté de remplacer Nagios / Munin / Observium par Prometheus / Grafana, dans les faits ce sont deux approches complètement différentes et certaines actions ne sont tout simplement pas possibles.
Du coup on a automatisé notre Nagios, il se base sur les mêmes informations que Prometheus (qu'il ne serait pas viable de faire à la main). Je pense effectivement comme toi à tous les checks de ports, de connexion smtp, imap, https, vérification de certificats, de contenu dans des pages web, vérification de crontabs, ...
Et au final ça marche très bien, ça consomme très peu de cpu / ram (Nagios est mine de rien sacrément optimisé pour encaisser beaucoup de charge).
Et puis le problème des agents Zabbix on le retrouve également avec les métrics Prometheus que beaucoup d'équipements / logiciels n'implémentent pas encore. Quand c'est logiciel on les a codé, quand c'est équipement tu peux rien faire. Donc même la partie métrologie n'est pas complètement remplacé encore.
Concernant l'automatisation, pas besoin d'API, c'est plus simple de fabriquer en IaC les fichiers de configuration et gérer les changements et faire un reload. Alors que vérifier par API que tout est comme tu le veux sur une infras conséquente ça fait tout de suite énormément de requêtes API qui vont durer des plombes pour vérifier la conformité.
Voilà notre point de vue.
Le 26/07/2022 à 17:32, Mickael MONSIEUR a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Hello,
Ca me rassure, je ne suis pas le seul à m'interroger sur ce point. Mais je n'ai toujours pas trouvé mieux pour le moment.
J'ai 1400 hosts et 9100 check sur nagios, avec a peu pres tout ce qui peut exister en protocol de supervision derrière.... Un thruk par dessus pour rendre l'utilisation de l'interface web plus agréable, et aussi profiter de l'API rest pour interroger l'état de plusieurs nagios. Et toute ma conf est généré par fabric
J'ai tenté zabbix, qui me parait un excellent outil et coté UI clairement plus avancé, mais l'effort de migration me parait trop lourd par rapport à ce que ca peut m'apporter. Icinga2 fait le taf aussi, leur système de conf est assez sympa, mais quand on génère la conf, au final, ca ne sert pas à grand chose..
Je vais probablement migrer vers naemon prochainement (ca reste un fork de nagios, donc toute ma conf marche sans rien faire), tout simplement parce que thruk a besoin de livestatus, dont je ne trouve plus de trace depuis l’apparition de checkmk.
Librenms reste hors course pour moi dès qu'on veut faire de la volumétrie. Je ne l'utilise que pour les équipements réseaux en tout cas
Donc pour ma part, je vais certainement rester sur du nagios like, et tant pis si l'interface est naze .... Sauf si la perle rare ressort de ce thread .
Reno.
Le 26/07/2022 à 17:46, Wallace a écrit :
Bonjour,
On a tenté de remplacer Nagios / Munin / Observium par Prometheus / Grafana, dans les faits ce sont deux approches complètement différentes et certaines actions ne sont tout simplement pas possibles.
Du coup on a automatisé notre Nagios, il se base sur les mêmes informations que Prometheus (qu'il ne serait pas viable de faire à la main). Je pense effectivement comme toi à tous les checks de ports, de connexion smtp, imap, https, vérification de certificats, de contenu dans des pages web, vérification de crontabs, ...
Et au final ça marche très bien, ça consomme très peu de cpu / ram (Nagios est mine de rien sacrément optimisé pour encaisser beaucoup de charge).
Et puis le problème des agents Zabbix on le retrouve également avec les métrics Prometheus que beaucoup d'équipements / logiciels n'implémentent pas encore. Quand c'est logiciel on les a codé, quand c'est équipement tu peux rien faire. Donc même la partie métrologie n'est pas complètement remplacé encore.
Concernant l'automatisation, pas besoin d'API, c'est plus simple de fabriquer en IaC les fichiers de configuration et gérer les changements et faire un reload. Alors que vérifier par API que tout est comme tu le veux sur une infras conséquente ça fait tout de suite énormément de requêtes API qui vont durer des plombes pour vérifier la conformité.
Voilà notre point de vue.
Le 26/07/2022 à 17:32, Mickael MONSIEUR a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Bonjour à tous,
il y a 3ans, j'ai eu à ma poser la question, mais au final, je suis resté sur un nagios pour le coeur du système, avec check_mk en webUI plugé dessus utilisant l'API livestatus. Ça m'a permis pas mal de personnalisation de l'UI (CSS pour les aventureux), et des dashboard en-veux-tu-en-voilà pour tous cas de figure : support clientèle, %dispo pour les chefs, sondes OS/network pour les adminsys, graphs de paramètres applicatifs pour les dev, idems pour les DBA, etc. Chacun son dashboard. De base, check_mk peut paraître austère, mais ça se customise au besoin et surtout la création/display/personnalisation des dashboard a été la killer-feature pour moi. Tout ça paramétré avec Ansible. ça facilite vraiment la vie : toute la conf (nagios/check_mk/sondes) y est templatisée. Si on rajoute un host, il y a juste 1-2 fichiers yaml à modifier, pareil si on rajoute une sonde, puis un `ansible-playbook nagios-playbook.yml` idempotent des familles et ça roule. C'est comme ça que je supervisais ~10000 sondes sur ~300 serveurs. Nagios automatisé/templatisé avec ansible + check_mk pour la webUI personnalisable a été le bon combo sur mon cas.
Etienne 27 juillet 2022 00:10 "Renaud Galante" <renaud.galante@oute.org (mailto:renaud.galante@oute.org?to=%22Renaud%20Galante%22%20renaud.galante@oute.org)> a écrit:
Hello,
Ca me rassure, je ne suis pas le seul à m'interroger sur ce point. Mais je n'ai toujours pas trouvé mieux pour le moment.
J'ai 1400 hosts et 9100 check sur nagios, avec a peu pres tout ce qui peut exister en protocol de supervision derrière.... Un thruk par dessus pour rendre l'utilisation de l'interface web plus agréable, et aussi profiter de l'API rest pour interroger l'état de plusieurs nagios. Et toute ma conf est généré par fabric
J'ai tenté zabbix, qui me parait un excellent outil et coté UI clairement plus avancé, mais l'effort de migration me parait trop lourd par rapport à ce que ca peut m'apporter. Icinga2 fait le taf aussi, leur système de conf est assez sympa, mais quand on génère la conf, au final, ca ne sert pas à grand chose..
Je vais probablement migrer vers naemon prochainement (ca reste un fork de nagios, donc toute ma conf marche sans rien faire), tout simplement parce que thruk a besoin de livestatus, dont je ne trouve plus de trace depuis l’apparition de checkmk.
Librenms reste hors course pour moi dès qu'on veut faire de la volumétrie. Je ne l'utilise que pour les équipements réseaux en tout cas
Donc pour ma part, je vais certainement rester sur du nagios like, et tant pis si l'interface est naze .... Sauf si la perle rare ressort de ce thread . Reno. Le 26/07/2022 à 17:46, Wallace a écrit :
Bonjour,
On a tenté de remplacer Nagios / Munin / Observium par Prometheus / Grafana, dans les faits ce sont deux approches complètement différentes et certaines actions ne sont tout simplement pas possibles.
Du coup on a automatisé notre Nagios, il se base sur les mêmes informations que Prometheus (qu'il ne serait pas viable de faire à la main). Je pense effectivement comme toi à tous les checks de ports, de connexion smtp, imap, https, vérification de certificats, de contenu dans des pages web, vérification de crontabs, ...
Et au final ça marche très bien, ça consomme très peu de cpu / ram (Nagios est mine de rien sacrément optimisé pour encaisser beaucoup de charge).
Et puis le problème des agents Zabbix on le retrouve également avec les métrics Prometheus que beaucoup d'équipements / logiciels n'implémentent pas encore. Quand c'est logiciel on les a codé, quand c'est équipement tu peux rien faire. Donc même la partie métrologie n'est pas complètement remplacé encore.
Concernant l'automatisation, pas besoin d'API, c'est plus simple de fabriquer en IaC les fichiers de configuration et gérer les changements et faire un reload. Alors que vérifier par API que tout est comme tu le veux sur une infras conséquente ça fait tout de suite énormément de requêtes API qui vont durer des plombes pour vérifier la conformité.
Voilà notre point de vue. Le 26/07/2022 à 17:32, Mickael MONSIEUR a écrit :
Bonjour, Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..) Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof. Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS. Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible. Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java. Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ (http://www.frsag.org/)
_______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ (http://www.frsag.org/)
Je vais probablement migrer vers naemon prochainement (ca reste un fork de nagios, donc toute ma conf marche sans rien faire), tout simplement parce que thruk a besoin de livestatus, dont je ne trouve plus de trace depuis l’apparition de checkmk.
Librenms reste hors course pour moi dès qu'on veut faire de la volumétrie. Je ne l'utilise que pour les équipements réseaux en tout cas
Donc pour ma part, je vais certainement rester sur du nagios like, et tant pis si l'interface est naze .... Sauf si la perle rare ressort de ce thread .
j'aime bien OMD avec son concept de "site" et un grand nombre de briques optionnelles directement opérationnelles, ça permet de se concentrer sur sa conf de supervision, et pas sur la plomberie.
Coucou,
Le Wed, 27 Jul 2022 00:10:56 +0200, Renaud Galante renaud.galante@oute.org a écrit :
Donc pour ma part, je vais certainement rester sur du nagios like, et tant pis si l'interface est naze ....
Sur ce point, l'IHM web de Icinga 2 a plein d'améliorations sympathiques comparé à Nagios.
François
On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote:
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf kevin@kdecherf.com a écrit :
On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote:
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ?
Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès.
Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring
While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server.
Quelqu'un a déjà essayé ?
-- Kevin Decherf - @Kdecherf GPG 0x108ABD75A81E6E2F https://kdecherf.com _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
On Tue, Jul 26, 2022, at 18:01, Mickael MONSIEUR wrote:
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf kevin@kdecherf.com a écrit :
On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote:
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ?
Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès.
Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring
While a Zabbix agent offers great features on most platforms, in
some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server.
Quelqu'un a déjà essayé ?
Je l'avais utilisé en production il y a quelques années, on utilisait le serveur comme "agent" pour quelques exceptions (mais j'ai oublié lesquelles), ça marchait.
Icinga2 mais il faut des agents. Après ça juste marche.
Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.org a écrit :
Hello,
Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
De : Mickael MONSIEUR mickael.monsieur@gmail.com Envoyé : mardi 26 juillet 2022 à 18:03 À : Kevin Decherf kevin@kdecherf.com Cc : frsag frsag@frsag.org Objet : [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Salut,
Zabbix et icinga2 peuvent interroger à distance.
C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste.
my 2 cents
Jacques
Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit :
Icinga2 mais il faut des agents. Après ça juste marche.
Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.org a écrit :
Hello,
Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
*De :* Mickael MONSIEUR mickael.monsieur@gmail.com *Envoyé :* mardi 26 juillet 2022 à 18:03 *À :* Kevin Decherf kevin@kdecherf.com *Cc :* frsag frsag@frsag.org *Objet :* [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste
les monitorer de l'extérieur, donc installation impossible. > >
Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
, Jérôme
Le mar. 26 juil. 2022, 19:39, Jacques MICHAU via FRsAG frsag@frsag.org a écrit :
Salut,
Zabbix et icinga2 peuvent interroger à distance.
C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste.
my 2 cents
Jacques
Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit :
Icinga2 mais il faut des agents. Après ça juste marche.
Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.org frsag@frsag.org a écrit :
Hello,
Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
*De :* Mickael MONSIEUR mickael.monsieur@gmail.com mickael.monsieur@gmail.com *Envoyé :* mardi 26 juillet 2022 à 18:03 *À :* Kevin Decherf kevin@kdecherf.com kevin@kdecherf.com *Cc :* frsag frsag@frsag.org frsag@frsag.org *Objet :* [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > --
Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F >
https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)shttp://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
C’est plus Nagios en dessous ?
Le 26 juil. 2022 à 20:34, Jerome Lien jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
Ouep, la base c'est nagios. Mais quand même vachement retravaillé maintenant. Pour le peu de serveurs que l'on gère cela fait le taff. Quasi tout via du snmp ou du scripting custom.
Le mar. 26 juil. 2022, 20:36, David Ponzone david.ponzone@gmail.com a écrit :
C’est plus Nagios en dessous ?
Le 26 juil. 2022 à 20:34, Jerome Lien jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais
que pensez-vous de centreon ?
C’est plus Nagios en dessous ?
ils ont forké nagios en 2011, c'est mieux intégré maintenant ;) , les performances sont meilleures aussi, avant >1000 services cela devenait intenable.
Nicolas
Le 26 juil. 2022 à 20:34, Jerome Lien jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
Liste de diffusion du %(real_name)s http://www.frsag.org/
J’ai peut être pas cherché assez mais on sait l’installer autrement que via leur image iso ?
Le 26 juil. 2022 à 20:36, Jerome Lien jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
, Jérôme
Le mar. 26 juil. 2022, 19:39, Jacques MICHAU via FRsAG frsag@frsag.org a écrit :
Salut,
Zabbix et icinga2 peuvent interroger à distance.
C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste.
my 2 cents
Jacques Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit :
Icinga2 mais il faut des agents. Après ça juste marche.
Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.org a écrit :
Hello,
Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
De : Mickael MONSIEUR mickael.monsieur@gmail.com Envoyé : mardi 26 juillet 2022 à 18:03 À : Kevin Decherf kevin@kdecherf.com Cc : frsag frsag@frsag.org Objet : [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Bonsoir,
Oui, il y a des dépôts pour RHEL8 et CentOS7 : https://docs.centreon.com/fr/docs/installation/introduction/
On trouve aussi des adaptations pour RockyLinux 8 : https://howtoforge.com/how-to-install-centreon-monitoring-tool-on-rocky-linu...
Florian HC
Le 26/07/2022 à 21:36, Mickael Monsieur a écrit :
J’ai peut être pas cherché assez mais on sait l’installer autrement que via leur image iso ?
Le 26 juil. 2022 à 20:36, Jerome Lien jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
, Jérôme
Le mar. 26 juil. 2022, 19:39, Jacques MICHAU via FRsAG frsag@frsag.org a écrit :
Salut, Zabbix et icinga2 peuvent interroger à distance. C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste. my 2 cents Jacques Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit :
Icinga2 mais il faut des agents. Après ça juste marche. Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG <frsag@frsag.org> <mailto:frsag@frsag.org> a écrit : Hello, Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix). Seb ------------------------------------------------------------------------ *De :* Mickael MONSIEUR <mickael.monsieur@gmail.com> <mailto:mickael.monsieur@gmail.com> *Envoyé :* mardi 26 juillet 2022 à 18:03 *À :* Kevin Decherf <kevin@kdecherf.com> <mailto:kevin@kdecherf.com> *Cc :* frsag <frsag@frsag.org> <mailto:frsag@frsag.org> *Objet :* [FRsAG] Re: Qui pour remplacer Nagios en 2022 ? Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
_______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
_______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
On est en Centreon. 4000 sondes environ. Ca tient, l’interface est propre. Centreon peut se répartir la charge de checks avec des petits serveurs satellites. Pratique.
Sylvain
De : frsag-bounces@frsag.org au nom de Florian Haller-Casagrande via FRsAG frsag@frsag.org Répondre à : Florian Haller-Casagrande florian.hc@laposte.net Date : mardi 26 juillet 2022 à 22:16 À : Mickael Monsieur mickael.monsieur@gmail.com, Jerome Lien jerome.lien@gmail.com Cc : frsag frsag@frsag.org Objet : [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Bonsoir,
Oui, il y a des dépôts pour RHEL8 et CentOS7 : https://docs.centreon.com/fr/docs/installation/introduction/
On trouve aussi des adaptations pour RockyLinux 8 : https://howtoforge.com/how-to-install-centreon-monitoring-tool-on-rocky-linu...
Florian HC
Le 26/07/2022 à 21:36, Mickael Monsieur a écrit : J’ai peut être pas cherché assez mais on sait l’installer autrement que via leur image iso ?
Le 26 juil. 2022 à 20:36, Jerome Lien jerome.lien@gmail.commailto:jerome.lien@gmail.com a écrit : Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
, Jérôme
Le mar. 26 juil. 2022, 19:39, Jacques MICHAU via FRsAG <frsag@frsag.orgmailto:frsag@frsag.org> a écrit :
Salut,
Zabbix et icinga2 peuvent interroger à distance.
C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste.
my 2 cents
Jacques Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit : Icinga2 mais il faut des agents. Après ça juste marche. Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.orgmailto:frsag@frsag.org a écrit : Hello,
Via des "custom script" oui, il peut tout faire. Il est possible de passer différentes variables ip/port/autres. mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
________________________________ De : Mickael MONSIEUR mickael.monsieur@gmail.commailto:mickael.monsieur@gmail.com Envoyé : mardi 26 juillet 2022 à 18:03 À : Kevin Decherf kevin@kdecherf.commailto:kevin@kdecherf.com Cc : frsag frsag@frsag.orgmailto:frsag@frsag.org Objet : [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
_______________________________________________
Liste de diffusion du %(real_name)s
http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
_______________________________________________
Liste de diffusion du %(real_name)s
________________________________
Ce message électronique et tous les fichiers attachés peuvent contenir des informations confidentielles et destinées exclusivement à l’usage de la personne dont le nom est mentionné ci-dessus. Si vous n'êtes pas destinataire de ce message, vous n'êtes pas autorisés à le lire, l'imprimer, le garder, le copier, le divulguer, le distribuer, l'utiliser, ni dans son ensemble, ni en partie, sans autorisation préalable. Si vous recevez ce message par erreur, merci de le détruire et d’en avertir sans délai l’expéditeur.
Le contenu de ce message ne pourrait engager la responsabilité de DDO Organisation que s’il a été émis par une personne dûment habilitée agissant dans le strict cadre des fonctions auxquelles elle est employée et à des fins non étrangères à ses attributions. Tout message électronique étant susceptible d’altération au cours de son acheminement sur Internet, DDO Organisation et le Groupe Cogeser ne peuvent être tenus responsables de son contenu. En outre, les idées et opinions présentées dans ce message sont celles de son auteur et ne représentent pas nécessairement celles de DDO Organisation ni du Groupe Cogeser.
@job-1 on avait pris du ServiceNav on-premise (dispo en SaaS par défaut) en mode revendeur (pour déployer chez nos clients). C'est un nagios like.
Pour une petite equipe, ce qui nous avait séduit c'est la ServiceNav box (comme un poller centreon) sous forme d'appliance virtuelle (possibilité de déployer sur du hardware également) qui embarque tout les plugins et qui permet donc de superviser pas mal de choses (avec entre autre une supervision poussée de SAN DataCore, voir https://servicenav.coservit.com/catalogue/) sans avoir à installer chaque plugins à la main comme dans Centreon.
Il est possible comme nagios de développer ses propres scripts. Ce n'est bien sûr pas gratuit, mais l'équipe derrière était super a l'écoute. Les montées de versions sont gérées par Ansible donc assez faciles.
Ludovic
Le mer. 27 juil. 2022 à 08:49, DONNET, Sylvain sylvain.donnet@ddo.net a écrit :
On est en Centreon. 4000 sondes environ. Ca tient, l’interface est propre.
Centreon peut se répartir la charge de checks avec des petits serveurs satellites. Pratique.
Sylvain
*De : *frsag-bounces@frsag.org au nom de Florian Haller-Casagrande via FRsAG frsag@frsag.org *Répondre à : *Florian Haller-Casagrande florian.hc@laposte.net *Date : *mardi 26 juillet 2022 à 22:16 *À : *Mickael Monsieur mickael.monsieur@gmail.com, Jerome Lien < jerome.lien@gmail.com> *Cc : *frsag frsag@frsag.org *Objet : *[FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Bonsoir,
Oui, il y a des dépôts pour RHEL8 et CentOS7 : https://docs.centreon.com/fr/docs/installation/introduction/
On trouve aussi des adaptations pour RockyLinux 8 : https://howtoforge.com/how-to-install-centreon-monitoring-tool-on-rocky-linu...
Florian HC
Le 26/07/2022 à 21:36, Mickael Monsieur a écrit :
J’ai peut être pas cherché assez mais on sait l’installer autrement que via leur image iso ?
Le 26 juil. 2022 à 20:36, Jerome Lien jerome.lien@gmail.com jerome.lien@gmail.com a écrit :
Je vais peut être me faire taper dessus car personne n'en parle, mais que pensez-vous de centreon ?
, Jérôme
Le mar. 26 juil. 2022, 19:39, Jacques MICHAU via FRsAG frsag@frsag.org a écrit :
Salut,
Zabbix et icinga2 peuvent interroger à distance.
C'est plus simple avec icinga2 je trouve - pour ce besoin sans agent sans snmp - mais il faut s'approprier la syntaxe et la manière de penser (enfin dans zabbix c'est pas mieux hein, c'est tout un monde à s'approprier). Perso je partirais sur icinga2 pour ce besoin. Et quelques agents à déployer pour le reste.
my 2 cents
Jacques
Le 26/07/2022 à 19:17, Nicolas GIRARDI a écrit :
Icinga2 mais il faut des agents.
Après ça juste marche.
Nicolas Girardi.
Le 26 juil. 2022 à 19:13, Sébastien CAPS via FRsAG frsag@frsag.org frsag@frsag.org a écrit :
Hello,
Via des "custom script" oui, il peut tout faire.
Il est possible de passer différentes variables ip/port/autres.
mais j'avoue Nagios est mieux pensé pour ce genre de cas (même si j'adore zabbix).
Seb
*De :* Mickael MONSIEUR mickael.monsieur@gmail.com mickael.monsieur@gmail.com *Envoyé :* mardi 26 juillet 2022 à 18:03 *À :* Kevin Decherf kevin@kdecherf.com kevin@kdecherf.com *Cc :* frsag frsag@frsag.org frsag@frsag.org *Objet :* [FRsAG] Re: Qui pour remplacer Nagios en 2022 ?
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf a écrit : > > On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote: > > Au début on pensait à Zabbix, mais quand on voit que ça passe d'office > > par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en > > SNMP, et certaines machines ne sont pas gérées par nous on doit juste > > les monitorer de l'extérieur, donc installation impossible. > > Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ? Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès. Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring While a Zabbix agent offers great features on most platforms, in some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server. Quelqu'un a déjà essayé ? > > -- > Kevin Decherf - @Kdecherf > GPG 0x108ABD75A81E6E2F > https://kdecherf.com > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s
Ce message électronique et tous les fichiers attachés peuvent contenir des informations confidentielles et destinées exclusivement à l’usage de la personne dont le nom est mentionné ci-dessus. Si vous n'êtes pas destinataire de ce message, vous n'êtes pas autorisés à le lire, l'imprimer, le garder, le copier, le divulguer, le distribuer, l'utiliser, ni dans son ensemble, ni en partie, sans autorisation préalable. Si vous recevez ce message par erreur, merci de le détruire et d’en avertir sans délai l’expéditeur.
Le contenu de ce message ne pourrait engager la responsabilité de DDO Organisation que s’il a été émis par une personne dûment habilitée agissant dans le strict cadre des fonctions auxquelles elle est employée et à des fins non étrangères à ses attributions. Tout message électronique étant susceptible d’altération au cours de son acheminement sur Internet, DDO Organisation et le Groupe Cogeser ne peuvent être tenus responsables de son contenu. En outre, les idées et opinions présentées dans ce message sont celles de son auteur et ne représentent pas nécessairement celles de DDO Organisation ni du Groupe Cogeser. _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Bonsoir,
Zabbix peut monitorer de plusieurs manières: - Agent Zabbix sur les machines - SNMP - Check TCP (sans agent) - Webcheck -> Check http/https avec par exemple recherche de pattern dans la page - Surement d'autres ...
Pour avoir utilisé la solution en prod ça marche plutôt pas mal
Fabien
Le 26/07/2022 à 18:01, Mickael MONSIEUR a écrit :
Le mar. 26 juil. 2022 à 17:56, Kevin Decherf kevin@kdecherf.com a écrit :
On Tue, Jul 26, 2022, at 17:32, Mickael MONSIEUR wrote:
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Sauf si ma mémoire me fait défaut, il me semblait que Zabbix supportait aussi les sondes SNMP sans passer par l'agent ?
Peut être bien.. mais ici je dois juste monitorer des services de manière passive sans agent ni snmp. Même si le snmp on l'a sur 50% des machines à monitorer, l'autre 50% on y a pas accès.
Sauf si Zabbix peut monitorer des ports/services/certificats/etc sans agent ni SNMP, on dirait que oui... https://www.zabbix.com/fr/agentless_monitoring
While a Zabbix agent offers great features on most platforms, in
some cases it is not possible to install it. For these cases, some agentless monitoring methods are provided by the Zabbix server.
Quelqu'un a déjà essayé ?
-- Kevin Decherf - @Kdecherf GPG 0x108ABD75A81E6E2F https://kdecherf.com _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
https://checkmk.com/product/raw-edition https://checkmk.com/product/raw-edition ?
J’avais commencé à jouer avec, mais pas eu beaucoup de temps pour approfondir (c’est sur la todo 2023: CheckMK peut-il virer LibreNMS ?). Mais ça semble plutôt pas mal.
Le 26 juil. 2022 à 17:32, Mickael MONSIEUR mickael.monsieur@gmail.com a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Le mar. 26 juil. 2022 à 18:02, David Ponzone david.ponzone@gmail.com a écrit :
https://checkmk.com/product/raw-edition ?
J’avais commencé à jouer avec, mais pas eu beaucoup de temps pour approfondir (c’est sur la todo 2023: CheckMK peut-il virer LibreNMS ?). Mais ça semble plutôt pas mal.
Bonjour David,
A 1ère vue, pas mal en effet...
5. Networking checks without agent
Access to a SMB Share / Free Space Check Number of Notifications per Contact Checkmk Hardware/Software-Inventory Connection to a TCP Port (unencrypted or with SSL) Current Route to Target Host DNS Query to a Nameserver Event Console Status for a Host or Application FTP Server HTTP Form Check HTTP/HTTPS Connection ICMP Echo Request (Ping) IMAP Mailboxes LDAP/LDAPS Connection POP3/IMAP Connection and Optional Mail Forwarding POP3/IMAP Connection and Optional Mail Forwarding SFTP Server SMTP Connection SQL Database Request Check SSH Connection to Execute Commands on a Remote Host SSH Service (Ping) Uniserv Service
Le 26 juil. 2022 à 17:32, Mickael MONSIEUR mickael.monsieur@gmail.com a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Hello,
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Librenms est capable de faire du polling de la même façon de nagios de ports SMTP/POP/IMAP, réponses DNS... etc...
/Xavier
Le 26 juil. 2022 à 20:39, Xavier Beaudouin via FRsAG frsag@frsag.org a écrit :
Hello,
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Librenms est capable de faire du polling de la même façon de nagios de ports SMTP/POP/IMAP, réponses DNS... etc...
Oui mais pour ça le Device doit être crée, et pour ça il faut l’ajouter en SNMP obligatoirement. Game over ;)
/Xavier _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Le 26 juil. 2022 à 21:33, Mickael Monsieur mickael.monsieur@gmail.com a écrit :
Le 26 juil. 2022 à 20:39, Xavier Beaudouin via FRsAG frsag@frsag.org a écrit :
Hello,
Librenms est capable de faire du polling de la même façon de nagios de ports SMTP/POP/IMAP, réponses DNS... etc...
Oui mais pour ça le Device doit être crée, et pour ça il faut l’ajouter en SNMP obligatoirement. Game over ;)
Hmm sur ma version, je peux ajouter un device en désactivant SNMP et on peut aussi cocher « Force add » pour ajouter le device sans check ICMP/SNMP.
Ceci dit, la dernière fois que j’ai regardé, LibreNMS utilisait les plugin Nagios pour les Service Check.
Le 26 juil. 2022 à 22:33, David Ponzone david.ponzone@gmail.com a écrit :
Le 26 juil. 2022 à 21:33, Mickael Monsieur mickael.monsieur@gmail.com a écrit :
Le 26 juil. 2022 à 20:39, Xavier Beaudouin via FRsAG frsag@frsag.org a écrit :
Hello,
Librenms est capable de faire du polling de la même façon de nagios de ports SMTP/POP/IMAP, réponses DNS... etc...
Oui mais pour ça le Device doit être crée, et pour ça il faut l’ajouter en SNMP obligatoirement. Game over ;)
Hmm sur ma version, je peux ajouter un device en désactivant SNMP et on peut aussi cocher « Force add » pour ajouter le device sans check ICMP/SNMP
Tu as sans doute raison, je suis parti du principe que libreNMS = observium que je connais mieux, mais le fork est assez ancien et depuis beaucoup de composants semblent avoir pris des routes très différentes…
Ceci dit, la dernière fois que j’ai regardé, LibreNMS utilisait les plugin Nagios pour les Service Check.
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
- nombres de métriques systèmes et applicatives possiblement énormes
- alertes crées de manières programmatiques
- auto-discovery
- découplage forcés de l'alerting/routing des alertes (on peut voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
- https://sre.google/workbook/monitoring/
- https://sre.google/sre-book/practical-alerting/- https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
nombres de métriques systèmes et applicatives possiblement énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/practical-alerting/- https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Les arguments de Raphel peuvent être repris en inconvénients.
Le principal problème je trouve c'est la quantité de données. Car quand on passe sur du prom, on a tendance à ne pas se contenter de toutes les 5 min ou 1 min à l'ancienne, on descend souvent à toutes les 15 secondes voir moins dans certains cas.
Et quand bien même on resterait sur 1min ou 5min, ce n'est pas juste un état ok, warning, error, non c'est toutes les métriques internes d'un logiciel en brut. Et ça entre un nagios et un prom pour une infra de plusieurs centaines de serveurs on passe de tout tient sur un seul serveur nagios qui mange dans les 200Go de datas sur 1 an de rétention pour 4 cpu, 8Go ram à un prom qui mange 4To de datas 32 cpu, 64Go ram pour garder 3 à 4 semaines de datas...
Et après il faut avoir des ressources pour être capable d'interroger toutes ces données rapidement pour faire les alertes, les graphs et là les 32cpu en vm ne suffisent plus ... ça rame sous grafana.
Bref on considère plus prom comme du temps réel à garder 24h / 48h max mais on perd l'investigation à posteriori d'évènements léger ou alors d'un gros pic qu'on a pas pu analyser dans le gap de temps imparti.
On a regardé aussi quelles bases de time series utilisées pour pouvoir notamment réduire les données au bout de certaines périodes : 1 mois, 6 mois, ... pour réduire la fréquence, mais on a rien trouvé qui marchait vraiment bien l'année dernière.
Le 28/07/2022 à 13:14, Nicolas GIRARDI a écrit :
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
nombres de métriques systèmes et applicatives possiblement énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut voir
ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Bonjour,
Pour les stats dans Grafana, on a des centaines de Go de Zabbix dans une base MariaDB, qui est partitionnée par jour et aucun problème de performances pour l'affichage.
Cordialement, David
On Thu, 28 Jul 2022 16:32:33 +0200 Wallace wallace@morkitu.org wrote:
Les arguments de Raphel peuvent être repris en inconvénients.
Le principal problème je trouve c'est la quantité de données. Car quand on passe sur du prom, on a tendance à ne pas se contenter de toutes les 5 min ou 1 min à l'ancienne, on descend souvent à toutes les 15 secondes voir moins dans certains cas.
Et quand bien même on resterait sur 1min ou 5min, ce n'est pas juste un état ok, warning, error, non c'est toutes les métriques internes d'un logiciel en brut. Et ça entre un nagios et un prom pour une infra de plusieurs centaines de serveurs on passe de tout tient sur un seul serveur nagios qui mange dans les 200Go de datas sur 1 an de rétention pour 4 cpu, 8Go ram à un prom qui mange 4To de datas 32 cpu, 64Go ram pour garder 3 à 4 semaines de datas...
Et après il faut avoir des ressources pour être capable d'interroger toutes ces données rapidement pour faire les alertes, les graphs et là les 32cpu en vm ne suffisent plus ... ça rame sous grafana.
Bref on considère plus prom comme du temps réel à garder 24h / 48h max mais on perd l'investigation à posteriori d'évènements léger ou alors d'un gros pic qu'on a pas pu analyser dans le gap de temps imparti.
On a regardé aussi quelles bases de time series utilisées pour pouvoir notamment réduire les données au bout de certaines périodes : 1 mois, 6 mois, ... pour réduire la fréquence, mais on a rien trouvé qui marchait vraiment bien l'année dernière.
Le 28/07/2022 à 13:14, Nicolas GIRARDI a écrit :
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
- nombres de métriques systèmes et applicatives possiblement
énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut
voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
J'ai l'impression de lire un thread de 2005.
Excusez-moi de cette approche trollesque, mais je vais y venir.
Aujourd'hui on a 3 grands modes de monitoring : * Le legacy : un check écrit par service, éventuellement paramétrable. C'est lier a un host et dès qu'on sort du ping ou du check http alacon c'est du travail d'artisans. ** Dans cette catégorie je met tout les nagios like tel que nagios ou centreon mais plein plein d'autres rentrer * Les check centré sur la métrique : ** ici on séparer 2 composents : la collecte d'une métrique et la définition de l'alerting ** C'est mieux, on peut faire du graph facilement, mais dès qu'on veut sortir de l'approche host centric c'est la misère * Les TSDB ** ici la notion d'host n'existe plus vraiment, ** c'est les graph qui priment sur les alertes (dans la vie réel, je me rend compte que je veux plus souvent des graphs et une fois que c'est mure mettre des alertes) ** les méthodes de collecte sont le plus souvent central.
Ce qui rend complexe la migration, c'est inertie de littéralement perdre toute l'expérience acquise sur sa solution de monitoring.
En 2022, sur une base seine, je partirais sur du monitoring centré sur une tsdb que ca soit prometheus, influxdb, victoriametric ou autre.
Il faut aussi comprendre un truc, c'est que le monitoring c'est comme les slip sale, ça ne se partage pas d'une organisation à une autre. et que oui c'est un projet de moyens terme. Mais avoir une vraie observabilité et des capacité de corréler les infos de différent système c'est un vrai gain opérationnel.
Surtout qu'à l'usage, quand on a l'entrepôt de timeseries. il y a de quoi s'amuser !
Alexis
Le jeu. 28 juil. 2022 à 17:18, David Durieux david@durieux.family a écrit :
Bonjour,
Pour les stats dans Grafana, on a des centaines de Go de Zabbix dans une base MariaDB, qui est partitionnée par jour et aucun problème de performances pour l'affichage.
Cordialement, David
On Thu, 28 Jul 2022 16:32:33 +0200 Wallace wallace@morkitu.org wrote:
Les arguments de Raphel peuvent être repris en inconvénients.
Le principal problème je trouve c'est la quantité de données. Car quand on passe sur du prom, on a tendance à ne pas se contenter de toutes les 5 min ou 1 min à l'ancienne, on descend souvent à toutes les 15 secondes voir moins dans certains cas.
Et quand bien même on resterait sur 1min ou 5min, ce n'est pas juste un état ok, warning, error, non c'est toutes les métriques internes d'un logiciel en brut. Et ça entre un nagios et un prom pour une infra de plusieurs centaines de serveurs on passe de tout tient sur un seul serveur nagios qui mange dans les 200Go de datas sur 1 an de rétention pour 4 cpu, 8Go ram à un prom qui mange 4To de datas 32 cpu, 64Go ram pour garder 3 à 4 semaines de datas...
Et après il faut avoir des ressources pour être capable d'interroger toutes ces données rapidement pour faire les alertes, les graphs et là les 32cpu en vm ne suffisent plus ... ça rame sous grafana.
Bref on considère plus prom comme du temps réel à garder 24h / 48h max mais on perd l'investigation à posteriori d'évènements léger ou alors d'un gros pic qu'on a pas pu analyser dans le gap de temps imparti.
On a regardé aussi quelles bases de time series utilisées pour pouvoir notamment réduire les données au bout de certaines périodes : 1 mois, 6 mois, ... pour réduire la fréquence, mais on a rien trouvé qui marchait vraiment bien l'année dernière.
Le 28/07/2022 à 13:14, Nicolas GIRARDI a écrit :
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
- nombres de métriques systèmes et applicatives possiblement
énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut
voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
J'ai testé durant près de 1 mois Zabbix et voici mon retour:
Les + - son GUI est pas mal - la courbe d’apprentissage est pas trop longue
Les - - Vraiment trop peu de possibilités sans agent - Pas pensé IPv4/IPv6 dual stack au niveau du monitoring (si j'encode une IPv4 il la monitore forcément, si j'encode un host il monitorera via l'IP du A ou AAAA selon la config du kernel de ma machine Zabbix, mais pas les deux adresses possibles, à moins d'encoder l'hôte 2 fois comme je fais avec nagios...)
Je crois que je suis reparti pour quelques années avec nagios :)
Le jeu. 28 juil. 2022 à 18:04, Alexis Lameire alexis.lameire@gmail.com a écrit :
J'ai l'impression de lire un thread de 2005.
Excusez-moi de cette approche trollesque, mais je vais y venir.
Aujourd'hui on a 3 grands modes de monitoring :
- Le legacy : un check écrit par service, éventuellement paramétrable. C'est lier a un host et dès qu'on sort du ping ou du check http alacon c'est du travail d'artisans.
** Dans cette catégorie je met tout les nagios like tel que nagios ou centreon mais plein plein d'autres rentrer
- Les check centré sur la métrique :
** ici on séparer 2 composents : la collecte d'une métrique et la définition de l'alerting ** C'est mieux, on peut faire du graph facilement, mais dès qu'on veut sortir de l'approche host centric c'est la misère
- Les TSDB
** ici la notion d'host n'existe plus vraiment, ** c'est les graph qui priment sur les alertes (dans la vie réel, je me rend compte que je veux plus souvent des graphs et une fois que c'est mure mettre des alertes) ** les méthodes de collecte sont le plus souvent central.
Ce qui rend complexe la migration, c'est inertie de littéralement perdre toute l'expérience acquise sur sa solution de monitoring.
En 2022, sur une base seine, je partirais sur du monitoring centré sur une tsdb que ca soit prometheus, influxdb, victoriametric ou autre.
Il faut aussi comprendre un truc, c'est que le monitoring c'est comme les slip sale, ça ne se partage pas d'une organisation à une autre. et que oui c'est un projet de moyens terme. Mais avoir une vraie observabilité et des capacité de corréler les infos de différent système c'est un vrai gain opérationnel.
Surtout qu'à l'usage, quand on a l'entrepôt de timeseries. il y a de quoi s'amuser !
Alexis
Le jeu. 28 juil. 2022 à 17:18, David Durieux david@durieux.family a écrit :
Bonjour,
Pour les stats dans Grafana, on a des centaines de Go de Zabbix dans une base MariaDB, qui est partitionnée par jour et aucun problème de performances pour l'affichage.
Cordialement, David
On Thu, 28 Jul 2022 16:32:33 +0200 Wallace wallace@morkitu.org wrote:
Les arguments de Raphel peuvent être repris en inconvénients.
Le principal problème je trouve c'est la quantité de données. Car quand on passe sur du prom, on a tendance à ne pas se contenter de toutes les 5 min ou 1 min à l'ancienne, on descend souvent à toutes les 15 secondes voir moins dans certains cas.
Et quand bien même on resterait sur 1min ou 5min, ce n'est pas juste un état ok, warning, error, non c'est toutes les métriques internes d'un logiciel en brut. Et ça entre un nagios et un prom pour une infra de plusieurs centaines de serveurs on passe de tout tient sur un seul serveur nagios qui mange dans les 200Go de datas sur 1 an de rétention pour 4 cpu, 8Go ram à un prom qui mange 4To de datas 32 cpu, 64Go ram pour garder 3 à 4 semaines de datas...
Et après il faut avoir des ressources pour être capable d'interroger toutes ces données rapidement pour faire les alertes, les graphs et là les 32cpu en vm ne suffisent plus ... ça rame sous grafana.
Bref on considère plus prom comme du temps réel à garder 24h / 48h max mais on perd l'investigation à posteriori d'évènements léger ou alors d'un gros pic qu'on a pas pu analyser dans le gap de temps imparti.
On a regardé aussi quelles bases de time series utilisées pour pouvoir notamment réduire les données au bout de certaines périodes : 1 mois, 6 mois, ... pour réduire la fréquence, mais on a rien trouvé qui marchait vraiment bien l'année dernière.
Le 28/07/2022 à 13:14, Nicolas GIRARDI a écrit :
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
- nombres de métriques systèmes et applicatives possiblement
énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut
voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote:
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
finalement, il y a eu retournement de situation. RETEX: un soft que personne n'avait évoqué : icinga. comme c'est un fork de nagios, ça aide grandement. avec icinga + icingaweb + director on a tout simplement un Nagios avec GUI moderne. (et tout web-based à part les plugins custom) comme on a pu ré encoder à l'identique toute notre hiérarchie nagios dans les fichiers conf vers icingaweb et utiliser tous nos plugins check maison, ça a grandement facilité une migration.
Le sam. 20 août 2022 à 12:51, Mickael MONSIEUR mickael.monsieur@gmail.com a écrit :
J'ai testé durant près de 1 mois Zabbix et voici mon retour:
Les +
- son GUI est pas mal
- la courbe d’apprentissage est pas trop longue
Les -
- Vraiment trop peu de possibilités sans agent
- Pas pensé IPv4/IPv6 dual stack au niveau du monitoring (si j'encode
une IPv4 il la monitore forcément, si j'encode un host il monitorera via l'IP du A ou AAAA selon la config du kernel de ma machine Zabbix, mais pas les deux adresses possibles, à moins d'encoder l'hôte 2 fois comme je fais avec nagios...)
Je crois que je suis reparti pour quelques années avec nagios :)
Le jeu. 28 juil. 2022 à 18:04, Alexis Lameire alexis.lameire@gmail.com a écrit :
J'ai l'impression de lire un thread de 2005.
Excusez-moi de cette approche trollesque, mais je vais y venir.
Aujourd'hui on a 3 grands modes de monitoring :
- Le legacy : un check écrit par service, éventuellement paramétrable. C'est lier a un host et dès qu'on sort du ping ou du check http alacon c'est du travail d'artisans.
** Dans cette catégorie je met tout les nagios like tel que nagios ou centreon mais plein plein d'autres rentrer
- Les check centré sur la métrique :
** ici on séparer 2 composents : la collecte d'une métrique et la définition de l'alerting ** C'est mieux, on peut faire du graph facilement, mais dès qu'on veut sortir de l'approche host centric c'est la misère
- Les TSDB
** ici la notion d'host n'existe plus vraiment, ** c'est les graph qui priment sur les alertes (dans la vie réel, je me rend compte que je veux plus souvent des graphs et une fois que c'est mure mettre des alertes) ** les méthodes de collecte sont le plus souvent central.
Ce qui rend complexe la migration, c'est inertie de littéralement perdre toute l'expérience acquise sur sa solution de monitoring.
En 2022, sur une base seine, je partirais sur du monitoring centré sur une tsdb que ca soit prometheus, influxdb, victoriametric ou autre.
Il faut aussi comprendre un truc, c'est que le monitoring c'est comme les slip sale, ça ne se partage pas d'une organisation à une autre. et que oui c'est un projet de moyens terme. Mais avoir une vraie observabilité et des capacité de corréler les infos de différent système c'est un vrai gain opérationnel.
Surtout qu'à l'usage, quand on a l'entrepôt de timeseries. il y a de quoi s'amuser !
Alexis
Le jeu. 28 juil. 2022 à 17:18, David Durieux david@durieux.family a écrit :
Bonjour,
Pour les stats dans Grafana, on a des centaines de Go de Zabbix dans une base MariaDB, qui est partitionnée par jour et aucun problème de performances pour l'affichage.
Cordialement, David
On Thu, 28 Jul 2022 16:32:33 +0200 Wallace wallace@morkitu.org wrote:
Les arguments de Raphel peuvent être repris en inconvénients.
Le principal problème je trouve c'est la quantité de données. Car quand on passe sur du prom, on a tendance à ne pas se contenter de toutes les 5 min ou 1 min à l'ancienne, on descend souvent à toutes les 15 secondes voir moins dans certains cas.
Et quand bien même on resterait sur 1min ou 5min, ce n'est pas juste un état ok, warning, error, non c'est toutes les métriques internes d'un logiciel en brut. Et ça entre un nagios et un prom pour une infra de plusieurs centaines de serveurs on passe de tout tient sur un seul serveur nagios qui mange dans les 200Go de datas sur 1 an de rétention pour 4 cpu, 8Go ram à un prom qui mange 4To de datas 32 cpu, 64Go ram pour garder 3 à 4 semaines de datas...
Et après il faut avoir des ressources pour être capable d'interroger toutes ces données rapidement pour faire les alertes, les graphs et là les 32cpu en vm ne suffisent plus ... ça rame sous grafana.
Bref on considère plus prom comme du temps réel à garder 24h / 48h max mais on perd l'investigation à posteriori d'évènements léger ou alors d'un gros pic qu'on a pas pu analyser dans le gap de temps imparti.
On a regardé aussi quelles bases de time series utilisées pour pouvoir notamment réduire les données au bout de certaines périodes : 1 mois, 6 mois, ... pour réduire la fréquence, mais on a rien trouvé qui marchait vraiment bien l'année dernière.
Le 28/07/2022 à 13:14, Nicolas GIRARDI a écrit :
Je suis mitigé. Ok pour la metrologie l’observabilité mais pour l’alerting le reporting ça reste un peu pénible.
Avis purement personnel.
Nicolas Girardi.
Le 28 juil. 2022 à 12:35, Raphael Mazelier raph@futomaki.net a écrit :
Bonjour,
Je suis tout de même étonné que peu de monde à part Wallace ait cité écosystème Prometheus.
Dans mes x précédentes aventures professionnelles c'était ce qu'il y avait ou que j'ai mis en place, et c'est ce qui parait le standard de facto de nos jours pour "observer" une infrastructure dynamique (cloud ou autre).
En effet il s'agit d'une approche assez différente (finalement assez proche de zabbix dans son fonctionnement nominal) qui est de récupérer un maximum de métriques et d'évaluer des règles d'alerting dessus.
En effet ce n'est pas agentless, mais si on y réfléchit peu de solution le sont. Il y a nécessairement quelque chose sur le host/équipement qui répond des métriques (possiblement des gauges) dans toutes les solutions (snmp, check_mk, agent-zabbix).
Les bénéfices de l'approche prometheus (ou alternatives) sont nombreux, mais les plus gros que je vois :
- nombres de métriques systèmes et applicatives possiblement
énormes
alertes crées de manières programmatiques
auto-discovery
découplage forcés de l'alerting/routing des alertes (on peut
voir ça comme un inconvénient)
En revanche cela ne remplace pas tout, on est bien d'accord. Les alertes prom sont du whitebox, et alertes passives.
Il faut en // maintenir des alertes blackbox actives (soit via un outil externes type pingdom), ou même des alertes actives via un tool internes (on en avait écrit certain) qui re-exposaient leurs résultat en métriques prom.
Je ne peux m'empecher de relinker les excellents papier de google SRE sur le monitoring :
https://sre.google/sre-book/monitoring-distributed-systems/
On 26/07/2022 17:32, Mickael MONSIEUR wrote: > Bonjour, > > Suite à une mise à jour des systèmes, on a décidé de remplacer > par la même occasion notre Nagios par quelque chose d'un peu plus > "user-friendly". (et pourtant c'est un demi barbu qui parle..) > > Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas > vraiment évolué, et on aimerait bien quelque chose avec un > minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an > dans la version XI pour un soft qui n'évolue presque pas... bof. > > Notre besoin est plutôt simple, on a déjà Observium qui fait 90% > de nos besoins au sein de notre réseau, mais Observium ne permet > pas "facilement" de monitorer "juste" des ports TCP, du > SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page > HTTPS, l'expiration d'un certificat TLS. > > Au début on pensait à Zabbix, mais quand on voit que ça passe > d'office par un agent, on en voit pas l'utilité. Observium fait > déjà tout ça en SNMP, et certaines machines ne sont pas gérées > par nous on doit juste les monitorer de l'extérieur, donc > installation impossible. > > Les seules conditions qu'on a c'est : open source, sans agent, et > pas dans un langage RAM killer comme Java. > > Mickael > _______________________________________________ > Liste de diffusion du %(real_name)s > http://www.frsag.org/ _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
Liste de diffusion du %(real_name)s http://www.frsag.org/
On 24/08/2022 18:41, Mickael MONSIEUR wrote:
finalement, il y a eu retournement de situation. RETEX: un soft que personne n'avait évoqué : icinga. comme c'est un fork de nagios, ça aide grandement. avec icinga + icingaweb + director on a tout simplement un Nagios avec GUI moderne. (et tout web-based à part les plugins custom) comme on a pu ré encoder à l'identique toute notre hiérarchie nagios dans les fichiers conf vers icingaweb et utiliser tous nos plugins check maison, ça a grandement facilité une migration.
Ouais c'est bon à savoir. Le gros « - » pour Nagios Core à mon avis c'est qu'il n'inclus pas les graphs de performance. Et Zabbix le fait pour tout type de ressource y compris disque entrée/sortie.
Est-ce que Icinga permet cela ? On a les graphs d'usage des ressource CPU, load, RAM et charge en écriture/lecture ?
-pph
icinga peut s'interfacer avec des "grapheurs" externes type grafana ou graphite (celui que j'utilise)
pour produire ses courbes.
D.
Le 18/09/2022 à 11:11, Pierre-Philipp Braun a écrit :
On 24/08/2022 18:41, Mickael MONSIEUR wrote:
finalement, il y a eu retournement de situation. RETEX: un soft que personne n'avait évoqué : icinga. comme c'est un fork de nagios, ça aide grandement. avec icinga + icingaweb + director on a tout simplement un Nagios avec GUI moderne. (et tout web-based à part les plugins custom) comme on a pu ré encoder à l'identique toute notre hiérarchie nagios dans les fichiers conf vers icingaweb et utiliser tous nos plugins check maison, ça a grandement facilité une migration.
Ouais c'est bon à savoir. Le gros « - » pour Nagios Core à mon avis c'est qu'il n'inclus pas les graphs de performance. Et Zabbix le fait pour tout type de ressource y compris disque entrée/sortie.
Est-ce que Icinga permet cela ? On a les graphs d'usage des ressource CPU, load, RAM et charge en écriture/lecture ?
-pph _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/
Ici on fait du naemon+gearman pour la distribution des checks, du puppet pour automatiser les déploiements des checks, des agents et la configuration de naemon. Et ça tourne plutôt bien vu le nombre d'équipements et de hosts clients. Et ça fonctionne encore quand on casse une partie du réseau (ce point n'est pas a negliger).
Le mar. 26 juil. 2022 à 17:33, Mickael MONSIEUR mickael.monsieur@gmail.com a écrit :
Bonjour,
Suite à une mise à jour des systèmes, on a décidé de remplacer par la même occasion notre Nagios par quelque chose d'un peu plus "user-friendly". (et pourtant c'est un demi barbu qui parle..)
Vous me demanderez ce qu'on a contre Nagios? En 15 ans, ça n'a pas vraiment évolué, et on aimerait bien quelque chose avec un minimum de GUI pour l'encodage, voir une API. Et mettre 2k/an dans la version XI pour un soft qui n'évolue presque pas... bof.
Notre besoin est plutôt simple, on a déjà Observium qui fait 90% de nos besoins au sein de notre réseau, mais Observium ne permet pas "facilement" de monitorer "juste" des ports TCP, du SMTP/POP/IMAP, des réponses DNS, des réponses HTML dans une page HTTPS, l'expiration d'un certificat TLS.
Au début on pensait à Zabbix, mais quand on voit que ça passe d'office par un agent, on en voit pas l'utilité. Observium fait déjà tout ça en SNMP, et certaines machines ne sont pas gérées par nous on doit juste les monitorer de l'extérieur, donc installation impossible.
Les seules conditions qu'on a c'est : open source, sans agent, et pas dans un langage RAM killer comme Java.
Mickael _______________________________________________ Liste de diffusion du %(real_name)s http://www.frsag.org/