Je suis un peu étonné de vos différentes conclusions sur Prometheus.
(...)
Pour l'archivage ou la rétention longue duré il existe différente solution que nous n'utilisons pas. La solution qui monte est
https://thanos.ioNous pensons créé un service d'extraction de quelques métriques via l'API prometheus afin d'archivage sous forme de fichier csv (github est pleins de piste pour cela)
L'UI de Prometheus est pas mal, même si d'un point de vue perso je n'adhère pas, mais c'est une question de gouts évidement.
Par contre chose que j'ai effectivement remarqué comme tout infra grafana like, c'est que la taille des machines et du stockage sont loin d’être anodin.
Loin de moi de dire que c'est pas bien, mais je trouve que pour les même métriques la surface et le nombre de cœurs/mémoire par rapport a des choses "legacy" (legacy = rrd), on est loin de la même efficacité.
Encore plus pour les logs, ou un FS ZFS avec dedup + compression avec un grep -r pour retrouver les informations sera toujours aussi efficace qu'un SQL ou un autre backend de "haut niveau".
Donc je reste vieux con, et je garde sur un frontend web que les data chaudes du jour / semaine / max 1 mois, le reste fichier plats + zfs + compression + dedup -> priceless (et grep -r est mon ami).
Xavier