'jour

Je vais essayer d'être un peu plus pénible avec Ceph en provoquant des coupures
brutales à des moments différents.

Il me semble avoir lu sur le forum Proxmox que leurs devs conseillent de mettre 5 noeuds Ceph dans un cluster (hyperconvergé ou dédié Ceph).
Comme ça, on peut en perdre 2 en même temps (coupure brutale) et on peut continuer en R/W (si le nombre de réplicant est suffisant bien sûr, il faut écrire les données sur trois noeuds).
Il faut donc aussi au moins trois monitors et trois managers.

Par contre, avec 5 noeuds et 40 OSD (8 SSD 2TB par noeuf), le facteur limitant en IOps c'est le réseau : deux ports 10 Gbps LACP dédiés pour le trafic Ceph c'est pas assez.
Le bench rados le montre clairement (60 secondes, 16 threads 4 MB) :
	Total time run:         60.055428
	Bandwidth (MB/sec):     959.447
	Average IOPS:           239
	Average Latency(s):     0.066696