Le 10/12/2013 15:26, Julien Escario a écrit :
Le 10/12/2013 01:20, Gilles Mocellin a écrit :
[...] Maintenant, Comme le dit Julien, tu peux aussi regarder du coté des filesystems distribués comme GlusterFS, Ceph, MooseFS. Surtout si tu veux de la haute dispo sur plusieurs machines. Préférence pour Ceph, surtout pour faire tourner des VM KVM, avec le driver RBD pour QEMU. Ça devient la solution de référence pour le stockage des Cloud IaaS, comme OpenStack.
J'étais justement en train de regarder Ceph et il semblerait qu'il manque LE truc indispensable : la geo réplication et donc un mode asynchrone avec un système de 'zone' (je veux qu'à un instant t, il y au moins un réplicat dans CHAQUE datacenter). Ca a l'air très demandé par la communauté ceph et certains l'ont fait avec du DRBD protocol A sous rados. Pourquoi pas mais ça commence à faire des couches et des couches donc des perfs en moins.
J'ai demandé récemment à un dev, et le truc qui pourrait remplacer une géo-réplication qu'il n'y aura pas de si tôt. Le snapshot incremental : http://ceph.com/dev-notes/incremental-snapshots-with-rbd/
L'idée : - Avoir un cluster Ceph, indépendants, dans deux datacenters. - Envoyer régulièrement (par scripts), des diffs des volumes que l'on souhaite protéger en Disaster Recovery.
A confirmer mais qemu intègre maintenant aussi un accès direct à un domaine gluster sans passer par la case FUSE.
Je confirme.
Avec la volumétrie de nos jours, les systèmes RAID et DRBD deviennent vite contraignant quand ils doivent se resynchroniser.
Déjà, si HDD >= 2 To, RAID6, plus RAID5. Et effectivement DRBD, même si ils ont amélioré les choses, nécessite une bonne compréhension de ce qu'est un slit-brain au risque de perdre des données. La resynchro drdb a pas évoluée aussi : on ne resynchronise que ce qui est désynchronisé maintenant, plus l'ensemble (peut être un comportement qui se configure ceci dit).
Je suis également en recherche de système de 'geo cluster' en open source, si certains ont des idées, je prends !
Julien
On a aussi la partie stockage d'OpenStack : Swift. Là, ça prend en charge la géo-réplication. Mais, c'est pas fait pour des volumes en mode block, faisant tourner des VMs...
Je crois que le Graal n'existe pas (encore)...