Bonsoir,
On 12/15/2017 11:24 AM, GAoL garfieldairlines on lists wrote:
On s'est posé exactement la même question ici, et on a donc décidé d'installer un cluster de test avec des machines disons… plutôt âgées.
Tout y est passé et on a même pas fait exprès : les disques qui ont lâchés, le switch pourri bas de gamme, la panne hardware sur un des quatre serveurs etc… et c'est plutôt solide.
Ok, cool. Et vous avez testé l'extinction brutale de _tous_ les nœuds du cluster... type coupure électrique de la salle serveurs ?
Il faut juste faire très attention : quand une machine tombe, toutes les autres seront pendant un certain temps plus actives histoire de recalculer et de ré-allouer les blocs CEPH qui ont disparu.
Oui. Alors je ne sais pas si le management de Ceph via Proxmox le permet, mais avec un Ceph « externe/classique », on peut mettre des priorités et faire en sorte que les I/O « clients » passent avant les I/O dues au load balancing des data. On peut aussi indiquer à Ceph de ne pas faire de load balancing du tout dans le cas où ce sont tous les OSDs d'un même host qui sont tombés (personnellement c'est un choix que je ferai si c'est possible avec un Ceph « proxmox-managed » of course). Ce sont juste des paramètres à définir dans le ceph.conf mais peut-être qu'avec un Ceph « Promox-managed » on ne peut pas toucher à ce fichier ? On peut ou c'est interdit ?
Donc bien faire attention à garder un peu d'espace disque libre, au cas où (je suggère de remplir au maximum 2/3).
Oui oui, tout à fait. Ce sont les préconisations de Ceph, ne jamais trop remplir les OSDs afin de permettre le load balancing des data à chaque instant.
Au fait, évite d'installer Proxmox sur des clés USB, ce n'est clairement pas fait pour
En effet, j'ai déjà eu des merdes avec les clés USB. Depuis, je ne tente plus le diable et j'utilise toujours un CD pour éviter les problèmes.
Je te suggère fortement un RAID1 pour l'OS
Oui, c'est ce qu'on projettait de faire (RAID1 Soft sur l'OS).
Merci pour ce retour plutôt encourageant. :)