Tout système d’information se doit d’avoir un plan de reprise d’activité adapté aux coûts et manques à gagner liés à l’indisponibilité de tout ou partie du système.
Dans ce contexte, la disponibilité des données du SI est un sujet de préoccupation majeur. Note : un autre sujet qui fera probablement l’objet d’un billet séparé est la disponibilité des ressources matérielles (que nous adressons entre autres par virtualisation du matériel).
Il existe chez JTEK deux types de données dont la disponibilité est importante :
- toutes les données des services internes,
- les données des applications en mode SaaS que JTEK héberge pour ses clients.
L’ensemble de ces données est stocké sur des systèmes sous Linux.
Deux types de besoins existent (et se combinent souvent pour les même données) :
- la disponibilité de sauvegardes :
- récentes,
- à un emplacement géographique distinct des données d’origine,
- disponibles rapidement (en quelques minutes, même pour les gros volumes de données),
- permettant de récupérer des données avec une granularité fine (la version d’un fichier à une heure donnée par exemple),
- la sécurisation du stockage à long terme des données les plus importantes (logs, pièces comptables numérisées, …).
Afin de répondre à ces besoins, JTEK utilise deux outils Open-Source intégrés à l’aide de développements internes :
Le premier outil, rdiff-backup, permet de disposer de sauvegardes sur disque incrémentales optimisant l’espace disque nécessaire en ne conservant que les différences entre les versions d’un même fichier. Cela nous permet de conserver un historique fin des fichiers (pour certaines données, une version par heure est conservée). La vitesse de récupération des données est en première approximation dépendant de la bande passante entre serveur de sauvegarde et destination des données restaurées.
Le deuxième outil, Tahoe-LAFS, permet de distribuer le stockage des données sur plusieurs systèmes et garantir leur disponibilité même si seul un sous-ensemble de systèmes reste accessible (tant que le nombre de systèmes accessibles reste supérieur ou égal à une valeur configurable). Actuellement notre système de conservation de données longue durée garantit que nos données sont disponibles tant que 3 systèmes sur 6 sont accessibles, chacun de ces 6 systèmes étant dans des locaux (voir des pays) distincts afin de réduire au maximum les risques.
Attention : les commentaires ne sont pas modérés. Vous êtes donc entièrement responsable du contenu que vous publiez ici (l'adresse IP utilisée pour poster votre commentaire est conservée). Un filtre anti-SPAM est utilisé et peut ralentir la publication de votre commentaire.
Commentaire(s)
Bonjour,
merci pour cet article et surtout de pointer The Least Authority File System, une belle découverte !
— Ben
C’est une manière de faire qui est intéressante afin d’avoir les sauvegardes sous la main en permanence et des sauvegardes à plus long terme sécurisé en dehors des locaux.
La “solution ultime” simple à déployé et satisfaisant les même contraintes n’existe pas encore. Pour m’être penché sur le sujet c’est assez complexe à réaliser proprement.
Merci pour l’article qui alimenté ma réflexion.
Pierre