
Souvent considérées comme synonymes ou approches alternatives, les techniques de compression, le SIS (Single Instance Storage) et la DéDuplication produisent des résultats très variable. En fait, aux dires de l'éditeur, pour qualifier une solution de DéDuplication, une des 4 approches suivantes doit être considérées:
- Déduplication au niveau bloc de taille fixe: la technique met en place une segmentation du flux de données en bloc, génère une signature pour chaque bloc et compare ces dernières. Si les signatures sont identiques, il est admis que le bloc est identique mais bien sûr la gestion des collisions est intégrée.
- Déduplication au niveau bloc de taille variable: la technique est similaire et ne limite pas l'analyse à une taille figée et la solution échappe alors aux contraintes d'alignement. Le résultat, le fameux ratio de déduplication, est alors meilleur. RockSoft se dit détenteur des patents autour du bloc variable et attaque souvent les vendeurs concurrents, je n'ai pas encore vu ou lu une poursuite de RockSoft, maintenant Quantum, vis-à-vis de PocketSoft. Le gag étant que les noms des sociétés sont très proches.
- Déduplication au niveau octet: très simple mais gourmand en CPU, temps et potentiellement taille car les enregistrements sont nombreux, il faut en effet comparer des octets (unité élémentaire). Cette solution ne souffre pas de problèmes d'alignement. Seules les parties différentes sont effectivement concernées et en l'occurrence stockées ce qui en fait une belle solution de réduction d'espace, ExaGrid utilise ce type d'approche.
- Déduplication au niveau octet avec utilisation minimale de ressources: l'approche est basée sur la précédente mais aucun espace de stockage n'est consommé par cette approche même temporaire, une seule passe sur les données à vérifier est effectuée, l'efficacité semble être la meilleure en temps, ressources et ratio de déduplication.
0 commentaires:
Post a Comment