Comparaison des différents raid

 

RAID 0

RAID 1

RAID 2

RAID 3

RAID 4

RAID 5

RAID 6

RAID 7

RAID 01(0+1) et 10(1+0)

Techniques utilisées

Stripping.

Mirroring et duplexing.

Byte-level stripping (découpage en octets) et code de Hamming ECC.

" Byte-level striping " avec parité dédiée.

Block-level striping (découpage en blocs) avec parité dédiée.

Block-level striping avec parité distribuée.

Block-level striping (découpage en blocs) avec double parité distribuée.

Asynchrone, cached striping (...) avec parité dédicacée.

Mirroring et striping sans parité

Petite description

Le plus simple des niveaux RAID, le RAID 0 devrait vraiment être appelé AID , puisqu’il n’y a pas de redondance. Les fichiers sont découpés en segments selon une taille définie par l’utilisateur et chaque segment est envoyé vers un des disques durs. Renoncer à la redondance autorise ce niveau de RAID à avoir les meilleurs caractéristiques des performances d’ensemble des simples niveaux RAID, spécialement pour son coût. Pour cela, il est devenu graduellement l’un des plus populaires.

Le RAID 1 est habituellement utilisé en mirroring, chaque disque ayant ses données dupliquées sur deux disques différents utilisant un contrôleur Raid matériel ou logiciel. Si un disque tombe, le second continue de fonctionner comme un disque unique jusqu’à ce que le disque tombé ait été remplacé.

Simple, le RAID 1 est populaire pour ceux qui requièrent une tolérance aux pannes et n’ayant pas besoin de hautes performances en lecture.

Une variante du RAID 1 est le duplexing qui est similaire au mirroring à la différence prêt que chaque disque repose sur un contrôleur RAID.

Le RAID 2 est l’intrus de la famille RAID dans le sens où c’est le seul niveau de RAID qui n’utilise pas une ou plusieurs des techniques standards de mirrorring, stripping et/ou parité.

Le RAID 2 utilise quelque chose de similaire au stripping avec parité mais ce n’est pas la même chose qui est utilisé par le RAID 3 ou 7. Cette méthode découpe les données (au byte-level) et les réparties sur des disques de données et sur des disques redondants éventuels.

Les bits redondants sont calculés selon les codes de Hamming (ECC = Error Correcting Code). Chaque fois que quelque chose doit être écrit sur la baie de disques, ces codes sont calculés et écris sur le (ou les) disques ECC dédié(s). Lorsque ces données sont lues ensuite, le code ECC l’est en même temps afin de vérifier qu’aucune erreur n’a eu lieu lors de l’écriture.

Si une simple erreur a lieu, elle peut être corrigée à la volée.

Les niveaux sous le RAID 3 découpe les données sur plusieurs disques au " byte-level ". La taille exacte des morceaux de fichiers est variable mais généralement en dessous d’1Ko. L’information de parité est envoyé à un disque de parité dédié, mais la perte d’un des disques de la baie peut être toléré (i.e le disque de parité dédié ne représente pas l’unique point de défaillance dans la baie). Le disque de parité dédié est généralement le goulot d’étranglement spécialement pour les écritures sur disques aléatoires, parce qu’il doit être accédé à chaque fois qu’une nouvelle chose est envoyé sur la baie de disques, ce qui est différent de la parité distribuée (RAID5) qui augmente les performances d’écritures en utilisant les parités distribuées.

Le RAID 3 diffère du RAID 4 uniquement par la taille du découpage des fichiers envoyés sur les différents disques.

RAID 4 améliore la performance en découpant les données en blocs sur différents disques et fourni une haute tolérance aux pannes par l’utilisation d’un disque de parité dédié.

Cette solution est en quelque sorte la solution intermédiaire entre le RAID de niveau 3 et le RAID de niveau 5. Elle est similaire au RAID 3 à la différence prêt qu’elle utilise des blocs aux lieux de mots pour le découpage et est similaire au RAID 5 à la différence prêt qu’elle utilise la parité dédiée au lieu de la parité distribuée.

Passé d’un découpage de niveau mot à bloc augmente les performance d’accès aléatoire, mais le disque de parité dédié reste le goulot d’étranglement, spécialement pour les performances d’écriture aléatoires.

La tolérance aux pannes, l’efficacité de l’organisation des données et beaucoup d’autres attributs sont les mêmes que le RAID 3 et le RAID 5.

Un des plus populaire niveau de RAID, le RAID 5 découpe à la fois les données et les informations de parité sur différents disques. Il est similaire au RAID 4 à la différence prêt qu’il échange le disque de parité dédié par un algorithme de distribution de cette dernière sur tous les disques de la baie. Ceci enlève l’effet de goulot d’étranglement que le disque de parité dédié représente, augmentant ainsi légèrement les performances d’écritures et améliore le parallélisme dans un contexte d’environnement transactionnel multiple. Cependant les délimiteurs (overheads) nécessaires pour la prise en compte de la parité continuent de décroître les performances d’écriture. La tolérance aux pannes est maintenue dans le sens où les informations de parités sont stockées dans des blocs de données placés sur des disques différents de ceux qui possèdent la donnée elle même. Les performances du RAID 5 peuvent être paramétrées en essayant différentes tailles de découpage jusqu’à ce qu’une taille qui s’applique bien à l’application utilisée soit trouvée.

Le RAID 6 est vu comme un RAID 5 amélioré. Il découpe les données en bloc et calcule la parité qu’il distribue ces informations sur les disques de la baie comme le RAID 5, cependant, il calcule deux jeux d’information de parité pour chaque lot d’information. L’objectif de cette duplication est d’améliorer la tolérance aux pannes. Le RAID 6 peut traiter la perte de deux disques alors que les niveau de RAID inférieur ne peuvent en traiter qu’un. D’un point de vue performance, le RAID 6 est généralement inférieur au RAID 5 en terme d’écriture dû à l’ajout de calcul de parité mais est légèrement plus rapide dans les lectures aléatoires dûes à la distribution des données sur un disque supplémentaire. Comme pour le RAID 4 et 5, les performances peuvent être ajustées en expérimentant différentes tailles de découpage.

A la différence des autres niveaux de RAID, le RAID 7 est un standard disponible au niveau industriel.

Le RAID 7 est basé sur les concepts utilisés pour le RAID 3 et RAID 4 mais largement plus développé pour pallier aux problèmes de ces deux niveau de RAID.

La grande particularité est l’insertion d’un cache au niveau contrôleur, ainsi qu’un processeur " temps réel " spécialisé pour diriger la baie de manière asynchrone.

Ces particularités, notamment le cache, permettent à la baie de traiter des opérations simultanément, augmentant ainsi toutes les caractéristiques de la baie en gardant la tolérance aux pannes. Par exemple, le RAID 7 offre de meilleures performances sur les lecture et écriture aléatoire que ne le peut le RAID 3 et le RAID 4 parce que la dépendance du disque de parité dédié est grandement réduite avec l’ajout du cache sur le contrôleur. Cependant, il faut savoir que l’ajout des performances du RAID 7 engendre un surcroît de coût. Il s’agit d’une solution chère, construite et supportée par une seule industrie : Storage Computer Corporation

Le plus répandu des multiples niveaux de RAID, les RAID 0+1 et 1+0 combinent les meilleurs caractéristiques de striping et de mirroring pour les solutions où l’on désire une grande performance et une tolérance aux pannes supérieure.

Le RAID 0+1 est une configuration utilisant deux jeux de disques en mode " striped " mirrorés.

Le RAID 1+0 est un découpage des fichiers à travers un nombre de disques en mode mirroring.

Les RAID 0+1 et 1+0 ont eu une popularité qui a grandi en même temps que les disques devenaient de moins en moins chers et que les 4 disques minimum ne sont de ce fait plus vu comme un obstacle.

RAID 1+0 fournit une meilleur tolérance aux pannes et une meilleure performance de reconstruction des disques que le RAID 0+1.

Les deux techniques fournissent des performances générales de très bonne à excellente en combinant la vitesse du RAID 0 et la redondance du RAID 1 (sans avoir à calculer la parité).

Dessin

                 

Exigence du contrôleur

Supporté par tous les contrôleurs matériels, SCSI et IDE/ATA , et donc par la plupart des solutions de raid logiciel.

Supporté par tous les contrôleurs matériels, SCSI et IDE/ATA , et donc par la plupart des solutions de raid logiciel.

Contrôleur RAID spécialisé.

Contrôleur RAID de moyen à haute performance.

Contrôleur RAID de moyen à haute performance.

Requiert une carte contrôleur de bonne qualité. Solution supportée par des logiciels RAID sous peine de dégradations substantielles des performances.

Requiert un contrôleur RAID spécialisé (cher).

Requiert un contrôleur spécialisé, propriétaire et cher.

La plupart des contrôleurs supportent le RAID 01 ou le RAID 10 mais rarement les deux. Même les contrôleurs " bas de gamme " supporte ce niveau multiple usuellement RAID 01. Les contrôleurs les plus chers supportent les deux.

Besoin en disque dur

Minimum de 2 disques dur.
Maximum en fonction du contrôleur.

Exactement deux disques. Tous les types de disques peuvent être utilisés mais idéalement, il vaut mieux qu’ils soient identiques.

Dépend de l’implémentation exacte mais une installation typique requiére 10 disques de données et 4 disques ECC pour un total de 14 disques ou 32 disques de données et 7 d’ECC, pour un total de 39 disques.

Un minimum de trois disques (le maximum étant fixé par le contrôleur). Les disques devraient être, dans la mesure du possible, de taille et de type identiques.

Un minimum de trois disques (le maximum étant fixé par le contrôleur). Les disques devraient être, dans la mesure du possible, de taille et de type identiques.

Un minimum de trois disques (le maximum étant fixé par le contrôleur). Les disques devraient être, dans la mesure du possible, de taille et de type identiques.

Un minimum de 4 disques, le maximum étant donné par le contrôleur. Pour le mieux, les disques devraient être de même type et de même taille.

Dépend de l’implémentation.

Minimum 4 disques. Le maximum étant fixé par le contrôleur. Tous les disques devraient être identiques.

Capacité

Taille du plus petit disque * nombre de disques

Taille du disque ayant la plus petite capacité

Dépend de l’implémentation exacte mais devrait être importante si l’on choisi cette solution avec nos disques modernes.

(Taille du plus petit disque) * (nombre de disques – 1).

((Taille du plus petit disque) * nombre de disques – 1).

((Taille du plus petit disque) * nombre de disques – 1).

(Taille du plus petit disque) * Nombre de disques – 2).

Dépend de l’implémentation.

(taille du disque le plus petit) * (nombre de disques) /2.

Efficacité de stockage

100 % si des disques durs identiques sont utilisés

50% si les disques durs sont identiques.

Dépends du nombre de disques de données et du nombre de disques ECC. Pour la configuration 10+4 : 71%. Pour la configuration 32+7 : 82%.

Si tous les disques sont de même taille :

((Nombre de disques – 1) / Nombre de disques).

Si tous les disques sont de même taille :

(Nombre de disques – 1) / Nombre de disques).

Si tous les disques sont de même taille :

(Nombre de disques – 1) / Nombre de disques).

Si tous les disques sont de taille identique :

(Nb disques – 2) / (Nb disque)

Dépend de l’implémentation.

Si tous les disques sont de taille identiques : 50 %.

Tolérance aux erreurs

Aucune : Une erreur d’un des disques entraîne la perte de toutes les

données.

Très bonne, le duplexing étant encore meilleur.

Juste moyenne. Pour tous les disques redondants inclus, vous ne trouverez pas une plus grandes tolérances aux erreurs. Uniquement un disque peut tomber dans cette configuration et être réparé à la volée.

Bonne. Peut tolérer la perte d’un disque.

Bonne. Peut tolérer la perte d’un disque.

Bonne. Peut tolérer la perte d’un disque.

Très bonne à excellente. Peut tolérer la perte simultanée de deux disques.

Très bonne.

Très bonne pour RAID 01, excellente pour RAID 10.

Disponibilité

Le plus faible de tous les niveaux RAID. Un manque d’une tolérance d’erreur signifie qu’il n’y aura pas de récupération rapide. L’échec de n’importe quel disque entrainera la perte immédiate des données jusqu’à la reconstruction et la restauration des données d’un backup

Très bonne. La plupart des contrôleurs Raid, même ceux de basse qualité, supporteront le " hot sparing " et la reconstruction automatique des baies RAID 1.

Très bonne due à la correction des erreurs à la volée.

Très bonne. La majeure partie des contrôleurs supportant le RAID 3 propose également les options de " Hot sparing " et de reconstruction automatique.

Très bonne. Le " Hot sparing " et la reconstruction automatique sont généralement supportés.

Très bonne. Le " Hot sparing " et la reconstruction automatique sont généralement supportés.

Excellente.

Excellente, due à l’utilisation de multiples disques utilisant le " hot sparing "

Très bonne pour RAID 01, excellente pour RAID 10.

Dégradation et reconstruction

Non applicable

Petite dégradation en performance de lecture. Performance d’écriture en progrès. Reconstruction relativement rapide.

En théorie, il y a une légère dégradation due à la perte d’un des disques.

Dégradation des performances faible lors de la perte d’un disque. La reconstruction quant à elle peut prendre plusieurs heures.

Dégradation modérée si un disque tombe. Reconstruction d’un disque potentiellement longue.

Due à la parité distribuée, la dégradation des performances est substantielle après une panne et durant une reconstruction.

Due à la complexité de la double parité distribuée, la dégradation peut être substantielle après une panne et durant la reconstruction. La double redondance permet de plus de retarder la reconstruction des disques afin d’éviter une diminution des performances.

Meilleur que bon nombre de niveaux de RAID due au fait que le contrôleur supporte le calcul d’opérations de parité ainsi que de multiples niveaux de cache.

Relativement faible pour RAID 10, plus substantielle pour le RAID 01

Performance de lecture aléatoire

Très bonne; meilleure si utilisant une taille large si le contrôleur supporte les lectures indépendantes sur les différents disques.

Bonne. Meilleure qu’un simple disque mais moins bonne que beaucoup d’autres niveau RAID.

Moyenne. Le " Byte-level striping " empêche l’accès multiple en lecture.

Bonne mais non excellente due au " byte-level striping ".

Très bonne.

Très bonne à excellente, généralement meilleure pour les découpages de grandes tailles. Peut être meilleure que le RAID 0 étant donné que les données sont distribuées sur un disque additionnel. De plus les informations de parités ne sont pas nécessaires durant la lecture.

Très bonne à excellente. Généralement meilleure pour les découpages de fichiers de grande taille.

Très bonne à excellente. L’ajout de cache permet de fournir les résultats de lecture sans avoir eu accès à la baie de disques.

Très bonne à excellente

Performance d’écriture aléatoire

Très bonne, de nouveau meilleur si utilisation d’une taille large des stripe et si l’écriture indépendante est supporté par le contrôleur.

Bonne. Moins bonne qu’un simple disque mais meilleur que beaucoup d’autres niveaux RAID.

Faible due au " Byte-level striping " et au calcul ECC.

Faible due au " byte-level striping ", au calcul de la parité ainsi que par le goulot d’étranglement du disque de parité.

Faible à moyenne, due au calcul de parité ainsi qu’au goulot d’étranglement du disque de parité dédié.

Seulement moyenne, due aux délimiteurs de la parité (mais tout de même meilleure aux solutions de RAID 3 et RAID 4).

Pauvre, due à la complexité de la double parité.

Très bonne. Substantiellement supérieur aux autres niveaux de RAID en faisant du découpage avec parité (striping with parity).

Bonne à très bonne

Performance de lecture séquentielle

De très bonne à excellente.

Passable. Du même acabit qu’un simple disque.

Très bonne due au parallélisme des disques.

Très bonne.

Bonne à très bonne.

Bonne à très bonne. Généralement meilleure pour des tailles de découpage des fichiers petites.

Bonne à très bonne. Généralement meilleur pour les découpages de petites tailles.

Très bonne à excellente.

Très bonne à excellente

Performance d’écriture séquentielle

Très bonne

Bonne. Encore une fois meilleur que beaucoup d’autres niveaux Raid.

Moyenne à bonne.

Moyenne à bonne.

Moyenne à bonne.

Moyenne à bonne.

Moyen.

Très bonne.

Bonne à très bonne

Coût

Le moins cher de tous les niveaux de RAID

Relativement cher dû aux disques redondants. Plus petite capacité de stockage des différents niveaux RAID. Le mode " duplexing " est encore plus cher due à la redondance des contrôleurs RAID.

D’un autre côté, les contrôleurs n’ont pas besoin d’être excessivement cher et la plupart de ces derniers ne sont pas hors de prix de nos jours, ce qui fait de RAID 1 un choix viable pour les systèmes individuels.

Très cher.

Modéré. Un contrôleur RAID est habituellement requis en plus d’au moins trois disques.

Modéré. Un contrôleur RAID est habituellement requis en plus d’au moins trois disques.

Modéré, mais souvent moins cher que le RAID 3 ou RAID 4 due à sa plus grande popularité, surtout si le logiciel RAID est utilisé.

Cher.

Très cher.

Relativement élevé du au nombre de disques requis et à l’efficacité de stockage (50%)

Considérations spéciales

L’utilisation du RAID 0 sans solution de backup (lecteur DAT) ne doit être utilisé que pour des informations qui n’ont pas une très grande importance pour l’utilisateur

La baie de disques RAID 1 est limité à la taille des disques utilisés sur la baie. Des baies de disques RAID1 peuvent être utilisées si des capacités de stockage plus grandes sont requises, mais le RAID 1+0 devient plus attrayant dans cette circonstance. Les performances sont de plus réduites si nous utilisons un logiciel plutôt que des contrôleurs RAID.

Non utilisé dans les systèmes modernes.

Pas aussi populaire que les autres solutions RAID les plus courantes. Pour les environnements transactionnels, le RAID 5 est habituellement un meilleur choix.

Les performances vont dépendre dans une certaine mesure à la taille du découpage choisi.

Dû à la quantité de calcul de parité, le logiciel de RAID 5 peut sérieusement ralentir le système. La performance dépendra du choix de la taille du découpage des fichiers.

Requiert une implémentation spéciale. Pas très répandu.

Le RAID 7 est un produit propriétaire d’une unique industrie. La mise en cache engendre de plus des problèmes de vulnérabilité dans le cas d’une panne, ce qui entraînerait l’utilisation d’un ou plusieurs onduleur(s).

La faible efficacité de stockage entraîne une potentielle limite sur la baie.

Utilisation recommandée

Les données non primordiales (ou les données qui changent rarement et qui possèdent une solution de backup) requièrent une grande rapidité, particulièrement en écriture, et un coût d’implémentation faible.

Ex : Audio, streaming video, serveur web, ...

Utilisé pour les applications qui requièrent une haute tolérance aux pannes à moindre coût, sans le besoin de grandes quantités de stockage et de performances optimales.

Spécialement utile dans les situations où les besoins se ressentent plus sécurisés dans une duplication des données plutôt que dans l’utilisation de la parité. Pour ces raisons, la solution RAID 1 est populaire pour les données comptables ou financières. Utilisé également pour de petites BDD, ou pour les particuliers qui requièrent une tolérance aux pannes à moindre coût.

Idem. 

Les applications utilisant des fichiers de grandes tailles qui requièrent un haut taux de transfert avec redondance : multimédia, publication, ... RAID 3 est souvent utilisé pour les mêmes applications qui voient l’utilité du RAID 0, où le manque de tolérance aux pannes du RAID 0 le rend inacceptable.

Moyen dans tous les secteurs sans être le maître dans aucun de ces derniers, le RAID 4 n’est pas aussi utilisé que le RAID 3 ou le RAID 5 parce qu’il est en quelque sorte un compromis entre eux ce qui ne semble pas être une cible de marché à la différence des deux autres solutions. Le RAID 4 est quelque fois utilisé pour les applications qui tournent généralement en RAID 3 ou RAID 5 ce qui couvre un éventail d’applications compris entre les bases de données et données multimédia de grandes tailles.

Le RAID 5 est vu par beaucoup comme étant la combinaison idéale pour de bonnes performances, pour une bonne tolérance aux pannes, une grande capacité ainsi que pour l’efficacité de stockage des informations.

Pour les applications requerrant une écriture intensive, RAID 1 ou RAID 0+1 sont probablement de meilleurs choix, parce que les performances d’écriture du RAID 5 diminuent dans de tels environnements

En théorie, le RAID 6 est utilisé sur les mêmes applications que le RAID 5 mais dans les situations où la tolérance aux pannes est requise. En pratique, le RAID 6 n’a pas vraiment fait une percée car peu de compagnies sont prêtes à dépenser le coût supplémentaires qui permet de faire face à un événement rare (à savoir le crash de deux disques simultanément). La montée des fonctionnalités de hot swaping et de reconstruction automatique coté RAID 5 ont rendu le RAID 6 encore moins désirable.

Pour la majeure partie de utilisateurs, un RAID à niveau multiple comme le RAID 0+1 donnera des performances comparables aux niveaux simples de RAID pour un coût réduit.

Les applications qui requièrent à la fois de bonne performance et de la fiabilité en contrepartie de la capacité de stockage. Ceci est utilisé par les serveurs d’entreprises, les systèmes de BDD de taille modérée...

Page précèdente : COUTS   Sommaire : SOMMAIRE   Page suivante : COMPARAISON RAID LOGICIEL - RAID MATERIEL