Sunteți pe pagina 1din 4

Stockage en rseau ou rseau de stockage ?

Philippe Latu
philippe.latu(at)linux-france.org
http://www.linux-france.org/prj/inetdoc/
Historique des versions $Revision: 1321 $ $Date: 2008-09-24 10:21:50 +0200 (mer 24 sep 2008) $ PL

Anne universitaire 2004-2005 - premire publication Rsum l'heure o le standard d'interconnexion Infiniband vient d'entrer dans le noyau Linux, on peut s'interroger sur l'avenir des technologies de distribution des espaces de stockage sur les rseaux. Cet article a pour but de prsenter les solutions existantes et leurs volutions. En effet, pour initier une dmarche de choix, il faut tre capable d'identifier les lments de base du type DAS, NAS ou SAN et d'envisager leur intgration dans le systme d'information. Comme pour l'ensemble des articles du projet inetdoc.LINUX, on introduit les implmentations correspondantes avec les systmes libres GNU/Linux.

Table des matires


1. Copyright et Licence .............................................................................................................................. 1.1. Mta-information ........................................................................................................................ 2. Les enjeux du stockage .......................................................................................................................... 3. Direct Attached Storage (DAS) ............................................................................................................... 3.1. Architecture type ........................................................................................................................ 3.2. Gestion des units de disques ....................................................................................................... 4. En guise de conclusion .......................................................................................................................... 1 1 2 2 3 3 3

1. Copyright et Licence
Copyright (c) 2000,2008 Philippe Latu. Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License". Copyright (c) 2000,2008 Philippe Latu. Permission est accorde de copier, distribuer et/ou modifier ce document selon les termes de la Licence de Documentation Libre GNU (GNU Free Documentation License), version 1.2 ou toute version ultrieure publie par la Free Software Foundation ; sans Sections Invariables ; sans Texte de Premire de Couverture, et sans Texte de Quatrime de Couverture. Une copie de la prsente Licence est incluse dans la section intitule Licence de Documentation Libre GNU .

1.1. Mta-information
Cet article est crit avec DocBook1 XML sur un systme Debian GNU/Linux2. Il est disponible en version imprimable aux formats PDF et Postscript : stockage.pdf3| stockage.ps.gz4.
1 2

http://www.docbook.org http://www.debian.org 3 http://www.linux-france.org/prj/inetdoc/telechargement/stockage.pdf 4 http://www.linux-france.org/prj/inetdoc/telechargement/stockage.ps.gz

Stockage en rseau ou rseau de stockage ? $Revision: 1321 $

Stockage en rseau ou rseau de stockage ?

2. Les enjeux du stockage


On dit qu'avec l'utilisation gnralise de l'Internet, nous sommes entr dans l're de l'information. L'information est dsormais considre comme un bien vital pour le dveloppement de l'activit d'une entreprise, voire-mme de l'conomie d'un pays. Les enjeux sur la disponibilit de l'information (des donnes dans notre cas) sont trs importants. En voici quelques exemples : Le premier enjeu, c'est l'volution du volume de donnes grer. Avant l'avnement de l'Internet, les systmes d'information ne comprenaient que quelques serveurs avec quelques gigaoctets de stockage surveiller et sauvegarder. Au moment de la rdaction de ce document, un systme d'information relativement moyen dispose de plusieurs centaines de gigaoctets. La nature cruciale du stockage est un autre souci. Mme des temps d'arrts limits peuvent pnaliser fortement une entreprise ou un service public. Les services tels que la planification des ressources d'entreprise (ERP pour Enterprise Resource Planning) et la gestion de relation client (CRM pour Customer Relationship Management) doivent tre disponibles 24 heures sur 24 et 7 jours sur 7. L'intgrit de l'information est aussi un enjeu important. Les informations stockes sur le rseau d'une organisation contiennent des lments essentiels sur les utilisateurs, les clients, les fournisseurs et les oprations internes. Il est donc vital que les donnes soient sres, rcuprables et protges contre les pertes. Ce contexte de stress sur l'information a conduit au dveloppement de nouvelles techniques d'accs, de gestion et de mise disposition de l'information. A l'origine, les fonctions de stockage et de sauvegarde taient dissocies du rseau. Aujourd'hui, toute solution de rtablissement suite une panne suppose un stockage et une synchronisation des donnes entre des locaux gographiquement spars. A l'intrieur d'un mme local, les mmes donnes sont de plus en plus souvent utilises par des services et|ou des systmes htrognes. Tout ceci conduit une interdpendance de plus en plus importante entre stockage et rseau. L'objectif de cet article est de prsenter les architectures types issues de cette interdpendance. Pour comprendre les volutions en cours, il faut dfinir chaque solution ainsi que ses possibilits d'implmentations sur les systmes libres GNU/Linux.

3. Direct Attached Storage (DAS)


L'espace de stockage directement connect l'unit centrale a domin le march informatique jusqu' l'avnement de l'Internet. Sous la forme la plus simple, il s'agit d'un disque dur qui est directement reli la carte mre de la machine via un bus. Historiquement, le bus de connexion parallle de disque du PC a t baptis IDE pour Integrated Drive Electronics puis ATA pour Advanced Technology Attachment. Avec l'introduction du bus de connexion srie ATA ou SATA, le bus parallle ATA (ex IDE) est dornavant appel PATA. En termes de dbits, les valeurs actuelles sont de 133MBps pour le bus PATA (ex IDE) et de 150MBps jusqu' 600MBps pour le bus SATA. Dans le monde des serveurs, c'est un autre type de bus qui sert de rfrence depuis de nombreuses annes : le bus SCSI pour Small Computer System Interface (voir Serial Attached SCSI). Les dbits actuels de la version parallle sont de 320MBps. La principale diffrence entre les technologies des disques ATA et SCSI se situe au niveau de la fiabilit. Le critre usuel de mesure de fiabilit est le temps moyen avant dfaillance ou Mean Time Before Failure (MTBF). Les valeurs typiques sont de 500000 heures pour la technologie ATA et 1200000 heures pour la technologie SCSI. C'est cette diffrence de fiabilit qui explique que la technologie des disques SCSI est beaucoup plus rpandue dans les serveurs que dans les postes de travail.

Stockage en rseau ou rseau de stockage ? $Revision: 1321 $

Stockage en rseau ou rseau de stockage ? Pour obtenir des informations plus dtailles sur les caractristiques de ces diffrents bus, on peut consulter le document donn en rfrence dans au point Serial Attached SCSI qui dresse un panorama complet des bus et des technologies de disques.

3.1. Architecture type


Dans la plupart des configurations qui rclament un espace de stockage consquent, on utilise un serveur avec beaucoup de logements ou une baie de disques spare.
_ .-[serveur]-----------------. .-[stockage interne/externe]-. _(_)_ |.----------. .---------.| |.---------. .----------. | (_)_(_) ||Processeur|----|Interface|--<scsi>--||Interface|--|Contrleur|-----<scsci>--|_(_)_| || | | SCSI || || SCSI | | RAID | | (_|_| |'----------' '---------'| |'---------' '(option)--' | disques '---------------------------' '----------------------------'

Dans ce cas de figure, c'est le systme d'exploitation du serveur qui gre les entres/sorties sur les disques. Il traduit les accs aux disques via son systme de fichiers local ou la gestion de volume logique. De cette faon, toutes les applications n'ont pas communiquer directement avec les disques. Le systme d'exploitation assure un traitement en mode bloc des accs aux units de disques. Cette architecture convient trs bien dans un systme d'information avec un nombre limit de serveurs. Cependant, une architecture classique de dlivrance services Internet suppose une distribution des rles en plusieurs couches ; ce qui implique un nombre de serveurs plus important (voir Firewall Deployment for Multitier Applications5). La gnralisation de l'utilisation des services Internet favorise le transfert des donnes depuis le serveur de fichier dpartemental isol vers une infrastructure globalise. Cette tendance de fond entrane une augmentation significative des donnes concentres dans un mme primtre. C'est dans ce contexte que la gestion de l'espace stockage directement connect une unit centrale (Direct Attached Storage) devient trs difficile. L'espace de stockage de chaque serveur doit tre gr sparment. Le nombre d'units de disques par machine est limit. Ces units ne sont pas partageables entre plusieurs machines. Enfin, l'volutivit de ces solutions est vraiment trs limite et coteuse puisque l'augmentation de l'espace de stockage suppose l'ajout d'un serveur complet. Tout ces lments ont conduit aux dveloppements de techniques de distribution de l'espace de stockage sur le rseau.

3.2. Gestion des units de disques


Bien que l'on cherche rendre l'espace de stockage disponible sur rseau, tout l'hritage de la connexion directe entre les disques et l'unit centrale n'est pas jetter aux orties.

4. En guise de conclusion
Cet article ne peut prtendre tre exhaustif sur la question du stockage distribu sur rseau. C'est d'autant plus vrai que les solutions proposes sont trs rgulirement remanies en profondeur. Est-ce qu'Infiniband tiendra ses promesses ? Est-ce que la version 4 du protocole NFS qui promet rplication et mobilit depuis longtemps sera utilisable ? Est-ce qu'un protocole du type iSCSI gagnera suffisament en popularit pour se gnraliser ? Beaucoup de questions et bien peu de rponse satisfaisantes. Les besoins sont bien prsents et seul pronostic que l'on puisse faire c'est que la solution qui mergera sera celle qui permettra de dpasser les problmes d'htrognit moindre cot. Investir prcipitemment dans des solutions propritaires fermes est probablement une erreur. Pour aller plus loin dans l'tude des diffrents sujets abords dans cet article, voici quelques documents de rfrence utiles.
5

http://www.zeltser.com/multi-firewall/

Stockage en rseau ou rseau de stockage ? $Revision: 1321 $

Stockage en rseau ou rseau de stockage ? Serial Attached SCSI, SAS Le site SCSI Trade Association6 rassemble toute la documentation sur les protocoles de type SCSI. Le document Serial Attached SCSI General overview7 est particulirement intressant pour comparer les caractristiques des bus ATA et SCSI.

6 7

http://www.scsita.org/ http://www.scsita.org/aboutscsi/sas/tutorials/SAS_General_overview_public.pdf

Stockage en rseau ou rseau de stockage ? $Revision: 1321 $

S-ar putea să vă placă și