Documente Academic
Documente Profesional
Documente Cultură
TOME IV
AZERTY MicroSystem
TOME IV chapitre 1
AZERTY MicroSystem
4.1.1
Un rseau informatique = mise en communication entre machines informatiques dans le but de partager des informations (ressources).
IMPORTANT
Un rseau provoque la communication entre lments informatiques - mais peut-tre aussi votre insu !
AZERTY MicroSystem
! ?
EXEMPLE
Dans un Rseau informatique, que veut dire superviser ? Il sagit de regarder TOUT sauf linformation.
t es T
IMPORTANT
AZERTY MicroSystem
! !
EXEMPLE
La surveillance = Regarder quelque chose de prcis. Par exemple : surveiller la porte dentre (rien dautre).
IMPORTANT
Superviser cest veiller sur les organes en remontant les informations quantitatives
CE QUIL FAUT RETENIR
AZERTY MicroSystem
Pourquoi superviser ?
4.1.4
! !
:-( :-( :-(
Je supervise dans le but dtre inform sur ltat de mon rseau ou de mes applications
Si je ne supervise pas :
! ! ! ! !
Je peux tre pirat sans le savoir Mes serveurs peuvent tre fatigus Mes performances peuvent tomber Les utilisateurs prviennent en cas de panne - je perds toute crdibilit Ma Direction se lasse : linformatique est toujours en panne
IMPORTANT
AZERTY MicroSystem
4.1.5
Si jattends la panne
Dure de la Panne Rparation
Signes avant coureurs PANNE Appel S.O.S utilisateurs Intervention Remise en service
Rparation
Intervention Signes avant coureurs Remise en service
Limitation des interventions les utilisateurs sont prvenus avant pour que lintervention puisse tre planifie Limage de linformatique samliore Les motifs des pannes peuvent tre trouvs pour amliorer les systmes
IMPORTANT
Plus les interventions sont courtes, plus on communique sur les actions prventives - plus les usagers travailleront en nous donnant la confiance et les crdits.
AZERTY MicroSystem
!
EXEMPLE
En face de chaque test faire il faut trouver LA ou LES fonctions (commandes) de surveillance. En face de chaque commande de surveillance il faut construire les trames de rsultat qui permettront la supervision.
/var/log/.....
IMPORTANT
Prparer vos tests de surveillance en considrant tout de mme la charge CPU - faire trop de tests tue le test !
Il est capital de vrifier que ce qui est surveill remonte bien les 2 tats : OK et KO - car un tat intermdiaire peut cacher un problme...
AZERTY MicroSystem
TOME IV chapitre 2
AZERTY MicroSystem
Niveaux de dfaillance : Lgre : il sagit dun critre qui prsente un tat instable Passagre : un lment dfaille dune manire prvisible et prvue (action de maintenance qui provoque une interruption de service) Localise : la dfaillance ne provoque pas de problme de qualit de service Grave : La dfaillance affecte la qualit de service
IMPORTANT
Le niveau de gravit dune dfaillance DOIT TRE value avant quelle ne se produit - le niveau est dfini et caractris par le choix technique de surveillance.
AZERTY MicroSystem
Puisquune dfaillance peut intervenir sans prvenir - sans notre volont En serais-je responsable pour autant ?
Premier cas :Une dfaillance grave est apparue avec des lments annonciateurs (disque dur ventilateurs ...) Jen suis responsable Second cas : Une dfaillance sans lments annonciateurs (alimentation ...) Je nen suis pas responsable
A condition, toutefois, de dmontrer quaucun lment naurait pu lannoncer.
Troisime cas : Une dfaillance prvue et organise (arrt pour maintenance ...) Jen suis responsable
moins davoir communiqu suffisamment tt
IMPORTANT
Suivant le cas, la dfaillance, mme pour des oprations de routine, peut entraner notre responsabilit personnelle.
AZERTY MicroSystem
O se trouve ma responsabilit ?
4.2.3
Chaque mtier de linformatique a sa responsabilit. Il faut donc savoir o se trouve la ntre : le primtre de ma responsabilit est dcrite par lintraction avec mes collaborateurs (et prestataires).
Maintenance logiciel
Administration Systme
Exploitation
IMPORTANT
Dans lorganigramme de la Socit, nous trouvons les autres intervenants afin de dbusquer les mtiers manquants : car, nous, lAdministrateur rcuprons ces fonctions dune manire intuitive !
Il ne faut pas tre laxiste en pensant que la dfaillance pourrait tre attribue quelquun dautre.
AZERTY MicroSystem
Par exemple : (pour ce qui concerne les sauvegardes) afin de connatre limpact rel dune dfaillance, disons quil y a eu le feu, les sauvegardes sont brles Combien de temps faut-il pour tout refaire (si cest possible) ! Mesurez le cot .... A ce moment l, tout naturellement, le responsable apparat lvidence - car cest le rle de personne dautre !
Devant le cot et les consquences : cest nous de mettre en place ce quil faut pour prvenir la panne, voire mme, le sinistre
IMPORTANT
Veillez ce que les consquences dune dfaillance ne vous fasse pas tomber avec elle !
AZERTY MicroSystem
Recette de cuisine : Faites le schma et crivez ce que chacun fait en cas de sinistre.
Par exemple : Je suis responsable dune liaison WAN. Je dois donc me demander qui sera pnalis en cas de dfaillance. Il faut donc noter les responsables et les lments qui rclament une qualit de service.
Responsable A
Responsable B
}
Prvenir quand on passe en mode dgrad
Ma responsabilit
IMPORTANT
Il faut trouver les intervenants qui dpendent de mes services afin de leur cder une part de responsabilit.
AZERTY MicroSystem
4.2.6
Les devoirs dun salari : Respecter le Code du Travail Accder au devoir dAlerte Ne pas mettre en pril la Socit par notre ngligence
Si votre Socit est mise en pril cause de votre ngligence - elle peut non-seulement vous licencier pour faute grave mais aussi entreprendre des actions civiles sur le motif a cherch nuire (dommages et intrts) !
Que vous soyez Salari ou pas (prestataire, consultant ...) vous avez un Devoir dAlerte. En clair : ne pas alerter = laisser une faille qui peut nuire = il faudra en cas de poursuites, dmontrer que les faits ne vous donneraient dune manire ou dune autre, aucun avantage (vous tes considrs comme coupables !)
IMPORTANT
Ne jamais rester sans rien dire devant des choses qui peuvent provoquer une panne.
AZERTY MicroSystem
AZERTY MicroSystem
La supervision permet de dterminer quune panne (bien souvent logicielle) arrive (la face cache dun Bug). Un processus qui ne libre pas la mmoire correctement provoque une saturation - avec le temps. Un reboot est bien souvent suffisant (tous les programmeurs ne sont pas forcment bons !) Le problme arrive assez souvent avec les Routeurs. Un fichier LOG qui gonfle trop peut entraner un plantage
EXEMPLE
Ecouter un serveur ( nos oreilles) suffit bien souvent pour prvenir dune panne matrielle (ventilateur / disques durs )
IMPORTANT
EXEMPLE
La supervision sert aussi prvenir de dfaillance et donc de prparer les oprations de maintenance prventive.
AZERTY MicroSystem
Il est difficile de dmontrer quune opration de maintenance prventive soit utile ! Puisque la panne na pas eu lieu - tout au moins : pas encore !
Cest pourquoi :
1 2
Lopration doit tre organise pour ne pas perturber les usagers Il faut que le cot soit prvu et justifiable par rapport aux pannes actuelles.
Recette de cuisine : Pour justifier lopration, il suffit de dmontrer le cot du nettoyage / remplacement / reboot / archivage face au cot de la panne.
IMPORTANT
Si la maintenance prventive doit tre jusitifie par moins de panne, il faut bien quantifier les pannes AVANT.
La maintenance prventive est trs importante / mais trop de maintenance prventive sera considre comme du gaspillage !
AZERTY MicroSystem
peu de panne
trop de panne
Gaspillage
Trop de panne
!
EXEMPLE
Lopportunit = chaque signe annonciateur il y a une dure davant panne - durant laquelle il faut intervenir.
archiver les Logs tous les jours = perte de temps = inutile = cote cher
IMPORTANT
Prvoir une maintenance prventive mme loigne permet de crdibiliser notre mtier - mme si la panne arrive dans lentre temps.
La maintenance prventive doit tre prvue sur le calendrier pour juger ce moment-l si lopration est prvoir.
AZERTY MicroSystem
4.3.4
!
EXEMPLE
df | grep /dev/hda3 | awk '{print "insert into SURVEILLANCE (ORGANE, VALEUR) values (\"AZERTY/hda3\",\"" $5 "\");"}' > /tmp/addSurveillance mysql -e "\. /tmp/addSurveillance" STATISTIQUES_AZERTY
df
[root@AZERTY /]# df SysFichier /dev/hda1 /dev/hda2 none /dev/hda6 /dev/hda3 /dev/hdb1 1K-blocs 4127076 4127108 499308 27118336 2063536 29547036
grep /dev/hda3
Utilis Dispo. Util% 2427436 1489996 62% 138460 3779000 4% 0 499308 0% 119336 25621428 1% 1630084 328628 84% 10012272 18033856 36% Mont sur / /DATABASES /dev/shm /serveur /var /mnt/30go
Base de Donnes
awk '{print "insert into SURVEILLANCE (ORGANE, VALEUR) values (\"AZERTY/hda3\",\"" $5 "\");"}'
IMPORTANT
La supervision logiciel ne permet QUE de surveiller les logiciels. La surveillance matrielle est faite par lquipe exploitation.
La supervision doit tre bien faite pour servir la maintenance. Prvoir de remonter une information synthtique pour quelle puisse tre utile.
AZERTY MicroSystem
!
EXEMPLE Usagers
0 1
Une nouvelle notion : la continuit de service = service continu pour les usagers Je dois me renseigner sur les services qui doivent continuer ex: est-ce que CRON doit avoir une continuit de services? pour les usagers Il faut donc identifier les services quil ne faut pas interrompre (ODBC, Telnet, Oracle, ...) Il suffit de placer les plannings de prsence des usagers avec celui de la maintenance => continuit de service
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Maintenance
IMPORTANT
Il faut que tout ce qui peut tre fait, le soit durant les priodes de maintenance.
La supervision me permet de prparer mes oprations de maintenance sur les plages dabsence des usagers.
AZERTY MicroSystem
?
Recette de cuisine
Comment faire pour que la maintenance soit en quilibre avec la continuit de service ?
La supervision me permet de voir une dfaillance qui peut arriver.. Je vais donc crire ce quil se passe pour me faire un retour dexprience et donc : de prvoir lopration de maintenance avant mme un symptme = maintenance prventive. Pour trouver lquilibre, il suffit de planifier les oprations de maintenance prventive hors horaire des usagers. Aucun usager nest prsent environs 15 heures par jours ! et ceci sur 5 jours.
Lundi 15 h de libre Mardi 15 h de libre Mercredi 15 h de libre Jeudi 15 h de libre Vendredi Samedi Dimanche 15 h de libre 24 h de libre 24 h de libre
IMPORTANT
Prvoir damnager les horaires de travail afin de tester les procdures de maintenance prventives (r-indexer les bases de donnes, vrifier les logs, sauvegarde systme ...)
Lquilibre ne se trouve pas en 5 minutes. Des annes dexprience / des annes de supervision permettent de trouver lquilibre dans votre Entreprise.
AZERTY MicroSystem
TOME IV chapitre 4
AZERTY MicroSystem
Existe-t-il un moyen standard de superviser presque tous les organes dun rseau ? Et sil existait une norme pour connatre les informations internes dun routeur, dune imprimante, de certains HUB, de serveurs
Trame dinterrogation
Infos techniques
Trame dinterrogation
Infos techniques
Effectivement, il existe plein de moyens pour superviser automatiquement les organes dun rseau. Lun des moyens actuels standard = SNMP (ne pas confondre avec SMTP
= messagerie)
IMPORTANT
SNMP me permet de surveiller des organes rseaux (imprimantes, routeurs, hub, serveurs, station )
Les appareils superviser nont pas forcment loption SNMP / dans ce cas il faut choisir autre chose. On utilise loutil fourni avec lappareil.
AZERTY MicroSystem
Un protocole de supervision
4.4.2
La raison est simple : elle est conomique. Llment na pas besoin dtre complexe pour avoir un agent SNMP. La complexit est renvoye la console de surveillance. Quest-ce que je peux faire avec ? : Connatre ltat dun appareil => en lui envoyant une question Avec une vue sur les donnes locales => nb paquets passs Configurer => en donnant un ordre, llment peut changer sa conf Alerter => dans le protocole, un port est rserv aux alertes
UDP 161
IMPORTANT
SNMP est un protocole en 2 morceaux : la dfinition de la structure (MIB) et les trames elles-mmes.
Chaque lment possde sa propre liste dordres et de rsultats une trame SNMP.
AZERTY MicroSystem
La M.I.B.
4.4.3
sysServices OBJECT-TYPE
Il sagit dun pseudo langage qui permet de dfinir les donnes envoyer llment pour obtenir le rsultat voulu. Ce langage possde mme une aide que le constructeur nous donne pour mieux comprendre le rsultat binaire de lappareil. En SNMP, les requtes partent sous forme de code auquel lappareil rpond.
SYNTAX STATUS
MAX-ACCESS read-only DESCRIPTION "A value indicating the set of services that this entity potentially offers. The value is a sum. This sum initially takes the value zero. Then, for each layer, L, in the range 1 through 7, that this node performs transactions for, 2 raised to (L - 1) is added to the sum. For example, a node which performs only routing functions would have a value of 4 (2^(3-1)). In contrast, a node which is a host offering application service would have a value of 72 (2^(4-1) + 2^(7-1)). Note that in the context of the Internet suite of protocols, values should be calculated accordingly: layer 1 2 3 4 7 functionality physical (e.g., repeaters) datalink/subnetwork (e.g., bridges) internet (e.g., supports the IP) end-to-end (e.g., supports the TCP) applications (e.g., supports the SMTP)
For systems including OSI protocols, layers 5 and 6 can also be counted." ::= { system 7 }
IMPORTANT
Un lment compatible SNMP nest exploitable quavec sa MIB. Attention lordre des bits !
AZERTY MicroSystem
La MIB contient des informations techniques que le constructeur a jug importantes - pas forcment intressantes - pas forcment pertinentes dans le cadre de la supervision. Par ailleurs, dautres informations qui ne se trouvent pas dans le SNMP sont capitales pour la supervision (ex. tat dune base de donnes).
Dun autre cot, des informations qui semblent tre sans importance refltent des critres de supervision / par exemple : le nombre de pages qui volue vite peut reflter une surcharge du serveur dimpression. Des trames importantes sortantes du Serveur Proxy (internet) peuvent nous diriger vers une recherche de virus (spyware) dans le rseau.
IMPORTANT
Toutes les informations ne sont pas utiles - il faut non seulement les trier mais aussi les agrmenter dautres donnes.
AZERTY MicroSystem
Il existe beaucoup doutil daide la gestion dactifs informatiques (Gestion de parc) quelques uns ont t slectionns.
Soft
Avantages STANDARD Fonctionne avec presque tous les appareils rseaux Fonctionne sur ltat des ressources + vnements systmes Paramtrable directement sur le systme client (UNIX, NT, ...). Gamme de logiciels qui part de la gestion des ressources jusqu linventaire de parc. Bases de donnes centralises. Donne une vue sur ltat des services Micro$oft. Fonctionne sur toutes les plateformes et ouvert aux dveloppeurs qui veulent crer leur propre surveillance (ex. surveillance des ressources dune application propritaire). Sadapte au Bloc alarme ALRM2v5.
Inconvnients Ne fonctionne pas avec les applications (logiciels) Ne sadapte pas aux applications internes (ex. bases de donnes)
SNMP NSM
Ne sadapte pas aux applications internes (ex. bases de donnes) Compatible quavec Micro$oft
NSM : marque dpose par Computer Associates www.ca.com TIVOLI : marque dpose par IBM www.tivoli.fr MOM : marque dpose par Microsoft www.microsoft.fr CGS : marque dpose par AZERTY MicroSystem gp.azerty.fr
IMPORTANT
Chaque Logiciel a son protocole prfr. Pour les appareils : SNMP. Pour les Stations : Agents locaux propritaires.
A chaque lment contrler (de VOTRE rseau), il faut choisir le Logiciel adapt pour superviser.
AZERTY MicroSystem
Surpervision
Surveillance
Agents
lments
Mais que veut-on rellement ? Bien plus que de la surveillance, en ralit, cest, en cas de problme, dautomatiser la solution (autant que possible).
IMPORTANT
Le choix du logiciel de surveillance prend donc toute son importance (base de connaissance des pannes ...).
AZERTY MicroSystem
Le leader aujourdhui est SNMP. Dautant plus que les ordres de configurations font partie de son vocabulaire maintenant. On le trouve sur les imprimantes rseaux, les Hubs, les routeurs, les serveurs (NT, UNIX, LINUX, As400, Switch ...)
IMPORTANT
Les constructeurs poussent vers des protocoles persos tout en maintenant une compatibilit SNMP.
Les constructeurs font leurs normes. Personne ne les vrifie ! Et eux, ils ne sont pas OpenSources - do le danger pour demain.
AZERTY MicroSystem
Par contre, ds lors o lon veut surveiller, il nous faut un protocole qui soit compatible avec le reste de notre infrastructure.
SNMP
IMPORTANT
Les appareils avec un agent (SNMP) cote plus cher / il faut donc mesurer la pertinence de nos choix.
AZERTY MicroSystem
TOME IV chapitre 5
AZERTY MicroSystem
Outil de supervision
4.5.1
Surpervision
Surveillance
Agents
lments
Remonte dalertes
IMPORTANT
Il ne faut pas multiplier les outils de supervision / car ladministration devient trop lourde.
AZERTY MicroSystem
Surpervision
Surveillance
Agents
lments
Alertes
Alertes Collisions
Le rle de ladministrateur est de dfinir les organes surveiller / ce quil faut surveiller et trouver ce quil faut faire chaque alerte.
IMPORTANT
Aprs la remise en service, il faut trouver le motif de la panne pour quelle ne se reproduise pas (si possible) pour certains routeurs le reboot rgulier est ncessaire (le sachant, nous prvoyons alors de la maintenance prventive rgulire.
CE QUIL FAUT RETENIR
La dfinition de notre primtre nous montre ce quil faut surveiller / il faut lister chaque lement.
AZERTY MicroSystem
Il y a moyen de paramtrer directement sous UNIX les agents UNIX avec les outils et les commandes locales !
NSM
A chaque vnement nous pouvons attribuer un batch de commandes ou des commandes vers lagent local.
Agent Windows (toutes les versions) Vue sur les Ressources / CPU/ mmoire / Disques / processus SNMP Nb de pages / nb paquets / Collisions / connexions
IMPORTANT
Avantage : NSM possde plein dautres fonctions (ordonnancement) Inconvnient : Son prix / documentation incomprhensible
AZERTY MicroSystem
TIVOLI
Une assistance est donne sur les alarmes mais il ny a pas vraiment de script bidirectionnel. Lancement de Batch
IMPORTANT
Avantage : Les donnes sont traites et places dans une base de rfrence (Gestion de parc) Inconvnient : Ne rsout pas la problmatique de rponse automatique une alerte.
CE QUIL FAUT RETENIR
TIVOLI nest pas vraiment un concurrent de NSM car ses fonctions dinventaire le cloisonne des clients de Gestion de Parc.
AZERTY MicroSystem
CGS
Une hirarchie de serveurs et de consoles permet chaque administrateur dempiter sur le terrain des autres - sans y interagir.
Admin Serveurs Agent Serveur Routeur en SNMP Agent SNMP Imprimante Responsable Imprimante Agent serveur dimpressions
IMPORTANT
Avantage : Les donnes sont traites et places dans une base de rfrence (Gestion de parc) + rponse automatique aux vnements. Inconvnient : Ne sera commercialis quen juin 2005.
CE QUIL FAUT RETENIR
CGS (SoftsCheckers) ouvre ses informations internes de fonctionnement afin que les administrateurs puissent crer eux-mme un agent compatible avec tous les autres.
AZERTY MicroSystem
CERUS Informatique a dvelopp LandPark. Il sagit dun logiciel de gestion de parc qui migre doucement doucement vers la supervision... (quavec SNMP et son agent dinventaire).
Nous sommes prvenus sil manque des feuilles dans limprimante cool ! Mais il faut que nous regardions la fiche de limprimante dans le logiciel pour le savoir .... pas cool .........
AZERTY MicroSystem
Agent local en ShellScript par exemple / avec un cron il teste llment surveiller
Le rsultat est mis dans un fichier... pour que le prog de surveillance vienne le vrifier...
Lagent de surveillance va traiter le fichier brut afin de lpurer des donnes inutiles et les ajoute aux vnements prcdents / idalement vers une base de donnes.
mv /var/log/maillog /var/log/maillog_dummy cat /var/log/maillog_dummy | grep sendmail | awk '{print "insert into MAILSLOG (CLEF, QUI, QUOI, DTE) values (\"" $6 "\",\"" $7 "\",\"" $0 "\",\"" $1 " " $2 " " $3 "\");"}' > /tmp/mailadd echo 'update MAILSLOG set SENS = "F" where ((QUI like "from=%") AND (isnull(SENS)));' >> /tmp/mailadd mysql -e "\. /tmp/mailadd STATISTIQUES_INTERNET rm -f /tmp/mailadd cat /var/log/maillog_dummy >> /var/log/maillog_HISTORY rm -f /var/log/maillog_dummy /etc/init.d/syslog restart > /dev/null
Loutil de supervision ouvre la base de donnes afin dy voir les informations linaires et sous forme de requte afin davoir une visibilit claire. Loutil de supervision peut tre fait en PHP par exemple.
IMPORTANT
Attention, lagent local doit tre rapide et sans blocage car il pourrait engendrer des soucis involontaires.
AZERTY MicroSystem
AZERTY MicroSystem
Imaginons que les incidents ne soient pas nots / comment trouver alors une rcurrence aux pannes ?
Un Help-Desk permet de noter les incidents et dy indiquer la rsolution. Au dbut, cest un bloc note de ce quil se passe Cest, vrai dire, assez peu rjouissant et fastidieux ... Rapidement, il devient un allier car, lorsquune panne ou un soucis apparat, ces informations (du pass) nous aide rsoudre le problme du moment ! Toutes les informations sappellent : une base de connaissance ou un Help-Desk. Bien sr, la mthode de rangement des informations est capitale ! Il faut ranger les donnes par thme et sous forme darbre logique.
IMPORTANT
Un Help-Desk est obligatoire / noublions pas quil est notre allier - dautant plus lorsquon est plusieurs informaticiens.
CE QUIL FAUT RETENIR
Avoir une base de connaissance permet aussi de mesurer le taux dincidents afin dtre transparent.
AZERTY MicroSystem
Ne serait-il pas intressant de pouvoir transmettre (un peu comme un Email) les donnes techniques + infos du problme la personne responsable ? Et bien, un tel logiciel sappelle un WorkFlow !
Nous regardons les serveurs, les droits Et il se trouve que a incombe au responsable des imprimantes (Pb matriel par ex).
+ prcisions techniques
Le responsable imprimante se voit confier la mission avec la prcision que ce nest pas un problme rseau
Le WorkFlow est un logiciel assez facile mettre en place (ou en lachetant) / il permet de mler les comptences et le flux dinformation entre services. Un peu comme un Mail, mais visible des autres intervenants.
IMPORTANT
Lutilisateur est notre client (baromtre), veillons ce quil ait le maximum dinformations.
AZERTY MicroSystem
Le service qualit peut vrifier que tout est OK pour rpondre lutilisateur.
FAIT
Le responsable applications ou DBA cre son tour le compte avec les droits.
IMPORTANT
Avec un tel schma, nous ne perdons plus de temps / et les utilisateurs sont contents aussi !
Bien plus que tout a, le travail en WorkFlow permet de garder en historique les interventions ou les missions.
AZERTY MicroSystem
A chaque demande du genre changer les droits / crer un compte, il nous faut noter QUI, QUAND, QUOI et POURQUOI nous le faisons. Bref, il nous faut ces donnes (dune manire ou dune autre). Le Help-Desk, aussi simpliste soit-il, rpond notre soucis de se souvenir pourquoi on a cr un compte le 10 janvier 2092 pour cocolapin ?!? Certaines socits exigent des traces papiers.
quand
qui
quoi
nd e qua jusqu + nd e qua jusqu +
pourquoi
fait le
IMPORTANT
A chaque mission dadministration / pensez documenter le pourquoi, qui, quand, quoi et jusque quand
On oublie souvent le jusque quand - cette information est capitale pour un accs de scurit.
AZERTY MicroSystem
Panne A
Panne A
Panne A
} }
IMPORTANT CE QUIL FAUT RETENIR
Il sagit dun travail long et peu pationnant, mais il est notre force de demain.
2 mois
2 mois
1 mois1/2
AZERTY MicroSystem
Envoyer AdmRseau Envoyer Resp.Impr. Envoyer AdmRseau Clture par AdmRseau Clture par D.I.
Interventions
IT 40 41 42 43 45 46 Date Pos .. .. .. .. .. .. 1 5 2 3 2 4
Lors du Login de Cocolapin => groupe Adm.Rseau Il se positionne sur la fiche en cours pour Lui : une liaison entre Interventions.Pos == WorkFlow.Pos Et ne liste que ceux pour EtatCourant == 3 (Adm.Rseau) La liste des fiches pour Cocolapin : 42, 45 et 46 Ds que la fiche saffiche / les boutons sont rafrachis en bas : exemple la fiche 42 : Pos = 2 , EtatSuivant de Pos 2 = 3 donc nous listons tous les boutons qui ont un EtatCourant == 3 en mettant InfoBouton dans le bouton de WorkFlow / ds que lon clique, la Pos du Bouton met jour la Fichier Interventions. Bien sr, il est conseill davoir un historique des actions en y mettant une zone commentaire pour le suivant.
Interventions
IT 40 41 42 43 45 46 Date Pos .. .. .. .. .. .. 1 5 2 3 2 4
WorkFlow
Pos EtatCourant EtatSuivant EtatCourant 1 2 3 4 5 6 1 1 3 2 3 1 1 3 2 Entre infos Chez lAdm Rseau Chez le Resp. Impr. Clture Clture Avorte InfoBouton de celui qui ma mis
ds cet tat
Envoyer AdmRseau Envoyer Resp.Impr. Envoyer AdmRseau Clture par AdmRseau Clture par D.I. Bloque la rception
Boutons pour cette fice
AZERTY MicroSystem
THEMES
code 1 2 3 4 5 Libell HUB Routeurs Serveurs Linux NetGear Thme parent
Les thmes sont rangs comme un arbre de pointeurs. Dune manire linaire, nous reconstruisons trs simplement larbre.
3 2
FICHES
N 1 2 3 4 5 Thme Motif 1 5 4 5 5 fil dbranch SNMP tomb Crer un compte Ajouter une trame faire un test Solutions apports rebrancher rebooter le routeur adduser interface HTTP://... connexion WIFI
autres infos
Le Help-Desk doit avoir une interface la plus simple possible, sinon, nous ny rentrerons pas grand chose. Exemple dcran sur LANDPARK
AZERTY MicroSystem
TOME IV chapitre 7
AZERTY MicroSystem
Ce concept ne permet non pas de fliquer les dlais (quoique), mais de ne pas mettre trop de temps rgler les problmes. En gnral, on sen sert pour refaire une relance par Mail la mme personne qui le dossier a t pass.
IMPORTANT
Lescalade est utile, voir ncessaire, lorsquil y a plusieurs intervenants - a vite les dossiers bloqus.
Ca demande une bonne entente dans le groupe de travail afin que lescalade ne soit pas mal vcue.
AZERTY MicroSystem
Dossiers date date darrive chez lacteur actuel numro de lacteur actuel
Escalades Numro acteur actuel Dlais pour passer au suivant Numro acteur suivant
Si date darriver chez lacteur actuel + dlais pour passer au suivant Where numro de lacteur actuel = Numro acteur actuel Alors Numro de lacteur actuel = Numro acteur suivant date darrive chez lacteur actuel = now()
IMPORTANT
Il ne sagit que de requtes SQL / beaucoup de logiciels de Help-Desk grent les escalades.
La gestion des escalades napporte gnralement pas de solution / elle ne fait que transmettre lautre les interventions effectuer.
AZERTY MicroSystem
Mail dalerte
Demande dintervention
Mail dalerte
Mail Garde-Fou
IMPORTANT
Il faut toujours prvoir quelque chose avant que les dlais ne sortent du raisonnable.
Pensez dterminer des dlais raisonnables pour chaque action / cest la frontire entre la transparence et le professionnalisme.
} }
1ier dlais
2ime dlais
3ime dlais
4ime dlais
AZERTY MicroSystem
Alerte maximale
Le rle de lAdminstrateur
4.7.4
LAdministration systme est au centre du rseau de lEntreprise. Et cest pour cela que nous en parlons aujourdhui. Car effectivement, dans toutes les Grandes Entreprises, il y a une Hot-Line (interne) qui route les appels au travers dun WorkFlow (ou dun organigramme). Quelque soit lEntreprise (voire mme la ntre), nous sommes au centre des escalades. A nous donc dtre exigeant car le moindre appel peut cacher une faille importante de la scurit.
Accs scuris
IMPORTANT
Mme un administrateur ne peut pas connatre tous les accs extrieurs ! Un simple portable avec un Modem Maintenant du WIFI Mais grce aux appels (quil ne faut pas laisser monter en escalade) nous construisons le VRAI rseau.
Lcoute et la rponse aux utilisateurs est notre seule chance lorsquon entre dans une Entreprise (PME).
AZERTY MicroSystem
}} }}
Dure durant laquelle, si votre collaborateur ne fait pas vite son travail, il peut y avoir des consquences sur la scurit !
}
IMPORTANT
1ier dlais
2ime dlais
Mail dalerte
En tant quagent de scurit, nous devons tre attentifs toutes les demandes des utilisateurs / mme si a ne nous concerne pas ( priori).
Malheureusement, les Entreprises nont pas encore compris que lagent de scurit est le passage oblig pour toutes les demandes non pas pour y rpondre !
1ier dlais
2ime dlais
Dlais durant lequel le rseau est vulnrable / dautant plus avec un accs RAS !!!
AZERTY MicroSystem
Ralisation
Comment sassurer que notre fonction nest pas en pril cause des escalades ? Lexemple prcdent est un peu la preuve quune escalade mal implmente peut provoquer des soucis srieux de scurit ! Avec lusage, les ajustements raliser nous sauterons la figure / condition dy tre attentif. Grce aux outils tels que le Help-Desk, WorkFlow et Supervision, nous limitons srieusement les imprvus et les on ne pouvait pas lviter (Bouyues Telecom Nov.2004)
IMPORTANT
Rien ne peut, priori, nous dire que la dfinition des escalades est correcte / cest pourquoi regarder les dlais de ralisation permet bien souvent de limiter la casse en relanant humainement lacteur en retard ou laxiste.
Le meilleur administrateur passera pour quelquun dinutile puisque tout va bien... Le mme administrateur qui utilise le Help-Desk et le WorkFlow passera pour un expert car il rsolve tous les soucis ! A nous de choisir !
AZERTY MicroSystem
Autant ces mthodes pseudo-techniques sont indispensables, autant, ne rien changer dans lOrganisation malgr les anomalies, nous lasse ! Comme indiqu juste avant, ces outils nous permettent non seulement de valoriser notre travail mais aussi de pouvoir amliorer nos recherches de pannes au niveau de la supervision. ex: IIS (de Micro$oft) tombe souvent en rade il y a de nombreux appels pour cela. Il nous suffit de crer un agent de surveillance du type HEAD / HTTP/1.1 sur le port 80 sur serveur. Le dlais de rponse nous donne sa sant instantane. Notre supervision nous permet alors de prvenir une dfaillance avant mme les appels et raliser nos oprations de maintenance prventive afin que le soucis ne paraisse plus quand les usagers sont l (Reboot du service pour IIS / Micro$oft oblige).
IMPORTANT
Ne pas croire que les appels puissent cacher un autre problme est souvent le reflet dun manque dorganisation.
AZERTY MicroSystem
AZERTY MicroSystem
lments
Bien souvent loutil de supervision contient les agents de surveillance. Inutile de dire que le CPU de la console doit tenir la route !
IMPORTANT
Tout est sur la mme machine / les sauvegardes sont uniques / en cas de crash : plus rien nest surveill.
AZERTY MicroSystem
Bien souvent, la supervision sappelle une console. Les agents de surveillance sont sur dautres machines, si possible le plus parpills possible afin de rpartir la charge CPU du traitement des informations (purations).
IMPORTANT
Ce type darchitecture rpond bien une supervision de Grande dimension (plusieurs centaines dagents).
Seules les informations traites sont stockes en base de donnes. Les infos donnes aux agents de surveillance ne sont pas stockes.
AZERTY MicroSystem
Avantages de la centralisation : Le cot (1 seule machine) La gestion des agents, puisquils sont sur le serveur
lments Surveillances Surpervision Agents
Avantages de la dcentralisation : Le CPU est pargn sur la console Chaque Agent est autonome Les agents ne consomment presque rien sur les stations clientes
IMPORTANT
Chaque architecture a ses avantages ! Le choix viendra trs certainement de la taille de votre Rseau.
Attention : tous les logiciels ne permettent pas le choix darchitecture Cest pourquoi il faut choisir le logiciel de surveillance en rapport avec la taille du Rseau.
AZERTY MicroSystem
Trouver un quilibre
4.8.4
Inconvnient de la centralisation : Le CPU de la console ne sert plus qu a. Lors dune panne / nous sommes aveugles Les bases de donnes sont immenses car elle enregistrent, bien souvent, tous les vnements
lments Surveillances Surpervision Agents
Inconvnient de la dcentralisation : Lorsque quune station o se trouve un agent, plante / nous devenons aveugles sur ce quelle surveillait. Nous ne pouvons pas voir le dtail des trames de surveillance.
IMPORTANT
Toutes les solutions ont leurs inconvnients / il faut les connatre pour sy prparer.
Attention : tous les logiciels ne permettent pas le choix darchitecture Cest pourquoi il faut choisir le logiciel de surveillance en rapport avec la taille du Rseau.
AZERTY MicroSystem
IMPORTANT
Attention, cette solution demande bien souvent des agents propres la plate forme !
Il ny a pas de solution magique. Mesurez dabord limpact de vos choix sur votre planning car il est bien souvent prfrable de dmarrer par une solution centralise pour partir peu peu vers une solution dcentralise en sarrtant lorsque lquilibre CPU est atteint.
AZERTY MicroSystem
NSM
IMPORTANT
Ne pas se jeter sur ce que dit la presse - mme celle de Linux / ils mlangent souvent Bidouille & professionnalisme.
Lisons la presse car elle dnote les tendances pour se remettre en question avec les nouveaux outils.
AZERTY MicroSystem
Si nous avons dj un Logiciel : nous navons plus le choix ! Il faut se soumettre la politique de lditeur Si je reste libre (outils perso) je minspire des rflexions de la presse et des diteurs pour que ma supervision rponde ce que jattends delle !
IMPORTANT
Dans tous les cas : Attention aux dfauts cachs ! - Les mails dalerte ne partent QUE si notre serveur de messagerie fonctionne (et internet) ! - Les SMS dalerte ne partent QUE si Internet fonctionne - Les alertes crans ne sont utiles que si vous tes devant lcran (pas de RTT).
Je prvois toujours de prvenir quelquun dautre en cas dabsence / une console sur une seconde station.
Ca vous semble bte aujourdhui ? Ca le sera moins demain ! Pensez tous ceux qui ont plac leur scurit sur le tlphone portable quand BOUYGUES est tomb !!! Depuis, AZERTY MicroSystem commercialise un botier electro-informatique de surveillance / alarme...
Quels sont les outils daujourdhui de supervision rseau LAN/WAN
AZERTY MicroSystem
AZERTY MicroSystem
Avant tout, il faut dfinir notre primtre daction Pour y parvenir facilement, voici une mthode : 1. dfinir les agences 2. dfinir les relations entre elles (routeurs, pont, WIFI ...) 3. trouver les relations de backup (+ accs externes RAS) 4. dfinir les rseaux et sous- rseaux 5. dfinir les plate formes de communication pour circulation des flux de supervision
Agence A
Agence B
4 2 3 3
Accs vers portables / accs clients
IMPORTANT
Nous navons pas le droit la bidouille ! Lapproche doit tre mthodique afin de ne rien oublier (autant que possible).
Aprs avoir fait le schma, il faut le faire valider, car les anciens en savent toujours plus que nous (en arrivant).
AZERTY MicroSystem
Agence B
lments
Petit rappel (qui ne fait pas de mal) : Un routeur possde plusieurs adresses IP. Donc, pour connatre le motif de la panne, voici un petit tableau simple.
ip WAN ip SNMP LAN Routeur externe ip ip WAN LAN Routeur Interne Motif
ok ok
ok
ok
ok ok ok
ok ok ok ok
tout va bien Routeur externe a un problme Liaison FT en rade routeur en rade ? Ma station na pas la bonne passerelle FT en rade je ne vois pas le bon rseau
ok
ok
ok
IMPORTANT
La mthode de DEBUG fonctionne condition de laisser lICMP sur les routeurs (ping).
A chaque lment, vrifions bien que nous avons lAgent de surveillance adapt (SNMP, ICMP, UDP ...)
Quels sont les outils daujourdhui de supervision rseau LAN/WAN
AZERTY MicroSystem
Il est facile de dire quil faut escalader - mais comment fait-on rellement ? (sans logiciel qui le fait) En face de chose qui ncessite une escalade, il faut dterminer les responsables prvenir (Email par exemple). Prenons un exemple : tester une ligne LS entre 2 routeurs. La mthode du ping est la plus simple et la plus rapide ( condition de ne pas avoir inhib les trames ICMP sur les routeurs). Si 3 fois ping sans rponse avec un intercalaire d 1 minute => mail admin Si 10 fois ping sans rponse avec un intercalaire d 1 minute => mail SMS
OK=`ping -c 1 www.tf1.fr | grep "1 packets received" | awk '{print $2}'`
En ralit, il sagit de 2 oprations diffrentes : Lun vrifie le Ping Lautre compte et envoie le mail
case "_$OK" in _packets*) # Connexion OK # effacer laugmentation de nombre dalertes ;; *) # Connexion tombee # il faut incrmenter puis, si 3 => envoyer un mail ;; esac
cat /etc/HOSTNAME > /tmp/mailOK date >> /tmp/mailOK mail -s `cat /etc/HOSTNAME` jfcasquet@yahoo.fr < /tmp/mailOK
IMPORTANT
EN prparant mes escalades - je prpare aussi lorganisation qui doit y faire face (ici mes collgues).
Grce au Help-Desk, mme si je suis en vacances, mes collgues pourront consulter la base de connaissance afin de faire ce quils doivent (tests faire, appeler FT ...)
AZERTY MicroSystem
Maintenant que jy suis, certaines alertes peuvent tre transmises dautres personnes. Bien souvent, ladministrateur est considr comme un hermite la supervision va permettre aussi de provoquer des changes constructifs de collaboration avec des BDA, programmeur, quipe dploiement applicatifs
Exemple : Nous sommes administrateur LAN en multisite. SI la liaison WAN tombe, ce nest pas de notre responsabilit mais, sans cette liaison, notre supervision tombe et les utilisateurs sont gns. Donc, dans nos tests, a ne nous cote pas grand chose de vrifier la liaison WAN (si son responsable ne le fait pas), afin de se rassurer sur nos installations et de prvenir le vrai responsable.
IMPORTANT
Nous sommes au coeur du Systme dinformation. Si une partie de lentreprise ne va pas bien, nous sommes les premiers impliqus / pensons donc, avec nos outils et nos ides, ce qui peut faire que le monde tourne mieux.
Les outils persos peuvent tre Netstat, ping, ssh, cat / grep, awk
AZERTY MicroSystem
4.9.5
Grce encore une fois, au Help-Desk, nous mesurons quand a va Bien souvent, on entend (de la part des services informatiques) on courre toujours... En ralit, grce au Help-Desk, nous pouvons mesurer le nombre dappel par jour + le temps de rsolution moyen - diviss par le temps de travail (hors congs) - a nous donne le nombre de personnes ncessaires au minimum dans lquipe informatique. Lorsque lquipe est de taille normale, et que les alertes (appels) sont en nombre normal, la surveillance est optimale puisquon prend le temps de voir si tout va bien. Une supervision tient la route quand on gre les incidents !
IMPORTANT
Si lquipe est trop petite, nous sommes les pompiers / ce moment l, prenons du temps lorsque les utilisateurs ne sont pas l pour mesurer les motifs des appels afin de rorganiser le travail ou daugmenter lquipe.
La supervision me permet danticiper seulement si cest humainement possible / Dans tous les cas, il faut prciser les soucis trouvs, pour les inscrire dans le Help-Desk.
AZERTY MicroSystem
4.9.6
Un tat de CRISE peut venir de plusieurs origines : Une panne blocante Trop dappels Une priorit qui met tous les appels en attente Des appels nombreux pour le mme motif Afin dviter les escalades automatiques qui viendraient sajouter la crise, prvoyons un tat de crise qui bloquera toutes les alertes. A ce jour, seul SoftsChecker (CGS) lenvisage ! Si nous faisons nos propres agents de surveillance, pensons intgrer cette option. Exemple Sous UNIX : Le chemin : /BACKUP/Agents/ contient tous les shells appels avec CRON pour la gestion des escalades et alertes. Le chemin : /BACKUP/AgentsEnCrise/ contient tous les shells vides. Ds que la crise arrive, les 2 chemins sont alors inverss
IMPORTANT
Najoutons pas un autre stress celui dune priode de crise - pensons nous prparer. Par exemple, prparons des messages (WALL) pour les usagers + mails explicatifs...
Un jour ou lautre, nous vivrons une crise - prparonsnous le mieux possible pour laffronter avec professionnalisme / par ailleurs, prvenir nous donne encore du temps car les usagers seront patients.
AZERTY MicroSystem
Se prparer au reporting
4.9.7
Nous abordons maintenant la partie appele Qualit de la supervision. Que a aille bien ou pas - il nous faut prparer des reportings afin de mettre en exergue les choses que lon ne voit pas. Reporting = Requtes visuelles En prparant des requtes dans tous les sens, certaines vont paratre intressantes...
par intranet :
IIS
Linux
0h ce graph montre que lintranet sur IIS fonctionne avec de gros besoin de maintenance humaine.
12h Ici, nous voyons clairement que les usagers se servent dinternet pour jouer le midi : RISQUE VIRAL et SPYWARE trs important !
24h
IMPORTANT
Les reportings ne sont QUE des requtes SQL sur les informations stockes dans le Help-Desk et WorkFlow.
Faire du reporting (mme inutile) montre aussi notre transparence + crdibilit + professionnalisme. Des fois, ils servent aussi noyer le poisson ;-)
AZERTY MicroSystem
Tableaux de Bord
4.9.8
Les reportings ne sont QUE des requtes avec des schmas (excel / OpenOffice / ou directement en PHP) - sans commentaire. Nous pouvons tre amens faire une tude sur le remplacement des routeurs BayNetworks pour migrer vers NetGear . Les reportings vont nous montrer des interventions nombreuses sur les routeurs. Ce type dinformation demande non plus de faire nimporte quelle requte mais de sinterroger sur les rsultats rcurrents. Cest lune des missions principales des RI.
fvrier
Routeurs
mars
Routeurs Linux UNIX
IMPORTANT
}
moyenne
Routeurs Linux UNIX
Un tableau de bord nest pas technique - il rpond un besoin lors dun runion de travail avec un comit directoire pluri-comptence.
CE QUIL FAUT RETENIR
Des tableaux de bord me permettent une srnit. Car les lments tranges des reportings sont tudis & comments afin de savoir si cest un Bug rpar ou un dfaut matriel.
AZERTY MicroSystem
Conclusion
TOME IV chapitre 10
AZERTY MicroSystem
Ma responsabilit
4.10.1
Elle dpend du rle que je joue dans lEntreprise / mais dans tous les cas la supervision sera, pour moi, loutil de ma srnit et la dmonstration de mon professionnalisme.
toutes mes interventions + type de rsolution sont nots dans mon Help-Desk.
Rapport mensuel
AZERTY MicroSystem
Programmation
Dpannage ustilisateurs
AZERTY MicroSystem
Vous souhaitez en savoir plus, ou prendre contact : Jean-Franois Casquet jfcasquet@yahoo.fr AZERTY MicroSystem http://gp.azerty.fr jfcasquet@azerty.fr
AZERTY MicroSystem
SOMMAIRE
Prsentation Jean-Franois Casquet : Formation / cursus / exprience Pourquoi superviser un rseau ? 4.1.1. Qu'est-ce qu'un rseau (les origines) ? 4.1.2. Que veut dire "Superviser" ? 4.1.3. Diffrence entre superviser et surveiller ? 4.1.4. Pourquoi superviser ? 4.1.5. Pourquoi ne pas attendre la panne ? 4.1.6. Oui mais : comment faire ? Quels sont les impacts rels d'une dfaillance ? 4.2.1. Qu'est-ce qu'une dfaillance ? 4.2.2. Suis-je responsable d'une dfaillance ? 4.2.3. O se trouve ma responsabilit ? 4.2.4. Comment mesurer les impacts rels d'une dfaillance ? 4.2.5. Comment rpartir ma responsabilit sur les vrais acteurs ? 4.2.6. Que dit la loi sur ma responsabilit ? Comment faire la frontire entre la supervision et la maintenance prventive ? 4.3.1. Qu'est-ce qu'une maintenance prventive ? 4.3.2. Comment mesurer le cot d'une maintenance prventive ? 4.3.3. Juger de lopportunits de la maintenance prventive ? 4.3.4. Comment se servir de la supervision (prvenir les pannes) ? 4.3.5. Dans un monde de supervision et de continuit de service ... 4.3.6. Equilibrer continuit de service et maintenance A quoi sert le protocole SNMP ? 4.4.1. Un moyen standard de supervision ? 4.4.2. Un protocole de supervision ? 4.4.3. La M.I.B. 4.4.4. Eplucher les informations 4.4.5. SNMP et les autres protocoles 4.4.6. Vers quel type de protocole va-t-on ? 4.4.7. Vers un protocole universel ? 4.4.8. Comment choisir mes appareils ? Quels outils de supervision : NSM / TIVOLI / CGS 4.5.1. Outil de supervision ? 4.5.2. Le rle pour un Administrateur Rseau 4.5.3. NSM : atouts et faiblesses 4.5.4. TIVOLI : atouts et faiblesses 4.5.5. CGS : atouts et faiblesses 4.5.6.Les 'autres outils du march 4.5.7. Crer son propre outil de surveillance Qu'est-ce qu'un Help-Desk & WorkFlow ? 4.6.1. Qu'est-ce qu'un Help-Desk ? 4.6.2. Qu'est-ce qu'un WorkFlow ? 4.6.3. Faire jouer les acteurs ensemble 4.6.4. Organisation & Srieux 4.6.5. Les alertes bien gres 4.6.6. Comment dvelopper un WorkFlow ? 4.6.7. Comment dvelopper un Help-Desk ? Comment grer les escalades ? 4.7.1. Qu'est-ce qu'une escalade ? 4.7.2. Comment grer les escalades ? 4.7.3. Pas descalades maximales! 4.7.4. Le rle d'un Administrateur 4.7.5. Le rle d'un Agent de Scurit dans lescalade 4.7.6. Mes escalades sont-elles correctes ? 4.7.7. La mise jour de l'Organisation
4.2.
4.3.
4.4.
4.5.
4.6.
4.7.
AZERTY MicroSystem
SOMMAIRE
4.8.
Une supervision centralise ou dcentralise : que choisir ? 4.8.1. Qu'est-ce que la centralisation 4.8.2. Qu'est-ce que la Dcentralisation 4.8.3. Avantages des 2 approches 4.8.4. Trouver l'quilibre ? 4.8.5. Gestion semi-centralise 4.8.6. Que dit la Presse ? 4.8.7. Comment faire son choix ? Comment garantir que ma supervision est correcte et complte ? 4.9.1. Primtre daction / mthode 4.9.2. Mettre en place les moyens techniques 4.9.3. Prparer les escalades 4.9.4. Rpartir les rayons d'action 4.9.5. Une organisation normale 4.9.6. Une organisation en crise 4.9.7. Se prparer au "reporting" 4.9.8. Tableaux de bord Conclusion 4.10.1. Ma responsabilit 4.10.2. Les enjeux professionnels 4.10.3. Se reposer sur une Mthode
4.9.
4.10
AZERTY MicroSystem