Documente Academic
Documente Profesional
Documente Cultură
I - Introduction
Le terme d'analyse des donnes recouvre en fait diverses mthodes partir desquelles on collecte, organise,
rsume, prsente et tudie des donnes pour permettre den tirer des conclusions et de prendre des dcisions.
Mais quoi donc servent toutes ces donnes ? Les donnes servent obtenir de linformation, et linformation sert
dcider, agir.
Exemples :
1 - Le mdecin analyse les donnes dun patient pour effectuer un diagnostic et tablir une ordonnance
2 - le politique analyse les donnes conomiques pour connatre la situation et dcider dactions
3 - le qualiticien analyse les donnes dun produit pour le tester et tablir un plan damlioration de la qualit
4 le gestionnaire analyse les donnes comptables pour connatre ltat financier de son entreprise et pour
proposer, par exemple, des rductions de dpenses,.
Nous ne pouvons donc pas chapper aux donnes. Mais pour passer des donnes aux informations et de
linformation la dcision, il faut de la mthode.
II - Mthodologie de linformation
Lanalyse des donnes est un processus qui met en jeu une mthodologie possdant les lments principaux
suivant :
1
Classification et Analyse de donnes Introduction
4
Classification et Analyse de donnes Introduction
5
Classification et Analyse de donnes Introduction
(g) les rfrences bibliographiques, les sources de donnes et les logiciels utiliss doivent tre mentionns.
6
Classification et Analyse de donnes Introduction
Exemples :
7
Classification et Analyse de donnes Introduction
(1) Les tailles, les poids de personnes sont des variables quantitatives,
(2) Les pourcentages, les taux, les ratios associs des indicateurs sont des variables quantitatives,
(3) Lopinion dune personne exprime dans une enqute selon la question : tes vous satisfait du service
X ? induit une variable qualitative, la question et plusieurs catgories de rponses : oui, je suis satisfait ;
non, je ne suis pas satisfait ; je ne sait pas rpondre. Ces trois rponses possibles sont les modalits de la
variable qualitative,
(4) Dans une enqute de population, les renseignements suivants induisent des variables qualitatives : le sexe,
la classe dge, le type de diplme, le type de statut civil ; le type de profession.
Variable statistique discrte et variables statistique continue :
Variable statistique discrte :
Si les valeurs possibles sont des valeurs isoles. Ex : Nombre denfants
Donc deux sortes de variables quantitatives : Les variables quantitatives discrte et les variables
quantitatives continue.
Exemples : la variable Nombre de tlviseurs par famille peut prendre les valeurs 0, 1, 2, 3, mais ne
prendra jamais la valeur 2.5 ou 1.7
Par contre la variable Surface dexploitation agricole pourrait a priori prendre nimporte quelle valeur
relle positive. Si lon rencontre des exploitation de 2 ou 3 ha, il est matriellement possible den rencontrer
aussi de 2.12 ha, ou 2.36 ha, etc on dira que la variable Surface est continue, alors que la variable
Nombre de tlviseurs par famille est discrte.
Une variable quantitative est discrte si elle ne peut prendre que des valeurs isoles, gnralement
entires. Elle est continue si ses valeurs peuvent tre nimporte lesquelles dun intervalle rel.
On peut de mme diffrencier plusieurs sortes de variables qualitatives.
Une variable est ordinale si lensemble des catgories est munie dun ordre total.
Exemple : taille de vtement : XS < S < M < L < XL < XXL
Il faudra, notamment pour les reprsentations graphiques, prsenter toujours les modalits dans lordre.
Rpartition dune population en fonction de sa taille vestimentaire
8
Classification et Analyse de donnes Introduction
Mais gnralement les variables qualitatives sont uniquement nominales : il ny a aucune raison dcrire
les modalits possibles dans un ordre plutt que dans un autre.
Exemples : - Couleur des yeux (bleus, verts, noirs,)
- Qualit dune production (bonne, mauvaise)
Dans le cas particulier o il ny a que deux modalits , on dit que la variable est dichotomique.
Exemples : Sexe (M et F, 1 ou 0), qualit (Bonne ou mauvaise), etc
9
Classification et Analyse de donnes Introduction
I dsigne lensemble des rgions ; X lindicateur dinefficacit. x1 , x 2,... , x i ,...., x n Dsigne lensemble des
valeurs de lindicateur X pour la rgion notes 1,2,,n. x i est la valeur de linefficacit induit une variable
quantitative.
On aurait pu prendre une population I laquelle on aurait pos une seule question de type rfrendum et laquelle
ou peut rpondre seulement oui ou non mais qui induit dautres modalits de rponses : vote blanc ; vote
abstention. Quatre modalits de rponses auraient t retenues et elles auraient t codes, par exemple, 1 pour
oui, 0 pour non, 2 pour abstention, 3 pour blanc. On aurait eu le mme modle de tableau de donnes avec pour
x i le vote exprim par la personne indice i au rfrendum.
10