Documente Academic
Documente Profesional
Documente Cultură
Une fois acheve la "rcolte des donnes" par questionnaire, par entretien ou par toute autre mthode, celles-ci doivent tre structures et analyses. En fonction de la mthode utilise, les donnes rcoltes sont comptes, rsumes, calcules ou interprtes, puis prsentes de manire en obtenir une bonne vue d'ensemble. Des connaissances spcifiques sont ncessaires cet effet
Quand les donnes rcoltes sont examines et structures. Il existent des programmes lectroniques qui facilitent le traitement de donnes numriques (par exemple Excel, SPSS) et de donnes verbales (par exemple Microsoft Word, Atlas-ti, ).
Dfinition
Le logiciel (SPSS) est un logiciel de gestion et d'analyse de donnes statistiques de porte gnrale. Le logiciel SPSS constitue un systme de traitement de donnes permettant, partir de fichiers SPSS ou partir dautres types de fichiers (Excel, Dbase, Access ) de gnrer divers tableaux, graphiques et diagrammes ou encore deffectuer divers traitements statistiques ( descriptive / rfrentiel).
Utilisation
On peut utiliser le logiciel SPSS pour effectuer diffrentes tches, comme par exemple: A) La prsentation des donnes sources On peut importer ou saisir en direct des donnes dans une feuille de tableur prsente dans le logiciel. Le Copier - coller de tableau permet de rutiliser en chane les valeurs rsultats de tableau. On peut trier des rsultats. . Le logiciel permet la division et l'clatement de fichiers. La cration d'une nouvelle variable est possible partir d'autres variables et de formules.
Toutes les oprations de base (cart-type, moyenne, variance, mdiane, mode, etc...) peuvent tre ralises. C) Les tests statistiques : Test student, Chi-deux,
D) Reprsentations graphiques:
Les graphiques (histogrammes, secteurs, boites, points, etc.) sont copiables vers dautres logiciels.
Les rgles respecter pour dfinir le nom dune variable : - Le nom doit commencer par une lettre. - Un nom de variable ne peut se terminer par un point. - La longueur du nom de la variable ne peut excder 8 caractres. - Le nom dune variable ne peut contenir des espaces blancs ou des caractres spciaux (comme !, ? et *). - Chaque nom de variable doit tre unique. Donner une tiquette une variable cest donner une identification plus explicite cette variable qui sera affiche dans les diffrents calculs statistiques.
- Une donne est de type alphanumrique lorsquelle peut prendre pour valeurs la fois des lettres et des chiffres. Les noms et les prnoms dindividus constituent des exemples de variable alphanumriques. Les traitements arithmtiques et statistiques possibles sont plus limits avec des informations de cette nature.(Il est possible deffectuer des dnombrements et des tris, par exemple). - Il existe dautres types de donnes, tels ceux de dates et de devises
2) Manipulations de donnes
Exemple :Dans une entreprise, le temps requis pour effectuer lassemblage dun montage transistoris est de 10 minutes. Un chronomtrage de cette opration sur 25 units de mme type donne le temps ci-contre.
11,6
10,3
11,8
11,0
10,6
12,3
9,6
11,9
10,8
12,9
10,3
10,1
12,2
11,1
10,3
10,0
10,5
9,8
11,8
12,0
Questionnaire
Quel est votre ge en anne ? : Quelle est votre sexe ? : M F
Arts Mdecine
Sciences Autres
Matrise Autre
tudiant Doctorant
Quel est votre poids en Kg ? : Quel est votre taille en mtre ? : Quel est votre groupe sanguin ?: Groupe O Groupe B Groupe A Groupe AB
Oui
Non
Groupe Fume 3 4 1 2
27
33
F
F
3
4
2
1
57
59
1,70
1,65
1
3
1
2
40
24
M
M
1
2
1
4
85
65
1,83
1,78
2
1
1
2
21
45 23 36
F
M F M
4
2 2 3
2
1 1 4
60
87 55 79
1,62
1,67 1,59 1,73
4
3 4 2
2
2 1 1
2) Dpouillement des valeurs dune variable continue selon une distribution de frquence
On veut obtenir la distribution de frquences en classes de la variable continue V (taille). A partir des rsultas obtenus prcdemment, la rpartition des donnes en classes peut seffectuer de la faon suivante. Les classes sont : 1,55 < X < 1,66 ----------> 1 1,67 < X < 1,76 ----------> 2 1,77< X < 1,88 ----------> 3
Les commandes sont : - Cliquer sur Transformer / Recoder / Cration de variable - Entrer dans la boite de variable de destination - Cliquer sur la boite Remplacer - Cliquer sur la boite ancienne et nouvelle valeur - Entrer dans la boite nouvelle valeur ( exemple : 1) - Cliquer sur Intervalle - Enter les valeurs limites (exemple : 1,55 et 1,66) - Cliquer sur Ajouter - Rpter les mmes oprations pour les autres donnes - Cliquer sur la boite Poursuivre - A la fin on faire ltiquette pour la nouvelle variable (exemple :Anciennet par classes) - Cliquer sur OK
4.1) On va associer des codes et des tiquettes aux diverses modalits des variables
NOM ETIQUETTE VALEURS (MODALITES) CODES
Quest1
Prendre lautobus
Rgulire
Occasionnelle
1
2
Quest2
Sexe
Masculin Fminin
1 2
Quest3
Age
1 2 3
- Cliquez sur Affichage des variables Entrez dans la colonne Etiquette de la variable Quest1 la variable : Prendre lautobus - Cliquer sur la colonne Valeurs , puis entrez dans le champ Valeur : 1, puis dans le champ Etiquette de valeur : Rgulire. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Entrez dans le champ Valeur : 2, puis dans le champ Etiquette de valeur : Occasionnelle. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine Entrez dans le champ Valeur : 3, puis dans le champ Etiquette de valeur : Ne prend pas lautobus. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Cliquez sur Continue puis sur OK. La codification des modalits des variables Quest2 et Quest3 seffectuent de la mme faon.
Fminin
Masculin Masculin Masculin
35 54 ans
55 ans et plus 18 34 ans 35 54 ans
Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus
Masculin
Fminin Masculin Masculin
18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus
Occasionnelle
Masculin
35 54 ans
4.2) On va maintenant dpouiller les donnes (nominales) de la question 1 selon une distribution de frquences et on trace un diagramme secteurs (Graphique en secteurs).
Cliquer sur la commande Statistique descriptive / Frquences Slectionner la variable Quest1 Cliquez sur le bouton Diagrammes puis slectionner Graphique en secteurs et pourcentages Cliquer sur Continue puis OK On procde de la mme faon pour la variable Quest2. Au lieu de la commande Graphique en secteurs on slectionne Diagrammes en btons. Les rsultats sont prsents de la faon suivante :
4.3) On veut laborer un diagramme illustrant la rpartition des rpondants selon les diverses modalits de la question 1 (utilisation de lautobus) en tenant compte du sexe du rpondant.
Dans la barre menus, slectionner Graphes / Btons. Ceci permet davoir la boite de dialogue Diagrammes en btons. Celle ci prsente trois types de diagrammes barres, soit : Simple Juxtapos (Catgoris) Empil On veut le type Juxtapos (Catgoris), ce qui va nous permettre de visualiser le pourcentage de rpondants daprs la frquence dutilisation du transport en commun avec une distinction quant au sexe du rpondant. Cliquez sur licne identifiant Juxtapos / Rcapitulatifs pour groupes dobservations puis Dfinir. Ceci permet davoir une boite de dialogue : Placez la variable Quest1 sur laxe des abscisses, puis la variable Quest2 sur laxe des ordonnes. Cliquez sur le bouton % dobservations puis OK pour lancer le traitement.
Les niveaux de signification - Lorsquon teste la diffrence (entre moyenne par exemple), on se posera la question suivante: La diffrence observe entre les chantillons doit-elle tre attribue au hasard ou bien provient-elle dune cause systmatique. Accepter H0 : Cest la diffrence observe est attribuable aux fluctuations dues au hasard de lchantillonnage. Rejeter H0 : Cest la diffrence observe est due une cause systmatique
On note les niveaux de signification de la manire suivante : * Diffrence non significative p > 0,05 (Non significative) * Diffrence significative p 0,05 (Significative)
0 TS
0,01 S
0,05 NS
0,1
9,1
11,3
11,9
10,9
1,9
11,6
10,3
11,8
11,0
10,6
12,3
9,6
11,9
10,8
12,9
10,3
10,1
12,2
11,1
10,3
10,0
10,5
9,8
11,8
12,0
Cliquer sur Statistiques descriptives / Comparer les moyennes / puis sur Test T pour chantillon unique . Introduisez la variable temps dans la zone Variable tester et la valeur donne (10) dans la zone Test Valeur de test. Cliquer sur OK pour lancer le traitement
Il sagit dun test dgalit de deux moyennes. Soit deux classes qui obtiennent au mme test pdagogique (not sur 10).
6
5 7 5 3 4 7
9
7 8 8 10 9 7 8 8 7
Moyenne 1 = 5,84
Moyenne 2 = 7,93
La classe 1 semble nettement plus faible que la classe 2. Peut-on attribuer cette diffrence une cause systmatique ou, au contraire, est-elle attribuable au hasard ? En dautre terme, la classe 2 est-elle rellement plus forte que la classe 1, ou bien doit-on penser que la diffrence provient du hasard dans la composition des classes ? On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.
1
1 1
4
5 6
1
1 1 1 1 1
7
9 8 6 5 7
1
1 1 1
5
3 4 7
Suite
2 2 2 2 2 2 2 8 7 9 8 6 8 9
2
2 2 2 2 2 2 2 2
7
8 8 10 9 7 8 8 7
mesures apparies
- Il sagit des donnes qui sont obtenues partir de la mme unit exprimentale (mme individu par exemple) avant et aprs avoir subir un certain traitement. Nous somme alors en prsence de mesures dpendantes ou apparies. - Il serait alors incorrect de procder un test de comparaison de moyennes. Loutil statistique appropri est alors un test sur la diffrence de mesures.
Exemple:
On veut valuer leffet ou lefficacit dun programme dapprentissage. Pour cela on a passer un test un certain nombre de personne avant et aprs la formation. Les rsultats obtenus sont prsents dan le tableau suivant
Avant le programme
15 13 8 9 7 12 11 12 11 9 10 12 11 7 12
Aprs le programme
17 16 10 9 9 13 14 15 14 11 14 11 13 10 13
Slectionner Analyse / Comparer les moyennes puis Test T pour chantillons apparis. Introduisez les deux variables (Avant et Aprs) dans la boite Variables apparies. Cliquer sur le bouton Options et spcifier un intervalle de confiance 99%. Cliquer sur Continue puis OK pour lancer le traitement.
Exemple : On constitue trois groupes dlves slectionns au hasard et on leur enseigne la mme matire de trois faons diffrentes : - Dans le groupe 1 on applique lenseignement magistral - Dans le groupe 2 un cours programm appliqu sous surveillance - Dans le groupe 3 partiellement domicile. On veut comparer le rsultat moyen de trois groupes dlves et tester sil existe une diffrence significative au seuil de signification 5%. Les rsultats obtenus sont prsents dan le tableau suivant :
Groupe 1
10 12 8 14 9 13
Groupe 2
17 19 14 18 17
Groupe 3
14 18 15 15 14 16 15 13
On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.
Classe 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 10 12 8 14 9 13 17 19 14 18 17 14 18 15 15 14 16 15 Notes
Slectionner Analyse / Comparer les moyennes puis ANOVA 1 facteur. Introduisez la variable rsultat dans la boite Variables dpendantes et la variable classe la boite Critre. Cliquer sur le bouton Options et choisir Caractristique ; Test dgalit des variances et exclure les observations analyse par analyse puis Poursuivre. Cliquer sur le bouton Post Hoc et slectionner la mthode de comparaison multiples de Bonferroni avec un seuil de signification 0,05. Cliquer sur Continue puis sur OK pour lancer le traitement.
Un tableau crois consiste en un tableau double entre o les modalits dune variable sont croises avec les modalits dune autre variable. Ce tableau est frquent lorsque lon veut examiner sil existe une certaine dpendance entre deux variable.
On va utiliser un sondage sur le transport en commun et laborer un tableau crois des modalits de la frquence dutilisation de lautobus (quest1) avec les catgories dge.
Fminin
Masculin Masculin Masculin
35 54 ans
55 ans et plus 18 34 ans 35 54 ans
Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus
Masculin
Fminin Masculin Masculin
18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus
Occasionnelle
Masculin
35 54 ans
2.2 Subdiviser un fichier Cliquer sur la commande Donnes / Scinder un fichier / comparer les groupes puis slectionner la liste de variable La subdivision de fichier est quivalent travailler avec deux ou trois fichiers. (exemples)