Sunteți pe pagina 1din 52

Traitement de donnes avec SPSS

Une fois acheve la "rcolte des donnes" par questionnaire, par entretien ou par toute autre mthode, celles-ci doivent tre structures et analyses. En fonction de la mthode utilise, les donnes rcoltes sont comptes, rsumes, calcules ou interprtes, puis prsentes de manire en obtenir une bonne vue d'ensemble. Des connaissances spcifiques sont ncessaires cet effet

Quand les donnes rcoltes sont examines et structures. Il existent des programmes lectroniques qui facilitent le traitement de donnes numriques (par exemple Excel, SPSS) et de donnes verbales (par exemple Microsoft Word, Atlas-ti, ).

Dfinition
Le logiciel (SPSS) est un logiciel de gestion et d'analyse de donnes statistiques de porte gnrale. Le logiciel SPSS constitue un systme de traitement de donnes permettant, partir de fichiers SPSS ou partir dautres types de fichiers (Excel, Dbase, Access ) de gnrer divers tableaux, graphiques et diagrammes ou encore deffectuer divers traitements statistiques ( descriptive / rfrentiel).

Utilisation
On peut utiliser le logiciel SPSS pour effectuer diffrentes tches, comme par exemple: A) La prsentation des donnes sources On peut importer ou saisir en direct des donnes dans une feuille de tableur prsente dans le logiciel. Le Copier - coller de tableau permet de rutiliser en chane les valeurs rsultats de tableau. On peut trier des rsultats. . Le logiciel permet la division et l'clatement de fichiers. La cration d'une nouvelle variable est possible partir d'autres variables et de formules.

B) Le traitement des donnes

Toutes les oprations de base (cart-type, moyenne, variance, mdiane, mode, etc...) peuvent tre ralises. C) Les tests statistiques : Test student, Chi-deux,
D) Reprsentations graphiques:

Les graphiques (histogrammes, secteurs, boites, points, etc.) sont copiables vers dautres logiciels.

I) Manipulation de base sur les donnes


1) Saisie de donnes partir de SPSS
Cette opration seffectue en deux tapes : Dfinir les variables et leurs proprits Saisir les donnes

Les rgles respecter pour dfinir le nom dune variable : - Le nom doit commencer par une lettre. - Un nom de variable ne peut se terminer par un point. - La longueur du nom de la variable ne peut excder 8 caractres. - Le nom dune variable ne peut contenir des espaces blancs ou des caractres spciaux (comme !, ? et *). - Chaque nom de variable doit tre unique. Donner une tiquette une variable cest donner une identification plus explicite cette variable qui sera affiche dans les diffrents calculs statistiques.

Les types de donnes :


Nous disons quune donne est de type numrique lorsquelle rfre un nombre tant dans sa reprsentation que dans son utilisation. Il arrive souvent que, pour faciliter le traitement, nous crons des donnes artificiellement numriques. Cest dire nous codifions par un chiffre une variable qualitative. 1 pour sexe masculin et 2 pour sexe fminin. Ce codage prsente un double avantage : Il facilite la saisie des donnes en diminuant les risques derreur de frappe. Il favorise une conomie despace en mmoire et de temps.

- Une donne est de type alphanumrique lorsquelle peut prendre pour valeurs la fois des lettres et des chiffres. Les noms et les prnoms dindividus constituent des exemples de variable alphanumriques. Les traitements arithmtiques et statistiques possibles sont plus limits avec des informations de cette nature.(Il est possible deffectuer des dnombrements et des tris, par exemple). - Il existe dautres types de donnes, tels ceux de dates et de devises

2) Manipulations de donnes
Exemple :Dans une entreprise, le temps requis pour effectuer lassemblage dun montage transistoris est de 10 minutes. Un chronomtrage de cette opration sur 25 units de mme type donne le temps ci-contre.

Temps observs (minutes)


9,1 11,3 11,9 10,9 1,9

11,6

10,3

11,8

11,0

10,6

12,3

9,6

11,9

10,8

12,9

10,3

10,1

12,2

11,1

10,3

10,0

10,5

9,8

11,8

12,0

Trier des donnes


Cliquer sur la commande Donnes / Trier les observations puis slectionner la liste de variable. Listing des donnes: * Commandes : Analyse / Rapport / Rcapitulatif des observations Afficher les informations sur le fichier des donnes : * Commandes : Fichier / Afficher informations sur les donnes / Ouvrir.

Questionnaire
Quel est votre ge en anne ? : Quelle est votre sexe ? : M F

Quel est votre domaine dtude :

Arts Mdecine

Sciences Autres
Matrise Autre

Quel est votre niveau ? :

tudiant Doctorant

Quel est votre poids en Kg ? : Quel est votre taille en mtre ? : Quel est votre groupe sanguin ?: Groupe O Groupe B Groupe A Groupe AB

Est ce que vous fumez ? :

Oui

Non

Age Sexe tude Niveau Poids Taille 30 25 M F 2 1 3 2 75 55 1,80 1,75

Groupe Fume 3 4 1 2

27
33

F
F

3
4

2
1

57
59

1,70
1,65

1
3

1
2

40
24

M
M

1
2

1
4

85
65

1,83
1,78

2
1

1
2

21
45 23 36

F
M F M

4
2 2 3

2
1 1 4

60
87 55 79

1,62
1,67 1,59 1,73

4
3 4 2

2
2 1 1

II) La statistique descriptive


1) Calcul de diverses statistiques Cliquer sur la commande Analyse / statistique descriptive / Frquences. Moyenne / Mdiane / Mode / Somme / Ecart - type / Variance

2) Dpouillement des valeurs dune variable continue selon une distribution de frquence

On veut obtenir la distribution de frquences en classes de la variable continue V (taille). A partir des rsultas obtenus prcdemment, la rpartition des donnes en classes peut seffectuer de la faon suivante. Les classes sont : 1,55 < X < 1,66 ----------> 1 1,67 < X < 1,76 ----------> 2 1,77< X < 1,88 ----------> 3

Les commandes sont : - Cliquer sur Transformer / Recoder / Cration de variable - Entrer dans la boite de variable de destination - Cliquer sur la boite Remplacer - Cliquer sur la boite ancienne et nouvelle valeur - Entrer dans la boite nouvelle valeur ( exemple : 1) - Cliquer sur Intervalle - Enter les valeurs limites (exemple : 1,55 et 1,66) - Cliquer sur Ajouter - Rpter les mmes oprations pour les autres donnes - Cliquer sur la boite Poursuivre - A la fin on faire ltiquette pour la nouvelle variable (exemple :Anciennet par classes) - Cliquer sur OK

3) Distribution de frquences et histogramme


Pour obtenir la distribution de frquences et histogramme, cliquer sur la commande /Analyse / Frquences / Choisir la variable ( ex :Poids par classe) / Diagrammes / Histogramme / Continue / Dsactiver toutes les commandes de la fentre Statistique (moyenne, mode, ) / continue / OK.

4) Traitement de donnes nominales


Question 1 : Au cours des 12 mois, avez-vous pris lautobus de faon rgulire ou occasionnelle ? - Rgulire . - Occasionnelle . - Ne prend pas lautobus .. Question 2 : Sexe : Masculin Fminin

Question 3 : Age : * 18 34 ans .. * 35 54 ans .. * 55 ans et plus .

4.1) On va associer des codes et des tiquettes aux diverses modalits des variables
NOM ETIQUETTE VALEURS (MODALITES) CODES

Quest1

Prendre lautobus

Rgulire
Occasionnelle

1
2

Ne prend pas lautobus

Quest2

Sexe

Masculin Fminin

1 2

Quest3

Age

18 34 ans 35 54 ans 55 ans et plus

1 2 3

- Cliquez sur Affichage des variables Entrez dans la colonne Etiquette de la variable Quest1 la variable : Prendre lautobus - Cliquer sur la colonne Valeurs , puis entrez dans le champ Valeur : 1, puis dans le champ Etiquette de valeur : Rgulire. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Entrez dans le champ Valeur : 2, puis dans le champ Etiquette de valeur : Occasionnelle. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine Entrez dans le champ Valeur : 3, puis dans le champ Etiquette de valeur : Ne prend pas lautobus. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Cliquez sur Continue puis sur OK. La codification des modalits des variables Quest2 et Quest3 seffectuent de la mme faon.

Tableau des donnes


Quest1 Rgulire Ne prend pas lautobus Occasionnelle Rgulire Ne prend pas lautobus Quest2 Masculin Fminin Fminin Fminin Fminin Quest3 18 34 ans 55 ans et plus 18 34 ans 18 34 ans 18 34 ans

Ne prend pas lautobus


Rgulire Ne prend pas lautobus Occasionnelle

Fminin
Masculin Masculin Masculin

35 54 ans
55 ans et plus 18 34 ans 35 54 ans

Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus

Masculin
Fminin Masculin Masculin

18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus

Occasionnelle

Masculin

35 54 ans

4.2) On va maintenant dpouiller les donnes (nominales) de la question 1 selon une distribution de frquences et on trace un diagramme secteurs (Graphique en secteurs).

Cliquer sur la commande Statistique descriptive / Frquences Slectionner la variable Quest1 Cliquez sur le bouton Diagrammes puis slectionner Graphique en secteurs et pourcentages Cliquer sur Continue puis OK On procde de la mme faon pour la variable Quest2. Au lieu de la commande Graphique en secteurs on slectionne Diagrammes en btons. Les rsultats sont prsents de la faon suivante :

4.3) On veut laborer un diagramme illustrant la rpartition des rpondants selon les diverses modalits de la question 1 (utilisation de lautobus) en tenant compte du sexe du rpondant.
Dans la barre menus, slectionner Graphes / Btons. Ceci permet davoir la boite de dialogue Diagrammes en btons. Celle ci prsente trois types de diagrammes barres, soit : Simple Juxtapos (Catgoris) Empil On veut le type Juxtapos (Catgoris), ce qui va nous permettre de visualiser le pourcentage de rpondants daprs la frquence dutilisation du transport en commun avec une distinction quant au sexe du rpondant. Cliquez sur licne identifiant Juxtapos / Rcapitulatifs pour groupes dobservations puis Dfinir. Ceci permet davoir une boite de dialogue : Placez la variable Quest1 sur laxe des abscisses, puis la variable Quest2 sur laxe des ordonnes. Cliquez sur le bouton % dobservations puis OK pour lancer le traitement.

Les niveaux de signification - Lorsquon teste la diffrence (entre moyenne par exemple), on se posera la question suivante: La diffrence observe entre les chantillons doit-elle tre attribue au hasard ou bien provient-elle dune cause systmatique. Accepter H0 : Cest la diffrence observe est attribuable aux fluctuations dues au hasard de lchantillonnage. Rejeter H0 : Cest la diffrence observe est due une cause systmatique

La rgle arbitraire est la suivante :


Sil y a plus de 5 % (0,05) des chances que la diffrence observe soit due au hasard, on adopte Ho et on dit que la diffrence nest pas significative (N S). Sil y a 5% (0,05) des chances ou moins, que la diffrence soit due au hasard, on rejette Ho et on dit : - Significative (S) : si la diffrence observe a plus de 1% (0,01) des chances (mais moins de 5%) dtre due au hasard. - Trs significative (T S) : si la diffrence observe 1% de chance ou moins dtre due au hasard.

On note les niveaux de signification de la manire suivante : * Diffrence non significative p > 0,05 (Non significative) * Diffrence significative p 0,05 (Significative)

* Diffrence significative p 0,01 (Trs significative)

0 TS

0,01 S

0,05 NS

0,1

III) Comparaisons de moyennes


Les diffrents tests de comparaison de moyenne qui existe en SPSS sont : Test T pour chantillon unique : Test de comparaison dune moyenne une valeur donne. Test T pour chantillons indpendants: Test dgalit de deux moyenne. Test T pour chantillons apparis : comparaison de deux sries de mesures apparies. ANOVA 1 facteur: Analyse de variance un seul facteur.

1) Test de comparaison dune moyenne de population normale une valeur donne


On va choisir un petit chantillon provenant dune population normale de variance inconnue. Ce test statistique sest effectue avec le t de Student. Dans une entreprise, le temps requis pour effectuer lassemblage dun montage transistoris est de 10 minutes. Un chronomtrage de cette opration sur 25 units de mme type donne le temps ci-contre.

Temps observs (minutes)

9,1

11,3

11,9

10,9

1,9

11,6

10,3

11,8

11,0

10,6

12,3

9,6

11,9

10,8

12,9

10,3

10,1

12,2

11,1

10,3

10,0

10,5

9,8

11,8

12,0

Les commandes sont :

Cliquer sur Statistiques descriptives / Comparer les moyennes / puis sur Test T pour chantillon unique . Introduisez la variable temps dans la zone Variable tester et la valeur donne (10) dans la zone Test Valeur de test. Cliquer sur OK pour lancer le traitement

2) Test dgalit de deux moyennes

Il sagit dun test dgalit de deux moyennes. Soit deux classes qui obtiennent au mme test pdagogique (not sur 10).

Tableau des donnes


Classe 1 4 5 6 7 9 8 Classe2 8 7 9 8 6 8

6
5 7 5 3 4 7

9
7 8 8 10 9 7 8 8 7

Moyenne 1 = 5,84

Moyenne 2 = 7,93

La classe 1 semble nettement plus faible que la classe 2. Peut-on attribuer cette diffrence une cause systmatique ou, au contraire, est-elle attribuable au hasard ? En dautre terme, la classe 2 est-elle rellement plus forte que la classe 1, ou bien doit-on penser que la diffrence provient du hasard dans la composition des classes ? On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.

Tableau des donnes en SPSS


Classe Notes

1
1 1

4
5 6

1
1 1 1 1 1

7
9 8 6 5 7

1
1 1 1

5
3 4 7

Suite
2 2 2 2 2 2 2 8 7 9 8 6 8 9

2
2 2 2 2 2 2 2 2

7
8 8 10 9 7 8 8 7

Les commandes sont :


Cliquer sur Analyse / Comparer les moyennes puis Test T pour chantillons indpendants. - Introduisez la variable Notes dans la zone Variable tester et la variable Classe dans la zone Critre de regroupement. Puis cliquer dans la boite Dfinir groupes. - Ecrire la valeur 1 dans la zone Groupe1 et la valeur 2 dans la zone Groupe2. - Cliquer sur Continue puis OK pour lancer le traitement

3) Comparaisons de deux sries de

mesures apparies

- Il sagit des donnes qui sont obtenues partir de la mme unit exprimentale (mme individu par exemple) avant et aprs avoir subir un certain traitement. Nous somme alors en prsence de mesures dpendantes ou apparies. - Il serait alors incorrect de procder un test de comparaison de moyennes. Loutil statistique appropri est alors un test sur la diffrence de mesures.

Exemple:
On veut valuer leffet ou lefficacit dun programme dapprentissage. Pour cela on a passer un test un certain nombre de personne avant et aprs la formation. Les rsultats obtenus sont prsents dan le tableau suivant

Avant le programme
15 13 8 9 7 12 11 12 11 9 10 12 11 7 12

Aprs le programme
17 16 10 9 9 13 14 15 14 11 14 11 13 10 13

Slectionner Analyse / Comparer les moyennes puis Test T pour chantillons apparis. Introduisez les deux variables (Avant et Aprs) dans la boite Variables apparies. Cliquer sur le bouton Options et spcifier un intervalle de confiance 99%. Cliquer sur Continue puis OK pour lancer le traitement.

4) Test dgalit de trois moyennes


Il sagit de la comparaison plus de deux moyennes. On ne peut pas utiliser le test t de Student. Loutil statistique appropri est une analyse de variance suivant un seul facteur (One-way Anova). Lanalyse de variance permet aussi de comparer les moyennes deux deux

Exemple : On constitue trois groupes dlves slectionns au hasard et on leur enseigne la mme matire de trois faons diffrentes : - Dans le groupe 1 on applique lenseignement magistral - Dans le groupe 2 un cours programm appliqu sous surveillance - Dans le groupe 3 partiellement domicile. On veut comparer le rsultat moyen de trois groupes dlves et tester sil existe une diffrence significative au seuil de signification 5%. Les rsultats obtenus sont prsents dan le tableau suivant :

Groupe 1
10 12 8 14 9 13

Groupe 2
17 19 14 18 17

Groupe 3
14 18 15 15 14 16 15 13

On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.
Classe 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 10 12 8 14 9 13 17 19 14 18 17 14 18 15 15 14 16 15 Notes

Slectionner Analyse / Comparer les moyennes puis ANOVA 1 facteur. Introduisez la variable rsultat dans la boite Variables dpendantes et la variable classe la boite Critre. Cliquer sur le bouton Options et choisir Caractristique ; Test dgalit des variances et exclure les observations analyse par analyse puis Poursuivre. Cliquer sur le bouton Post Hoc et slectionner la mthode de comparaison multiples de Bonferroni avec un seuil de signification 0,05. Cliquer sur Continue puis sur OK pour lancer le traitement.

III) Le tableau crois


Dans ce chapitre, on va : associer un code et une tiquette aux diverses modalits dune variable laborer un tableau crois obtenir diverses statistiques associes aux variables du tableau crois

Un tableau crois consiste en un tableau double entre o les modalits dune variable sont croises avec les modalits dune autre variable. Ce tableau est frquent lorsque lon veut examiner sil existe une certaine dpendance entre deux variable.

On va utiliser un sondage sur le transport en commun et laborer un tableau crois des modalits de la frquence dutilisation de lautobus (quest1) avec les catgories dge.

Tableau des donnes


Quest1 Rgulire Ne prend pas lautobus Occasionnelle Rgulire Ne prend pas lautobus Quest2 Masculin Fminin Fminin Fminin Fminin Quest3 18 34 ans 55 ans et plus 18 34 ans 18 34 ans 18 34 ans

Ne prend pas lautobus


Rgulire Ne prend pas lautobus Occasionnelle

Fminin
Masculin Masculin Masculin

35 54 ans
55 ans et plus 18 34 ans 35 54 ans

Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus

Masculin
Fminin Masculin Masculin

18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus

Occasionnelle

Masculin

35 54 ans

Les commandes sont :


Slectionnez Statistiques descriptives / Tableaux croiss Entrez la variable dans la ligne et lautre dans la colonne Cliquez sur le bouton Statistiques et choisir le test Chi - deux puis sur le bouton continue Cliquez sur le bouton Cellules et slectionner les frquences observes (Observ) et les frquences thorique (Thorique). Cliquez sur Continue puis sur OK pour lancer le traitement.

2.2 Subdiviser un fichier Cliquer sur la commande Donnes / Scinder un fichier / comparer les groupes puis slectionner la liste de variable La subdivision de fichier est quivalent travailler avec deux ou trois fichiers. (exemples)

S-ar putea să vă placă și