Cours SPSS2

Traitement de donnes avec SPSS
Une fois acheve la "rcolte des donnes" par questionnaire, par entretien ou par toute autre mthode, celles-ci doivent tre structures et analyses. En fonction de la mthode utilise, les donnes rcoltes sont comptes, rsumes, calcules ou interprtes, puis prsentes de manire en obtenir une bonne vue d'ensemble. Des connaissances spcifiques sont ncessaires cet effet
Quand les donnes rcoltes sont examines et structures. Il existent des programmes lectroniques qui facilitent le traitement de donnes numriques (par exemple Excel, SPSS) et de donnes verbales (par exemple Microsoft Word, Atlas-ti, ).
Dfinition
Le logiciel (SPSS) est un logiciel de gestion et d'analyse de donnes statistiques de porte gnrale. Le logiciel SPSS constitue un systme de traitement de donnes permettant, partir de fichiers SPSS ou partir dautres types de fichiers (Excel, Dbase, Access ) de gnrer divers tableaux, graphiques et diagrammes ou encore deffectuer divers traitements statistiques ( descriptive / rfrentiel).
Utilisation
On peut utiliser le logiciel SPSS pour effectuer diffrentes tches, comme par exemple: A) La prsentation des donnes sources On peut importer ou saisir en direct des donnes dans une feuille de tableur prsente dans le logiciel. Le Copier - coller de tableau permet de rutiliser en chane les valeurs rsultats de tableau. On peut trier des rsultats. . Le logiciel permet la division et l'clatement de fichiers. La cration d'une nouvelle variable est possible partir d'autres variables et de formules.
B) Le traitement des donnes
Toutes les oprations de base (cart-type, moyenne, variance, mdiane, mode, etc...) peuvent tre ralises. C) Les tests statistiques : Test student, Chi-deux,
D) Reprsentations graphiques:
Les graphiques (histogrammes, secteurs, boites, points, etc.) sont copiables vers dautres logiciels.
I) Manipulation de base sur les donnes

1) Saisie de donnes partir de SPSS
Cette opration seffectue en deux tapes : Dfinir les variables et leurs proprits Saisir les donnes
Les rgles respecter pour dfinir le nom dune variable : - Le nom doit commencer par une lettre. - Un nom de variable ne peut se terminer par un point. - La longueur du nom de la variable ne peut excder 8 caractres. - Le nom dune variable ne peut contenir des espaces blancs ou des caractres spciaux (comme !, ? et *). - Chaque nom de variable doit tre unique. Donner une tiquette une variable cest donner une identification plus explicite cette variable qui sera affiche dans les diffrents calculs statistiques.
Les types de donnes :

Nous disons quune donne est de type numrique lorsquelle rfre un nombre tant dans sa reprsentation que dans son utilisation. Il arrive souvent que, pour faciliter le traitement, nous crons des donnes artificiellement numriques. Cest dire nous codifions par un chiffre une variable qualitative. 1 pour sexe masculin et 2 pour sexe fminin. Ce codage prsente un double avantage : Il facilite la saisie des donnes en diminuant les risques derreur de frappe. Il favorise une conomie despace en mmoire et de temps.
- Une donne est de type alphanumrique lorsquelle peut prendre pour valeurs la fois des lettres et des chiffres. Les noms et les prnoms dindividus constituent des exemples de variable alphanumriques. Les traitements arithmtiques et statistiques possibles sont plus limits avec des informations de cette nature.(Il est possible deffectuer des dnombrements et des tris, par exemple). - Il existe dautres types de donnes, tels ceux de dates et de devises
2) Manipulations de donnes
Exemple :Dans une entreprise, le temps requis pour effectuer lassemblage dun montage transistoris est de 10 minutes. Un chronomtrage de cette opration sur 25 units de mme type donne le temps ci-contre.
Temps observs (minutes)

9,1 11,3 11,9 10,9 1,9
11,6
10,3
11,8
11,0
10,6
12,3
9,6
11,9
10,8
12,9
10,3
10,1
12,2
11,1
10,3
10,0
10,5
9,8
11,8
12,0
Trier des donnes

Cliquer sur la commande Donnes / Trier les observations puis slectionner la liste de variable. Listing des donnes: * Commandes : Analyse / Rapport / Rcapitulatif des observations Afficher les informations sur le fichier des donnes : * Commandes : Fichier / Afficher informations sur les donnes / Ouvrir.
Questionnaire
Quel est votre ge en anne ? : Quelle est votre sexe ? : M F
Quel est votre domaine dtude :
Arts Mdecine
Sciences Autres
Matrise Autre
Quel est votre niveau ? :
tudiant Doctorant
Quel est votre poids en Kg ? : Quel est votre taille en mtre ? : Quel est votre groupe sanguin ?: Groupe O Groupe B Groupe A Groupe AB
Est ce que vous fumez ? :
Oui
Non
Age Sexe tude Niveau Poids Taille 30 25 M F 2 1 3 2 75 55 1,80 1,75
Groupe Fume 3 4 1 2
27
33
F
F
3
4
2
1
57
59
1,70
1,65
1
3
1
2
40
24
M
M
1
2
1
4
85
65
1,83
1,78
2
1
1
2
21
45 23 36
F
M F M
4
2 2 3
2
1 1 4
60
87 55 79
1,62
1,67 1,59 1,73
4
3 4 2
2
2 1 1
II) La statistique descriptive

1) Calcul de diverses statistiques Cliquer sur la commande Analyse / statistique descriptive / Frquences. Moyenne / Mdiane / Mode / Somme / Ecart - type / Variance
2) Dpouillement des valeurs dune variable continue selon une distribution de frquence
On veut obtenir la distribution de frquences en classes de la variable continue V (taille). A partir des rsultas obtenus prcdemment, la rpartition des donnes en classes peut seffectuer de la faon suivante. Les classes sont : 1,55 < X < 1,66 ----------> 1 1,67 < X < 1,76 ----------> 2 1,77< X < 1,88 ----------> 3
Les commandes sont : - Cliquer sur Transformer / Recoder / Cration de variable - Entrer dans la boite de variable de destination - Cliquer sur la boite Remplacer - Cliquer sur la boite ancienne et nouvelle valeur - Entrer dans la boite nouvelle valeur ( exemple : 1) - Cliquer sur Intervalle - Enter les valeurs limites (exemple : 1,55 et 1,66) - Cliquer sur Ajouter - Rpter les mmes oprations pour les autres donnes - Cliquer sur la boite Poursuivre - A la fin on faire ltiquette pour la nouvelle variable (exemple :Anciennet par classes) - Cliquer sur OK
3) Distribution de frquences et histogramme

Pour obtenir la distribution de frquences et histogramme, cliquer sur la commande /Analyse / Frquences / Choisir la variable ( ex :Poids par classe) / Diagrammes / Histogramme / Continue / Dsactiver toutes les commandes de la fentre Statistique (moyenne, mode, ) / continue / OK.
4) Traitement de donnes nominales

Question 1 : Au cours des 12 mois, avez-vous pris lautobus de faon rgulire ou occasionnelle ? - Rgulire . - Occasionnelle . - Ne prend pas lautobus .. Question 2 : Sexe : Masculin Fminin
Question 3 : Age : * 18 34 ans .. * 35 54 ans .. * 55 ans et plus .
4.1) On va associer des codes et des tiquettes aux diverses modalits des variables
NOM ETIQUETTE VALEURS (MODALITES) CODES
Quest1
Prendre lautobus
Rgulire
Occasionnelle
1
2
Ne prend pas lautobus
Quest2
Sexe
Masculin Fminin
1 2
Quest3
Age
18 34 ans 35 54 ans 55 ans et plus
1 2 3
- Cliquez sur Affichage des variables Entrez dans la colonne Etiquette de la variable Quest1 la variable : Prendre lautobus - Cliquer sur la colonne Valeurs , puis entrez dans le champ Valeur : 1, puis dans le champ Etiquette de valeur : Rgulire. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Entrez dans le champ Valeur : 2, puis dans le champ Etiquette de valeur : Occasionnelle. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine Entrez dans le champ Valeur : 3, puis dans le champ Etiquette de valeur : Ne prend pas lautobus. - Cliquez sur le bouton Ajouter et linformation saisie se retrouvera dans la zone voisine - Cliquez sur Continue puis sur OK. La codification des modalits des variables Quest2 et Quest3 seffectuent de la mme faon.
Tableau des donnes

Quest1 Rgulire Ne prend pas lautobus Occasionnelle Rgulire Ne prend pas lautobus Quest2 Masculin Fminin Fminin Fminin Fminin Quest3 18 34 ans 55 ans et plus 18 34 ans 18 34 ans 18 34 ans

Rgulire Ne prend pas lautobus Occasionnelle
Fminin
Masculin Masculin Masculin
35 54 ans
55 ans et plus 18 34 ans 35 54 ans
Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus
Masculin
Fminin Masculin Masculin
18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus
Occasionnelle
Masculin
35 54 ans
4.2) On va maintenant dpouiller les donnes (nominales) de la question 1 selon une distribution de frquences et on trace un diagramme secteurs (Graphique en secteurs).
Cliquer sur la commande Statistique descriptive / Frquences Slectionner la variable Quest1 Cliquez sur le bouton Diagrammes puis slectionner Graphique en secteurs et pourcentages Cliquer sur Continue puis OK On procde de la mme faon pour la variable Quest2. Au lieu de la commande Graphique en secteurs on slectionne Diagrammes en btons. Les rsultats sont prsents de la faon suivante :
4.3) On veut laborer un diagramme illustrant la rpartition des rpondants selon les diverses modalits de la question 1 (utilisation de lautobus) en tenant compte du sexe du rpondant.
Dans la barre menus, slectionner Graphes / Btons. Ceci permet davoir la boite de dialogue Diagrammes en btons. Celle ci prsente trois types de diagrammes barres, soit : Simple Juxtapos (Catgoris) Empil On veut le type Juxtapos (Catgoris), ce qui va nous permettre de visualiser le pourcentage de rpondants daprs la frquence dutilisation du transport en commun avec une distinction quant au sexe du rpondant. Cliquez sur licne identifiant Juxtapos / Rcapitulatifs pour groupes dobservations puis Dfinir. Ceci permet davoir une boite de dialogue : Placez la variable Quest1 sur laxe des abscisses, puis la variable Quest2 sur laxe des ordonnes. Cliquez sur le bouton % dobservations puis OK pour lancer le traitement.
Les niveaux de signification - Lorsquon teste la diffrence (entre moyenne par exemple), on se posera la question suivante: La diffrence observe entre les chantillons doit-elle tre attribue au hasard ou bien provient-elle dune cause systmatique. Accepter H0 : Cest la diffrence observe est attribuable aux fluctuations dues au hasard de lchantillonnage. Rejeter H0 : Cest la diffrence observe est due une cause systmatique
La rgle arbitraire est la suivante :

Sil y a plus de 5 % (0,05) des chances que la diffrence observe soit due au hasard, on adopte Ho et on dit que la diffrence nest pas significative (N S). Sil y a 5% (0,05) des chances ou moins, que la diffrence soit due au hasard, on rejette Ho et on dit : - Significative (S) : si la diffrence observe a plus de 1% (0,01) des chances (mais moins de 5%) dtre due au hasard. - Trs significative (T S) : si la diffrence observe 1% de chance ou moins dtre due au hasard.
On note les niveaux de signification de la manire suivante : * Diffrence non significative p > 0,05 (Non significative) * Diffrence significative p 0,05 (Significative)
* Diffrence significative p 0,01 (Trs significative)
0 TS
0,01 S
0,05 NS
0,1
III) Comparaisons de moyennes

Les diffrents tests de comparaison de moyenne qui existe en SPSS sont : Test T pour chantillon unique : Test de comparaison dune moyenne une valeur donne. Test T pour chantillons indpendants: Test dgalit de deux moyenne. Test T pour chantillons apparis : comparaison de deux sries de mesures apparies. ANOVA 1 facteur: Analyse de variance un seul facteur.
1) Test de comparaison dune moyenne de population normale une valeur donne

On va choisir un petit chantillon provenant dune population normale de variance inconnue. Ce test statistique sest effectue avec le t de Student. Dans une entreprise, le temps requis pour effectuer lassemblage dun montage transistoris est de 10 minutes. Un chronomtrage de cette opration sur 25 units de mme type donne le temps ci-contre.
Temps observs (minutes)
9,1
11,3
11,9
10,9
1,9
11,6
10,3
11,8
11,0
10,6
12,3
9,6
11,9
10,8
12,9
10,3
10,1
12,2
11,1
10,3
10,0
10,5
9,8
11,8
12,0
Les commandes sont :
Cliquer sur Statistiques descriptives / Comparer les moyennes / puis sur Test T pour chantillon unique . Introduisez la variable temps dans la zone Variable tester et la valeur donne (10) dans la zone Test Valeur de test. Cliquer sur OK pour lancer le traitement
2) Test dgalit de deux moyennes
Il sagit dun test dgalit de deux moyennes. Soit deux classes qui obtiennent au mme test pdagogique (not sur 10).
Tableau des donnes

Classe 1 4 5 6 7 9 8 Classe2 8 7 9 8 6 8
6
5 7 5 3 4 7
9
7 8 8 10 9 7 8 8 7
Moyenne 1 = 5,84
Moyenne 2 = 7,93
La classe 1 semble nettement plus faible que la classe 2. Peut-on attribuer cette diffrence une cause systmatique ou, au contraire, est-elle attribuable au hasard ? En dautre terme, la classe 2 est-elle rellement plus forte que la classe 1, ou bien doit-on penser que la diffrence provient du hasard dans la composition des classes ? On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.
Tableau des donnes en SPSS

Classe Notes
1
1 1
4
5 6
1
1 1 1 1 1
7
9 8 6 5 7
1
1 1 1
5
3 4 7
Suite
2 2 2 2 2 2 2 8 7 9 8 6 8 9
2
2 2 2 2 2 2 2 2
7
8 8 10 9 7 8 8 7

Cliquer sur Analyse / Comparer les moyennes puis Test T pour chantillons indpendants. - Introduisez la variable Notes dans la zone Variable tester et la variable Classe dans la zone Critre de regroupement. Puis cliquer dans la boite Dfinir groupes. - Ecrire la valeur 1 dans la zone Groupe1 et la valeur 2 dans la zone Groupe2. - Cliquer sur Continue puis OK pour lancer le traitement
3) Comparaisons de deux sries de
mesures apparies
- Il sagit des donnes qui sont obtenues partir de la mme unit exprimentale (mme individu par exemple) avant et aprs avoir subir un certain traitement. Nous somme alors en prsence de mesures dpendantes ou apparies. - Il serait alors incorrect de procder un test de comparaison de moyennes. Loutil statistique appropri est alors un test sur la diffrence de mesures.
Exemple:
On veut valuer leffet ou lefficacit dun programme dapprentissage. Pour cela on a passer un test un certain nombre de personne avant et aprs la formation. Les rsultats obtenus sont prsents dan le tableau suivant
Avant le programme
15 13 8 9 7 12 11 12 11 9 10 12 11 7 12
Aprs le programme
17 16 10 9 9 13 14 15 14 11 14 11 13 10 13
Slectionner Analyse / Comparer les moyennes puis Test T pour chantillons apparis. Introduisez les deux variables (Avant et Aprs) dans la boite Variables apparies. Cliquer sur le bouton Options et spcifier un intervalle de confiance 99%. Cliquer sur Continue puis OK pour lancer le traitement.
4) Test dgalit de trois moyennes

Il sagit de la comparaison plus de deux moyennes. On ne peut pas utiliser le test t de Student. Loutil statistique appropri est une analyse de variance suivant un seul facteur (One-way Anova). Lanalyse de variance permet aussi de comparer les moyennes deux deux
Exemple : On constitue trois groupes dlves slectionns au hasard et on leur enseigne la mme matire de trois faons diffrentes : - Dans le groupe 1 on applique lenseignement magistral - Dans le groupe 2 un cours programm appliqu sous surveillance - Dans le groupe 3 partiellement domicile. On veut comparer le rsultat moyen de trois groupes dlves et tester sil existe une diffrence significative au seuil de signification 5%. Les rsultats obtenus sont prsents dan le tableau suivant :
Groupe 1
10 12 8 14 9 13
Groupe 2
17 19 14 18 17
Groupe 3
14 18 15 15 14 16 15 13
On va commencer par la saisie des donnes . Pour faire cette comparaison en SPSS, on doit utiliser deux variable, lune pour la classe et lautre pour les notes.
Classe 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 10 12 8 14 9 13 17 19 14 18 17 14 18 15 15 14 16 15 Notes
Slectionner Analyse / Comparer les moyennes puis ANOVA 1 facteur. Introduisez la variable rsultat dans la boite Variables dpendantes et la variable classe la boite Critre. Cliquer sur le bouton Options et choisir Caractristique ; Test dgalit des variances et exclure les observations analyse par analyse puis Poursuivre. Cliquer sur le bouton Post Hoc et slectionner la mthode de comparaison multiples de Bonferroni avec un seuil de signification 0,05. Cliquer sur Continue puis sur OK pour lancer le traitement.
III) Le tableau crois

Dans ce chapitre, on va : associer un code et une tiquette aux diverses modalits dune variable laborer un tableau crois obtenir diverses statistiques associes aux variables du tableau crois
Un tableau crois consiste en un tableau double entre o les modalits dune variable sont croises avec les modalits dune autre variable. Ce tableau est frquent lorsque lon veut examiner sil existe une certaine dpendance entre deux variable.
On va utiliser un sondage sur le transport en commun et laborer un tableau crois des modalits de la frquence dutilisation de lautobus (quest1) avec les catgories dge.
Tableau des donnes

Quest1 Rgulire Ne prend pas lautobus Occasionnelle Rgulire Ne prend pas lautobus Quest2 Masculin Fminin Fminin Fminin Fminin Quest3 18 34 ans 55 ans et plus 18 34 ans 18 34 ans 18 34 ans

Rgulire Ne prend pas lautobus Occasionnelle
Fminin
Masculin Masculin Masculin
35 54 ans
55 ans et plus 18 34 ans 35 54 ans
Rgulire
Ne prend pas lautobus Occasionnelle Ne prend pas lautobus
Masculin
Fminin Masculin Masculin
18 34 ans
55 ans et plus 55 ans et plus 55 ans et plus
Occasionnelle
Masculin
35 54 ans

Slectionnez Statistiques descriptives / Tableaux croiss Entrez la variable dans la ligne et lautre dans la colonne Cliquez sur le bouton Statistiques et choisir le test Chi - deux puis sur le bouton continue Cliquez sur le bouton Cellules et slectionner les frquences observes (Observ) et les frquences thorique (Thorique). Cliquez sur Continue puis sur OK pour lancer le traitement.
2.2 Subdiviser un fichier Cliquer sur la commande Donnes / Scinder un fichier / comparer les groupes puis slectionner la liste de variable La subdivision de fichier est quivalent travailler avec deux ou trois fichiers. (exemples)

Cours SPSS2

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Cours SPSS2

Încărcat de

Drepturi de autor:

Formate disponibile

Traitement de donnes avec SPSS

B) Le traitement des donnes

I) Manipulation de base sur les donnes

Les types de donnes :

Temps observs (minutes)

Trier des donnes

Quel est votre domaine dtude :

Quel est votre niveau ? :

Est ce que vous fumez ? :

Age Sexe tude Niveau Poids Taille 30 25 M F 2 1 3 2 75 55 1,80 1,75

II) La statistique descriptive

3) Distribution de frquences et histogramme

4) Traitement de donnes nominales

Question 3 : Age : * 18 34 ans .. * 35 54 ans .. * 55 ans et plus .

Ne prend pas lautobus

18 34 ans 35 54 ans 55 ans et plus

Tableau des donnes

Ne prend pas lautobus

La rgle arbitraire est la suivante :

* Diffrence significative p 0,01 (Trs significative)

III) Comparaisons de moyennes

1) Test de comparaison dune moyenne de population normale une valeur donne

Temps observs (minutes)

Les commandes sont :

2) Test dgalit de deux moyennes

Tableau des donnes

Tableau des donnes en SPSS

Les commandes sont :

3) Comparaisons de deux sries de

4) Test dgalit de trois moyennes

III) Le tableau crois

Tableau des donnes

Ne prend pas lautobus

Les commandes sont :

S-ar putea să vă placă și