Documente Academic
Documente Profesional
Documente Cultură
Initiation au traitement statistique sur micro-ordinateur avec SPSS Windows: Notes pour le cours CRI1600, Initiation aux mthodes quantitatives. Montral : Universit de Montral
1. LE LOGICIEL SPSS
SPSS (Statistical Package for Social Sciences) est essentiellement un logiciel de traitement de donnes en vue d'analyses statistiques. Il lit les donnes, les traduit en format SPSS, les transforme si demand et excute des oprations mathmatiques et statistiques.
2. L'ENVIRONNEMENT SPSS 2.1. LA FENTRE DITEUR DE DONNES La fentre diteur de donnes prsente le contenu d'un fichier de donnes que vous avez pralablement slectionn. Vous pouvez crer de nouvelles feuilles de donnes ou modifier des donnes prexistantes.
2.2. LA FENTRE VIEWER SPSS La fentre Viewer SPSS enregistre les rsultats des oprations effectues : tableaux, statistiques et diagrammes obtenus tout au long de votre session de travail. SPSS ouvre automatiquement cette fentre au dbut de chaque sance de travail et y inscrit l'ensemble des rsultats obtenus ainsi que le dtail des oprations effectues. Les rsultats sempilent les uns la suite des autres, au fur et mesure que vous effectuez de nouvelles oprations, lintrieur dune mme session de travail. Utilisez les menus de la fentre pour slectionner des fichiers, des statistiques et des diagrammes. Vous comprendrez aussi rapidement la pertinence de faire le mnage au fur et mesure dans les rsultats que vous produisez, une feuille Viewer SPSS qui ne -1Intro - CRI 1600G
serait pas dbarrasse des rsultats errons, ou ventuellement devenus inutiles, se faisant de plus en plus difficile consulter. 2.3. LES BARRES DOUTILS Chaque fentre sa barre doutils, utiliser comme dans dautres programmes Windows
2.4. LES BOTES DE DIALOGUE Les botes de dialogues permettent de slectionner des variables et des options pour effectuer des statistiques et des diagrammes.
Procdure pour ouvrir un fichier de donnes Fichier (choisir cette option dans le menu principal prsent en entte de SPSS)
"
Ouvrir
"
Donnes (la liste des fichiers de donnes lisibles pour SPSS apparat) cliquez sur le nom du fichier ncessaire vos analyses (extension .sav) qui apparat sous cette rubrique puis cliquez sur
"
OK.
Cette procdure ouvre automatiquement la fentre diteur de donnes dans laquelle apparaissent les donnes que vous avez appeles. Vous pouvez choisir, grce aux onglets au bas de lcran, entre laffichage des donnes et laffichage des variables. Le fichier, lorsque mis sous loption affichage des donnes, se prsente cette fois sous la forme suivante:
Le nom du fichier de donnes que vous avez slectionn apparat en entte de la fentre. Vous pouvez ds lors effectuer les traitements que vous jugez ncessaires, qu'il s'agisse de modifications l'intrieur mme du fichier de donnes ou de traitements statistiques. Dans lexemple qui prcde, le fichier de donnes ouvert porte le nom de Sondage victimes Qubec.sav . L'ouverture dun fichier de donnes doit toujours prcder les instructions de traitement statistiques donnes SPSS, autrement celui-ci ne pourra pas s'excuter, ne sachant pas quelles donnes traiter. Si des modifications ont t apportes au fichier de donnes pralablement ouvert, SPSS demandera lutilisateur si ces modifications doivent tre sauvegardes avant que le fichier soit ferm. Par ailleurs, il est impossible, dans SPSS, douvrir deux fichiers de donnes simultanment.
3.2. LES FICHIERS DE RSULTATS Les fichiers de rsultats se reconnaissent par lextension .spo suivant le nom attribu au fichier par lutilisateur. Ils apparaissent dans la fentre Viewer SPSS et consistent en Tant et aussi divers rsultats d'oprations prcdentes qui ont t sauvegards.
longtemps que lutilisateur na pas sauvegard le travail effectu en sance, le fichier se nomme RSULTATS1. Au moment de sauvegarder un fichier contenant les rsultats quil dsire conserver, lutilisateur doit obligatoirement lui donner un nom. ouvert, consult, dit, nouveau sauvegard... Mme si tout ce qui se retrouve dans le fichier rsultat est gnr automatiquement par SPSS, il est possible d'accder ces fichiers et de les diter, c'est--dire d'en modifier le contenu dans le but, par exemple, de prsenter intgralement les rsultats dans le cadre d'un travail remettre ou d'un article en production sans avoir en refaire manuellement la prsentation, ou encore pour faire du mnage : effacer les oprations inutiles ou les rsultats errons, enlever les messages derreurs dont on a pris connaissance ou produire une meilleure mise en page. Pour ce faire, il s'agit de manipuler le fichier comme vous le feriez si vous tiez dans un traitement de texte simplifi, en coupant, en collant et en ajoutant du nouveau texte. Les capacits de SPSS en matire traitement de texte sont toutefois limites. Nous verrons comment y pallier. partir de ce moment, le fichier peut tre manipul comme tout autre fichier, cest--dire quil peut tre
Procdure pour ouvrir un fichier de rsultats Fichier (choisir cette option dans le menu principal prsent en entte de SPSS)
"
Ouvrir
"
Rsultat
cliquez sur le nom du fichier choisi (nom .spo), puis sur
"
OK.
Voici un exemple dun fichier de rsultats o lon peut voir un tableau de frquence illustrant les rponses une question du sondage de victimisation :
N.B: Afin de passer d'un fichier de donnes un fichier de rsultats dj ouvert (ou vice versa), il sagit simplement de cliquer sur les onglets du bas de votre cran. Le fichier ouvert devant vous tant indiqu par une couleur distincte des autres.
4.1. TRAVAILLER AVEC LES MENUS, SOUS-MENUS ET LA SOURIS # C'est l'aide de la souris # que vous vous dplacerez dans SPSS. Le curseur indique l'endroit o vous vous trouvez. La touche de gauche de la souris # vous permet de slectionner, en cliquant dessus, un lment du menu, ou encore une commande, une sous-commande ou une option qui lui sont associes.
4.2. LES COMMANDES, LES SOUS-COMMANDES ET LES OPTIONS Les items qui apparaissent aux diffrents niveaux de menus sont des commandes, des sous-commandes ou des options que vous pouvez (ou dans certains cas devez) ou non slectionner afin de complter ou de prciser une commande principale que vous envisagez demander SPSS de mettre excution. SPSS prvoit ordinairement, par dfaut, un certain nombre d'options minimales qu'il associe automatiquement chaque commande ou sous-commande rencontre sous SPSS, selon le cas. Dans la mesure o ces options vous satisfont, vous n'avez rien d'autre spcifier que les commandes et souscommandes pour que SPSS remplisse la mission (de traitement des donnes) qui vous lui assignez. Une fois que vous avez construit une commande en spcifiant les variables dont vous avez besoin, et que vous avez slectionn les options que vous privilgiez en rapport avec lexcution de la commande en question, alors il ne vous reste plus qu' cliquer sur CONTINUE et/ou sur OK (selon le cas), pour que SPSS excute la commande.
N.B. Que vous vous trouviez dans n'importe quelle fentre, si, pour une raison ou une autre, vous voulez quitter cette fentre sans effectuer l'opration qu'elle vous prsente, cliquez simplement sur CANCEL. Vous tes alors ramen au menu prcdent ou, ventuellement, au menu principal, sans que SPSS nentreprenne aucun traitement des donnes.
4.3. RALISER UNE OPRATION DANS SPSS Une fois que vous savez comment utiliser la souris # et vous dplacer dans les divers menus et sous-menus de SPSS, rien n'est plus simple que de demander SPSS d'excuter une commande. En fait, il s'agit chaque fois de slectionner, via la souris # partir de laquelle vous cliquez, les oprations et les options que vous dsirez voir excuter, d'indiquer sur quelles variables les oprations doivent tre faites et, finalement, de lancer la commande en cliquant sur OK, ce qui confirme SPSS de se mettre en action.
N.B. Toutes les commandes de SPSS doivent se terminer par lordre "OK". Cette touche indique que la commande est complte et conforme et que vous tes prt ce qu'elle soit excute.
Si l'opration que vous venez d'excuter est une commande statistique, il est tout fait normal que la fentre rsultat apparaisse. Rappelez-vous aussi que tant et aussi longtemps que vous navez pas vous-mme sauvegard ce fichier-rsultat, celui-ci est temporaire et seffacera la fin de la sance de travail en cours. Voyez-y.
Par contre, notez bien que si vous travaillez sur les ordinateurs de l'universit, vous devez absolument sauvegarder le fruit de votre travail sur votre disquette, qui doit se trouver dans le lecteur a de lordinateur que vous utilisez, puisque vous n'avez pas accs la mmoire centrale (disque dur) en mode criture.
N.B.: Il est important que vous conserviez intact lextension de fichier (.sav ou .spo, selon le cas). On peut comparer cette extension un nom de famille qui permet au programme de savoir de quel type de fichier il s'agit, et dagir en consquence.
Procdure pour sauvegarder les dernires modifications apportes un fichier qui possde dj un nom (donc qui a dj t sauvegard) Reproduisez simplement les trois premires tapes dcrites ci-dessus.
ATTENTION: Chaque nouvelle sauvegarde de votre travail lintrieur dun fichier qui garde son nom crase l'ancienne version !!! Soyez donc sr de votre coup avant de sauvegarder un fichier nouveau ou modifi sous le nom dun ancien fichier car vous risquez ainsi de perdre une partie du travail antrieurement ralis, les nouvelles donnes prenant la place des anciennes.
Il peut tre trs utile de savoir sauvegarder des fichiers sous de nouveaux noms ou alors de s'en faire des copies ailleurs, comme par exemple sur une autre disquette. Faites en sorte que les noms de fichiers que vous choisissez vous disent quelque chose. La gestion de vos fichiers (et de votre temps) en sera ainsi grandement facilite.
N'hsitez pas multiplier les copies de vos fichiers, on ne sait jamais quelle catastrophe peut survenir et vous obliger tout recommencer si vous n'avez pas de copies jour de votre travail.
5.1. O SAUVEGARDER? LES DRIVES $ ET LES DIRECTORIES % Les drives font rfrence aux divers supports o vous pouvez conserver les fichiers en mmoire. En ce qui vous concerne, vous aurez sans doute travailler partir d'une disquette rigide &. Dans les ordinateurs de l'universit (se trouvant dans les diffrents laboratoires dont celui situ au 3ime tage du Pavillon Lionel-Groulx) le lecteur de disquettes rigides est appele lecteur a . Vous devrez donc slectionner le drive a: afin que le fichier ', quel quil soit, soit enregistr sur votre disquette &. Les dossier % sont, pour leur part, des rpertoires et des sous-rpertoires qui servent ordonner et classer les divers fichiers sur le disque dur $ ou sur les disquettes &. Dans les laboratoires de luniversit, par exemple, les ordinateurs mis en rseau (interconnects) sont organiss de telle sorte que sur le disque dur z: se trouvent diffrents rpertoires, dont celui des COURS. En double cliquant sur ce rpertoire % COURS, on accde, entre autres, au sous-rpertoire du cours CRI 1600G, l'intrieur duquel sont classs plusieurs fichiers.
6. VOUS VOUS SENTEZ DPASS ? VOUS TEZ MAL PRIS ? DEMANDEZ DABORD SPSS
VOUS AIDER.
DE
La plupart du
temps, cette source dinformation suffit nous dpanner dans les pires circonstances. Lorsque vous faites face une difficult qui vous semble insurmontable et pour laquelle le petit guide que vous avez en main et que vous avez parcouru en long et en large ne semble pas pouvoir rpondre vos questions, adressez-vous dabord au AIDE de SPSS. Il se fera un plaisir de tenter de vous rpondre. -9Intro - CRI 1600G
7. QUITTER SPSS
Procdure pour quitter SPSS et clore la session de travail: Cliquez sur Fichier dans le menu principal. Cliquez sur Quitter. Alors, automatiquement, SPSS vous demandera successivement si vous voulez sauvegarder les modifications qui ont t faites aux divers fichiers que vous avez utiliss. En temps normal, on sauvegarde tous les fichiers utiliss, mais il arrive aussi qu'on veuille viter enregistrer des fichiers ne contenant que des rsultats errons ou inutiles. On choisira alors de ne pas sauvegarder le fichier ou de faire le mnage avant de quitter de faon ne conserver que les bons rsultats . En d'autres mots, il vaut mieux prendre le temps de rflchir avant de cliquer sur OK et de tout sauvegarder sans discernement. Ces quelques secondes de rflexion pourraient dans certains cas vous sauver beaucoup d'ennuis et de temps. Par exemple, prenez le temps de vous demander si vous avez bel et bien effectu des transformations dans les donnes avant d'accepter de sauvegarder le fichier de donnes. Il arrive en effet qu'on accroche le clavier de lordinateur, par inadvertance, alors que la fentre des donnes est active. Cet accrochage pourrait ventuellement changer des donnes pralablement correctement inscrites dans le fichier de donnes. Par contre, si vous tes certains de vouloir sauvegarder le contenu du fichier qui vous est indiqu, alors vous navez qu rpondre oui linvitation qui vous est faite de procder de la sorte. SPSS vous prsente ds lors le nom du fichier sauvegarder ainsi que le rpertoire sur lequel il se trouve. Vous pouvez alors choisir de conserver le mme nom de fichier. Dans ce cas, SPSS crase lancienne version du fichier pour la remplacer par la nouvelle que vous venez de crer. Vous pouvez aussi choisir de changer le nom du fichier. Il sagit alors de remplacer la partie du nom qui prcde le suffixe .sav ou .spo qui indique le type de fichier dont il sagit, par un autre nom. Dans ce cas, linformation contenue dans le fichier original est conserve et linformation modifie est sauvegarde sous le nouveau nom de fichier. Ceci est vrai (cest--dire que linformation originelle est conserve) tant et aussi longtemps que nous neffectuez pas une procdure de sauvegarde sadressant au fichier original.
N.B.: Vous devez absolument utiliser des disquettes rigides &, idalement de type high density (HD). Vous ne pouvez pas enregistrer vos rsultats sur le disque dur $ des ordinateurs ( de luniversit, alors n'oubliez pas de sauvegarder rgulirement votre travail sur une disquette &. N'oubliez pas de reprendre votre disquette & la fin de chaque session de travail Identifiez clairement vos disquettes &, de sorte que si, par malheur, vous les oubliez dans le lecteur a dun ordinateur du Pavillon Lionel-Groulx, par exemple, ce qui ne manque jamais darriver, vous puissiez ventuellement les rcuprer. La semaine suivante, rapportez votre disquette de travail, sinon vous ne pourrez tout simplement pas travailler, moins de tout reprendre depuis le dbut )
La plupart du temps, lorsquon traite statistiquement des informations, on travaille partir de fichiers de donnes dj constitus. Mais il arrive aussi qu'il faille btir une nouvelle banque de donnes. Lopration est gnralement trs simple. Il faut toutefois avoir pralablement compris la faon dont se prsente une grille de donnes. Dans un fichier de donnes, chaque cas (individu, rpondant, dossier...) est reprsent par une ligne contenant les donnes pour un ensemble de variables. Les variables, pour leur part, figurent en colonnes (chaque variable occupe l'espace d'une colonne). La rencontre d'une variable et d'un cas se prsentera donc sous forme dune cellule dans laquelle l'information se trouve consigne. Exemple: si Paul a 21 ans, l'intersection du cas Paul et de la variable ge se trouvera le chiffre 21 . Par dfaut, lorsque vous ouvrez SPSS, une grille de donnes vierge apparat. Il s'agit alors simplement d'effectuer la saisie des donnes (ce qui veut tout simplement dire d'entrer les donnes dans la grille informatique prvue cet effet). On aura alors soin de sauvegarder le fichier le plus tt possible et de procder des sauvegardes rgulires au fur et mesure de lentre des donnes, de sorte quune panne soudaine naura que des effets limits (autrement dsastreux).
Afin de vous dplacer dans un fichier de donnes, vous avez le choix procder avec la souris#, les flches + , - . se trouvant sur le sur le clavier / ou alors grce aux ascenseurs situs en bas et sur le ct de l'cran (. approprie et d'inscrire l'information en question. Si vous voulez inscrire ou corriger des donnes, il s'agira alors simplement de placer le curseur dans la case L'information apparatra dans la grille seulement aprs que vous ayez quitt cette case, soit en appuyant sur la touche enter, soit en vous dplaant avec la souris #, ou les flches + , - ., vers une autre cellule ou lextrieur du tableau de donnes.
prfrera toujours, dans la mesure du possible, associer une forme numrique aux donnes. En effet, SPSS travaille beaucoup plus facilement avec des chiffres qu'avec des lettres. Dans le cas des donnes de niveau de mesure nominal ou ordinal, il s'agit alors d'attribuer un code numrique aux donnes. Par exemple, pour indiquer le sexe d'un individu, on prfrera coder les rponses de la faon suivante: femmes: "1"; hommes: "2", plutt que femmes: "F"; hommes: "H". Bien entendu, pour certaines variables telles le nom, le prnom, les alias... il est quasi impossible d'imaginer une codification un tant soit peu sense. Il s'agira donc d'une contrainte incontournable. Le traitement de telles donnes, dans le cadre danalyses statistiques, est toutefois fort limit ce qui diminue les inconvnients que pose leur forme alphanumrique.
VARIABLES
prnom Annie Caroline Claude Andr Monique Marcel Roger Annie Michelle Andr
Nom Lger Pelletier Gagnon Perron gagn Tremblay Pich Caron Martin Sguin
intra 25 22 24 29 29 27 13 19 17 19
tp3 10 7 8 9 7 6 8 8 8 7
final 35 32 34 38 33 36 32 39 35 30
sexe 1 1 2 2 1 2 2 1 1 2
date nai. 780116 771221 760512 780721 681122 790915 730508 800401 770523 580420
3.
Il est toujours possible d'ajouter une ligne (un cas) ou une colonne (une variable) un fichier de donnes dj constitu. Pour ce faire:
procdures pour insrer un nouveau cas ou une nouvelle variable dans une banque de donnes
Placez le curseur soit sur la ligne qui se trouve immdiatement sous l'endroit o vous voulez que le nouveau cas apparaisse, soit sur la colonne situe immdiatement aprs l'endroit o vous dsirez que la nouvelle variable apparaisse. Cliquez sur Donnes dans le menu principal. Cliquez sur Insrer une observation ou Insrer une variable, selon que vous voulez voir apparatre une nouvelle ligne recevant un nouvel enregistrement ou une nouvelle colonne ajoutant une nouvelle variable aux donnes.
Vous pouvez ds lors insrer linformation se rapportant au nouveau cas ou la nouvelle variable que vous ajoutez au tableau des donnes en remplissant chacune des cellules correspondant lemplacement o doit se trouver la nouvelle information.
alphanumriques (vitez les caractres spciaux du genre #, $, !..., leur usage pouvant tre rserv pour SPSS), sans espaces (on peut lier les deux parties du nom par un petit tiret _ comme dans sex_rep pour sexe du rpondant). Procdure pour nommer plus prcisment une variable Double-cliquez dans le rectangle gris au-dessus de la colonne contenant les valeurs de la variable nommer ou cliquez sur longlet affichage des variable au bas de la fentre Il apparatra la liste des variables et de leurs caractristiques, comme son nom, son type, sa largeur, les dcimales prvues, son tiquette, ses valeurs, les valeurs manquantes associes cette variable. Vous navez plus qu complter ou corriger chacune des cases afin de bien nommer et qualifier vos donnes. NOM : Le nom donn la variable doit contenir un maximum de 8 caractres non accentus et sans espaces intercals. TYPE : De prfrence, veuillez traiter vos variables comme si elles taient toutes numriques, mais gardez en tte que toutes les oprations ne peuvent tre faites sur nimporte quel type de variable.
Dans le cas de variables proportionnelles, comme par exemple lge du rpondant ou le salaire familial brut calcul sur une base annuelle, il nest pas utile de chercher tiquetter les valeurs de la variable puisque les donnes portent de facto ltiquette laquelle elles correspondent (25 ans, 30 ans , 40 ans... 22,432$, 70,557$, 253,500$. Lapposition dune tiquette prcisant le nom de la variable demeure toutefois de mise.
Une fois que vous avez associ la bonne valeur au chiffre correspondant, cliquez sur Ajouter. Linformation se retrouve alors dans le rectangle de droite. Recommencez lopration jusqu ce que toutes les valeurs numriques de la variable aient leur tiquette. N.B. N'oubliez pas d'appuyer sur Ajouter aprs avoir prcis chaque tiquette correspondant une valeur donne de la variable. Lorsque toutes les valeurs de la variable ont reu leur tiquette, cliquez sur OK
Procdure pour signifier SPSS la prsence de valeurs manquantes pour une variable Cliquez sur le petit carr gris apparaissant dans la case approprie. Il apparatra alors une seconde zone de dialogue:
Spss vous soumet diffrentes options: 0 Aucune valeur manquante: signale quil ny a pas de valeurs manquantes pour cette variable Il sagit de la valeur par dfaut de cette sous-commande. 0 Valeurs manquantes discrtes: trois rectangles sont ici prvus afin de permettre de dfinir jusqu trois valeurs manquantes pour une mme variable. Trs souvent, on choisi les valeurs 9, 99 ou 999 comme valeurs manquantes, condition bien entendu que ces valeurs ne sont pas des valeurs possible de la variable. 0 Plage et valeurs manquantes discrtes facultatives: vous permet de dclarer toutes les valeurs comprises entre une borne infrieure (Faible) et une borne suprieure (leve) comme tant autant de valeurs manquantes. Par exemple on pourrait vouloir prciser que toutes les valeurs comprises entre 75 et 99, pour la variable ge du rpondant, correspondent autant de valeurs manquantes. 0 Valeur discrte: reprend les proprits de loption prcdente toute en permettant dajouter la dclaration dune valeur discrte comme tant aussi manquante.
Une fois que vous avez constitu votre fichier de donnes, nomm vos variables, attribus des tiquettes plus explicites tant aux variables quaux catgories des variables de niveau de mesure nominal et ordinal, vous tes prts passer aux traitements statistiques des donnes proprement dites. Les labo suivants ont pour but de vous guider dans cette tche, quil sagisse de produire des distributions de frquences, des tableaux croiss des statistiques uni ou bi-varis.
Que vous ayez vous-mme cr une banque de donnes ou que celle-ci vous ait t fournie, il s'agit maintenant d'explorer ces donnes, de vous les approprier suffisamment pour bien les comprendre et pour voir s'il n'y aurait pas quelques modifications leur apporter pour qu'elles puissent tre plus facilement analyses.
Valide
Manquante
Augment Diminu Demeur le mme Total Ne sait pas Non dclar Total
Total
Dans le haut du tableau on retrouve ltiquette de la variable pour laquelle on a demand la production dune distribution des frquences. Viennent ensuite les
tiquettes attribues chacune des valeurs de la variable. Frquence Pourcentage o Le nombre de cas correspondant chacune des valeurs de la variable. Le pourcentages de cas que reprsente chacune des valeurs ou catgories de la variable par rapport l'ensemble des cas, y compris les valeurs manquantes (nombre de cas correspondant une valeur ou catgorie donne / nombre total de cas) Pourcentages des cas associs chacune des valeurs ou catgories dune variable par rapport au nombre de cas valides, cest--dire l'exclusion des valeurs manquantes (nombre de cas correspondant une valeur ou catgorie donne / nombre total de cas nombre de valeurs manquantes).
Pourcentage valide o
Pourcentages cumuls Pourcentage d'une catgorie dune variable ajout aux pourcentages que o cumulent les catgories prcdentes. Les pourcentages cumuls ne sont ordinairement pas pertinents lorsqu'il s'agit d'une variable de niveau de mesure nominal car, dans ce cas, il est impossible dordonner de quelque faon que ce soit les rsultats. Par contre, dans le cas de la distribution d'une variable de niveau ordinal ou proportionnel, les pourcentages cumuls permettent de situer facilement l'emplacement d'une fraction des individus partageant une caractristique donne (ex: 75% des individus ont moins de 30 ans). Cette donne ne sera toutefois intressante que si le nombre de catgories que compte la variable ltude est suffisamment important.
procdure pour crer un tableau de frquence Cliquez sur Analyse dans le menu principal " cliquez sur Statistiques descriptives... " cliquez sur Frequences... Slectionnez la variable pour laquelle vous dsirez obtenir une distribution de frquences en cliquant sur son nom tel qu'il apparat dans le rectangle de gauche (lequel prsente la liste des variables ltude, par ordre alphabtique). (si le nom de la variable napparat pas lcran, dplacez-vous dans le rectangle grce l'ascenseur droite de lcran, la variable recherche est certainement situe plus haut ou plus bas dans la fentre). Cliquez maintenant sur la flche situe entre les deux rectangles. Vous verrez alors le nom de la variable sauter du rectangle de droite au rectangle de gauche. " cliquez sur OK (confirme SPSS dexcuter la commande)
En format SPSS, lcran de dialogue qui apparat est le suivant, alors quon demande la distribution des frquences de la variable Crim dans votre quartier , laquelle est passe du rectangle de gauche, contenant les liste exhaustive des variables contenues dans le fichier de donnes, dans le rectangle de droite, lequel prcise les variables pour lesquelles une distribution de frquences est demande.
Cette manire de slectionner les variables sur lesquelles on veut effectuer des oprations (en les faisant passer dun rectangle lautre) est la mme partout dans SPSS, souvenez-vous-en. Notez aussi que vous pouvez slectionner plusieurs variables la fois en retenant le bouton de la souris et en la dplaant vers le haut ou vers le bas de lcran jusqu ce que lensemble des variables quon souhaite soumettre lanalyse soient noircies (et en autant quelles se suivent dans la liste des variables). Mais surtout, notez qu' chaque fois que vous effectuez une nouvelle opration, il faut commencer par RANGER LES ANCIENNES VARIABLES en les slectionnant dans le rectangle de droite et en les envoyant dans le rectangle de gauche (ou en cliquant sur le bouton Restaurer ce qui a pour effet de ramener lensemble des variables leur emplacement initial. Cela vous vitera de nombreux ennuis, dont celui daccumuler inutilement des rsultats reproduits plusieurs fois et vitera SPSS de travailler pour rien.
traitement de texte plus classique afin dy intgrer des commentaires, de dcrire les rsultats ou encore de fignoler la prsentation. Rappelez-vous que si SPSS est fort puissant pour ce qui est de calculer des statistiques, ses capacits en matire de traitement de texte sont par contre des plus limites. Procdure pour imprimer directement le fichier rsultat partir du menu dentte de SPSS, choisir la commande Fichier (dans le menu principal) " Imprimer... Choisir entre les options " OK (confirme SPSS dexcuter la commande).
Parfois, il est plus intressant de travailler partir dun logiciel de traitement de texte si vous voulez insrer du texte (linterprtation des rsultats par exemple), ou encore prsenter vos rsultats de manire diffrente. Pour ce faire, nous suggrons soit de faire une simple couper-coller , soit de refaire entirement vos tableaux sur Word, si vous dsirez avoir encore davantage de latitude.
4.1. LES VALEURS MANQUANTES Il arrive dans certains cas que toute l'information concernant tous les individus pour l'ensemble des variables ou encore pour une variable en particulier ne soit pas disponible. Dans ce cas, on dira que l'information est manquante. Un code sera alors utilis pour en rendre compte. manquantes. C'est l'utilisateur de choisir le code qui lui convient pour identifier les valeurs manquantes lintrieur de sa banque de donnes. Par convention, le chiffre 9 (ou 99 ou 999 , selon le cas) est le plus souvent utilis. On peut aussi prvoir diffrents types de valeurs manquantes et leur attribuer diffrents codes permettant de les distinguer. Par exemple, on attribuera la valeur 7 ceux qui, en rponse une question, indiquent ne sait pas ; la valeur 8 ceux qui refusent de rpondre, et la valeur 9 pour toute information vraiment manquante Il arrive trs souvent quon trouve des valeurs manquantes dans la distribution des donnes, mais que l'ordinateur ne le sache pas initialement. SPSS. Il faut donc que vous observiez chaque tableau en vous demandant s'il y a des valeurs manquantes signifier Vous reconnatrez les valeurs manquantes par leur code numrique (9, 99, 999,...), par l'tiquette qui leur est attache (pas de rponse; N.S.P.; ne s'applique pas; indtermin, ...) ou par l'absence d'annotation. Il est important, au moment de traiter les frquences des rponses, de faire le bilan des valeurs manquantes. Une variable qui prsente un trop grand nombre de valeurs manquantes pourra tre considre non valide. On peut, au contraire, dcider que le nombre de valeurs manquantes n'est pas suffisant pour invalider le traitement de la variable. Toutefois, on ne voudra pas tenir compte des valeurs manquantes dans les analyses. Il faudra alors indiquer SPSS de ne pas tenir compte, au moment des analyses statistiques, des individus pour lesquels l'information n'est pas disponible. Nous verrons comment plus loin. Ce code sert prcisment identifier les valeurs
N.B.: La catgorie rsiduelle Autres ne correspond pas des valeurs manquantes. Elle indique plutt que linformation est autre que celle prvue dans les catgories de rponses prtablies - 25 Labo 2 - CRI 1600G
Statut de l'agresseur
Valeur Suspect Accus Condamn N.S.P. 1 2 3 6 9 Total
Valeurs manquantes: 0
La logique aussi peut nous aider dtecter des erreurs, comme si dans un tableau reprsentant l'ge des meurtriers, on retrouve la valeur 2 . Puisqu'il est fort peu probable que l'un des tueurs apparaissant dans la distribution des donnes ait vraiment eu deux ans au moment de lvnement, on prfrera inclure ce cas dans les valeurs manquantes ou, ventuellement, corriger linformation dans le fichier des donnes, pour peu quon puisse retrouver la bonne donne.
semblent tre parentes ou de limiter le nombre des catgories analyser. Par exemple, on pourrait vouloir faire seulement 3 catgories avec la liste de dlits reprsente au tableau suivant. On regrouperait alors les catgories 1 homicide + 2 agression sexuelle + 3 vol qualifi sous la grande rubrique: 1 dlits contre la personne; les catgories 4 introduction par effraction + 5 vol de moins de 1000$ + 6 vol de plus de 1000$ sous la grande rubrique: 2 dlits contre la proprit; et finalement les catgories 7 possession de stupfiants + 8 prostitution sous la grande rubrique: 3 dlits sans victimes.
*Dlits contre la personne comprenant: homicide, agression sexuelle, vol qualifi; dlits contre les biens comprenant: introduction par effraction, vol de plus et vol de moins de 1000$; et dlits sans victimes comprenant: possession de stupfiants et prostitution.
- Les variables proportionnelles Les variables proportionnelles, pour leur part, prsentent habituellement un tel nombre de valeurs qu'il faut, presque toujours, les regrouper en un nombre limit de catgories si on veut en prsenter un tableau de frquences lisible. Vous constaterez en effet que le tableau de frquences d'une variable proportionnelle est souvent extrmement long, sa prsentation peut occuper jusqu plusieurs pages, et qu'il est assez peu instructif, linformation se trouvant grandement parpille. prsentation et de consultation rapide du matriel. Par contre, en crant des catgories plus larges, on rgle souvent le problme de
RAPPEL: 4
types
de
regroupements
sont
possibles
pour
les
variables
proportionnelles En classes de largeurs gales En classes d'ingales largeurs respectant un principe conceptuel En classes d'ingales largeurs constitues autour de points de concentration des donnes En classes d'ingales largeurs constitues pour respecter un modle prtabli d'analyse Ces procdures de recodage ne sont par ailleurs pas ncessairement mutuellement exclusives. Il est en effet possible de combiner plusieurs dentre elles. Ainsi, une catgorisation, mme en classes dgales largeurs, pourrait rpondre des caractristiques conceptuelles... etc.
Dans tous les cas, la catgorisation dune variable devra rpondre deux impratifs:
1Les catgories doivent tre mutuellement exclusives et 1 elles doivent tre exhaustives.
5. PRPARER LE RECODAGE
Vous devez maintenant prparer tous les changements effectuer sur vos donnes avant de passer aux analyses dfinitives. Il s'agit tout simplement de noter, propos de toutes les variables pertinentes, les transformations que vous dsirez effectuer.
Demandez-vous: Cette variable m'intresse-t-elle? Y a-t-il des valeurs manquantes non dclares? Y a-t-il des valeurs absurdes? Faut-il organiser une nouvelle catgorisation (un recodage)? C'est ici la base de tout travail d'analyse de qualit.
Voici quoi pourrait ressembler lutilisation dune distribution de frquences pour fins de nettoyage et de recodage (notification normalement faites manuellement):
ARME
Arme utilise par l'agresseur Valid % ,6 1,4 10,0 ,6 1,5 12,9 1,7 5,7 ,1 ,2 62,8 1,9 ,5 ,1 ,1 ,1 ------Cum % ,6 2,0 11,9 12,5 14,0 26,9 28,5 34,2
Valeur automatique canon sci arme de poing arme feu carabine/fusil autre arme feu couteau autre tranchant/pointu objet contondant armes explosifs feu force physique darmes autre arme menace =missing inconnu N.S.P. Total Valid cases 1574 Missing cases 0 1 2 3 4 5 6 7 8 9 10 11 12 13 43 98 99
1:
=2: autr.
34,3 34,5 97,3 = 3: pas 99,2 = 2 99,7 = 3 99,8 erreur 99,9 missing 100,0 missing 100,0
Voici de quoi pourrait avoir l'air le tableau de frquence de la mme variable, une fois celle-ci retravaille (mnage et recodage fait partir de SPSS):
ARME
Arme utilise par l'agresseur Valeur Freq. 220 353 998 % 14,0 22,5 63,5 Valid % 14,0 22,5 63,5 Cum % 14,0 36,5 100,0
1 2 3
1571
100,0
Il
s'agit
maintenant
d'effectuer
toutes
les
transformations
sur
les
donnes,
1. RECODER OU TRANSFORMER LES VARIABLES Voyons comment s'y prendre pour transformer la catgorisation initiale dune variable, ou, en langage SPSS, comment "recoder" une variable. Procdure pour recoder une variable Transformer " Recoder " Cration de variable2
Loption RECODAGE DE VARIABLE est aussi disponible. Toutefois, nous suggrons fortement de ne jamais recoder la variable initiale en tant que telle, car une fois les transformations effectues, il nest plus possible de revenir en arrire et de retrouver les valeurs telles
Slectionnez la variable transformer dans le rectangle de gauche Cliquez sur la flche 2 le nom de la variable slectionne apparat dans le rectangle Variable entre --> Variable Inscrivez laide du clavier dordinateur, dans le rectangle de droite, le nom de la nouvelle variable cre ainsi que son tiquette (ex: infractions en trois catgories) Cliquez sur Remplacer Cliquez sur Anciennes et nouvelles valeurs... Une nouvelle zone de dialogue apparat encore une fois:
Inscrivez, dans le rectangle de gauche, la ou les valeur(s) numrique(s) que vous voulez changer:
- il peut sagir dune valeur unique 3 Valeur - dune valeur antrieurement dclare manquante 3 Manquante par dfault ou 3 Manquante par dfault ou spcifie - ou dune suite de valeurs 3 Intervalle (ex:: les valeurs 1 5----> 1 5 )
Associez, dans le rectangle de droite, la nouvelle valeur (nouvelle: 1) une ou plusieurs anciennes valeurs Cliquez sur Ajouter. Recommencez les deux dernires oprations jusqu' ce que vous ayez trait toutes les valeurs recoder. Attention, si certaines valeurs ne doivent pas tre recodes, il nest pas ncessaire de faire correspondre anciennes et nouvelles valeurs qui sont alors quivalentes. On doit toutefois prciser SPSS que pour toutes ces valeurs (toutes les autres valeurs dans le rectangle de gauche en bas), la valeur de la variable demeure la mme, ceci en lui prcisant de les recopier (copier les anciennes valeurs) dans le rectangle de droite en haut de lcran).
quinitialement colliges. Il vaut donc mieux garder une version intacte de la variable initiale et ne travailler quavec des duplicata pour tout ce qui touche les transformations des donnes.
Une fois toutes les oprations de transformation ralises, terminez la procdure de la faon suivante: Cliquez sur Ajouter (pour enregistrer la dernire commande de modification) " Poursuivre " OK (complte la procdure)
CLS UTILES POUR LE RECODAGE DES VARIABLES NUMRIQUES (permet de raccourcir l'criture du recodage)
de la plus petite (recode la plus grande (recode ... ... (recode Toutes les autres valeurs les valeurs plus petites que) les valeurs plus grandes que) les valeurs comprises entre ... et ...) (recode les valeurs restantes pour lesquelles aucun autre recodage n'est prvu)
MISE EN GARDE: Appliquez la recodification dune variable de prfrence la variable "nettoye", i.e. celle o les valeurs manquantes sont dj dfinies et les donnes erratiques corriges ou limines en les associant aux valeurs manquantes, lorsque que vous procdez la transformation dune variable. Sinon, n'oubliez pas de redfinir (ou rappeler) SPSS la prsence des valeurs manquantes. Une valeur ne peut tre recode plus d'une fois au cours d'une mme procdure. Toutefois on peut appliquer une mme variable toute une srie de recodages, en autant quon cre autant de nouvelles variables quil y a de recodages diffrents denvisags pour cette mme variable. N'oubliez pas, immdiatement aprs le recodage, d'aller vrifier si les transformations ont effectivement eu lieu. Vous les verrez apparatre dans le fichier de donnes. Mais ne vous attendez pas les voir apparatre dans un tableau de frquences tant et aussi longtemps que vous navez pas command un tableau de frquences pour cette nouvelle variable (et non pour lancienne qui est demeure intacte). Procdez immdiatement ltiquettage des valeurs de la nouvelle variable. ( labo 1).
3. Calculer, OU CRER DE NOUVELLES VARIABLES La commande Calculer permet de crer une nouvelle variable, partir d'une variable dj existante, pour tous les cas d'une banque de donnes. Elle permet, par exemple, de crer, partir d'une banque de donnes incluant toutes les notes d'un tudiant dans un cours donn, une nouvelle variable qui correspond la somme de toutes ces notes, donc son rsultat final (resultat = tp1 + tp2). Il sagit l dun exemple trs simple de ce que l'on peut faire avec la commande Calculer. Dites-vous que la commande Calculer peut effectuer peu prs n'importe quelle opration mathmatique que lon souhaite appliquer aux donnes. Voyons brivement comment sy prendre dans les cas les plus simples.
Procdure pour crer une nouvelle variable laide de la commande Calculer partir du fichier dentte de SPSS, suivre le cheminement suivant: Transformer (choisir cette option dans le menu principal prsent en entte de SPSS) " Calculer Un cran de dialogue apparat:
Inscrire, laide du clavier dordinateur /, le nom de la nouvelle variable dans le rectangle (Variable destination) situ en haut gauche de lcran de dialogue. Cliquer sur Type et tiquette pour apposer une tiquette cette nouvelle variable.
crire, droite, l'expression numrique permettant la cration de cette nouvelle variable (vous pouvez soit l'crire grce au clavier dordinateur, soit utiliser la zone de
dialogue en slectionnant les variables sa gauche, les oprateurs et les fonctions endessous et en cliquant successivement sur les touches correspondant aux donnes ncessaires la cration de la nouvelle variable).
Il existe une infinit de possibilits pour crer de nouvelles variables partir doprations plus ou moins complexes. Nous nous contenterons dindiquer ici la faon dinscrire les principaux oprateurs mathmatiques ainsi que quelques fonctions de transformations parmi les plus courantes, rappelez-vous seulement quoprateurs et fonctions peuvent tre combins volont.
Oprateurs:
+: -: *: /: **:
plus petit, plus grand; plus petit ou gal, plus grand ou gal. et ou
Quelques fonctions:
valeur absolue moyenne racine carre arrondir au nombre entier faire la somme calculer la priode entre deux dates
N.B. L'ordre d'excution des oprations arithmtiques dans SPSS ne diffre pas de celui que vous avez appris dans vos cours de mathmatiques: exponentiels en premier lieu; multiplications et divisions en second lieu; additions et soustractions en troisime lieu.
Il est important de se le rappeler sinon on risque de ne pas obtenir les rsultats souhaits. Seules les parenthses peuvent modifier l'ordre d'excution des oprations.
4. L'OPTION SI: L'option SI, qui se prsente sous la forme d'un rectangle situ juste en-dessous des oprations et des fonctions de plusieurs commandes, permet de crer, de recoder ou d'associer une valeur une variable SOUS CERTAINES CONDITIONS. On retrouve loption SI pour les commandes recoder, cration de variable ou calculer et bien dautres (que vous verrez ultrieurement). La procdure est toujours la mme ou fort approche:
Procdure suivre pour imposer une condition une commande Atteindre la commande pour laquelle on veut imposer une condition dexcution (recode, calculer ...) Reprer loption SI dans lcran de dialogue correspondant Cliquer sur SI...
Un nouvel cran de dialogue apparat lequel revt plus ou moins la forme suivante vous permettant de prciser les conditions appliquer la commande (recode, calculer...) en cours:
"
ATTENTION On prendra la prcaution de sauvegarder le fichier constitu uniquement des donnes concernant les mineurs sous un nouveau nom. Ceci a pour effet de conserver le fichier de donnes initial intact et de crer un nouveau fichier de donnes contenant uniquement celles pertinentes ltude en cours, ici une tude portant sur la criminalit des mineurs. Ceci fait en sorte quadvenant quon veuille reproduire ltude pour les adultes, ou encore quon souhaite comparer ce qui se passe dans le cas des adultes par rapport aux mineurs, on possde toujours linformation ncessaire dans le fichier de donnes dorigine.
Exemple 2:
Recherche qui utilise un sous-groupe de la population ou de lchantillon initial pour une partie seulement des analyses
Ltude que vous entreprenez consiste dresser le portrait des populations en institutions carcrales. Vient le moment danalyser les donnes concernant la nature (peine pour non-paiement damende, sentence de juridiction provinciale ou sentence de juridiction fdrale) et la dure (en nombre de jours) des peines imposes. On sait que les prisons du Qubec accueillent la fois des prvenus (des suspects en attente de verdict ou de sentence) et des condamns (individus reconnus coupables qui se voient imposer une peine de prison). La question de la dure des sentences concerne uniquement les individus condamns (les autres ne connaissant pas encore le verdict ou la sentence dans leur cause). Aussi, cette partie des analyses, spcifiquement, ne portera que sur ceux dj condamns. Il sagit alors en quelque sorte de neutraliser la partie de la population ou de lchantillon de dpart qui ne doit pas tre prise en compte pour cette partie prcise des analyses. On effectuera alors une slection temporaire (option Filtres, voir plus bas) des cas devant tre pris en compte cette tape de lanalyse.
REMARQUE Au moment dinterprter les rsultats, il faudra prendre la prcaution de prciser que les analyses portent sur une partie seulement des donnes, celles concernes par la variable ltude. Ainsi, par exemple, on crira que: pour les personnes admises dans les institutions carcrales du Qubec et condamnes une peine de prison, la dure moyenne de la peine est de ... .
Exemple 3: Recherche qui utilise une variable contrle On vous demande de vrifier l'hypothse selon laquelle le mariage serait pour les femmes un facteur important dans la dcision de cesser une carrire criminelle mais pas pour les hommes (variable contrle: sexe de lindividu). Il sagit alors dutiliser une banque de donnes comprenant la fois des hommes et des femmes nanmoins analyss sparment. Ici, il sagit, dans un premier temps, deffectuer les analyses sur le sous-groupe (sous-population ou sous-chantillon) compos uniquement des femmes pour ensuite refaire ces analyses sur le sous-groupe (sous-population ou souschantillon) regroupant spcifiquement les hommes. Schma danalyse: 1re condition impose : Slectionner selon une condition logique SI SEXE = 1 (Si la
1re srie de traitements statistiques concernant le sous-groupe des femmes. 2me condition impose: Slectionner selon une condition logique SI SEXE = 2 (Si la
2ime srie de traitements statistiques (quivalents aux premiers) concernant cette fois le sous-groupe des hommes.
Comparaison des donnes obtenues dans les deux cas. Procdures pour slectionner un sous-groupe (tir dune population ou dun chantillon initial) partir du fichier dentte de SPSS, suivre le cheminement suivant:
" Donnes (choisir cette option dans le menu principal prsent en entte de
SPSS)
Choisir loption " 3 Selon une condition logique " Cliquer sur le rectangle SI...
crire dans le rectangle de droite, laide du clavier dordinateur /, la condition permettant la cration du sous-groupe (sous-population ou du sous-chantillon) requis. " Poursuivre REMARQUE: Pour liminer DFINITIVEMENT, cest--dire pour lensemble des analyses ralises dans le cadre de ltude en cours, les cas qui ne rpondent pas aux conditions du groupe sousmis aux analayses: choisir loption " sinon laisser sur " 3 Supprimes 3 Filtres (option par dfaut) la slection est alors
temporaire et il est possible de retourner aisment l'ensemble de la population ou de lchantillon de dpart, ceci en slectionnant:
"
OK.
Remarquez que lorsquune slection temporaire dune sous-population ou dun souschantillon (par l'option Filtres) est effectue pour une partie des analyses, les cas non-slectionns sont facilement identifiables dans la fentre Donnes puisque le numro didentification des lignes correspondantes apparat comme tant barr.
2. SLECTIONNER UN CHANTILLON La commande Slectionner des observations Par chantillon alatoire permet de crer un chantillon alatoire temporaire ou permanent partir d'un fichier de donnes. Une fois que vous avez cr un chantillon, toutes les commandes suivantes sont excutes partir de cet chantillon, jusqu' ce quune nouvelle commande indique SPSS de revenir la population ou lchantillon de dpart.
Procdures pour slectionner un chantillon alatoire parmi l'ensemble des cas " Donnes "Slectionner des observations... " 3 Par chantillon alatoire Cliquer sur "chantillon... puis:
Soit, indiquer le % des cas devant tre gards dans l'chantillon Soit, indiquer le nombre de cas que l'ordinateur doit slectionner.
(Suivant cette procdure, indiquer dans le second rectangle, le nombre de cas que contient initialement la banque de donnes)
Choisir
" "
3 Filtres 3 Supprimes
selon que vous vouliez que l'chantillonnage soit temporaire ou permanent, suivant en cela la mme logique que celle prcdemment prsente.
"Donnes "Slectionner des observations... "3 Toutes les observaions " OK.
1. LES MESURES DE TENDANCES CENTRALES ET DE DISPERSION Les mesures de tendance centrale et de dispersion sont tout particulirement pertinentes lorsqu'il s'agit de dcrire des variables de niveau de mesure proportionnelle ou intervalle.
partir du menu principal choisir successivement: " Analyse " Statistiques descriptives " Frquence (lcran de dialogue que vous connaissez maintenant apparat) Slectionner la variable voulue: (toujours la version proportionnelle ou brute dbarasse des valeurs manquantes :il sagit de la seule valide pour calculer des statistiques Cliquer dans le carr Afficher les tableaux de frquence afin d'enlever le X qui sy trouve (sil sy trouve) car un X dans ce petit carr indique SPSS quon ne souhaite pas que le tableau de frquences soit fourni.
Par contre, lorsquil sagit de produire des statistiques sur un tableau de frquences concernant une variable de niveau interval ou proportionnel, on peut indiquer SPSS les statistiques souhaites tout en lui prcisant quon ne dsire pas voir apparatre le tableau de frquences correspondant, lequel stendrait probablement sur plusieurs pages. vous de choisir la bonne option.
Choisir les mesures de tendances centrales ou de dispersion dont vous avez besoin en cliquant dans les carrs prcdant la statistique en question. "Poursuivre ... " OK
Mode: Somme:
LES MESURES DE DISPERSION cart-type mesure la dispersion des observations autour de la moyenne. Un cart-type qui est grand par rapport la moyenne indique la prsence de donnes disperses autour de la moyenne donc htrognes, alors quun cart-type petit par rapport la moyenne indique la prsence de donnes concentres autour de la moyenne donc relativement homognes. cart-type lev au carr. Sinterprte en termes dunits carres.
Variance :
diffrence entre la plus grande valeur et la plus petite valeur d'une srie d'observations. plus petite et distribution. plus grande valeurs rencontres dans la
LES MESURES QUI RENDENT COMPTE DE LA FORME DE LA DISTRIBUTION APLATISSEMENT indique le degr de voussure de la distribution (varie en -1 qui indique la prsence dune distribution leptokurtique et 1 qui indique la prsence dune distribution platikurtique en passant par 0, distribution msokurtique). indique le degr de symtrie de la distribution (varie entre -1 qui indique la prsence dune distribution ngativement dissymtrique ou tendue vers la gauche et 1 indiquant la prsence dune distribution positivement dissymtrique ou tendue vers la droite en passant pas zro, distribution symtrique).
ASYMTRIE
Gnralement, on ne prsente pas les mesures de tendance centrale et de dispersion sous forme de tableau, on prfre en discuter dans le texte en les y intgrant. Toutefois, il peut arriver, pour une raison ou pour une autre, qu'on veuille aussi prsenter ces rsultats plus schmatiquement. La prsentation des mesures de tendance centrale et de dispersion pourrait alors se faire de la manire suivante:
366.6 90 3650
Aplatissement: 0,336
Valeurs manquantes:
502
(4,1%)
RAPPEL Attention, les statistiques concernant la distribution des valeurs dune variable: mesures de tendance centrale, de dispersion ou de position se calculent sur les donnes brutes nettoyes et lexclusion des valeurs manquantes.
Exemples de graphiques:
FIGURE 5.1 Age du meurtrier (SPCUM, 1989)
600 500 400 300 200 Std. Dev = 12,63 100 0
0,0 10,0 5,0 20,0 30,0 40,0 50,0 60,0 70,0 80,0 90,0 15,0 25,0 35,0 45,0 55,0 65,0 75,0 85,0
Age du meutrier
f amilial
Procdure pour crer un graphique partir du menu principal choisir successivement les options: " Analyse " Statistiques descriptives " Frquence (lcran de dialogue que vous connaissez maintenant apparat) Slectionner la variable pour laquelle on dsire une reprsentation graphique. Cliquer sur loption Diagrammes. Lcran de dialogue suivant apparat:
" Slectionnez alors le diagramme de votre choix OK (complte la procdure et indique SPPS de raliser le graphique) - 62 Labo 5 - Cri 1600
N.B. Pour produire dautres formes de diagrammes ou alors pour en faire de type plus labor, choisissez plutt loption Graphes du menu principal.
Procdures pour diter un graphique Une fois la diagramme apparus dans la fentre de rsultats :: Slectionnez le diagramme en cliquant deux fois dessus La fentre diteur de diagramme SPSS devrait maintenant prsenter le graphique, lequel peut alors tre modifi votre guise.
Ajoutez un titre, une lgende, ou ajustez n'importe quel lment du graphique (son orientation, la taille des caractres ...), soit en double-cliquant sur l'lment transformer, soit en utilisant les menus qui vous prsentent les diffrentes options de transformations possibles cette tape des procdures de cration et ddition dun graphique.
Conseil: Les graphiques ont l'avantage d'tre loquents et amusants faire, par contre, ils prennent beaucoup de place et prsentent des informations relativement limites, n'en abusez donc pas. En outre, une reprsentation graphique, tout comme une prsentation des donnes sous forme de tableau de frquences, appelle un commentaire de la part du chercheur qui prsente les donnes. Ne vous illusionnez pas : de toute manire, vous ny chapperez pas.
Le test d'hypothse sur deux moyennes dtermine si une diffrence entre deux statistiques chantillonnales est significative ou si elle est simplement due une variation d'chantillonnage (on dira plus simplement due au hasard). En d'autre mots, on utilise le test de moyenne quant on veut savoir si la diffrence de moyennes entre deux groupes, pour une variable donne, est significative ou pas.
N.B. Le test de diffrence de moyennes peut se faire lorsqu'on est face : 1 variable DPENDANTE de type PROPORTIONNELLE (QUANTITATIVE) et 1 variable INDPENDANTE de type NOMINALE DICHOTOMIQUE (cest--dire prsentant seulement deux modalits ou catgories)
Exemple:
On veut savoir si, parmi les dlinquants qui commettent des vols qualifis, la diffrence dans la moyenne des gains est significative si on compare ceux qui sattaquent aux dpanneurs et ceux qui s'attaquent aux garages? On fait alors un test de moyennes: la variable dpendante (celle qui est appele varier) est le montant d'argent vol et
la variable indpendante (celle qui pourrait faire varier la variable dpendante) est le lieu o
se commet le dlit (dpanneur ou garage). dichotomique. Cette dernire se prsente sous forme
Procdures pour effectuer un test de moyenne: Dans le menu principal slectionner sous loption " Analyse " Comparer les moyennes " Moyennes... Vous obtenez lcran suivant:
Slectionnez la variable dpendante (qui devrait toujours tre de niveau de mesure proportionnel) dans le rectangle de gauche et faites-la passer, en usant de lespace flch prvu cet effet, dans le rectangle intitul Variable(s) dpendante(s). On peut choisir plus dune variable dpendante si plusieurs tests de moyennes doivent tre raliss en fonction dune mme variable indpendante (par exemple on cherche tablir si le nombre dheures passes tudier, le nombre dheures passes travailler, et les rsultats scolaires varient en fonction du fait quon vit encore ou non chez ses parents). Slectionnez la variable indpendante (laquelle devrait toujours se prsenter sous une forme dichotomique, ce qui peut vouloir dire un certain travail de recodage) dans le rectangle de gauche prsentant lensemble des variables contenues dans la banque de donnes et faitesla passer, en usant de lespace flch prvu cet effet, explicatives. dans le rectangle Variables On peut choisir plus dune variable indpendante, si celles-ci sont toutes
susceptibles dinfluencer la moyenne dune ou de plusieurs variables dpendantes. Celles-ci doivent toutes tre testes en regard de la ou des mmes variables dpendantes (par exemple, on calcule la diffrence de moyennes dans la dure des procdures et la dure de la sentence en fonction du sexe masculin / fminin , du statut libre / dtenu., de la situation demploi possde un emploi oui / non et de la prsence ou non dantcdents judiciaires). Cliquez sur OPTION Vous obtenez la boite de dialogue suivante vous permettant de choisir un certain nombre doptions selon quelles vous semblent plus ou moins propos compte tenu des analyses que vous voulez effectuer:
Assurez-vous que les options Moyenne, cart-type) et Count (nombre de donnes valides sur lesquelles sappuient les analyses) sont slectionnes. Ce sont les donnes dont vous avez minimalement besoin pour procder votre analyse. Les options Variance (idem en franais) et Sum (qui fait la somme de toutes les donnes disponibles) sont juges moins utiles et servent surtout de base dautres analyses. Slectionnez loption statistique ANOVA (qui vous donnera deux statistiques indispensables: Table et Eta) " Continue " OK.
Rgle de dcision: comment dterminer si la diffrence de moyennes observe est statistiquement significative? Si on accepte un pourcentage d'erreur de 5% (donc qu'on veut tre sr 95% de ne pas se tromper en disant quil existe une diffrence significative entre les moyennes observes et que, par consquent, cette diffrence nest pas simplement de au hasard chantillonnal): Si on trouve P (ou Sig) infrieur 0.05, alors on conclut que la diffrence entre les moyennes est statistiquement significative; Si P (ou Sig) est suprieur 0.05, alors la diffrence observe entre les moyennes n'est pas statistiquement significative.
Si on se fixe un pourcentage d'erreur de 1% (donc on veut tre sr 99% de ne pas se tromper en disant quil existe une diffrence significative entre les moyennes observes et que, par consquent, cette diffrence nest pas simplement de au hasard chantillonnal ): Si P (ou Sig) est infrieur 0.01, alors la diffrence est juge statistiquement significative Si P (ou Sig) est suprieur 0.01, alors la diffrence n'est pas statistiquement significative. En sciences humaines on accepte gnralement un pourcentage d'erreur maximum de 10%, 5% ou de 1%. selon les vises de ltude et le degr de certitude ou de prcision requis pourquoi on compare P l'un des seuils suivants, soit: 0.1, 0.05 ou 0.01 C'est
Voici de quoi aurait l'air le rsultat d'un test de diffrences de moyennes permettant de savoir si la valeur des vols dpendent de lendroit ou a t perptr le dlit :
Moyennes
Observation Calculer Rcapituler Observations Exclu(s) N Pourcentage 416 23,3%
N 1782
Tableau de bord VALVOLFR Valeur du vol ou de la fraude DEP_BANQ Moyenne N 5,00 Dpanneur 422,8920 1093 6,00 Banque 9393,5128 273 Total 2215,7028 1366
Tableau ANOVA Somme des carrs 1,758E+10 2,268E+11 2,443E+11 Moyenne des carrs 1,758E+10 166250827
df 1 1364 1365
Combin
F 105,734
Signification ,000
Mesures des associations Eta VALVOLFR Valeur du vol ou de la fraude * DEP_BANQ dpanneur ou banque ,268 Eta carr ,072
Amnags, pour tre rendus dans le cadre dun travail ou dun article, les rsultats dun test de moyenne pourraient tre prsents ainsi: Tableau 6.1: Dure du procs en fonction des antcdents judiciaires du suspect
Montant du vol Dans des dpanneurs Dans des banques Au total P = .000 ta carr : 0,072 Valeurs manquantes: 416 ou 23,3% 422,89 9393,51 2215,70
Quant l'interprtation, on pourrait simplement dire qu'il existe une diffrence de moyennes statistiquement significative dans le montant des vols selon lendroit o ils ont t commis. En effet, on peut dire que ceux qui s'attaquent aux dpanneurs font moins d'argent (en moyenne, 422,89$) que ceux qui volent des banques (en moyenne, 9393,51$), puisque p<.05. La mesure dassociation ta carr nous permet daffirmer que 7,2% de la variation des montants des vols pourrait tre expliqu par oendroit ou celui-ci a t commis.
1. LE TABLEAU CROIS La commande Tableaux croiss permet de prsenter sous forme de tableau crois la mise en relation de 2 ou plusieurs variables catgorises. Le tableau crois se prsente sous forme de ranges et de colonnes la croise desquelles on retrouve des cellules reprsentant le nombre de cas prenant simultanment une valeur donne pour la variable indpendante et une valeur donne pour la variable dpendante. Chacune des cellules du tableau reprsente donc une seule combinaison de valeurs croisant une valeur de la variable dpendante avec une valeur de la variable indpendante. Par exemple, le tableau croisant la variable CRIME DE VIOLENCE (laquelle prsente 2 catgories: crime violent vs crime non violent) avec la variable EFFET DE LALCOOL (2 catgories: sous l'effet d'alcool vs sobre) donnerait un tableau prsentant quatre cellules constituant respectivement les quatre combinaisons suivantes: Sous l'effet de l'alcool / Crime violent Sous l'effet de l'alcool/ Crime non-violent Sobre / Crime violent Sobre / Crime non-violent
N.B. Il est gnralement prfrable de prsenter les valeurs de la variable indpendante en colonnes et celles de la variable dpendante en ranges. En effet, par convention implicite on a convenu de standardiser la prsentation des tableaux sous cette forme, la lecture des donnes s'en trouvant facilite. Toutefois, par souci d'esthtisme ou pour dautres raisons, il est possible de passer outre cette rgle. Par exemple, dans le cas o la variable dpendante prsente un grand nombre de catgories alors que la variable indpendante n'en affiche pour sa part qu'un trs petit nombre, il peut paratre prfrable de prsenter le tableau croisant les deux variables sur le sens de la largeur plutt que sur celui de la longueur. Une chose demeure capitale, quelle que soit le prsentation que l'on choisi de retenir, il faut rfrer aux pourcentages appropris au moment de procder aux analyses et de formuler son commentaire sur les donnes.
Procdures pour crer un tableau crois Dans le menu principal slectionner sous loption Analyse: "Statistiques descriptives "Tableaux croiss... Vous obtenez lcran suivant:
Slectionnez dans le rectangle de gauche, prsentant lensemble des variables contenues dans la banque de donnes, la ou les variables dpendantes que vous souhaitez soumettre lanalyse et faites-les passer, laide des rectangles flchs prvus cet effet, dans le rectangle Lignes(s). Faire de mme pour la ou les variables indpendantes de sorte quelles sinscrivent, cette fois, dans le rectangle Colonne(s). Vous constatez ainsi que vous pouvez soumettre au cours dune mme commande, plusieurs variables indpendantes et plusieurs variables dpendantes qui seront mises en relations les unes avec les autres. Sachez toutefois que vous multipliez de ce fait le nombre de tableaux croiss produits. Ainsi, le fait de prciser deux variables dpendantes et deux variables indpendantes, comme dans lexemple fourni plus haut, donnera lieu 4 tableaux (sexe des victimes et catgories dhomicide en fonction de lge de lagresseur et sexe des victimes et catgories dhomicide en fonction du sexe de lagresseur.
Loption Strates 1 sur 1 prsent dans le mme cran de dialogue permet pour sa part de faire intervenir des variables contrles. De la mme faon que pour les procdures prcdentes, vous devez choisir dans le rectangle de gauche une ou des variables que vous voudriez faire intervenir en tant que variables contrles. Ainsi, dans lexemple prcdent, le fait de faire ou non), comme variable contrle, double le intervenir la variable RESOLU (affaire rsolue
nombre de tableaux produits, les quatre tableaux dorigine tant produits dune part pour les homicides non rsolus (4 premiers tableaux) et dautre part pour les homicides rsolus (4 autres tableaux). Loption Supprimer les tableaux vous permet dobtenir les statistiques concernant la mise en relation de deux variables, sans que les tableaux croiss correspondant ne soient produits. Ceci peut-tre pratique si la seule chose qui vous est utile ce sont les statistiques, ou encore, si aprs avoir produit un tableau de frquences vous vous apercevez que vous avez besoin des statistiques et que vous avez oubli de demander SPSS de les produire. Si la mise en oeuvre de cette option nest pas prcise (il sagit pour la slectionner de cliquer dans le petit carr prcdant le nom de loption afin dy faire apparatre un x qui signale que loption est en vigueur), SPSS produit par dfaut les tableaux croiss demands.
Loption Statistiques...
Loption Statistiques permet de slectionner les coefficients dont vous avez besoin afin de prciser la relation entre les deux variables (sa significativit, dans certains cas sa force, dans certains cas encore sa direction).
Voici les statistiques les plus couramment utilises: Khi-deux (Khi-carr, 2): permet de dterminer s'il existe une relation statistiquement significative entre les variables. Seul coefficient qui, avec ses drivs (phi, C de contingence, V de Cramer), s'applique pour les variables de niveau de mesure nominal, et par consquent sapplique aussi pour toutes les variables de niveaux de mesure suprieur. SPSS nomme le 2 tel que nous avons appris le calculer le Khi-deux de Pearson. Les autres donnes affrentes au 2 sont des variantes que nous napprendrons pas interprter. Coefficient de contingence: Driv du 2 qui mesure la force de la relation. Sutilise le plus souvent dans le cas de variables de niveau nominal mais sapplique aussi dans le cas de variables de niveaux de mesure suprieurs. Utilis lorsque le tableau comprend le mme nombre de colonnes et de ranges. Phi et V de Cramer: Drivs du 2 qui mesurent la force de la relation. Sutilisent le plus souvent dans le cas de variables de niveau nominal mais sappliquent aussi dans le cas de variables de niveaux de mesures suprieurs. Phi s'applique dans le cas de tableaux de dimension 2 (colonnes) X 2 (ranges). V de Cramer s'applique quelle que soit la dimension du tableau.
Loption Cellules... Vous permet de slectionner les informations que vous dsirez voir apparatre dans les cellules du tableau crois.
Sous Effecif.. Observ prsente le nombre de cas, la frquence de deux caractristiques (lune concernant la variables dpendante lautre la variable indpendante) prises simultanment.
Thorique prsente les frquences espres (ou attendues ou thoriques) de chacun des points de rencontre (cellule) entre une valeur de la variable indpendante et une valeur de la variable dpendante si les variables mises en relation taient parfaitement indpendantes (premire tape du calcul du 2).
Sous Pourcentages Ligne Colonne Total donne le pourcentage calcul en ligne pour chacune des ranges (Nb de cas de la cellule / Nb de cas (frquence) de la range) * 100 donne le pourcentage calcul en colonne pour chacune des colonnes (Nb de cas de la cellule / Nb de cas (frquence) de la colonne) * 100 donne le pourcentage de cas qui appartient chaque cellule en rapport avec le nombre de cas total ltude (Nb de cas de la cellule / Nb total de cas) * 100
1.1. EXEMPLE DE TABLEAU CROIS Voici un exemple de tableau crois o la variable dpendante est le fait d'avoir commis un crime violent ou au contraire un dlit ne prsentant pas de violence et o la variable indpendante reprsente le fait d'avoir consomm ou non de l'alcool juste avant la commission du dlit. Ici, la sous-commande Statistiques, on a slectionn les options Khi-deux et Phi et V de Cramer tandis qu' la sous-commande Cellules les options retenues taient Effectif > Observ et la sous-commande Pourcentage > Colonne(s). Tableau 7.1: Relation entre la consommation d'alcool juste avant de dlit et le fait d'avoir commis un crime violent ou non
Alcool 19 70,3% 8 29,6% Non-violent 27 54,0% Total Aucune valeur manquante Crime violent Khi-Deux Pearson Phi Valeur 11,7681 ,48514
ddl 1
Signification ,00060
1.2. EXEMPLE D'INTERPRTATION DE TABLEAU CROIS Un questionnaire pass 50 dtenus d'un pnitencier qubcois tend montrer l'existence d'une relation entre la consommation d'alcool et la violence des dlits. En effet, malgr qu'au total il y ait environ le mme nombre de crimes violent (24) et non-violent (26), on remarque que 70,3% des rpondants ayant consomm de l'alcool juste avant la commission du dlit ont commis des crimes violents, comparativement seulement 21,7% des dtenus affirmant qu'ils - 7.10 Labo 7 - Cri 1600
taient sobres au moment du passage l'acte. Un test du Khi carr a permis de confirmer la prsence d'une relation statistiquement significative entre les deux variables (P < .05). Le coefficient Phi (0.48) permet pour sa part d'affirmer que la relation entre la consommation d'alcool et les crimes violents semble tre relativement forte. Notons toutefois que ces tests ne nous permettent absolument pas d'affirmer que l'alcool pousse les gens faire usage de violence. On pourrait, en effet, tout aussi bien dire que les individus boivent souvent avant de commettre un crime violent, soit pour se donner du courage, soit pour se donner une excuse.
1. LE R DE PEARSON Le R2 de Pearson, appel aussi le COEFFICIENT DE DTERMINATION, est un nombre qui mesure l'intensit de la liaison linaire entre deux variables de niveau de mesure quantitatives. Le coefficient R2 varie toujours entre -1 et 1, "-1" reprsentant une relation linaire ngative parfaite (on dira aussi que les variables sont lies par une relation linaire parfaitement inversement proportionnelle); "0" reprsentant l'absence totale de relation linaire entre les variables; et "1" reprsentant une relation linaire positive parfaite (ou encore le fait que les variables sont lies par une relation linaire parfaitement directement proportionnelle). Entre ces valeurs extmes , le coefficient de dtermination indique si les variables sont plus ou moins bien linairement lies entre elles, dans un sens ou dans lautre. Ainsi, plus on sapprochera de -1 ou 1 plus on conclura que la force de la relation (inversement ou directement proportionnelle) est importante. linverse, plus le coefficient de dtermination tend vers zro, plus on sapproche dune situation dabsence de relation linaire entre les variables ltude. Plus prcisment encore, le coefficient de dtermination se lit comme tant le pourcentage de variance de la variable dpendante explique par sa mise en relation avec la variable indpendante. On dtermine donc ainsi, si la variable indpendante constitue un plus ou moins bon prdicteur des valeurs que prendra la variable dpendante.
Notez que les relations linaires parfaites ou trs leves (R2 >.80) doivent tre questionnes: il est possible qu'elles soient dues au fait qu'on mesure deux fois le mme phnomne. En d'autres mots, il est possible que les variables ne soient pas rellement distinctes. Par exemple, on mesure la peur du crime dans le quartier et en gnral et on met les deux variables en relation. On trouve une relation quasi parfaite entre les deux. Cest lindication, quen fait, la peur du crime dans le quartier et la peur du crime en gnral ne font quun. On avait toutefois raison, dans un premier temps, de vouloir sen assurer scientifiquement . Toutefois, pour la suite de ltude, on sera avis de ne conserver quun seul des deux indicateurs puisquon vient dtablir que les deux mesuraient finalement la mme chose.
N'oubliez pas qu'il peut y avoir une forte relation entre deux variables, sans que cette relation soit linaire. Pour que le coefficient de dtermination rende justice la relation, il faut absolument que la relation entre les variables soit positivement ou ngativement linaire. 1.1 QUELQUES EXEMPLES DE RELATIONS ENTRE VARIABLES ILLUSTRS LAIDE DE
DIAGRAMMES DE DISPERSION (OU NUAGE DE POINTS)
2. LE DIAGRAMME DE DISPERSION ou LE NUAGE DE POINT Le diagramme de dispersion, ou le nuage de points, constitue la reprsentation graphique de la relation entre deux variables de niveau de mesure proportionnel. Chaque point reprsente un couple d'observations (x,y) rapport sur un graphique en prenant pour abscisse (axe horizontal) la variable indpendante (x) et pour ordonne (axe vertical) la variable dpendante (y).
- 9. -
13
Graphique 8. 1: Relation entre le taux de famille vivant sous le seuil de pauvret et le taux de dlinquance dans les secteurs de recensement de Montral.
16
14
12
10
e c n a u q n i l d e d x u a T
-2 0 20 40 60 80 100
Le diagramme de dispersion permet de dceler loeil que ces deux variables varient dans le mme sens, dans une relation linaire directement proportionnelle (ou positive). On doit nanmoins faire appel au calcul des coefficients de dtermination et de corrlation afin dtablir prcisment dans quelle mesure (avec quelle force) ces deux variables sont inter-relies, de manire linaire ou non. Procdure pour la production dun diagramme de dispersion (ou nuage de points) illustrant la relation entre deux variables de niveau proportionnel partir du menu dentte, choisir: "Graphes "Diagramme de dispersion... Lcran suivant apparat, vous offrant un choix doptions parmi lesquelles, lorsquil sagit de mettre en relation seulement deux variables, seule loption Simple sapplique.
- 9. -
14
Slectionner la variable dpendante soumise lanalyse dans le rectangle de gauche qui vous prsente lensemble des variables contenues dans la banque de donnes et linscrire, en la faisant passer laide du rectangle flch prvu cet effet, dans le rectangle correspondant l'axe Y (axe vertical), lequel doit reprsenter les valeurs de la variable dpendante. Rpter lopration pour ce qui est de la variable indpendante laquelle sera pour sa part porte dans le rectangle reprsentant laxe des X (axe horizontal dans la reprsentation graphique).
- 9. -
15
P.S. Vous pouvez ds cette tape prciser les titres des axes et du graphique ( partir de loption TITRES... prsente en bas de la bote de dialogue, mais cette opportunit vous sera aussi donne, une fois le graphique constitu, et il est alors un peu plus ais de procder. Alors attendre avant de procder ces ramnagements esthtiques. " OK (prcise SPSS de procder la commande) Le graphique se cre et apparat dans la fentre Rsultats. Vous n'avez plus qu' cliquer afin d'amnager le graphique votre got. Vous tes alors guid par une srie de menus et sous-menus qui vous permettent dajouter des titres, des lgendes, de redimentionner les chelles des axes des x et des y... vous de jouer. Procdures pour l'analyse de corrlation: R de Pearson:
- 9. -
16
Tableau 8.1: Corrlation entre le taux de famille pauvre et le taux de dlinquance dans 245 secteurs de recensement de l'le de Montral On a ici une matrice mettant en relation uniquement deux variables. TAUX_DEL TAUX_DEL 1,0000 ( 245) P= , ,4707 ( 244) P= ,000 PAUVRES ,4707 (r de Pearson) ( 244) (nombre de cas ayant servi au calcul) P= ,000 (niveau de significativit) 1,0000 ( 245) P= ,
PAUVRES
Interprtation possible du tableau 8.1: Il existe une relation statistiquement significative (p<.05) et directement proportionnelle (puisque le signe du coefficient nest pas ngatif) entre le taux de familles vivant sous le seuil de pauvret et le taux de dlinquance juvnile. De fait, on constate que plus il y a de familles pauvres dans un secteur de recensement donn, plus le taux de dlinquance y est lev. Ceci est confirm par un coefficient de corrlation R de Pearson de .47 (p 0,000) indiquant une relation statistiquement significative positive assez forte entre les deux variables. P.S. Dans le cadre dun article scientifique, lorsque seulement deux variables sont mises en relation, on se contentera de glisser la valeur du coefficient et le degr de significativit dans le texte lappui de notre analyse. Inutile de prsenter la matrice des rsultats de lanalyse de corrlation.
3. LA RGRESSION 3.1. LA DROITE DE RGRESSION SIMPLE La droite de rgression est la droite qui s'ajuste le mieux possible aux points d'un diagramme de dispersion mettant en relation deux variables. Formule de la droite de rgression: y=a+bx, o "y" = variable dpendante, "x" = variable indpendante "a" = l'ordonn l'origine (quon nommera aussi constante) "b" = la pente de la droite. Exemple de la relation entre le nombre de victimisations subies et la peur du crime, telle que mesure sur une chelle croissante de 1 7, 7 reprsentant le plus haut degr de peur que peut indiquer un rpondant.
- 9. -
17
1 8 4
2 3 10 2 6 1
4 9 2
5 6 5
6 6 3
7 2 5
8 3 1
9 4 3
10 11 12 13 14 15 16 17 18 19 20 10 5 3 10 7 3 3 6 8 8 5 5 2 2 5 4 3 4 4 5 6 6
Ici, la droite de rgression s'inscrit: Indice de peur du crime = 2,01 + 0,30 (x = nombre de victimisations)
Tableau 8.2 Indice de la peur du crime en fonction du nombre d'expriences de victimisation subies par les rpondants 7 y = 2,0111 + 0,30320x R^2 = 0,269 6
0 0 2 4 6 8 10 12
Nombre de victimisations
Le R2 de Pearson est ici de 0,27, cest--dire que le nombre de victimisations subies permet dexpliquer 27% de la variance observe en ce qui a trait au niveau de peur du crime exprim par les rpondants.
3.2. LE COEFFICIENT DE DTERMINATION: R2 Le coefficient de dtermination, le R2 de Pearson, reprsente la proportion de la variation totale que subie la variable dpendante qui est explique par la droite de rgression, lorsquune variable indpendante quelconque est prise en compte. Il s'exprime comme le rapport de la variation explique (par la prsence de la variable indpendante) la variation totale (lorsque la variable indpendante nest pas tenue en compte). En dautres mot, il sagit dun indice de lajustement de la droite au nuage de points dcoulant de la mise en relation de deux variables. Ainsi, on peut voir que le premier diagramme, qui reprsente une relation plus forte entre les deux variables, prsente un coefficient de dtermination plus lev que le second diagramme.
- 9. -
18
La procdure de rgression ralise par SPSS sert donc dterminer la prsence d'une relation statistiquement significative, cest--dire qui ne serait pas due au hasard, entre les variables (donn par le niveau de significativit; la direction de cette relation (donne par la pente positive ou native); ainsi que la proportion de variance de la variable dpendante explique par la prsence de la variable indpendante avec laquelle elle est mise en relation (R2). Procdres afin d'effectuer un test de rgression partir de lentte de dpart, choisir: " Analyse " Rgression " Linaire ... Slectionner les variables dpendantes et indpendantes que lon souhaite soumettre lanalyse. Ici il est important de bien dterminer et prciser SPSS quelles sont les variables indpendante et dpendante. " OK. (prcise SPSS de sexcuter) 3.3. EXEMPLE D'UN LISTING SPSS D'UNE ANALYSE DE RGRESSION:
Rgression
b Variables introduites/limines
Modle 1
Variables limines ,
Mthode Introduire
- 9. -
19
Modle 1
R ,537a
R-deux ,288
Modle 1
ddl 1 18
Rgression Rsidu
F 7,283
Signification ,015a
a. Valeurs prdites : (constantes), PEUR Indice de la peur du crime b. Variable dpendante : VICTIM Nombre de victimisation
Modle 1
Interprtation possible des coefficients et/ou de la droite de rgression et/ou du nuage de point: Nous constatons lexistence dune relation statistiquement significative (p = .01) et directement proportionnelle (signe de la pente = positif) entre le nombre de victimisations subies et la peur du crime telle que mesure par une chelle allant de 1 7, o 7 indique le niveau le plus lev de peur. Ainsi, plus une personne aura t victimise, plus elle aura tendance craindre la criminalit (R de Pearson: 0,54). La droite de rgression nous permet mme de dire que la variable indpendante nombre de victimisations permet dexpliquer prs de 30% de la variance observe au sujet de la variable dpendante peur du crime exprime par les rpondants (R2 = 0,288).
- 9. -
20