Sunteți pe pagina 1din 182

i

Guide sommaire de IBM SPSS Statistics 20

Remarque : Avant dutiliser ces informations et le produit quelles concernent, lisez les informations gnrales sous Remarques sur p. 166. Cette version sapplique IBM SPSS Statistics 20 et toutes les publications et modifications ultrieures jusqu mention contraire dans les nouvelles versions. Les captures dcran des produits Adobe sont reproduites avec lautorisation de Adobe Systems Incorporated. Les captures dcran des produits Microsoft sont reproduites avec lautorisation de Microsoft Corporation. Matriel sous licence - Proprit dIBM
Copyright IBM Corporation 1989, 2011.

Droits limits pour les utilisateurs au sein dadministrations amricaines : utilisation, copie ou divulgation soumise au GSA ADP Schedule Contract avec IBM Corp.

Prface
Le manuel Guide sommaire de IBM SPSS Statistics 20 propose un ensemble de didacticiels conus pour vous familiariser avec les diffrents composants de IBM SPSS Statistics. Ce guide est exploitable sous toutes les versions de systme dexploitation du logiciel, notamment : Windows, Macintosh et Linux. Vous pouvez suivre les exercices dans lordre ou consulter les rubriques pour lesquelles vous souhaitez obtenir des informations supplmentaires. Vous pouvez consulter ce guide en complment ou en remplacement du didacticiel en ligne fourni avec le systme central SPSS Statistics ou ignorer le didacticiel en ligne et commencer directement avec les didacticiels fournis ici.

IBM SPSS Statistics 20


IBM SPSS Statistics 20 est un systme complet danalyse de donnes. SPSS Statistics peut utiliser les donnes de presque tout type de fichier pour gnrer des rapports mis en tableau, des diagrammes de distributions et de tendances, des statistiques descriptives et des analyses statistiques complexes. Grce SPSS Statistics, lanalyse statistique est plus accessible aux dbutants et plus pratique pour les utilisateurs chevronns. Grce des menus et des slections de bote de dialogue simples, vous pouvez excuter des analyses complexes sans saisir une seule ligne de syntaxe de commande. Lditeur de donnes offre une fonctionnalit de type tableur simple et efficace pour la saisie des donnes et la lecture du fichier de travail.

Ressources Internet
Le site Web de IBM Corp.(http://www.ibm.com/support) fournit des rponses aux questions frquemment poses, un accs aux fichiers de donnes et dautres informations utiles. En outre, le groupe de discussion SPSS USENET (non patronn par IBM Corp.) est ouvert toutes les personnes intresses. Ladresse du groupe USENET est comp.soft-sys.stat.spss. Vous pouvez galement vous inscrire sur une liste de messages lectroniques relie par passerelle au groupe USENET. Pour vous inscrire, envoyez un message lectronique ladresse listserv@uga.cc.uga.edu. Le texte du message lectronique doit tre : subscribe SPSSX-L prnom nom. Vous pouvez ensuite envoyer des messages vers la liste. Pour ce faire, envoyez vos messages ladresse listserv@uga.cc.uga.edu.

Documents supplmentaires
Le module supplmentaire de procdures statistiques IBM SPSS Statistics, cr par Marija Noruis, a t publi par Prentice Hall. Il contient des prsentations des procdures du systme IBM SPSS Statistics de base, ainsi que des options de rgression logistique et des modles linaires gnraux. Le module supplmentaire de procdures statistiques avances IBM SPSS Statistics a galement t publi par Prentice Hall. Il inclut les prsentations des procdures dans les modules des modles avancs et de rgression.
Copyright IBM Corporation 1989, 2011. iii

Options IBM SPSS Statistics


Les options suivantes sont fournies comme amliorations complmentaires du systme de base complet IBM SPSS Statistics (pas de la version Student) :
Statistics Base vous offre une large gamme de procdures statistiques permettant deffectuer des analyses et des rapports de base, comprenant des effectifs, des tableaux croiss et des statistiques descriptives, les cubes OLAP et des rapports du livre de code. Il fournit aussi une grande varit de techniques de rduction de dimension, classification et segmentation telles que les analyses factorielles, les classifications, les analyses du voisin le plus proche et de fonction discriminante. En outre, SPSS Statistics Base offre une large varit dalgorithmes pour la comparaison des moyennes et des techniques prdictives telles que le test-t, lanalyse de la variance, la rgression linaire et la rgression ordinale.

Le module Statistiques avances dcrit les techniques souvent utilises dans la recherche biomdicale et exprimentale avance. Il inclut des procdures pour les modles linaires gnraux (GLM), les modles mixtes linaires, lanalyse des composantes de variance, lanalyse log-linaire, la rgression ordinale, la dure de vie actuarielle, lanalyse de survie de Kaplan-Meier, et la rgression de Cox de base et tendue. Lamorce est une mthode consistant driver des estimations robustes des erreurs standard et des intervalles de confiance pour des estimations telles que la moyenne, la mdiane, le calcul de la proportion, lodds ratio, le coefficient de corrlation ou de rgression. Le module Modalits excute des procdures de codage optimal comme lanalyse des correspondances. Le module Echantillons complexes permet aux chercheurs chargs deffectuer des enqutes (notamment dopinion), des tudes de march, ou des tudes dans le domaine de la sant, ainsi quaux spcialistes des sciences sociales qui utilisent une mthodologie dtude fonde sur les chantillons, dincorporer leurs propres plans dchantillonnage complexes dans lanalyse des donnes.
Conjoint offre une manire raliste de mesurer la faon dont les attributs du produit individuel

affectent les prfrences des consommateurs et des citoyens. Avec Conjoint, il est possible de mesurer facilement leffet de compromis de chaque attribut de produits dans le contexte dun ensemble dattributs de produitscomme le font certains consommateurs lorsquils dcident de ce quils vont acheter. Le module Tableaux personnaliss cre toute une gamme de rapports en tableau de qualit prsentation, y compris des tableaux croiss complexes et les affichages de donnes de rponses multiples.
Prparation des donnes fournit un clich visuel rapide de vos donnes. Il permet dappliquer des rgles de validation qui identifient les valeurs de donnes non valides. Vous pouvez crer des rgles qui reprent les valeurs hors plage, les valeurs manquantes et les valeurs vides. Vous pouvez galement enregistrer des variables qui enregistrent les violations de rgles individuelles et le nombre total de violations de rgles par observation. Un ensemble limit de rgles prdfinies que vous pouvez copier ou modifier vous est fourni.
iv

Arbre de dcision cre un modle darbre de segmentation. Elle classe les observations en

groupes ou estime les valeurs dune variable (cible) dpendante partir des valeurs de variables (explicatives) indpendantes. Cette procdure fournit des outils de validation pour les analyses de classification dexploration et de confirmation.
Direct Marketing permet aux organisations de rendre leurs programmes de marketing aussi

efficaces que possible, grce des techniques conues spcialement pour le marketing direct. Le module Tests exacts (Exact Tests) calcule les valeurs p exactes pour les tests statistiques lorsque de petits chantillons ou des chantillons distribus de faon trs ingale risquent de fausser la prcision des tests habituels. Cette option nest disponible que sous les systmes dexploitation Windows. Le module Prvision effectue des prvisions et des analyses de sries chronologiques compltes avec plusieurs modles dajustement aux courbes, des modles de lissage et des mthodes destimation des fonctions autorgressives. Le module Valeurs manquantes dcrit les types des donnes manquantes, value les moyennes et dautres statistiques, et affecte des valeurs aux observations manquantes. Le module Rseaux neuronaux (Neural Networks) permet de prendre des dcisions commerciales en prvoyant la demande dun produit en fonction du prix et dautres variables, ou en catgorisant les clients en fonction des habitudes dachat et des caractristiques dmographiques. Les rseaux neuronaux sont des outils de modlisation de donnes non linaires. Ils permettent de modliser les relations complexes entre les entres et les rsultats, ou de rechercher des modles dans les donnes. Le module Rgression fournit des techniques danalyse des donnes non adaptes aux modles statistiques linaires classiques. Il contient des procdures pour les modles de choix binaire, la rgression logistique, la pondration estime, la rgression par les doubles moindres carrs et la rgression non linaire gnrale.
Amos (analyse de structures de moments) utilise la modlisation dquation structurelle pour

confirmer et expliquer des modles conceptuels qui impliquent lattitude, les perceptions et dautres facteurs qui entranent un comportement.

Sminaires de formation
IBM Corp. propose des sminaires de formation, publics et sur site pour IBM SPSS Statistics. Tous les sminaires font appel des ateliers de travaux pratiques et auront lieu rgulirement dans les grandes villes des Etats-Unis et dEurope. Pour plus dinformations sur ces sminaires, accdez au site http://www.ibm.com/software/analytics/spss/training/.

Support technique
Un support technique est disponible pour les clients du service de maintenance. Les clients peuvent contacter lassistance technique pour obtenir de laide concernant lutilisation des produits IBM Corp. ou linstallation dans lun des environnements matriels pris en charge. Pour contacter lassistance technique, visitez le site IBM Corp. ladresse http://www.ibm.com/support. Votre nom, celui de votre socit, ainsi que votre contrat dassistance vous seront demands.
v

Version Student de IBM SPSS Statistics 20


La version Student de IBM SPSS Statistics 20 est une version performante, bien que limite, de SPSS Statistics.

Capacit
La version Student contient de nombreux outils importants danalyse des donnes de IBM SPSS Statistics, notamment :

Editeur de donnes de type tableur pour la saisie, la modification et laffichage des fichiers de donnes. Procdures statistiques, notamment tests t, analyse des variances et tabulations croises. Diagrammes interactifs qui vous permettent de modifier ou dajouter des lments et des variables de manire dynamique. Les modifications apparaissent ds que vous les effectuez. Diagrammes standard haute rsolution permettant dobtenir une gamme complte de diagrammes et de tableaux de prsentation et analytiques.

Limites
Cre des fins pdagogiques, la version Student ne doit tre utilise que par des tudiants et des instructeurs dans un contexte de formation. Les restrictions suivantes sappliquent la version Student de IBM SPSS Statistics 20 :

Les fichiers de donnes ne peuvent pas contenir plus de 50 variables. Les fichiers de donnes ne peuvent pas contenir plus de 1 500 observations. Les modules SPSS Statistics complmentaires (tels que les modles de rgression ou les statistiques avances) ne peuvent pas tre utiliss avec la version Student. La syntaxe de commande SPSS Statistics nest pas disponible. En effet, contrairement la version complte de IBM SPSS Statistics, la version Student ne permet pas de rpter une analyse en enregistrant une srie de commandes dans une syntaxe ou un fichier de tche. Lutilisateur ne peut ni crire des scripts, ni automatiser des tches. En effet, contrairement la version complte de SPSS Statistics, la version Student ne permet pas de crer des scripts afin dautomatiser les tches rptitives.

Support technique pour les tudiants


Si vous tes un tudiant qui utilise la version pour tudiant, personnel de lducation ou diplm dun produit logiciel IBM SPSS, veuillez consulter les pages Solutions pour lducation (http://www.ibm.com/spss/rd/students/) consacres aux tudiants. Si vous tes un tudiant utilisant une copie du logiciel IBM SPSS fournie par votre universit, veuillez contacter le coordinateur des produits IBM SPSS de votre universit.

vi

Support technique pour les instructeurs


Les instructeurs qui utilisent la version Student lors de leurs cours peuvent contacter le support technique afin dobtenir de laide. Aux Etats-Unis et au Canada, contactez le support technique au (312) 651-3410, ou rendez-vous sur http://www.ibm.com/support.

vii

Contenu
1 Introduction 1
Fichiers dexemple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Ouverture dun fichier de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Excution dune analyse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Affichage des rsultats. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 Cration de diagrammes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

Lecture des donnes

10

Structure de base dun fichier de donnes IBM SPSS Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Lecture des fichiers de donnes IBM SPSS Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 Lecture de donnes partir de feuilles de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 Lecture de donnes partir dune base de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 Lecture de donnes partir dun fichier texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19

Utilisation de lditeur de donnes

27

Saisie de donnes numriques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 Saisie de donnes chane . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 Dfinition de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 Ajout des tiquettes de variables . . . . . . . . . . . . . . . . . . . . . . . . . Modification du type et du format de variable . . . . . . . . . . . . . . . Ajout dtiquettes de valeur pour les variables numriques . . . . . Ajout dtiquettes de valeur pour les variables chane . . . . . . . . . Utilisation des tiquettes de valeurs pour la saisie de donnes . . Gestion des donnes manquantes . . . . . . . . . . . . . . . . . . . . . . . . Valeurs manquantes des variables numriques . . . . . . . . . . . . . . Valeurs manquantes dune variable chane . . . . . . . . . . . . . . . . . Copier-coller des attributs de variable . . . . . . . . . . . . . . . . . . . . . Dfinition des proprits des variables qualitatives . . . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 32 33 33 35 36 37 38 40 41 44

Utilisation des sources de donnes multiples

50

Manipulation de base de plusieurs sources de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 Utilisation de plusieurs ensembles de donnes dans une syntaxe de commande . . . . . . . . . . . . . 53 Copie et collage dinformations entre les ensembles de donnes . . . . . . . . . . . . . . . . . . . . . . . . . 53

viii

Attribution dun nouveau nom aux ensembles de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 Suppression de plusieurs ensembles de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Examen des statistiques rcapitulatives pour chaque variable

55

Niveau de mesure. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Mesures rcapitulatives pour donnes qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 Diagrammes pour donnes qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 Mesures rcapitulatives pour variables dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 Histogrammes pour variables dchelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61

Cration et modification de diagrammes


Utilisation de la galerie Gnrateur de diagrammes . . Dfinition des variables et des statistiques . . . . . . . . Ajout de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Cration du diagramme . . . . . . . . . . . . . . . . . . . . . . . Modification de diagrammes Notions de base . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ...

63
... ... ... ... ... 64 65 68 69 69 70 71 72 73 75 76 77 82

Cration de diagrammes - Notions de base. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63

Slection dlments de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Utilisation de la fentre Proprits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Changement de la couleur des btons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Formatage des valeurs des tiquettes de graduation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Modification de texte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Affichage des tiquettes des valeurs de donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Utilisation de modles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Dfinition des options de diagramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Utilisation du rsultat

86

Utilisation du Viewer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 Utilisation de lditeur de tableau pivotant . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Accs aux dfinitions de rsultats . . . Tableaux pivotants. . . . . . . . . . . . . . . Cration et affichage de strates . . . . . Modification de tableaux . . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... 88 88 91 93

ix

Masquage de lignes et de colonnes. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Modification des formats daffichage des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 Modles de tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96 Utilisation de formats prdfinis. . . . . . . . . . . . . . . . . . . . Personnalisation des styles Modles de tableau . . . . . . . Modification des formats par dfaut dun tableau . . . . . . Personnalisation des paramtres de laffichage initial . . . Affichage dtiquettes de variable et de valeur . . . . . . . . Utilisation de rsultats dans dautres applications . . . . . . . . . ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... ... . . . 96 . . . 97 . . 100 . . 102 . . 103 . . 105 .. .. .. .. .. 105 106 107 115 118

Collage des rsultats sous forme de tableaux Word . . . . . . . . . . . . . . . . . . . . . . . Collage des rsultats sous forme de texte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exportation des rsultats vers un fichier Microsoft Word, PowerPoint ou Excel . . Exportation des rsultats vers PDF. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Exportation des rsultats vers HTML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Utilisation de la syntaxe

119

Collage dune syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 Modification dune syntaxe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120 Ouverture et excution dun fichier de syntaxe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 Prsentation du Panneau derreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123 Utilisation des points darrt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123

Modification des valeurs de donnes

126

Cration dune variable qualitative partir dune variable dchelle . . . . . . . . . . . . . . . . . . . . . . 126 Calcul de nouvelles variables . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132 Utilisation de fonctions dans les expressions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Utilisation dexpressions conditionnelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 Utilisation des dates et heures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 Calcul du temps coul entre deux dates. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 Ajout dune dure une date . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

10 Tri et slection de donnes

146

Tri des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

Traitement dun fichier scind. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Tri dobservations pour le traitement dun fichier scind. . . . . . . . . . . . . . . . . . . . . . . . . . . . 148 Activation et dsactivation du traitement dun fichier scind . . . . . . . . . . . . . . . . . . . . . . . . 149 Slection de sous-groupes dobservations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 Slectionner des sous-ensembles dobservations laide dune expression conditionnelle . Slectionner un chantillon alatoire. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Slection dun intervalle de temps ou dobservations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Traitement des observations exclues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Etat de la slection dune observation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150 151 152 153 154

Annexes A Fichiers dexemple B Remarques Index 155 166 169

xi

Chapitre

Introduction

Ce guide met votre disposition un ensemble de didacticiels vous permettant deffectuer des analyses utiles de vos donnes. Vous pouvez suivre les exercices dans lordre ou consulter les rubriques pour lesquelles vous souhaitez obtenir des informations supplmentaires. Ce chapitre vous prsente les fonctions de base et dcrit une session normale. Nous allons rcuprer un fichier de donnes IBM SPSS Statistics pralablement dfini, puis crer un rcapitulatif statistique simple et un diagramme. Des instructions plus dtailles sur de nombreux sujets abords dans ce chapitre seront donnes dans les chapitres suivants. Nous esprons vous offrir une structure essentielle pour une bonne comprhension des derniers didacticiels.

Fichiers dexemple
La plupart des exemples prsents ici utilisent le fichier de donnes demo.sav. Ce fichier de donnes est une enqute factice mene auprs de plusieurs milliers de personnes, contenant des informations dmographiques et relatives la consommation. Si vous utilisez la version Student, votre version du fichier demo.sav est un chantillon reprsentatif du fichier de donnes dorigine, qui a t rduit pour respecter la limite de 1 500 observations. Les rsultats obtenus avec ce fichier de donnes seront diffrents des rsultats prsents ici. Les fichiers dexemple installs avec le produit figurent dans le sous-rpertoire Echantillons du rpertoire dinstallation. Il existe un dossier distinct au sein du sous-rpertoire Echantillons pour chacune des langues suivantes : Anglais, Franais, Allemand, Italien, Japonais, Coren, Polonais, Russe, Chinois simplifi, Espangol et Chinois traditionnel. Seuls quelques fichiers dexemples sont disponibles dans toutes les langues. Si un fichier dexemple nest pas disponible dans une langue, le dossier de langue contient la version anglaise du fichier dexemple.

Ouverture dun fichier de donnes


Ouvrir un fichier de donnes :
E A partir des menus, slectionnez : Fichier > Ouvrir > Donnes Copyright IBM Corporation 1989, 2011. 1

2 Chapitre 1

Vous pouvez galement utiliser le bouton Ouvrir fichier de la barre doutils.


Figure 1-1 Bouton Ouvrir fichier de la barre doutils

Une bote de dialogue douverture des fichiers apparat. Par dfaut, les fichiers de donnes IBM SPSS Statistics (extension .sav) apparaissent. Cet exemple utilise le fichier demo.sav.
Figure 1-2 Fichier demo.sav dans Data Editor

Le fichier de donnes apparat dans lEditeur de donnes. Dans Data Editor, si vous placez le curseur de la souris sur le nom dune variable (en-tte de colonne), une tiquette de variable plus dtaille apparat, si elle a t dfinie pour cette variable. Par dfaut, les valeurs de donnes relles sont affiches. Pour afficher les tiquettes :
E A partir des menus, slectionnez : Affichage > Etiquettes de valeur

Vous pouvez galement utiliser le bouton Etiquettes de valeurs dans la barre doutils.
Figure 1-3 Bouton Etiquettes de valeurs

3 Introduction

Des tiquettes de valeurs descriptives saffichent pour faciliter linterprtation des rponses.
Figure 1-4 Etiquettes de valeurs affiches dans lditeur de donnes

Excution dune analyse


Si vous disposez de modules complmentaires, le menu Analyse contient une liste de modalits danalyse de rapport et danalyse statistique. Nous commencerons par crer un simple tableau des effectifs. Cette exemple ncessite loption Statistiques de base.
E A partir des menus, slectionnez : Analyse > Statistiques descriptives > Effectifs...

La bote de dialogue Effectifs saffiche.


Figure 1-5 Bote de dialogue Effectifs

4 Chapitre 1

Une icne ct de chaque variable fournit des informations sur le type de donnes et le niveau de mesure.
Numrique Echelle (continue). Ordinal Nominal Chane n/a Date Heure

E Cliquez sur la variable Catgories de revenu en milliers [inccat]. Figure 1-6 Noms et tiquettes de variable dans la bote de dialogue Effectifs

Si ltiquette et/ou le nom de la variable apparat tronqu dans la liste, ltiquette ou le nom complet est affich lorsque vous placez le curseur dessus. Le nom de variable inccat est affich entre crochets la suite de ltiquette de variable descriptive. Catgories de revenu en milliers est ltiquette de variable. Sil ny avait pas dtiquette de variable, seul le nom de la variable apparatrait dans la zone de liste. A limage des fentres, vous pouvez redimensionner les botes de dialogue en cliquant sur les bords externes ou sur les angles, et en les faisant glisser. Par exemple, si vous largissez la bote de dialogue, vous largissez galement les listes de variables.

5 Introduction Figure 1-7 Bote de dialogue redimensionne

Dans la bote de dialogue, choisissez les variables analyser dans la liste source gauche et faites-les glisser dans la liste Variable(s) droite. Le bouton OK, qui excute lanalyse, est dsactiv jusqu ce quune variable soit place dans la liste Variable(s). Vous pouvez obtenir des informations supplmentaires en cliquant avec le bouton droit sur tout nom de variable dans la liste.
E Cliquez avec le bouton droit de la souris sur Modalit de revenu en milliers [rev_dis] et slectionnez Informations sur les variables. E Cliquez sur la flche vers le bas dans la liste droulante Etiquettes de valeurs. Figure 1-8 Etiquettes dfinies pour les variables de revenus

Toutes les tiquettes de valeur dfinies pour la variable apparaissent.

6 Chapitre 1 E Cliquez sur Sexe [gender] dans la liste des variables source, puis faites glisser la variable dans la

liste cible Variable(s).


E Cliquez sur la variable Modalit de revenus en milliers [rev_dis] dans la liste source, puis faites-la

glisser vers la liste cible.


Figure 1-9 Variables slectionnes pour lanalyse

E Cliquez sur OK pour excuter la procdure.

Affichage des rsultats


Figure 1-10 Fentre du Viewer

Les rsultats sont affichs dans la fentre du Viewer.

7 Introduction

Vous pouvez rapidement accder nimporte quel lment du Viewer en le slectionnant dans le panneau de lgende.
E Cliquez sur Modalit de revenu en milliers [rev_dis]. Figure 1-11 Tableau deffectifs des modalits de revenus

Le tableau deffectifs des modalits de revenus saffiche. Ce tableau deffectifs indique le nombre et le pourcentage de personnes dans chaque catgorie de revenus.

Cration de diagrammes
Bien que certaines procdures statistiques puissent crer des diagrammes, vous pouvez galement utiliser le menu Graphes pour la cration de diagrammes. Vous pouvez, par exemple, crer un diagramme montrant la relation entre lutilisation de services de tlphonie sans fil et la proprit dun agenda lectronique.
E A partir des menus, slectionnez : Graphes > Gnrateur de diagrammes... E Cliquez sur longlet Galerie (sil nest pas slectionn). E Cliquez sur Bton (sil nest pas slectionn). E Faites glisser licne Btons juxtaposs sur le canevas, qui est la zone tendue au-dessus de

la galerie.

8 Chapitre 1 Figure 1-12 Bote de dialogue Gnrateur de diagrammes

E Faites dfiler la liste Variables et cliquez avec le bouton droit de la souris sur Service sans fil [WiFi] et slectionnez Nominales comme niveau de mesure. E Faites glisser la variable Service sans fil [WiFi] dans laxe x. E Cliquez avec le bouton droit de la souris sur Possde un agenda lectronique [pda] et slectionnez Nominales comme niveau de mesure. E Faites glisser la variable Possde un agenda lectronique [pda] dans la zone de dplacement de

juxtaposition dans le coin suprieur droit du canevas.


E Cliquez sur OK pour crer le diagramme.

9 Introduction Figure 1-13 Diagramme en btons affich dans la fentre du Viewer

Le diagramme en btons est affich dans le Viewer. Le diagramme indique que la proportion de personnes possdant un agenda lectronique est plus importante chez les personnes utilisant un service de tlphonie sans fil. Vous pouvez modifier les diagrammes et les tableaux en double-cliquant dessus dans le panneau de contenu de la fentre de lEditeur de rsultats et vous pouvez copier-coller vos rsultats dans dautres applications. Ces sujets seront traits ultrieurement.

Chapitre

Lecture des donnes

Les donnes peuvent tre saisies directement ou importes partir de sources diffrentes. Ce chapitre traite des processus de lecture de donnes stockes dans les fichiers de donnes IBM SPSS Statistics, dans des applications de feuilles de calcul telles que Microsoft Excel, dans les applications de base de donnes telles que Microsoft Access et dans des fichiers texte.

Structure de base dun fichier de donnes IBM SPSS Statistics


Figure 2-1 Editeur de donnes

Les fichiers de donnes IBM SPSS Statistics sont organiss par observations (lignes) et par variables (colonnes). Dans ce fichier de donnes, les observations reprsentent des rpondants dans le cadre dune enqute. Les variables reprsentent des rponses chaque question pose au cours du sondage.

Lecture des fichiers de donnes IBM SPSS Statistics


Les fichiers de donnes IBM SPSS Statistics, portant lextension de fichier .sav, contiennent les donnes que vous avez enregistres. Pour ouvrir demo.sav, un fichier dexemple install avec le produit, procdez comme suit :
E A partir des menus, slectionnez : Fichier > Ouvrir > Donnes Copyright IBM Corporation 1989, 2011. 10

11 Lecture des donnes E Recherchez le fichier demo.sav et ouvrez-le. Pour plus d'informations, reportez-vous la section

Fichiers dexemple dans l'annexe A sur p. 155. Les donnes sont affiches dans lditeur de donnes.
Figure 2-2 Fichier de donnes ouvert

Lecture de donnes partir de feuilles de calcul


Au lieu de saisir toutes vos donnes directement dans lditeur de donnes, vous pouvez les lire partir dapplications telles que Microsoft Excel. Vous pouvez galement lire des en-ttes de colonne comme noms de variable.
E A partir des menus, slectionnez : Fichier > Ouvrir > Donnes E Slectionnez Excel (*:xls) comme type de fichier afficher. E Ouvrez demo.xls. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans

l'annexe A sur p. 155. La bote de dialogue Ouvrir la source de donnes Excel apparat ; elle vous permet de choisir si les noms de variable doivent tre inclus dans la feuille de calcul, et dindiquer les cellules importer. Dans Excel 95 ou version suprieure, vous pouvez galement indiquer les feuilles de calcul importer.

12 Chapitre 2 Figure 2-3 Bote de dialogue Ouvrir la source de donnes Excel

E Vrifiez que la case Lire le nom des variables partir de la premire ligne de donnes est slectionne.

Cette option lit les en-ttes de colonne comme des noms de variable. Si les en-ttes de colonne ne sont pas conformes aux rgles de dnomination de variable IBM SPSS Statistics, ils sont convertis en noms de variable valides et les en-ttes de colonne dorigine sont enregistrs comme tiquettes de variable. Pour nimporter quune partie de la feuille de calcul, indiquez lintervalle de cellules importer dans la zone de texte Intervalle.
E Cliquez sur OK pour lire le fichier Excel.

Les donnes apparaissent prsent dans lEditeur de donnes, les en-ttes de colonne tant utiliss comme noms de variable. Puisque les noms de variables ne peuvent pas contenir despaces, les espaces des en-ttes de colonne dorigine ont t supprims. Par exemple, Situation familiale dans le fichier Excel devient la variable Situatio. Len-tte de colonne dorigine est conserv comme tiquette de variable.
Figure 2-4 Donnes Excel importes

13 Lecture des donnes

Lecture de donnes partir dune base de donnes


Les donnes issues de sources de bases de donnes peuvent facilement tre importes laide de lAssistant de base de donnes. Toute base de donnes utilisant des pilotes ODBC (Open Database Connectivity) peut tre lue directement une fois ces pilotes installs. Les pilotes ODBC de nombreux formats de base de donnes sont fournis sur le CD dinstallation. Vous pouvez obtenir des pilotes supplmentaires auprs de distributeurs indpendants. Lune des applications de base de donnes les plus courantes, Microsoft Access, est traite dans cet exemple. Remarque : Cet exemple est propre Microsoft Windows et ncessite un pilote ODBC pour Access. Les tapes sont semblables sur les autres plateformes mais peuvent ncessiter un pilote ODBC tiers pour Access.
E A partir des menus, slectionnez : Fichier > Ouvrir la base de donnes > Nouvelle requte...

14 Chapitre 2 Figure 2-5 Bote de dialogue Bienvenue dans lassistant de base de donnes

E Slectionnez Base de donnes MS Access dans la liste des sources de donnes et cliquez sur Suivant.

Remarque : En fonction de votre installation, vous pouvez voir une liste des sources de donnes OLEDB gauche de lassistant (systmes dexploitation Windows uniquement), mais cet exemple utilise la liste de sources de donnes ODBC affiche sur la droite.

15 Lecture des donnes Figure 2-6 Bote de dialogue Connexion au pilote ODBC

E Cliquez sur Parcourir pour accder au fichier de base de donnes Access ouvrir. E Ouvrez demo.mdb. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans

l'annexe A sur p. 155.


E Cliquez sur OK dans la bote de dialogue de connexion.

A ltape suivante, vous pourrez indiquer les tables et les variables que vous souhaitez importer.
Figure 2-7 Etape Slectionner des donnes

16 Chapitre 2 E Faites glisser le tableau demo vers la liste Rtablir les champs dans cet ordre. E Cliquez sur Suivant.

A ltape 4, slectionnez les enregistrements (observations) importer.


Figure 2-8 Etape Limiter les observations rcupres

Si vous ne souhaitez pas importer toutes les observations, vous pouvez slectionner un sous-ensemble dobservations (par exemple, les hommes de plus de 30 ans) ou un chantillon alatoire dobservations dans la source de donnes. Pour les sources de donnes volumineuses, vous pouvez limiter le nombre dobservations un chantillon restreint et reprsentatif afin de rduire la dure du traitement.
E Cliquez sur Suivant pour continuer.

17 Lecture des donnes

Les noms de champ permettent de crer des noms de variable. Si ncessaire, ils sont convertis en noms de variable valides. Les noms de champ dorigine sont conservs en tant qutiquettes de variable. Vous pouvez galement modifier les noms de variable avant dimporter la base de donnes.
Figure 2-9 Etape Dfinir variables

E Cliquez sur la cellule Recoder en numrique dans le champ Sexe. Cette option convertit les

variables chane en variables numriques (entiers) et conserve la valeur dorigine comme tiquette de valeur de la nouvelle variable.
E Cliquez sur Suivant pour continuer.

18 Chapitre 2

Linstruction SQL cre partir de vos slections dans lAssistant de base de donnes apparat ltape Rsultats. Cette instruction peut tre excute immdiatement ou enregistre dans un fichier pour une utilisation ultrieure.
Figure 2-10 Etape Rsultats

E Cliquez sur Terminer pour importer les donnes.

19 Lecture des donnes

Toutes les donnes de la base de donnes Access slectionnes pour limportation sont prsent disponibles dans lditeur de donnes.
Figure 2-11 Donnes importes partir dune base de donnes Access

Lecture de donnes partir dun fichier texte


Les fichiers texte sont une autre source de donnes courante. De nombreux tableurs et bases de donnes peuvent enregistrer leur contenu dans lun des nombreux formats de fichier texte. Les fichiers dlimits par une virgule ou une tabulation se rapportent aux lignes de donnes utilisant des virgules ou des tabulations pour indiquer chaque variable. Dans cet exemple, les donnes sont dlimites par des tabulations.
E A partir des menus, slectionnez : Fichier > Lire les donnes texte... E Slectionnez Texte (*.txt) comme type de fichier afficher. E Ouvrez demo.txt. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans

l'annexe A sur p. 155.

20 Chapitre 2

LAssistant dimportation de texte vous guide tout au long du processus permettant de dfinir le mode dimpression du fichier texte indiqu.
Figure 2-12 Assistant dimportation de texte : Etape 1 sur 6

E A ltape 1, vous pourrez slectionner un format prdfini ou crer un format dans lAssistant. Slectionnez Non pour indiquer quun nouveau format doit tre cr. E Cliquez sur Suivant pour continuer.

21 Lecture des donnes

Comme indiqu prcdemment, ce fichier utilise un format dlimit par des tabulations. En outre, les noms de variable sont dfinis sur la premire ligne de ce fichier.
Figure 2-13 Assistant dimportation de texte : Etape 2 sur 6

E Slectionnez Dlimit pour indiquer que les donnes utilisent une structure de format dlimit. E Slectionnez Oui pour indiquer que les noms de variable doivent tre lus partir du dbut du fichier. E Cliquez sur Suivant pour continuer.

22 Chapitre 2 E Saisissez 2 dans la section suprieure de la bote de dialogue suivante pour indiquer que la

premire ligne de donnes commence sur la deuxime ligne du fichier texte.


Figure 2-14 Assistant dimportation de texte : Etape 3 sur 6

E Conservez les valeurs par dfaut des autres champs de cette bote de dialogue et cliquez sur Suivant pour continuer.

23 Lecture des donnes

Laperu des donnes de ltape 4 vous offre un moyen rapide de vrifier que vos donnes ont t lues correctement.
Figure 2-15 Assistant dimportation de texte : Etape 4 sur 6

E Slectionnez Tab et dslectionnez les autres options. E Cliquez sur Suivant pour continuer.

24 Chapitre 2

Etant donn que des noms de variable peuvent avoir t tronqus pour des raisons de formatage, cette bote de dialogue vous permet de modifier les noms superflus.
Figure 2-16 Assistant dimportation de texte : Etape 5 sur 6

Vous pouvez galement dfinir les types de donnes dans cette bote de dialogue. Par exemple, nous pouvons supposer que la variable de revenus doit contenir une certaine somme en dollars. Pour modifier un type de donnes :
E Sous laperu de donnes, slectionnez la variable modifier, cest--dire Revenu dans cet

exemple.

25 Lecture des donnes E Slectionnez Dollar dans la liste droulante Format des donnes. Figure 2-17 Slectionnez le type de donnes.

E Cliquez sur Suivant pour continuer.

26 Chapitre 2 Figure 2-18 Assistant dimportation de texte : Etape 6 sur 6

E Conservez les slections par dfaut dans cette bote de dialogue et cliquez sur Terminer pour

importer les donnes.

Chapitre

Utilisation de lditeur de donnes


Cette fentre affiche le contenu du fichier de donnes actif. Les informations contenues dans lditeur de donnes se composent de variables et dobservations. Dans laffichage des donnes, les colonnes reprsentent des variables et les lignes des observations. Dans laffichage des variables, chaque ligne est une variable et chaque colonne est un attribut associ cette variable.

Les variables sont utilises pour reprsenter les diffrents types de donnes que vous avez rassembles. Une analogie courante est celle de lenqute. La rponse chaque question dune enqute est quivalente une variable. Il existe de nombreux types de variable : nombres, caractres, monnaies et dates.

Saisie de donnes numriques


Les donnes peuvent tre saisies dans lditeur de donnes, qui peut savrer utile pour traiter les fichiers de donnes peu volumineux ou pour apporter de lgres modifications des fichiers de donnes plus volumineux.
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes.

Vous devez dfinir les variables qui seront utilises. Dans cet exemple, seules trois variables sont ncessaires : age, situatio et revenu.

Copyright IBM Corporation 1989, 2011.

27

28 Chapitre 3 Figure 3-1 Noms de variable dans laffichage des variables

E Dans la premire ligne de la premire colonne, saisissez age. E Dans la deuxime ligne, saisissez situatio. E Dans la troisime ligne, saisissez revenu.

Un type de donnes numrique est automatiquement attribu aux nouvelles variables. Si vous ne saisissez pas de noms de variable, des noms uniques sont automatiquement crs. Cependant, ces noms ne sont pas descriptifs et ne sont pas recommands pour les fichiers de donnes volumineux.
E Cliquez sur longlet Affichage des donnes pour continuer saisir des donnes.

Les noms saisis dans laffichage des variables sont prsent les en-ttes des trois premires colonnes de laffichage des donnes.

29 Utilisation de lditeur de donnes

Commencez saisir des donnes dans la premire ligne, en commenant par la premire colonne.
Figure 3-2 Valeurs entres dans laffichage des donnes

E Dans la colonne age, saisissez 55. E Dans la colonne situatio, saisissez 1. E Dans la colonne revenu, saisissez 72000. E Placez le curseur dans la seconde ligne de la premire colonne pour ajouter les donnes du sujet

suivant.
E Dans la colonne age, saisissez 53. E Dans la colonne situatio, saisissez 0. E Dans la colonne revenu, saisissez 153 000.

Les colonnes age et situatio affichent actuellement un sparateur dcimal alors que les valeurs sont des entiers. Pour masquer le sparateur dcimal de ces variables :
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Dans la colonne Dcimales de la ligne ge, saisissez 0 pour masquer la dcimale.

30 Chapitre 3 E Dans la colonne Dcimales de la ligne situatio, saisissez 0 pour masquer la dcimale. Figure 3-3 Proprit Dcimales des variables age et situatio mise jour

Saisie de donnes chane


Des donnes non numriques, telles que des chanes de texte, peuvent galement tre saisies dans lditeur de donnes.
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Dans la premire cellule de la premire ligne vide, saisissez sexe comme nom de variable. E Cliquez sur la cellule Type ct de votre entre.

31 Utilisation de lditeur de donnes E Cliquez sur le bouton droite de la cellule Type pour ouvrir la bote de dialogue Type de variable. Figure 3-4 Bouton prsent dans la cellule Type de la variable sexe

E Slectionnez Chane pour indiquer le type de variable. E Cliquez sur OK pour enregistrer votre slection et revenir dans Data Editor. Figure 3-5 Bote de dialogue Type de variable

32 Chapitre 3

Dfinition de donnes
Outre les donnes, vous pouvez aussi dfinir des tiquettes de variables descriptives et des tiquettes de valeurs pour les noms de variables et les valeurs de donnes. Ces tiquettes descriptives sont utilises dans les rapports statistiques et les diagrammes.

Ajout des tiquettes de variables


Les tiquettes fournissent une description des variables. Ces descriptions correspondent souvent une version plus longue des noms de variable. Les tiquettes peuvent slever jusqu 255 octets. Ces tiquettes sont utilises dans les rsultats pour identifier les variables diffrentes.
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Dans la colonne Etiquette de la ligne age, saisissez l'ge du rpondant. E Dans la colonne Etiquette de la ligne situatio, saisissez la situation familiale. E Dans la colonne Etiquette de la ligne revenu, saisissez revenu du mnage. E Dans la colonne Etiquette de la ligne sexe, saisissez le sexe. Figure 3-6 Etiquettes de variable entres dans laffichage des variables

33 Utilisation de lditeur de donnes

Modification du type et du format de variable


La colonne Type affiche le type de donnes actuel de chaque variable. Les types de donnes les plus courants sont les formats numriques et chanes, mais de nombreux autres formats sont pris en charge. Dans le fichier de donnes actuel, la variable revenu est dfinie comme tant un type numrique.
E Cliquez sur la cellule Type de la ligne revenu, puis sur le bouton droite de la cellule pour ouvrir

la bote de dialogue Type de variable.


E Slectionnez Dollar. Figure 3-7 Bote de dialogue Type de variable

Les options de format du type de donnes slectionn apparaissent.


E Dans cet exemple, slectionnez $###,###,### comme format de devise. E Cliquez sur OK pour appliquer vos modifications.

Ajout dtiquettes de valeur pour les variables numriques


Les tiquettes de valeur correspondent une faon dassocier aux valeurs de variable des tiquettes de chane. Dans cet exemple, il y a deux valeurs possibles pour la variable situatio. La valeur 0 signifie que le sujet est clibataire et la valeur 1 quil est mari.
E Cliquez sur la cellule Valeurs de la ligne situatio, puis sur le bouton droite de la cellule pour

ouvrir la bote de dialogue Etiquettes de valeur. Le champ Valeur correspond la valeur numrique relle. Le champ Etiquette de valeur correspond ltiquette de chane applique la valeur numrique indique.
E Saisissez 0 dans le champ Valeur.

34 Chapitre 3 E Saisissez Clibataire dans le champ Etiquette. E Cliquez sur Ajouter pour ajouter ltiquette la liste. Figure 3-8 Bote de dialogue Etiquettes de valeurs

E Saisissez 1 dans le champ Valeur, puis Mari dans le champ Etiquette. E Cliquez sur Ajouter, puis sur OK pour enregistrer vos modifications et revenir dans lditeur de

donnes. Ces tiquettes peuvent galement apparatre dans laffichage des donnes pour faciliter la lecture de vos donnes.
E Cliquez sur longlet Affichage des donnes en bas de la fentre de lditeur de donnes. E A partir des menus, slectionnez : Affichage > Etiquettes de valeur

Les tiquettes figurent prsent dans une liste lorsque vous entrez des valeurs dans Data Editor. Cette configuration a lavantage de proposer des rponses valides et plus descriptives.

35 Utilisation de lditeur de donnes

Si llment de menu Etiquettes de valeurs est dj activ (lorsquil est indiqu par une coche), slectionner nouveau Etiquettes de valeursdsactive laffichage des tiquettes de valeurs.
Figure 3-9 Etiquettes de valeur dans laffichage des donnes

Ajout dtiquettes de valeur pour les variables chane


Les variables chane peuvent galement ncessiter des tiquettes de valeur. Par exemple, les lettres M ou F sont utilises pour identifier le sexe du sujet. Les tiquettes de valeur peuvent tre utilises pour prciser que M signifie Masculin et FFminin.
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Cliquez sur la cellule Valeurs de la ligne sexe, puis sur le bouton droite de la cellule pour ouvrir

la bote de dialogue Etiquettes de valeur.


E Saisissez F dans le champ Valeur, puis Fminin dans le champ Etiquette.

36 Chapitre 3 E Cliquez sur Ajouter pour ajouter ltiquette au fichier de donnes. Figure 3-10 Bote de dialogue Etiquettes de valeurs

E Saisissez M dans le champ Valeur, puis Masculin dans le champ Etiquette. E Cliquez sur Ajouter, puis sur OK pour enregistrer vos modifications et revenir dans lditeur de

donnes. Les valeurs de chane font la distinction entre les majuscules et les minuscules, vous devez donc tre cohrent. Le m minuscule est diffrent du M majuscule.

Utilisation des tiquettes de valeurs pour la saisie de donnes


Vous pouvez utiliser des tiquettes de valeurs pour la saisie de donnes.
E Cliquez sur longlet Affichage des donnes en bas de la fentre de lditeur de donnes. E Dans la premire ligne, slectionnez la cellule pour sexe. E Cliquez sur le bouton droite de la cellule et choisissez Masculin dans la liste droulante. E Dans la seconde ligne, slectionnez la cellule pour sexe.

37 Utilisation de lditeur de donnes E Cliquez sur le bouton droite de la cellule et choisissez Fminin dans la liste droulante. Figure 3-11 Utilisation dtiquettes de variable pour slectionner des valeurs

Seules les valeurs dfinies sont rpertories ; ainsi, vous tes sr que les donnes saisies sont au format souhait.

Gestion des donnes manquantes


Les donnes manquantes ou non valides sont trop frquentes pour tre ignores. Les personnes interroges peuvent refuser de rpondre certaines questions, ne pas connatre la rponse ou donner une rponse dont le format est inattendu. Si vous ne filtrez ou nidentifiez pas ces donnes, les rsultats de votre analyse risquent dtre imprcis. En ce qui concerne les donnes numriques, les champs de donnes vides ou contenant des entres non valides sont convertis en donnes manquantes par dfaut, signales par une virgule (Windows franais) ou un point (Windows anglais).

38 Chapitre 3 Figure 3-12 Valeurs manquantes affiches sous la forme de virgules

La raison pour laquelle une valeur est manquante peut tre importante pour votre analyse. Par exemple, vous pouvez juger utile de distinguer les personnes qui ont refus de rpondre une question de celles qui nont pas rpondu car cette question ne les concernait pas.

Valeurs manquantes des variables numriques


E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Cliquez sur la cellule Manquante de la ligne ge, puis sur le bouton droite de la cellule pour

ouvrir la bote de dialogue Valeurs manquantes.

39 Utilisation de lditeur de donnes

Dans cette bote de dialogue, vous pouvez indiquer jusqu trois valeurs manquantes ou un intervalle de valeurs et une valeur discrte supplmentaire.
Figure 3-13 Bote de dialogue Valeurs manquantes

E Slectionnez Valeurs manquantes discrtes. E Saisissez 999 dans la premire zone de texte. Ne remplissez pas les deux autres zones de texte. E Cliquez sur OK pour enregistrer vos modifications et revenir dans lditeur de donnes.

La valeur des donnes manquantes ayant t ajoute, vous pouvez appliquer une tiquette cette valeur.
E Cliquez sur la cellule Valeurs de la ligne ge, puis sur le bouton droite de la cellule pour ouvrir la

bote de dialogue Etiquettes de valeur.


E Saisissez 999 dans le champ Valeur. E Saisissez Non rpondu dans le champ Etiquette. Figure 3-14 Bote de dialogue Etiquettes de valeurs

E Cliquez sur Ajouter pour ajouter ltiquette au fichier de donnes. E Cliquez sur OK pour enregistrer vos modifications et revenir dans lditeur de donnes.

40 Chapitre 3

Valeurs manquantes dune variable chane


Les valeurs manquantes des variables de chane sont gres de la mme faon que les valeurs manquantes des variables numriques. Cependant, contrairement aux valeurs numriques, les champs vides dans les variables de chane ne sont pas dsigns comme donnes manquantes par dfaut. Ils sont interprts comme des chanes de caractres vides.
E Cliquez sur longlet Affichage des variables en bas de la fentre de lditeur de donnes. E Cliquez sur la cellule Manquante de la ligne sexe, puis sur le bouton droite de la cellule pour

ouvrir la bote de dialogue Valeurs manquantes.


E Slectionnez Valeurs manquantes discrtes. E Saisissez NR dans la premire zone de texte.

Les valeurs manquantes des variables chane distinguent les majuscules des minuscules. Par consquent, la valeurnr nest pas traite comme une valeur manquante.
E Cliquez sur OK pour enregistrer vos modifications et revenir dans lditeur de donnes.

Vous pouvez prsent ajouter une tiquette pour la valeur manquante.


E Cliquez sur la cellule Valeurs de la ligne sexe, puis sur le bouton droite de la cellule pour ouvrir

la bote de dialogue Etiquettes de valeur.


E Saisissez NR dans le champ Valeur. E Saisissez Non rpondu dans le champ Etiquette. Figure 3-15 Bote de dialogue Etiquettes de valeurs

E Cliquez sur Ajouter pour ajouter ltiquette au projet. E Cliquez sur OK pour enregistrer vos modifications et revenir dans lditeur de donnes.

41 Utilisation de lditeur de donnes

Copier-coller des attributs de variable


Une fois les attributs dune variable dfinis, vous pouvez les copier et les appliquer dautres variables.
E Dans laffichage des variables, saisissez agemar dans la premire cellule de la premire ligne vide. Figure 3-16 Variable agemar dans laffichage des variables

E Dans la colonne Etiquette, saisissez Age mariage. E Cliquez sur la cellule Valeurs de la ligne age. E A partir des menus, slectionnez : Edition > Copier E Cliquez sur la cellule Valeurs de la ligne agemar. E A partir des menus, slectionnez : Edition > Coller

Les valeurs dfinies de la variable age sont prsent appliques la variable agemar.

42 Chapitre 3

Pour appliquer lattribut plusieurs variables, il suffit de slectionner plusieurs cellules cible (cliquez et faites glisser vers le bas la colonne).
Figure 3-17 Plusieurs cellules slectionnes

Lorsque vous collez lattribut, il sapplique toutes les cellules slectionnes. De nouvelles variables sont automatiquement cres si vous collez les valeurs dans des lignes vides.

43 Utilisation de lditeur de donnes

Pour copier tous les attributs dune variable vers une autre variable :
E Cliquez sur le numro de la ligne dans la lignesituatio. Figure 3-18 Ligne slectionne

E A partir des menus, slectionnez : Edition > Copier E Cliquez sur le numro de ligne de la premire ligne vide. E A partir des menus, slectionnez : Edition > Coller

44 Chapitre 3

Tous les attributs de la variable situatio sont appliqus la nouvelle variable.


Figure 3-19 Toutes les valeurs colles dans une ligne

Dfinition des proprits des variables qualitatives


Pour les donnes qualitatives (nominales, ordinales), vous pouvez utiliser la bote de dialogue Dfinir les proprits de variable afin de dfinir des tiquettes de valeur et dautres proprits de variable. Le processus Dfinir les proprits de variable :

Analyse les valeurs relles des donnes et rpertorie toutes les valeurs de donnes uniques pour chaque variable slectionne. Identifie les valeurs non tiquetes et possde une fonction d tiquetage automatique . Permet de copier des tiquettes de valeurs dfinies dune autre variable vers la variable slectionne ou de la variable slectionne vers dautres variables.

Cet exemple utilise le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155. Ce fichier de donnes comporte dj des tiquettes de valeur dfinies, saisissons donc une valeur laquelle aucune tiquette de valeur ne correspond.
E Dans laffichage des donnes de Data Editor, cliquez sur la premire cellule de donnes de la

variable ownpc (vous pouvez tre amen faire dfiler lcran vers la droite) et saisissez 99.

45 Utilisation de lditeur de donnes E A partir des menus, slectionnez : Donnes > Dfinir les proprits de variables Figure 3-20 Bote de dialogue initiale Dfinir les proprits de variable

Dans la bote de dialogue initiale Dfinir les proprits de variable, slectionnez les variables nominales ou ordinales pour lesquelles dfinir des tiquettes de valeur et/ou dautres proprits.
E Faites glisser les variables depuis Possde une TV [owntv] jusqu Possde un fax [ownfax] et

dposez-les dans la liste des Variables analyser. Vous aurez srement remarqu que les icnes de niveau de mesure de toutes les variables slectionnes indiquent quil sagit de variables dchelle, et non de variables qualitatives. Toutes les variables slectionnes dans cet exemple sont de vritables variables qualitatives utilisant les valeurs numriques 0 et 1 pour reprsenter respectivement Non et Oui. Dans la bote de dialogue Dfinir les proprits de variable, nous allons notamment modifier la proprit de variable du niveau de mesure.
E Cliquez sur Poursuivre.

46 Chapitre 3 Figure 3-21 Dfinir les proprits de variable, bote de dialogue principale

E Dans la liste des variables analyses, slectionnez ownpc.

Le niveau de mesure actuel de la variable slectionne est chelle. Vous pouvez slectionner un autre niveau de mesure dans la liste droulante ou consulter ceux proposs par la bote de dialogue Dfinir les proprits de variable.
E Cliquez sur Suggrer.

La bote de dialogue Suggestion dun niveau de mesure est affiche.

47 Utilisation de lditeur de donnes Figure 3-22 Bote de dialogue Suggestion dun niveau de mesure

Etant donn que la variable comporte peu de valeurs diffrentes et que toutes les observations analyses contiennent des valeurs entires, vous devez choisir un niveau de mesure ordinal ou nominal.
E Slectionnez Ordinal, puis cliquez sur Continuer.

La variable slectionne comporte prsent un niveau de mesure ordinal. La grille des tiquettes de valeurs affiche toutes les valeurs de donnes uniques de la variable slectionne, toutes les tiquettes de valeur dfinies pour ces valeurs, ainsi que le nombre doccurrences (effectif) de chaque valeur dans les observations analyses. La valeur saisie dans laffichage de donnes, 99, figure dans la grille. Leffectif est de 1 car nous navons modifi la valeur que pour une observation. Quant la colonne Etiquette, elle est vide car nous navons pas encore dfini dtiquette de valeur pour 99. Le X dans la premire colonne de la liste des variables analyses indique par ailleurs que la variable slectionne comporte au moins une valeur observe sans tiquette de valeur dfinie.
E Dans la colonne Etiquette de la valeur 99, saisissez Pas de rponse. E Cochez la case dans la colonne Manquante pour la valeur 99 afin didentifier la valeur 99 comme

valeur utilisateur manquante. Les valeurs des donnes dfinies comme valeurs utilisateur manquantes sont repres par un indicateur en vue dun traitement spcial et sont exclues de la plupart des calculs.

48 Chapitre 3 Figure 3-23 Nouvelles proprits dfinies pour la variable ownpc

Avant de terminer la modification des proprits de la variable ownpc, appliquons un niveau de mesure, des tiquettes de valeur et des dfinitions de valeurs manquantes identiques aux autres variables de la liste.
E Dans la zone Copier les proprits, cliquez sur Vers dautres variables. Figure 3-24 Bote de dialogue Appliquer les tiquettes et le niveau

E Dans la bote de dialogue Appliquer les tiquettes et le niveau, slectionnez toutes les variables de la liste, puis cliquez sur Copier.

49 Utilisation de lditeur de donnes

Si vous slectionnez lune des autres variables de la liste des variables analyses de la bote de dialogue principale Dfinir les proprits de variable, vous constaterez quil sagit dsormais dune variable ordinale avec une valeur de 99 dfinie comme valeur manquante utilisateur et une tiquette de valeur Pas de rponse.
Figure 3-25 Nouvelles proprits dfinies pour la variable ownfax

E Cliquez sur OK pour enregistrer toutes les proprits de variable dfinies.

Chapitre

Utilisation des sources de donnes multiples


Avec la version 14.0, plusieurs sources de donnes peuvent tre ouvertes en mme temps, ce qui permet de facilement : Basculer entre les sources de donnes. Comparer les contenus des diffrentes sources de donnes. Copier et coller les donnes entre les sources de donnes. Crer de multiples sous-ensembles dobservations et/ou de variables pour analyse. Fusionner plusieurs sources de donnes partir de diffrents formats de donnes (par exemple des feuilles de calcul, des bases de donnes ou des donnes texte) sans avoir enregistrer pralablement chaque source de donnes.

Copyright IBM Corporation 1989, 2011.

50

51 Utilisation des sources de donnes multiples

Manipulation de base de plusieurs sources de donnes


Figure 4-1 Deux sources de donnes souvrent en mme temps

Par dfaut, chaque source de donnes que vous ouvrez est affiche dans une nouvelle fentre de lditeur de donnes.

Toute source de donnes ouverte au pralable le reste pour utilisation ultrieure. Lorsque vous ouvrez dabord une source de donnes, elle devient automatiquement lensemble de donnes actif. Vous pouvez modifier lensemble de donnes actif en cliquant simplement nimporte o dans la fentre Data Editor de la source de donnes que vous souhaitez utiliser ou en slectionnant la fentre Data Editor pour cette source de donnes partir du menu Fentre.

52 Chapitre 4

Seules les variables de lensemble de donnes actif sont disponibles pour analyse.

Figure 4-2 Liste de variables contenant les variables dans lensemble de donnes actif

Vous ne pouvez pas modifier lensemble de donnes actif lorsque une bote de dialogue ayant accs aux donnes est ouverte (y compris toutes les botes de dialogue qui affichent des listes de variables). Au moins une fentre Data Editor doit tre ouverte lors dune session. Lorsque vous fermez la dernire fentre de lditeur de donnes, IBM SPSS Statistics se ferme automatiquement, vous invitant au pralable enregistrer vos modifications.

53 Utilisation des sources de donnes multiples

Utilisation de plusieurs ensembles de donnes dans une syntaxe de commande


Si vous utilisez la syntaxe de commande pour ouvrir les sources de donnes (par exemple GET FILE ou GET DATA), vous devez utiliser la commande DATASET NAME pour nommer de faon explicite chaque ensemble de donnes afin davoir plusieurs sources de donnes ouvertes simultanment. Lorsque vous utilisez une syntaxe de commande, le nom de lensemble de donnes actif apparat dans la barre doutils de la fentre de syntaxe. Toutes les actions suivantes permettent dactiver un autre ensemble de donnes :

Utiliser la commande DATASET ACTIVATE. Cliquer nimporte o dans la fentre de lditeur de donnes dun ensemble de donnes. Slectionner le nom dun ensemble de donnes dans la barre doutils de la fentre de syntaxe.

Figure 4-3 Ensembles de donnes ouverts affichs dans la barre doutils de la fentre de syntaxe

Copie et collage dinformations entre les ensembles de donnes


Vous pouvez copier la fois des donnes et des attributs de dfinition de variable dun ensemble de donnes un autre de la mme faon que vous copiez et collez des informations au sein dun fichier de donnes unique.

Le fait de copier et coller des cellules de donnes slectionnes dans Affichage des donnes ne colle que les valeurs des donnes, sans les attributs de dfinition de variable. Le fait de copier et coller une variable entire dans Affichage des donnes en slectionnant le nom de la variable en haut de la colonne colle toutes les donnes et tous les attributs de dfinition de variable pour cette variable. Le fait de copier et coller des attributs de dfinition de variable ou des variables entires dans Affichage des variables colle les attributs slectionns (ou la dfinition de la variable entire) mais ne colle pas les valeurs des donnes.

54 Chapitre 4

Attribution dun nouveau nom aux ensembles de donnes


Lorsque vous ouvrez une source de donnes via les menus et les botes de dialogue, un nom densemble de donnes DataSetn est automatiquement attribuer chaque source de donnes ; n est une valeur entire squentielle . Lorsque vous ouvrez une source de donnes via la syntaxe de commande, aucun nom densemble de donnes nest attribu moins que vous en spcifiez un avec DATASET NAME. Pour fournir des noms densembles de donnes plus descriptifs :
E Depuis les menus de la fentre Data Editor pour lensemble de donnes dont vous souhaitez

modifier le nom, choisissez :


Fichier > Renommer lensemble de donnes... E Entrez un nouveau nom conforme aux rgles de dnomination des variables pour lensemble

de donnes.

Suppression de plusieurs ensembles de donnes


Si vous prfrez quun seul ensemble de donnes soit disponible un moment donn et souhaitez supprimer la fonctionnalit douverture de plusieurs ensembles de donnes :
E A partir des menus, slectionnez : Affichage > Options E Cliquez sur longlet Gnral.

Slectionnez (cochez) la case Ouvrir un seul ensemble de donnes la fois.

Chapitre

Examen des statistiques rcapitulatives pour chaque variable

Ce chapitre traite des mesures rcapitulatives simples et de la faon dont le niveau de mesure dune variable influence le type de statistiques devant tre utilis. Nous utiliserons le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.

Niveau de mesure
Diffrentes mesures rcapitulatives sont adaptes diffrents types de donnes, selon le niveau de mesure :
Qualitatives : Donnes ayant un nombre limit de valeurs ou de modalits distinctes (par exemple,

sexe ou situation de famille). Elles sont parfois galement qualifies de donnes qualitatives. Les variables qualitatives peuvent tre des donnes chane (alphanumrique) ou des variables numriques qui utilisent des codes chiffrs pour reprsenter les modalits (par exemple, 0 = Clibataire et 1 = Mari). Il existe deux types essentiels de donnes qualitatives :

Nominal. Donnes qualitatives dont les modalits nont aucun ordre inhrent. Par exemple,

une modalit demploi de type ventes nest pas suprieure ou infrieure une modalit demploi de type marketing ou tude.

Ordinal. Donnes qualitatives dont les modalits possdent un ordre significatif, mais pour

lesquelles il nexiste aucune distance mesurable entre les modalits. Par exemple, les valeurs leve, moyenne et faible doivent tre classes dans un certain ordre, mais il est impossible de calculer la distance entre ces valeurs.
Echelle. Donnes mesures sur une chelle dintervalle ou de rapport, o les valeurs de donnes indiquent la fois lordre des valeurs et la distance qui les spare. Par exemple, un salaire de 58 160 est suprieur un salaire de 42 212 et la distance entre les deux valeurs est de 15 948 . Ces donnes sont aussi appeles donnes quantitatives ou donnes continues.

Mesures rcapitulatives pour donnes qualitatives


Pour les donnes qualitatives, la mesure rcapitulative la plus courante est le nombre ou le pourcentage dobservations dans chaque modalit. Le mode est la modalit ayant le plus grand nombre dobservations. Pour les donnes ordinales, la mdiane (valeur au-dessus ou au-dessous de laquelle se trouve la moiti des observations) peut galement tre une mesure rcapitulative utile sil existe un grand nombre de modalits. La procdure Frquences produit des tableaux de frquences qui affichent le nombre et le pourcentage dobservations pour chaque valeur observe dune variable.
Copyright IBM Corporation 1989, 2011. 55

56 Chapitre 5 E A partir des menus, slectionnez : Analyse > Statistiques descriptives > Effectifs

Remarque : Cette fonction ncessite loption Statistiques de base.


E Slectionnez Possde un agenda lectronique [pda] et Possde un tlviseur [tv], et dplacez-les

vers la liste Variable(s).


Figure 5-1 Variables qualitatives slectionnes pour lanalyse

E Cliquez sur OK pour excuter la procdure.

57 Examen des statistiques rcapitulatives pour chaque variable Figure 5-2 Tableaux de frquences

Les tableaux de frquences apparaissent dans la fentre du Viewer. Les tableaux deffectifs rvlent que seuls 20,4 % des personnes possdent un agenda lectronique, mais que la quasi-totalit possdent une tlvision (99,0 %). Ces informations ne semblent pas vraiment pertinentes, mais il peut tre intressant den savoir plus sur le petit groupe de personnes qui ne possdent pas de tlvision.

Diagrammes pour donnes qualitatives


Vous pouvez afficher graphiquement les informations dans un tableau de frquences avec un diagramme en btons ou un diagramme en secteurs.
E Ouvrez nouveau la bote de dialogue Frquences. (Les deux variables doivent toujours tre

slectionnes.) Vous pouvez utiliser le bouton Rappeler bote de dialogue de la barre doutils pour revenir rapidement aux dernires procdures utilises.
Figure 5-3 Bouton Rappeler bote de dialogue

E Cliquez sur Diagrammes.

58 Chapitre 5 E Cliquez sur Diagrammes en btons, puis sur Poursuivre. Figure 5-4 Bote de dialogue Frquences : Diagrammes

E Cliquez sur OK dans la bote de dialogue principale pour excuter la procdure. Figure 5-5 Diagramme en btons

Outre les tableaux de frquences, les mmes informations sont prsent affiches sous forme de diagrammes en btons ; vous pouvez ainsi voir que la plupart des personnes nont pas dagenda lectronique alors que la quasi-totalit dentre elles possdent une tlvision.

59 Examen des statistiques rcapitulatives pour chaque variable

Mesures rcapitulatives pour variables dchelle


De nombreuses mesures rcapitulatives sont disponibles pour les variables dchelle, dont :

Mesures de la tendance centrale.Les mesures les plus courantes de la tendance centrale sont la

moyenne (moyenne arithmtique) et la mdiane (valeur au-dessus ou au-dessous de laquelle se trouve la moiti des observations).

Mesures de la dispersion. Les statistiques qui mesurent la quantit de variation ou de

dispersion dans les donnes comprennent lcart-type, minimal et maximal.


E Ouvrez nouveau la bote de dialogue Frquences. E Cliquez sur Rinitialiser pour effacer les paramtres prcdents. E Slectionnez la variable Revenu du mnage en milliers [revenu] et dplacez-la dans la liste

Variable(s).
Figure 5-6 Variables dchelle slectionnes pour lanalyse

E Cliquez sur Statistiques.

60 Chapitre 5 E Slectionnez Moyenne, Mdiane, Ecart type, Minimum et Maximum. Figure 5-7 Bote de dialogue Frquences : Statistiques

E Cliquez sur Poursuivre. E Dslectionnez Afficher les tableaux deffectif dans la bote de dialogue principale Effectifs. (En

gnral, les tableaux de frquences ne sont pas trs utiles pour les variables dchelle car il peut exister presque autant de valeurs distinctes que dobservations dans le fichier de donnes.)
E Cliquez sur OK pour excuter la procdure.

Le tableau statistique de frquences est affich dans la fentre du Viewer.


Figure 5-8 Tableau statistique de frquences

61 Examen des statistiques rcapitulatives pour chaque variable

Dans cet exemple, la diffrence entre la moyenne et la mdiane est importante. La moyenne est plus importante que la mdiane de quasiment 25 000, ce qui indique que les valeurs ne sont pas distribues normalement. Vous pouvez vrifier visuellement la distribution grce un histogramme.

Histogrammes pour variables dchelle


E Ouvrez nouveau la bote de dialogue Frquences. E Cliquez sur Diagrammes. E Cliquez sur Histogrammes et Avec courbe gaussienne. Figure 5-9 Bote de dialogue Frquences : Diagrammes

E Cliquez sur Poursuivre, puis sur OK dans la bote de dialogue principale pour excuter la procdure.

62 Chapitre 5 Figure 5-10 Histogramme

La grande majorit des observations est regroupe au bas de lchelle, la plupart se trouvant au-dessous de 100 000. Quelques observations, cependant, se trouvent dans lintervalle 500 000 et au-del (elles sont si peu nombreuses que vous devez modifier lhistogramme pour les voir). Ces valeurs trs leves pour quelques observations seulement ont un effet significatif sur la moyenne mais peu deffet, voire aucun, sur la mdiane ; cela signifie que, dans cet exemple, la mdiane est un meilleur indicateur de la tendance centrale.

Chapitre

Cration et modification de diagrammes

Vous pouvez crer et modifier des types de diagramme divers et varis. Dans ce chapitre, nous allons crer et modifier des diagrammes en btons. Vous pouvez appliquer les principes nimporte quel type de diagramme.

Cration de diagrammes - Notions de base


Pour illustrer les notions de base de la cration de diagrammes, nous allons crer un diagramme en btons du revenu moyen pour plusieurs niveaux de satisfaction professionnelle. Cet exemple utilise le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.
E A partir des menus, slectionnez : Graphes > Gnrateur de diagrammes...

Copyright IBM Corporation 1989, 2011.

63

64 Chapitre 6

La bote de dialogue Gnrateur de diagrammes est une fentre interactive qui vous permet dobtenir laperu dun diagramme avant que vous ne le gnriez.
Figure 6-1 Bote de dialogue Gnrateur de diagrammes

Utilisation de la galerie Gnrateur de diagrammes


E Cliquez sur longlet Galerie sil nest pas slectionn.

La galerie inclut plusieurs diagrammes diffrents prdfinis, qui sont organiss par type de diagramme. Longlet Elments de base fournit galement des lments de base (comme les axes et les lments graphiques) pour crer des diagrammes en partant de zro, mais il est plus facile dutiliser la galerie.
E Cliquez sur Bton sil nest pas slectionn.

Les icnes reprsentant les diagrammes en btons disponibles dans la galerie apparaissent dans la bote de dialogue. Les images doivent fournir suffisamment dinformations pour identifier le type de diagramme spcifique. Si vous avez besoin de plus dinformations, vous pouvez galement afficher une description de la note daide du diagramme en posant votre curseur sur une icne.

65 Cration et modification de diagrammes E Faites glisser licne du diagramme en btons simples sur le canevas , qui est en fait la zone

tendue au-dessus de la galerie. Le Gnrateur de diagrammes affiche un aperu du diagramme sur le canevas. Notez que les donnes utilises pour dessiner le diagramme ne sont pas vos donnes en cours. Il sagit dexemples.
Figure 6-2 Diagramme en btons sur le canevas du Gnrateur de diagrammes

Dfinition des variables et des statistiques


Bien quil y ait un diagramme sur le canevas, il nest pas complet car il ny a aucune variable ou statistique pour contrler la hauteur des btons et pour spcifier la catgorie de variable correspondant chaque bton. Vous ne pouvez pas avoir de diagramme sans variable et statistique. Vous pouvez ajouter des variables en les glissant de la liste Variables qui se trouve gauche du canevas. Le niveau de mesure dune variable est important dans le Gnrateur de diagrammes. Vous allez utiliser la variable Satisfaction professionnelle de laxe x. Cependant, licne (qui ressemble une rgle) ct de la variable indique que son niveau de mesure est dfini en tant que variable

66 Chapitre 6

dchelle. Pour crer le diagramme correct, vous devez utiliser un niveau de mesure qualitatif. Plutt que de revenir et de modifier le niveau de mesure dans lAffichage des variables, vous pouvez le modifier temporairement dans le Gnrateur de diagrammes.
E Cliquez avec le bouton droit de la souris sur Satisfaction professionnelle dans la liste Variables et choisissez Ordinal. Ordinal correspond un niveau de mesure appropri car les catgories dans

Satisfaction professionnelle peuvent tre ordonnes par niveau de satisfaction. Notez que licne change une fois le niveau de mesure modifi.
E Faites glisser Satisfaction professionnelle de la liste Variables dans la zone de dplacement de

laxe x.
Figure 6-3 Satisfaction professionnelle dans la zone de dplacement de laxe x.

La zone de dplacement de laxe y prend par dfaut la statistique Effectif. Si vous souhaitez utiliser une autre statistique (comme pourcentage ou moyenne), vous pouvez facilement en changer. Vous nutiliserez aucune de ces statistiques dans cet exemple, mais nous allons revoir le processus au cas o vous devez changer cette statistique plus tard.
E Cliquez sur Proprit des lments pour afficher la fentre Proprit des lments.

67 Cration et modification de diagrammes Figure 6-4 Fentre Proprit des lments

La fentre Proprit des lments vous permet de modifier les proprits des diffrents lments du diagramme. Ces lments comprennent les lments graphiques (comme les btons du diagramme) et les axes du diagramme. Slectionnez un des lments dans Modifier les proprits de liste pour modifier les proprits associes cet lment. Notez galement le X rouge situ droite de la liste. Ce bouton supprime un lment graphique du canevas. Puisque Bton1 est slectionn, les proprits affiches sappliquent aux lments graphiques, en particulier les lments de btons. La liste droulante Statistiques affiche les statistiques spcifiques qui sont disponibles. Les mmes statistiques sont habituellement disponibles pour chaque type de diagramme. Notez que certaines statistiques requirent que la zone de dplacement de laxe y contienne une variable.
E Revenez la bote de dialogue Gnrateur de diagrammes et faites glisser Revenu du mnage en

milliers de la liste Variables vers la zone de dplacement de laxe y. Puisque la variable sur laxe y est sous forme dchelle et que la variable de laxe x est qualitative (ordinal est un type de niveau de mesure qualitatif), la zone de dplacement de laxe y prend par dfaut la statistique Moyenne. Il sagit des variables et des statistiques souhaites, il ny a donc aucun besoin de modifier les proprits de llment.

68 Chapitre 6

Ajout de texte
Vous pouvez galement ajouter des titres et des notes de bas de page au diagramme.
E Cliquez sur longlet Titres/Notes de bas de page. E Slectionnez Titre 1. Figure 6-5 Titre 1 affich sur le canevas

Le titre apparat sur le canevas avec ltiquette T1.


E Dans la fentre Proprit des lments, slectionnez Titre 1 dans Modifier les proprits de liste. E Dans la zone de texte Contenu, saisissez Revenu par satisfaction professionnelle. Il sagit du

texte que le titre affichera.


E Cliquez sur Appliquer pour enregistrer le texte. Bien que le texte ne soit pas affich dans le

Gnrateur de diagrammes, il apparat lorsque vous gnrez le diagramme.

69 Cration et modification de diagrammes

Cration du diagramme
E Cliquez sur OK pour crer le diagramme en btons. Figure 6-6 Diagramme en btons

Le diagramme en btons indique que les rpondants les plus satisfaits de leur situation professionnelle ont tendance avoir des revenus plus levs.

Modification de diagrammes Notions de base


Vous pouvez modifier les diagrammes de diffrentes faons. Pour lexemple de diagramme en btons cr, vous allez effectuer les tches suivantes :

Changement de couleur. Formatage des valeurs des tiquettes de graduation. Modification du texte. Affichage des tiquettes des valeurs de donnes. Utilisation de modles de diagramme.

Pour modifier le diagramme, ouvrez-le dans lditeur de diagrammes.

70 Chapitre 6 E Double-cliquez sur le diagramme en btons pour louvrir dans lditeur de diagrammes. Figure 6-7 Diagramme en btons dans lditeur de diagrammes

Slection dlments de diagramme


Pour modifier un lment de diagramme, slectionnez-le.
E Cliquez sur lun des btons. Les rectangles contenant les btons signifient quils sont slectionns.

Il existe des rgles gnrales pour slectionner des lments dans un diagramme simple :

Si aucun des lments graphiques nest slectionn, cliquez sur lun deux afin de les slectionner tous. Si tous les lments graphiques sont slectionns, cliquez sur lun deux afin que la slection porte sur lui seul. Pour slectionner un autre lment graphique, vous pouvez cliquer dessus. Pour slectionner plusieurs lments graphiques, cliquez dessus tout en maintenant la touche Ctrl enfonce.

E Pour dslectionner tous les lments, appuyez sur la touche Echap.

71 Cration et modification de diagrammes E Cliquez sur un bton pour reslectionner tous les btons.

Utilisation de la fentre Proprits


E A partir des menus de lditeur de diagrammes, slectionnez : Edition > Proprits

Ce menu affiche la fentre Proprits, qui contient les onglets sappliquant aux btons slectionns. Ces onglets varient selon llment de diagramme que vous slectionnez dans lditeur de diagrammes. Par exemple, si vous aviez slectionn un cadre de texte au lieu de btons, plusieurs onglets apparaissent dans la fentre Proprits. Ces onglets vous permettent deffectuer la plupart des modifications de diagramme.
Figure 6-8 Fentre Proprits

72 Chapitre 6

Changement de la couleur des btons


Vous allez dabord changer la couleur des btons. En outre, vous spcifiez les attributs de couleur des lments graphiques ( lexception des courbes et des marques) dans longlet de remplissage et de bordures.
E Cliquez sur longlet Remplissage et bordures. E Cliquez sur lchantillon en regard de loption de remplissage pour indiquer que vous souhaitez

modifier la couleur de remplissage des btons. Les numros figurant sous lchantillon font rfrence aux composantes rouge, verte et bleue de la couleur actuelle.
E Cliquez sur la couleur bleu clair, au deuxime rang gauche sur la deuxime ligne en partant

du bas.
Figure 6-9 Onglet Remplissage et bordures

E Cliquez sur Appliquer.

73 Cration et modification de diagrammes

Les btons du diagramme apparaissent dsormais en bleu clair.


Figure 6-10 Modification du diagramme en btons bleus

Formatage des valeurs des tiquettes de graduation


Notez que les valeurs sur laxe des y sont exprimes en milliers. Pour amliorer la prsentation du diagramme et faciliter son interprtation, nous allons modifier le format numrique des tiquettes de graduation, puis le titre de laxe en consquence.
E Slectionnez les tiquettes de graduation sur laxe des y en cliquant dessus. E Pour rouvrir la fentre Proprits (si vous lavez ferme prcdemment), slectionnez les options

suivantes :
Edition > Proprits

Remarque : A ce stade, nous supposons que la fentre Proprits est ouverte. Si vous avez ferm la fentre Proprits, suivez ltape prcdente pour la rouvrir. Il est galement possible dutiliser le raccourci clavier Ctrl+T afin de rouvrir cette fentre.
E Cliquez sur longlet Format numrique. E Si vous ne souhaitez pas afficher les dcimales sur les tiquettes de graduation, entrez 0 dans

la zone de texte Dcimales.


E Saisissez 0,001 dans la zone de texte Facteur dchelle. Le facteur dchelle correspond au diviseur

de la valeur affiche, utilis par lditeur de diagrammes. Etant donn que 0,001 reprsente une

74 Chapitre 6

fraction, employer ce diviseur incrmente de 1 000 les valeurs des tiquettes de graduation. Par consquent, elles ne sont plus exprimes en milliers et leur mise lchelle est annule.
E Slectionnez Afficher le regroupement de chiffres. La fonction de regroupement des chiffres utilise

un caractre spcial (fourni par les paramtres rgionaux de votre ordinateur) pour marquer la position des milliers dans la valeur concerne.
Figure 6-11 Onglet Format numrique

E Cliquez sur Appliquer.

75 Cration et modification de diagrammes

Les tiquettes de graduation refltent ce nouveau formatage numrique : Aucune dcimale napparat, les valeurs ne sont plus mises lchelle et les milliers sont signals par un caractre spcial.
Figure 6-12 Diagramme en btons modifi contenant le nouveau format numrique

Modification de texte
Maintenant que vous avez modifi le format numrique des tiquettes de graduation, le titre de laxe ne correspond plus. Vous devrez le modifier par la suite en tenant compte du nouveau format numrique. Remarque : Vous navez pas besoin douvrir la fentre Proprits pour modifier le texte. Vous pouvez modifier du texte directement lintrieur des diagrammes.
E Cliquez sur le titre de laxe des y pour le slectionner. E Cliquez nouveau dessus afin dactiver le mode ddition. Une fois en mode ddition, lditeur

de diagrammes positionne horizontalement le texte aprs rotation. Il affiche galement un curseur en forme de barre rouge qui clignote (non illustr dans cet exemple).

76 Chapitre 6 E Supprimez le texte suivant : en milliers E Appuyez sur Entre pour dsactiver le mode ddition et mettre jour le titre de laxe. Ce titre

dcrit dsormais avec prcision le contenu des tiquettes de graduation.


Figure 6-13 Diagramme en btons contenant le titre modifi de laxe des y

Affichage des tiquettes des valeurs de donnes


Une autre tche courante consiste afficher les valeurs prcises associes aux lments graphiques (sous forme de btons dans cet exemple). Ces valeurs apparaissent dans les tiquettes de donnes.
E A partir des menus de lditeur de diagrammes, slectionnez : Elments > Afficher les tiquettes de donnes

77 Cration et modification de diagrammes Figure 6-14 Diagramme en btons contenant les tiquettes des valeurs de donnes

Chaque bton du diagramme indique dsormais le revenu moyen exact du mnage. Notez que les units sont en milliers. Par consquent, vous pouvez rutiliser longlet Format numrique pour modifier le facteur dchelle.

Utilisation de modles
Si vous modifiez rgulirement vos diagrammes, vous pouvez utiliser un modle de diagramme pour rduire le temps ncessaire leur cration et leur modification. Un modle de diagramme enregistre les attributs dun diagramme spcifique. Vous pouvez par la suite appliquer ce modle lorsque vous crez ou modifiez un diagramme. Nous allons enregistrer le diagramme actuel en tant que modle, puis appliquer ce modle lors de la cration dun nouveau diagramme.
E A partir des menus, slectionnez : Fichier > Enregistrer modle de diagramme...

La bote de dialogue Enregistrer modle de diagramme vous permet de spcifier les attributs de diagramme ajouter au modle. Si vous dveloppez lun des lments de larbre, vous voyez apparatre les attributs susceptibles dtre enregistrs avec le diagramme. Par exemple, si vous dveloppez la partie Axes dchelle de larbre, vous voyez tous les attributs des tiquettes des valeurs de donnes que contiendra le modle. Vous pouvez slectionner nimporte quel attribut pour linclure dans ce modle.

78 Chapitre 6 E Slectionnez Tous les paramtres afin dajouter ce modle tous les attributs de diagramme

disponibles. Vous pouvez galement saisir la description du modle. Cette description apparatra lorsque vous appliquerez le modle.
Figure 6-15 Bote de dialogue Enregistrer modle de diagramme

E Cliquez sur Poursuivre. E Dans la bote de dialogue Enregistrer le modle, indiquez lemplacement et le nom de fichier

du modle.
E Lorsque vous avez termin, cliquez sur Enregistrer.

Vous pouvez appliquer le modle quand vous crez un diagramme ou dans lditeur de diagrammes. Dans lexemple suivant, nous allons lappliquer durant la cration dun diagramme.

79 Cration et modification de diagrammes E Fermez lditeur de diagrammes. Le diagramme en btons mis jour apparat dans le Viewer. Figure 6-16 Diagramme en btons mis jour dans le Viewer

E A partir du menu du Viewer, slectionnez : Graphes > Gnrateur de diagrammes...

La bote de dialogue Gnrateur de diagrammes mmorise les variables entres lors de la cration du premier diagramme. Toutefois, dans le cas prsent, vous allez crer un diagramme lgrement diffrent pour voir comment lapplication dun modle formate un diagramme.
E Supprimez Satisfaction professionnelle de laxe x en le glissant de la zone de dplacement vers

la liste Variables. Vous pouvez galement cliquer sur la zone de dplacement et appuyer sur Supprimer.
E Cliquez avec le bouton droit de la souris sur Niveau dducation dans la liste Variables et choisissez Ordinal. E Faites glisser Niveau dducation de la liste Variables vers la zone de dplacement de laxe x.

Puisque le titre nest plus pertinent, nous allons le supprimer.


E Dans longlet Titres/Notes de bas de page, dslectionnez Titre 1.

80 Chapitre 6

Nous allons maintenant indiquer le modle appliquer au nouveau diagramme.


E Cliquez sur Options. E Dans le groupe Modles de la bote de dialogue Options, cliquez sur Ajouter. E Dans la bote de dialogue Trouver les fichiers du modle, reprez le fichier du modle

pralablement enregistr laide de la bote de dialogue Enregistrer modle de diagramme.


E Slectionnez ce fichier et cliquez sur Ouvrir. Figure 6-17 Bote de dialogue Options avec le modle

La bote de dialogue Options indique le chemin daccs du modle slectionn.


E Cliquez sur OK pour fermer la bote de dialogue Options.

81 Cration et modification de diagrammes Figure 6-18 Gnrateur de diagrammes avec des zones de dplacement compltes

E Cliquez sur OK dans la bote de dialogue Gnrateur de diagrammes pour crer le diagramme et

appliquer le modle. Le formatage du nouveau diagramme correspond celui du diagramme que vous avez cr et modifi prcdemment. Mme si les variables sur laxe des x sont diffrentes, les diagrammes, eux, sont semblables. Notez que le titre du diagramme prcdent a t conserv dans le modle, mme si vous avez supprim le titre dans le Gnrateur de diagrammes.

82 Chapitre 6

Si vous souhaitez appliquer des modles aprs avoir cr un diagramme, vous pouvez le faire dans Chart Editor (choisissez loption Appliquer modle de diagramme du menu Fichier).
Figure 6-19 Diagramme en btons mis jour dans le Viewer

Dfinition des options de diagramme


En plus des modles permettant de formater des diagrammes, vous pouvez utiliser les diffrentes options pour contrler plusieurs aspects du mode de cration des diagrammes.
E Dans les menus de lditeur de donnes ou du Viewer, slectionnez : Edition > Options...

83 Cration et modification de diagrammes

La bote de dialogue Options contient de nombreux paramtres de configuration. Cliquez sur longlet Diagrammes pour visualiser les options disponibles.
Figure 6-20 Onglet Diagrammes de la bote de dialogue Options

Les options dterminent le mode de cration du diagramme. Pour chaque nouveau diagramme, vous pouvez spcifier :

Si les paramtres actuels ou un modle doivent tre utiliss. Le rapport hauteur/largeur (proportions). Si vous ne vous servez daucun modle, les paramtres utiliser en vue du formatage. Les cycles de style des lments graphiques.

Les cycles de style vous permettent dindiquer le style des lments graphiques des nouveaux diagrammes. Dans cet exemple, nous allons consulter les dtails du cycle de style des couleurs.
E Cliquez sur Couleurs pour ouvrir la bote de dialogue Donnes Couleurs des lments.

Pour un diagramme simple, lditeur de diagrammes utilise le style que vous spcifiez. Pour un diagramme regroup, lditeur de diagrammes utilise un ensemble de styles quil applique chaque groupe (modalit) du diagramme.
E Slectionnez Diagrammes simples.

84 Chapitre 6 E Slectionnez la couleur vert clair, qui est la troisime en partant de la droite dans la deuxime

ligne partir du bas.


Figure 6-21 Bote de dialogue Donnes Couleurs des lments

E Cliquez sur Poursuivre. E Dans la bote de dialogue Options, cliquez sur OK pour enregistrer les modifications apportes au

cycle de style des couleurs. Les lments graphiques dans tout nouveau diagramme simple apparaissent maintenant en vert clair.
E Dans les menus de lditeur de donnes ou du Viewer, slectionnez : Graphes > Gnrateur de diagrammes...

Le Gnrateur de diagrammes affiche le dernier diagramme cr. Souvenez-vous que ce diagramme tait associ un modle. Nous ne souhaitons plus utiliser ce modle.
E Cliquez sur Options. E Dselectionnez (dcochez) le modle que vous avez ajout prcdemment. Notez que vous

pouviez galement cliquer sur le X rouge pour supprimer le modle. Dslectionner plutt que supprimer permet de garder le modle disponible pour une utilisation ultrieure.
E Cliquez sur OK pour crer le diagramme.

85 Cration et modification de diagrammes

Les btons du nouveau diagramme sont en vert clair. Ce diagramme est diffrent du dernier pour plusieurs raisons. Il ny a pas de titre ; les tiquettes des axes sont exprimes en milliers ; il ny a pas dtiquette de donnes. Des diffrences sont survenues parce que le modle ne sappliquait pas au diagramme.
Figure 6-22 Diagramme en btons mis jour dans le Viewer

Chapitre

Utilisation du rsultat

Les rsultats des procdures statistiques apparaissent dans le Viewer. En fonction des choix effectus lors de lexcution de la procdure, ces rsultats peuvent prendre la forme dun texte, ou de tableaux, de diagrammes ou de graphiques statistiques. Cette section utilise les fichiers viewertut.spv et demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.

Utilisation du Viewer
Figure 7-1 Viewer

La fentre du Viewer est divise en deux panneaux. Le panneau de lgende contient la lgende de toutes les informations stockes dans le Viewer. Le panneau de contenu comporte les tableaux statistiques, les graphiques et les textes. A laide des barres de dfilement horizontale et verticale, parcourez le contenu de la fentre. Pour faciliter la navigation, cliquez sur un item dans le panneau de lgende pour lafficher dans le panneau de contenu. Si une partie seulement du tableau apparat dans le Viewer ou si laffichage de la lgende est trop serr, vous pouvez redimensionner la fentre.
E Cliquez sur la bordure droite du panneau de lgende et faites-la glisser pour modifier sa largeur.

Dans le panneau de lgende, lorsquune icne en regard dun lment reprsente un livre ouvert, cela indique quil est actuellement visible dans le Viewer, mme sil nest pas visible dans le panneau de contenu.
Copyright IBM Corporation 1989, 2011. 86

87 Utilisation du rsultat E Pour masquer un tableau ou un diagramme, double-cliquez sur licne du livre dans le panneau

de lgende. Licne reprsente maintenant un livre ferm, ce qui signifie que les informations associes sont masques.
E Pour que le rsultat apparaisse nouveau, double-cliquez sur licne du livre ferm.

Vous pouvez galement masquer tous les rsultats dune procdure statistique donne ou lintgralit des rsultats dans le Viewer.
E Cliquez sur la case comportant le signe moins (), gauche de la procdure dont vous souhaitez

masquer les rsultats, ou cochez la case situe en regard de llment figurant tout en haut du panneau de lgende pour masquer la totalit des rsultats. Larborescence de la lgende est rduite, indiquant visuellement que les rsultats sont masqus. Vous pouvez galement modifier lordre de laffichage des rsultats.
E Dans le panneau de lgende, cliquez sur les items dplacer. E Faites glisser les items slectionns vers un nouvel emplacement de la lgende et relchez le

bouton de la souris.
Figure 7-2 Rsultats rorganiss dans le Viewer

Vous pouvez galement dplacer les lments de rsultat en cliquant dessus et en les faisant glisser dans le panneau de contenu.

Utilisation de lditeur de tableau pivotant


Les rsultats de la plupart des procdures statistiques sont affichs dans des tableaux pivotants.

88 Chapitre 7

Accs aux dfinitions de rsultats


De nombreux termes statistiques sont affichs dans le rsultat. Vous pouvez directement accder aux dfinitions de ces termes dans le Viewer.
E Activez le tableau crois (double-cliquez dessus) Possde un agenda lectronique * Sexe *

Internet.
E Cliquez avec le bouton droit de la souris sur Effectif thorique et slectionnez Quest-ce que cest ? dans le menu contextuel.

La dfinition apparat dans une fentre contextuelle.


Figure 7-3 Dfinition contextuelle

Tableaux pivotants
Les tableaux produits par dfaut risquent de ne pas prsenter les informations aussi clairement que vous le voudriez. Avec les tableaux pivotants, vous pouvez transposer des lignes et des colonnes ( retourner le tableau), ajuster lordre des donnes dun tableau et modifier le tableau de nombreuses autres faons. Vous pouvez, par exemple, changer un tableau court et large en un tableau long et troit, en transposant les lignes et les colonnes. La modification de la mise en page

89 Utilisation du rsultat

dun tableau naffecte pas les rsultats. Cest, au contraire, une faon dafficher vos informations dune manire diffrente, plus attrayante.
E Sil nest pas dj activ, double-cliquez sur le tableau crois Possde un agenda lectronique *

Sexe * Internet pour lactiver.


E Si la fentre Structures pivotantes nest pas visible, partir des menus, slectionnez : Pivoter > Structure pivotante

Les structures pivotantes vous permet de dplacer les donnes entre les colonnes, les lignes et les strates.
Figure 7-4 Structure pivotante

90 Chapitre 7 E Faites glisser llment Statistiques de la dimension de ligne la dimension de colonne, sous Sexe.

Le tableau est immdiatement reconfigur pour reflter vos modifications.


Figure 7-5 Dplacement des lignes vers les colonnes

Lordre des lments dans la structure pivotante reflte lordre daffichage des lments dans le tableau.

91 Utilisation du rsultat E Faites glisser llment Possde un agenda lectronique avant llment Internet dans la

dimension de ligne pour inverser lordre de ces deux lignes.


Figure 7-6 Permuter les lignes

Cration et affichage de strates


Les strates savrent utiles pour les grands tableaux ayant des modalits dinformations embotes. En crant des strates, vous simplifiez le tableau qui devient plus facile lire.

92 Chapitre 7 E Faites glisser llment Sexe de la dimension de colonne la dimension de strate. Figure 7-7 Icne de rotation Sexe dans la dimension Strate

Pour afficher une autre strate, slectionnez une modalit dans la liste droulante du tableau.
Figure 7-8 Choix dune strate

93 Utilisation du rsultat

Modification de tableaux
A moins que vous ayez pris le temps de crer un modle de tableaux personnalis, les tableaux pivotants sont crs avec un format standard. Vous pouvez modifier le format dun texte lintrieur dun tableau. Les formats modifiables sont entre autres le nom, la taille, le style (italique ou gras) et la couleur de la police.
E Double-cliquez sur le tableau Niveau dducation. E Si la barre doutils de formatage nest pas visible, partir des menus, slectionnez : Affichage > Barre doutils E Cliquez sur le texte du titre, Niveau dducation. E Dans la liste droulante des tailles de police de la barre doutils, slectionnez 12. E Pour modifier la couleur du texte du titre, cliquez sur loutil Couleur du texte et slectionnez

une couleur.
Figure 7-9 Texte du titre reformat dans le tableau pivotant

Vous pouvez galement modifier le contenu des tableaux et des tiquettes. Vous pouvez, par exemple, modifier le titre de ce tableau.
E Double-cliquez sur le titre. E Saisissez Niveau d'enseignement dans la nouvelle tiquette.

Remarque : Si vous modifiez les valeurs dun tableau, les totaux et les autres statistiques ne sont pas recalculs.

94 Chapitre 7

Masquage de lignes et de colonnes


Certaines donnes affiches dans un tableau ne sont pas forcment utiles ou rendent le tableau trop complexe. Vous pouvez masquer des lignes et des colonnes entires sans perdre de donnes.
E Sil nest pas dj activ, double-cliquez sur le tableau Niveau dducation pour lactiver. E Cliquez sur la colonne Pourcentage valide pour la slectionner. E Dans le menu Edition ou le menu contextuel, choisissez : Slectionnez > Cellules de donnes et dtiquettes E Dans le menu Affichage, choisissez Masquer ou dans le menu contextuel, choisissez Masquer la modalit.

La colonne est masque, mais non supprime.


Figure 7-10 Colonne Pourcentage valide masque dans le tableau

Pour afficher de nouveau la colonne :


E A partir des menus, slectionnez : Affichage > Montrer Tout

A linstar des colonnes, les lignes peuvent tre masques et affiches.

Modification des formats daffichage des donnes


Vous pouvez modifier le format daffichage des donnes dans les tableaux pivotants en toute facilit.
E Sil nest pas dj activ, double-cliquez sur le tableau Niveau dducation pour lactiver.

95 Utilisation du rsultat E Cliquez sur la colonne Pourcentage pour la slectionner. E Dans le menu Edition ou le menu contextuel, choisissez : Slectionnez > Cellules de Donnes E Dans le menu Format ou le menu contextuel, choisissez Proprits de la cellule. E Cliquez sur longlet Valeur de format. E Saisissez 0 dans le champ Dcimales pour masquer tous les sparateurs dcimaux dans cette

colonne.
Figure 7-11 Proprits des Cellules, onglet Valeur de format

Vous pouvez galement modifier le type de donnes et le formatage dans cette bote de dialogue.
E Slectionnez le type souhait dans la liste Modalit et le format de ce type dans la liste Format.

96 Chapitre 7 E Cliquez sur OK ou Appliquer pour appliquer les modifications que vous avez apportes. Figure 7-12 Dcimales masques dans la colonne Pour cent

Les dcimales sont prsent masques dans la colonne Pourcentage.

Modles de tableaux
Le format de vos tableaux est primordial pour que les rsultats soient clairs, prcis et significatifs. Si votre tableau est complexe, les informations quil contient risquent dtre difficiles comprendre.

Utilisation de formats prdfinis


E Double-cliquez sur le tableau Situation familiale. E A partir des menus, slectionnez : Format > Modles de tableaux

97 Utilisation du rsultat

La bote de dialogue Modles de tableaux rpertorie diffrents styles prdfinis. Slectionnez un style dans la liste pour afficher son aperu dans la fentre Exemple droite.
Figure 7-13 Bote de dialogue Modles de tableaux

Vous pouvez utiliser un style tel quil est ou le modifier pour ladapter vos besoins.
E Pour utiliser un style existant, slectionnez-le et cliquez sur OK.

Personnalisation des styles Modles de tableau


Vous pouvez personnaliser un format pour ladapter vos besoins. La quasi-totalit des aspects dun tableau peut tre personnalise, de la couleur darrire-plan aux styles de bordure.
E Double-cliquez sur le tableau Situation familiale. E A partir des menus, slectionnez : Format > Modles de tableaux E Slectionnez le style correspondant le mieux au format voulu et cliquez sur Modifier modle.

98 Chapitre 7 E Cliquez sur longlet Formats de cellule pour afficher les options de formatage. Figure 7-14 Bote de dialogue Proprits du tableau

Les options de formatage comprennent le nom, la taille, le style et la couleur de police. Elles incluent galement lalignement, la couleur du texte et de larrire-plan, et la taille des marges. La fentre Echantillon droite fournit un aperu de la modification de laspect du tableau. Chaque zone du tableau peut avoir des styles de format diffrents. Vous pouvez, par exemple, ne pas appliquer le mme style au titre et aux donnes. Pour slectionner une zone de tableau modifier, slectionnez le nom de la zone dans la liste droulante Aires ou cliquez sur la zone dans la fentre Exemple.
E Slectionnez Donnes dans la liste droulante Aires. E Slectionnez une nouvelle couleur dans la palette droulante Arrire-plan. E Ensuite, slectionnez une nouvelle couleur de texte.

99 Utilisation du rsultat

La fentre Exemple illustre le nouveau style.


Figure 7-15 Modification des formats de cellule de tableau

E Cliquez sur OK pour revenir la bote de dialogue Modles de tableaux.

Vous pouvez enregistrer le nouveau style pour lutiliser ultrieurement dans dautres tableaux.
E Cliquez sur Enregistrer sous. E Accdez au rpertoire cible souhait et saisissez un nom pour le nouveau style dans la zone

Nom du fichier.
E Cliquez sur Enregistrer. E Cliquez sur OK pour appliquer vos modifications et revenir dans le Viewer.

100 Chapitre 7

Le tableau contient prsent le format personnalis que vous avez spcifi.


Figure 7-16 Modle de tableau personnalis

Modification des formats par dfaut dun tableau


Bien que vous puissiez modifier le format des tableaux crs, il peut savrer plus efficace de modifier une fois pour toutes le modle de tableau par dfaut. Pour modifier le style du modle de tableau par dfaut pour vos tableaux pivotants, partir des menus, slectionnez :
Edition > Options...

101 Utilisation du rsultat E Cliquez sur longlet Tableaux pivotants de la bote de dialogue Options. Figure 7-17 Bote de dialogue Options

E Slectionnez le style du modle de tableau utiliser pour tous les nouveaux tableaux.

La fentre Echantillon droite affiche un aperu de chaque modle de tableau.


E Cliquez sur OK pour enregistrer les paramtres et fermer la bote de dialogue.

Tous les tableaux crs aprs la modification du modle de tableau par dfaut suivent automatiquement les nouvelles rgles de formatage.

102 Chapitre 7

Personnalisation des paramtres de laffichage initial


Les paramtres de laffichage initial comprennent lalignement des objets dans le Viewer, quils soient affichs ou masqus par dfaut, et la largeur de la fentre du Viewer. Pour modifier ces paramtres :
E A partir des menus, slectionnez : Edition > Options... E Cliquez sur longlet Viewer. Figure 7-18 Options du Viewer

Vos paramtres sont appliqus objet par objet. Vous pouvez, par exemple, personnaliser le mode daffichage des diagrammes sans modifier celui des tableaux. Il suffit de slectionner lobjet personnaliser et dapporter les modifications souhaites.
E Cliquez sur licne Titre pour afficher ses paramtres. E Cliquez sur Centre pour afficher tous les titres au centre (horizontal) du Viewer.

Vous pouvez galement masquer des items, tels que le journal et les messages davertissement, qui ont tendance rendre les rsultats confus. Double-cliquez sur une icne pour modifier automatiquement la proprit daffichage de cet objet.

103 Utilisation du rsultat E Double-cliquez sur licne Avertissement pour masquer les messages davertissement dans les

rsultats.
E Cliquez sur OK pour enregistrer vos modifications et fermer la bote de dialogue.

Affichage dtiquettes de variable et de valeur


Dans la plupart des cas, il est plus judicieux dafficher les tiquettes des variables et des valeurs plutt que le nom de la variable et la valeur relle des donnes. Toutefois, il peut arriver que vous vouliez afficher les noms et les tiquettes.
E A partir des menus, slectionnez : Edition > Options... E Cliquez sur longlet Etiquettes de rsultats. Figure 7-19 Options dtiquetage des rsultats

104 Chapitre 7

Vous pouvez indiquer des paramtres diffrents pour les panneaux de lgende et de contenu. Par exemple, pour afficher des tiquettes dans la lgende, et des noms de variable et des valeurs de donnes dans le contenu :
E Dans le groupe Etiquette tableau pivotant, slectionnez Noms dans la liste droulante Noms des

variables en tiquettes pour afficher des noms de variable la place des tiquettes.
E Slectionnez ensuite Valeurs dans la liste droulante Valeurs des variables en tiquettes pour

afficher des valeurs de donnes la place des tiquettes.


Figure 7-20 Paramtres Etiquette tableau pivotant

Les tableaux suivants gnrs au cours de la session reflteront ces modifications.


Figure 7-21 Noms et valeurs de variable affichs

105 Utilisation du rsultat

Utilisation de rsultats dans dautres applications


Vos rsultats peuvent tre utiliss dans de nombreuses applications. Vous pouvez, par exemple, inclure un diagramme ou un tableau dans une prsentation ou un rapport. Les exemples suivants sont propres Microsoft Word, mais ils peuvent fonctionner de la mme faon dans dautres applications de traitement de texte.

Collage des rsultats sous forme de tableaux Word


Vous pouvez coller des tableaux pivotants dans Word en tant que tableaux natifs Word. Tous les attributs de tableau, comme la taille et la couleur de la police, sont conservs. Du fait que le tableau est coll dans le format de tableau Word, vous pouvez le modifier dans Word comme tout autre tableau.
E Cliquez sur le tableau Situation familiale dans le Viewer. E A partir des menus, slectionnez : Edition > Copier E Ouvrez lapplication de traitement de texte. E A partir des menus du traitement de texte, slectionnez : Edition > Collage spcial E Slectionnez Texte mis en forme (RTF) dans la bote de dialogue Collage spcial. Figure 7-22 Bote de dialogue Collage spcial

E Cliquez sur OK pour coller vos rsultats dans le document actuel.

106 Chapitre 7 Figure 7-23 Tableau pivotant affich dans Word

Le tableau est prsent affich dans votre document. Vous pouvez appliquer des formats personnaliss, modifier les donnes et redimensionner le tableau en fonction de vos besoins.

Collage des rsultats sous forme de texte


Les tableaux pivotants peuvent tre copis dans dautres applications sous forme de texte brut. Avec cette mthode, les styles de format ne sont pas conservs, mais vous pouvez modifier les donnes du tableau aprs lavoir coll dans lapplication cible.
E Cliquez sur le tableau Situation familiale dans le Viewer. E A partir des menus, slectionnez : Edition > Copier E Ouvrez lapplication de traitement de texte. E A partir des menus du traitement de texte, slectionnez : Edition > Collage spcial

107 Utilisation du rsultat E Slectionnez Texte sans mise en forme dans la bote de dialogue Collage spcial. Figure 7-24 Bote de dialogue Collage spcial

E Cliquez sur OK pour coller vos rsultats dans le document actuel. Figure 7-25 Tableau pivotant affich dans Word

Chaque colonne du tableau est spare par des tabulations. Vous pouvez modifier la largeur des colonnes en ajustant les marques de tabulation dans votre application de traitement de texte.

Exportation des rsultats vers un fichier Microsoft Word, PowerPoint ou Excel


Vous pouvez exporter les rsultats vers un fichier Microsoft Word, PowerPoint ou Excel. Vous pouvez exporter les lments slectionns ou tous les lments du Viewer. Cette section utilise les fichiers msouttut.spv et demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.

108 Chapitre 7

Remarque : Lexportation vers PowerPoint nest disponible que sous les systmes dexploitation Windows et nest pas disponible dans la version Student. Dans le panneau de lgende du Viewer, vous pouvez slectionner les lments spcifiques que vous souhaitez exporter ou exporter tous les lments ou tous les lments visibles.
E A partir du menu du Viewer, slectionnez : Fichier > Exporter...

Au lieu dexporter tous les objets du Viewer, vous pouvez nexporter que les objets visibles (livres ouverts dans le panneau de lgende) ou ceux slectionns dans le panneau de lgende. Si vous navez slectionn aucun lment du panneau de lgende, vous navez pas la possibilit dexporter les objets slectionns.
Figure 7-26 Bote de dialogue Exporter rsultats

E Dans le groupe Objets exporter, slectionnez Tous.

109 Utilisation du rsultat E Dans la liste droulante Type, slectionnez Word/RTF (*.doc). E Cliquez sur OK pour gnrer le fichier Word.

Lorsque vous ouvrez le fichier obtenu dans Word, vous pouvez observer le mode dexportation des rsultats. Les notes, qui ne sont pas des objets visibles, apparaissent dans Word car vous avez choisi dexporter tous les objets.
Figure 7-27 Output.doc dans Word

110 Chapitre 7

Les tableaux pivotants deviennent des tableaux Word et conservent lintgralit de leur formatage dorigine (polices, couleurs, bordures, etc.).
Figure 7-28 Tableaux pivotants dans Word

111 Utilisation du rsultat

Les diagrammes sont inclus dans le document Word sous la forme dimages graphiques.
Figure 7-29 Diagrammes dans Word

112 Chapitre 7

Les rsultats sous forme de texte sont affichs avec la mme police que celle utilise pour lobjet texte dans le Viewer. Tous les rsultats de texte ncessitent une police point fixe (espacement unique) pour un alignement correct.
Figure 7-30 Rsultats texte dans Word

113 Utilisation du rsultat

Si vous exportez des donnes vers un fichier PowerPoint, chaque lment export est plac sur une diapositive distincte. Les tableaux pivotants exports dans PowerPoint deviennent des tableaux Word et conservent lintgralit du formatage dorigine (polices, couleurs, bordures, etc.).
Figure 7-31 Tableaux pivotants dans PowerPoint

114 Chapitre 7

Les diagrammes slectionns pour lexportation vers PowerPoint sont intgrs dans le fichier PowerPoint.
Figure 7-32 Diagrammes dans PowerPoint

Si vous exportez des rsultats vers un fichier Excel, lexportation est ralise de manire diffrente.
Figure 7-33 Output.xls dans Excel

115 Utilisation du rsultat

Les lignes, les colonnes et les cellules des tableaux pivotants deviennent des lignes, des colonnes et des cellules Excel. Chaque ligne du rsultat texte est une ligne dans le fichier Excel, avec le contenu de toute la ligne dans une seule cellule.
Figure 7-34 Rsultats texte dans Excel

Exportation des rsultats vers PDF


Vous pouvez exporter les lments slectionns ou tous les lments du Viewer dans un fichier PDF (Portable Document Format).
E A partir des menus de la fentre du Viewer contenant le rsultat exporter vers un fichier PDF,

slectionnez :
Fichier > Exporter...

116 Chapitre 7 E Dans la liste droulante Type de fichier Format dexportation de la bote de dialogue Exporter rsultats, slectionnez Portable Document Format. Figure 7-35 Bote de dialogue Exporter rsultats

Le panneau de lgende du document du Viewer est converti en signets dans le fichier PDF pour une navigation plus facile. La taille de la page et son orientation, les marges, le contenu et laffichage des en-ttes et des pieds de page, ainsi que la taille des graphiques imprims dun document PDF sont grs par les options de mise en page (menu Fichier, option Mise en page de la fentre du Viewer). La rsolution (ppp) dun document PDF est le paramtre de rsolution courant de limprimante slectionne ou par dfaut (vous pouvez changer limprimante via loption Mise en page). La rsolution maximale est de 1 200 ppp. Si le paramtre de rsolution de limprimante est suprieur, la rsolution du document PDF sera de 1 200 ppp. Remarque :

117 Utilisation du rsultat

Une haute rsolution peut gnrer des rsultats mdiocres si les documents sont imprims sur des imprimantes de rsolution infrieure.
Figure 7-36 fichier PDF avec signets

118 Chapitre 7

Exportation des rsultats vers HTML


Vous pouvez galement exporter des rsultats vers HTML. Lorsque vous enregistrez les rsultats au format HTML, tous les rsultats non graphiques sont exports dans un fichier HTML unique.
Figure 7-37 Output.htm dans un navigateur Web

Lorsque vous exportez les rsultats vers le format HTML, vous pouvez galement exporter des diagrammes, mais pas vers un fichier unique. Chaque diagramme sera enregistr sous la forme dun fichier au format que vous spcifiez, et les rfrences ces fichiers graphiques seront places dans le document HTML. Une option vous permet galement dexporter tous les diagrammes (ou seulement certains) dans des fichiers graphiques distincts.

Chapitre

Utilisation de la syntaxe

Vous pouvez enregistrer et automatiser de nombreuses tches courantes grce au puissant langage de commande. Il fournit galement des fonctionnalits qui ne se trouvent ni dans les menus ni dans les botes de dialogue. La plupart des commandes sont accessibles depuis les menus et botes de dialogue. Cependant, certaines options et commandes ne sont disponibles quen utilisant le langage de commande. Le langage de commande permet galement denregistrer vos travaux dans un fichier de syntaxe afin de vous permettre de relancer votre analyse une date ultrieure. Un fichier de syntaxe de commande est un fichier texte simple contenant des commandes de syntaxe IBM SPSS Statistics. Vous pouvez ouvrir une fentre de syntaxe et y entrer des commandes directement, mais il est souvent plus simple de laisser la bote de dialogue faire une partie ou tout le travail pour vous. Les exemples de ce chapitre utilisent le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155. Remarque : La syntaxe de commande nest pas disponible dans la version Student.

Collage dune syntaxe


Le bouton Coller, affich dans la plupart des botes de dialogue, constitue le moyen le plus simple de crer une syntaxe.
E Ouvrez le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section

Fichiers dexemple dans l'annexe A sur p. 155.


E A partir des menus, slectionnez : Analyse > Statistiques descriptives > Effectifs

La bote de dialogue Effectifs souvre.


Figure 8-1 Bote de dialogue Effectifs

Copyright IBM Corporation 1989, 2011.

119

120 Chapitre 8 E Slectionnez la variable Situation familiale [situation] et dplacez-la vers la liste Variable(s). E Cliquez sur Diagrammes. E Dans la bote de dialogue Diagrammes, slectionnez Diagrammes en btons. E Dans le groupe Valeurs du diagramme, slectionnez Pourcentages. E Cliquez sur Poursuivre. E Cliquez sur Coller pour copier la syntaxe cre grce aux slections effectues dans la bote de

dialogue de lEditeur de syntaxe.


Figure 8-2 Syntaxe deffectifs

E Pour excuter la syntaxe actuellement affiche, partir des menus, slectionnez : Excuter > Slection

Modification dune syntaxe


Dans la fentre de syntaxe, vous pouvez modifier la syntaxe. Par exemple, vous pouvez modifier la sous-commande /BARCHART pour afficher des effectifs la place des pourcentages. (Une souscommande est indique par une barre oblique.) Si vous connaissez le mot-cl pour afficher les effectifs, vous pouvez le saisir directement. Si vous ne le connaissez pas, vous pouvez obtenir une liste des mots-cls disponibles pour la sous-commande en positionnant le curseur nimporte o aprs le nom de la sous-commande et en appuyant simultanment sur Ctrl+barre despace. Ceci affiche le contrle de saisie semi-automatique pour la sous-commande.

121 Utilisation de la syntaxe Figure 8-3 Contrle de saisie semi-automatique affichant les mots-cls

E Cliquez sur llment tiquet FREQ pour les effectifs. En cliquant sur un lment dans le contrle

de saisie semi-automatique, il sera insr lemplacement actuel du curseur (le mot-cl initial
PERCENT a t supprim manuellement).

Par dfaut, le contrle de saisie semi-automatique vous proposera une liste des termes disponibles au fur et mesure que vous saisissez. Supposons par exemple que vous souhaiteriez inclure un diagramme en secteurs avec un diagramme en btons. Le diagramme en secteurs est spcifi par une sous-commande distincte.
E Appuyez sur Entre aprs le mot-cl FREQ et tapez une barre oblique pour indiquer le dbut de

la sous-commande. LEditeur de syntaxe vous propose une liste des sous-commandes pour la commande en cours.
Figure 8-4 Contrle de saisie semi-automatique affichant les sous-commandes

Pour obtenir plus daide sur la commande en cours, appuyez sur la touche F1. Vous tes directement dirig vers un guide de rfrence dtaill de la syntaxe de commande en cours.

122 Chapitre 8 Figure 8-5 Aide relative la syntaxe de la commande FREQUENCIES

Vous avez peut-tre remarqu que le texte affich dans la fentre de syntaxe est en couleur. Le codage par couleur vous permet didentifier rapidement les termes non reconnus, puisque que seuls les termes reconnus sont en couleur. Supposons par exemple que vous ayez mal orthographi la sous-commande FORMAT en FRMAT. Les sous-commandes sont en vert par dfaut, mais le texte FRMAT napparatra pas en couleur, puisquil nest pas reconnu.

Ouverture et excution dun fichier de syntaxe


E Pour ouvrir un fichier de syntaxe enregistr, partir du menu, slectionnez : Fichier > Ouvrir > Syntaxe...

Une bote de dialogue standard douverture de fichiers apparat.


E Slectionnez un fichier de syntaxe. Si aucun fichier de syntaxe napparat, assurez-vous que loption Syntaxe (*.sps) est slectionne en tant que type de fichier afficher. E Cliquez sur Ouvrir. E Utilisez le menu Excuter de la fentre de syntaxe pour excuter les commandes.

123 Utilisation de la syntaxe

Si les commandes sappliquent un fichier de donnes particulier, vous devez ouvrir ce dernier avant dexcuter les commandes ou inclure une commande qui ouvre le fichier de donnes. Vous pouvez coller ce type de commande partir des botes de dialogue permettant douvrir les fichiers de donnes.

Prsentation du Panneau derreur


Le panneau derreur affiche les erreurs dexcution survenues lors de lexcution la plus rcente. Il contient les dtails pour chaque erreur, ainsi que le numro de la ligne de la commande dans laquelle lerreur est survenue.
Figure 8-6 Panneau derreur affich dans lEditeur de syntaxe

Cliquez sur lentre dune erreur positionne le curseur la premire ligne de la commande sur laquelle lerreur est survenue.

Utilisation des points darrt


Les points darrt vous permettent dinterrompre lexcution dune syntaxe de commande des points spcifis lintrieur de la syntaxe et de poursuivre lexcution lorsque vous tes prt. Ceci vous permet de visualiser les rsultats ou les donnes un moment intermdiaire de la tche de syntaxe, ou dexcuter la syntaxe de commande affichant les informations sur ltat actuel des donnes, telles que FREQUENCIES. Les points darrt ne peuvent tre rgls quau niveau dune commande, et non sur les lignes spcifiques au sein dune commande. Pour insrer un point darrt dans une commande :
E Cliquez nimporte o dans la zone gauche du texte associ la commande.

124 Chapitre 8

Le point darrt est reprsent par un cercle rouge dans la zone gauche du texte de la commande et sur la mme ligne que le nom de la commande, peu importe o vous cliquez.
Figure 8-7 Point darrt affich dans la fentre de lEditeur de syntaxe

Lorsque vous excutez une syntaxe de commande contenant des points darrt, lexcution sinterrompt avant chaque commande contenant un point darrt.
Figure 8-8 Excution interrompue un point darrt

La flche pointant vers le bas gauche du texte de commande prsente la progression de lexcution de la syntaxe. Elle couvre la zone stendant de la premire excution de commande la dernire excution de commande. Cela savre trs pratique lorsque lexcution dune syntaxe de commande contient des points darrt.

125 Utilisation de la syntaxe

Pour reprendre lexcution aprs un point darrt :


E Dans le menu de la fentre de lEditeur de syntaxe, slectionnez : Excuter > Poursuivre

Chapitre

Modification des valeurs de donnes


Lorganisation des donnes de dpart ne rpond pas systmatiquement vos besoins en matire de cration de rapport ou danalyse. Par exemple, vous pouvez : Crer une variable qualitative partir dune variable dchelle. Combiner plusieurs modalits de rponses en une seule modalit. Crer une nouvelle variable qui reprsente la diffrence calcule entre deux variables existantes. Calculer le temps coul entre deux dates.

Dans ce chapitre, nous utilisons le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.

Cration dune variable qualitative partir dune variable dchelle


Plusieurs variables catgorielles du fichier de donnes demo.sav sont drives de variables dchelle de ce mme fichier. Par exemple, la variable inccat est simplement revenu, rparti en quatre modalits. Cette variable qualitative utilise les valeurs entires comprises entre 1 et 4 pour reprsenter les modalits de revenus suivantes (en milliers) : infrieur 25 , 25 49 , 50 74 et 75 ou plus. Pour crer la variable qualitative inccat :
E A partir des menus de la fentre de lditeur de donnes, slectionnez : Transformer > Regroupement visuel...

Copyright IBM Corporation 1989, 2011.

126

127 Modification des valeurs de donnes Figure 9-1 Bote de dialogue initiale Regroupement visuel

Dans la bote de dialogue initiale Regroupement visuel, slectionnez les variables dchelle et/ou ordinales pour lesquelles vous souhaitez crer des variables regroupes. Le regroupement consiste prendre plusieurs valeurs contigus et les regrouper dans une mme modalit. Etant donn que le regroupement visuel se base sur les valeurs relles du fichier de donnes pour vous proposer les meilleurs choix de regroupement, il doit tout dabord lire ce fichier. Si le fichier de donnes contient un nombre dobservations important, cette opration peut prendre un certain temps. Par consquent, la bote de dialogue initiale vous permet galement de limiter le nombre dobservations lire ( analyser ). Cette limitation est inutile avec notre fichier de donnes exemple. Il contient plus de 6 000 observations, mais lanalyse dun tel nombre dobservations est rapide.
E Faites glisser Revenu du foyer en milliers (revenu) de la liste Variables vers la liste Variables regrouper, puis cliquez sur Poursuivre.

128 Chapitre 9 Figure 9-2 Bote de dialogue principale Regroupement visuel

E Dans la liste des variables analyses de la bote de dialogue principale Regroupement visuel,

slectionnez Revenu du foyer en milliers (revenu). Un histogramme affiche la distribution de la variable slectionne (trs asymtrique dans le cas qui nous occupe).
E Affectez le nom inccat2 la nouvelle variable regroupe et slectionnez ltiquette de variable

Modalit de revenu en milliers.


E Cliquez sur Crer des divisions.

129 Modification des valeurs de donnes Figure 9-3 Bote de dialogue Divisions de regroupement visuel

E Slectionnez Intervalles de longueur identique. E Saisissez 25 pour lemplacement de la premire division, 3 pour le nombre de divisions et 25

pour la largeur. Le nombre de modalits regroupes correspond au nombre de divisions, plus 1. Ainsi, dans cet exemple, la nouvelle variable regroupe comportera quatre modalits, les trois premires couvrant une plage de 25 (milliers) et la dernire toutes les valeurs suprieures celle de la dernire division (75).
E Cliquez sur Appliquer.

130 Chapitre 9 Figure 9-4 Bote de dialogue principale Regroupement visuel, dans laquelle des divisions ont t dfinies

Les valeurs qui figurent prsent dans la grille reprsentent les divisions dfinies, savoir les extrema suprieurs de chaque modalit. Par ailleurs, les lignes verticales de lhistogramme indiquent lemplacement des divisions. Par dfaut, les valeurs de division sont incluses dans les modalits correspondantes. Par exemple, la premire valeur (25) inclurait toutes les valeurs infrieures ou gales 25. Dans cet exemple toutefois, nous voulons dfinir les modalits suivantes : infrieur 25, 2549, 5074, et 75 ou plus.
E Dans le groupe Extrema suprieurs, slectionnez Exclus (<). E Cliquez ensuite sur Crer des tiquettes.

131 Modification des valeurs de donnes Figure 9-5 Etiquettes de valeur gnres automatiquement

Cette opration permet de gnrer automatiquement des tiquettes de valeur descriptives pour chaque modalit. Etant donn que les valeurs relles affectes la nouvelle variable regroupe sont de simples entiers squentiels (le premier tant 1), les tiquettes de valeur peuvent savrer trs utiles. Vous pouvez galement procder manuellement pour entrer ou modifier des divisions et des tiquettes dans la grille, pour modifier des emplacements de division en faisant glisser les lignes de division de lhistogramme, et pour supprimer des divisions en faisant glisser les lignes de division hors de lhistogramme.
E Cliquez sur OK pour crer la variable regroupe.

132 Chapitre 9

La nouvelle variable est affiche dans lditeur de donnes. Etant donn que la variable est ajoute la fin du fichier, elle apparat dans la colonne la plus droite de laffichage Donnes et dans la dernire ligne de laffichage Variable.
Figure 9-6 Nouvelle variable affiche dans lditeur de donnes

Calcul de nouvelles variables


A laide dune grande varit de fonctions mathmatiques, vous pouvez calculer de nouvelles variables en fonction dquations extrmement complexes. Dans cet exemple, cependant, nous calculerons simplement une nouvelle variable qui reprsente la diffrence entre les valeurs de deux variables existantes. Le fichier de donnes demo.sav contient une variable pour lge actuel du rpondant et une variable pour le nombre dannes doccupation du poste actuel. En revanche, il ne contient pas de variable indiquant lge du rpondant au moment o il a t embauch ce poste. Nous pouvons crer une nouvelle variable qui reprsenterait la diffrence calcule entre lge actuel et le nombre dannes doccupation du poste actuel afin dobtenir lge approximatif du rpondant au moment de lembauche.
E A partir des menus de la fentre de lditeur de donnes, slectionnez : Transformer > Calculer la variable... E Pour Variable destination, saisissez dbutempl.

133 Modification des valeurs de donnes E Slectionnez la variable Age en annes [ge] dans la liste des variables source et cliquez sur le

bouton flch pour la copier dans la zone Expression numrique.


E Cliquez sur le bouton moins () du clavier du pav numrique de la bote de dialogue (ou appuyez

sur la touche moins du clavier).


E Slectionnez Nb dannes avec lemployeur actuel [emploi] et cliquez sur le bouton flch pour

la copier dans lexpression.


Figure 9-7 Bote de dialogue Calculer la variable

Remarque : Veillez slectionner la variable demploi approprie. Il existe galement une version qualitative recode de la variable, mais ce nest pas ce que vous recherchez. Lexpression numrique doit tre geemploi et non geempl_dis.
E Cliquez sur OK pour calculer la nouvelle variable.

134 Chapitre 9

La nouvelle variable est affiche dans lditeur de donnes. Etant donn que la variable est ajoute la fin du fichier, elle apparat dans la colonne la plus droite de laffichage Donnes et dans la dernire ligne de laffichage Variable.
Figure 9-8 Nouvelle variable affiche dans lditeur de donnes

Utilisation de fonctions dans les expressions


Vous pouvez galement utiliser des fonctions prdfinies dans les expressions. Vous disposez de plus de 70 fonctions intgres, dont les suivantes :

Fonctions arithmtiques Fonctions statistiques Fonctions de distribution Fonctions logiques Fonctions dagrgation et dextraction relatives la date et lheure Fonctions de valeur manquante

135 Modification des valeurs de donnes

Fonctions dobservations croises Fonctions sur chanes

Figure 9-9 Bote de dialogue Calculer la variable indiquant le regroupement des fonctions

Les fonctions sont organises en groupes logiques, tels quun groupe pour les oprations arithmtiques et un autre pour le calcul des mtriques statistiques. Dans un souci de commodit, une srie de variables systme couramment utilises, telles que la variable $TIME (date et heure actuelles), figurent galement dans des groupes de fonctions appropris. Une brve description de la variable systme ou de la fonction actuellement slectionne (en loccurrence, la fonction SUM) apparat dans une zone particulire de la bote de dialogue Calculer la variable.
Collage dune fonction dans une expression

Pour coller une fonction dans une expression :


E Dans lexpression, positionnez le curseur l o vous souhaitez que la fonction apparaisse. E Slectionnez le groupe appropri dans la liste Groupe de fonctions. Le groupe tiquet Tous

rpertorie toutes les fonctions et variables systme disponibles.


E Double-cliquez sur la fonction dans la liste Fonctions et variables spciales (ou slectionnez-la,

puis cliquez sur la flche adjacente la liste Groupe de fonctions).

136 Chapitre 9

La fonction est insre dans lexpression. Si vous slectionnez une partie de lexpression, puis insrez la fonction, la partie slectionne de lexpression est utilise comme premier argument dans la fonction.
Modification dune fonction dans une expression

La fonction colle nest complte que lorsque vous avez saisi les arguments, symboliss par des points dinterrogation. Le nombre de points dinterrogation indique le nombre minimum darguments requis pour complter la fonction.
E Slectionnez les points dinterrogation dans la fonction colle. E Saisissez les arguments. Si les arguments sont des noms de variable, vous pouvez les coller

partir de la liste des variables.

Utilisation dexpressions conditionnelles


Vous pouvez utiliser des expressions conditionnelles (galement appeles expressions logiques) pour appliquer des transformations aux sous-groupes dobservations slectionns. Une expression conditionnelle renvoie la valeur vrai, faux ou manquant pour chaque observation. Si le rsultat dune expression conditionnelle est True (vrai), la transformation est applique cette observation. Si le rsultat est False (faux) ou Manquant, la transformation nest pas applique lobservation. Pour indiquer une expression conditionnelle :
E Cliquez sur Si dans la bote de dialogue Calculer la variable. Cette opration ouvre la bote de

dialogue Si les observations.

137 Modification des valeurs de donnes Figure 9-10 Bote de dialogue Calculer la variable : si les observations

E Slectionnez Inclure lorsque lobservation remplit la condition : E Entrez lexpression conditionnelle.

La plupart des expressions conditionnelles contiennent au moins un oprateur relationnel, comme dans :
ge>=21

ou
revenu*3<100

Dans le premier exemple, seules les observations dont la valeur Age [ge] est suprieure ou gale 21 sont slectionnes. Dans le deuxime exemple, la valeur Revenu du foyer en milliers [revenu] multiplie par 3 doit tre infrieure 100 pour quune observation soit slectionne. Vous pouvez aussi lier au moins deux expressions conditionnelles laide doprateurs logiques, comme dans :
ge>=21 | ed>=4

ou
revenu*3<100 & ed=5

138 Chapitre 9

Dans le premier exemple, les observations qui remplissent la condition Age [age] ou Nombre dannes dducation [ed] sont slectionnes. Dans le deuxime exemple, les observations doivent remplir les conditions Revenu du foyer en milliers [revenu] et Nombre dannes dducation [ed] pour tre slectionnes.

Utilisation des dates et heures


LAssistant Date et heure vous permet de raliser de nombreuses tches courantes portant sur les dates et les heures. A laide de cet assistant, vous pouvez effectuer les oprations suivantes :

Crer une variable date/heure partir dune variable caractres contenant une date ou une heure. Construire une variable date/heure en fusionnant des variables contenant diffrentes parties de la date ou de lheure. Ajouter ou soustraire des valeurs aux variables date/heure, notamment ajouter ou soustraire deux variables date/heure. Extraire une partie dune variable date ou heure, telle que le jour du mois dune variable date/heure de format mm/jj/aaaa.

Les exemples de cette section utilisent le fichier de donnes upgrade.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155. Pour utiliser lAssistant Date et heure :
E A partir des menus, slectionnez : Transformer > Assistant Date et heure...

139 Modification des valeurs de donnes Figure 9-11 Ecran de prsentation de lAssistant Date et heure

Lcran de prsentation de lAssistant Date et heure met votre disposition une srie de tches gnrales. Les tches inapplicables aux donnes utilises sont dsactives. Par exemple, le fichier de donnes upgrade.sav ne contient aucune variable chane. Par consquent, la tche permettant de crer une variable date partir dune chane est dsactive. Si vous ne savez pas comment manipuler les dates et les heures dans IBM SPSS Statistics, vous pouvez slectionner loption Connatre la reprsentation des dates et heures, puis cliquer sur le bouton Suivant. Cette opration fait apparatre un cran contenant une brve prsentation des variables date/heure et un lien, par le biais du bouton Aide, vers des informations complmentaires.

Calcul du temps coul entre deux dates


Lune des tches les plus courantes portant sur les dates est le calcul du temps scoulant entre deux dates. A titre dexemple, imaginez un diteur de logiciels qui souhaite analyser les achats de licence de mise niveau en dterminant le nombre dannes coules depuis le dernier achat dune mise niveau par chaque client. Le fichier de donnes upgrade.sav contient une variable pour la date du dernier achat dune mise niveau par client, mais pas pour le nombre dannes coules depuis cet achat. Une nouvelle variable reprsentant le temps coul, en annes, entre la date de la dernire mise niveau et la date de la version suivante du produit fournira une mesure de cette quantit. Pour calculer le temps coul entre deux dates :
E Slectionnez loption Calculer avec des dates et heures dans lcran de prsentation de lAssistant Date et heure, puis cliquez sur le bouton Suivant.

140 Chapitre 9 Figure 9-12 Calcul du temps coul entre deux dates : Etape 1

E Slectionnez loption Calculez le nombre dunits de temps sparant deux dates, puis cliquez sur le bouton Suivant. Figure 9-13 Calcul du temps coul entre deux dates : Etape 2

E Slectionnez loption Date de la prochaine version pour la variable Date1. E Slectionnez loption Date de la dernire mise niveau pour la variable Date2.

141 Modification des valeurs de donnes E Slectionnez annes pour lunit et Tronquer lentier pour le traitement du rsultat. (Ce sont

des slections par dfaut.)


E Cliquez sur Suivant. Figure 9-14 Calcul du temps coul entre deux dates : Etape 3

E Entrez NbreAnsDepMAN comme nom de la variable de rsultat. Les variables de rsultat ne

peuvent pas porter le mme nom quune variable existante.


E Entrez Nombre dannes coules depuis la dernire mise niveau comme tiquette de la variable

de rsultat. Les tiquettes des variables de rsultat sont facultatives.


E Conservez la slection par dfaut de loption Crer la variable maintenant, puis cliquez sur le bouton Terminer pour crer la nouvelle variable.

La nouvelle variable NbreAnsDepMAN, affiche dans lditeur de donnes, est le nombre entier dannes entre les deux dates. Les parties fractionnelles dune anne ont t tronques.

142 Chapitre 9 Figure 9-15 Nouvelle variable affiche dans lditeur de donnes

Ajout dune dure une date


Vous pouvez ajouter ou soustraire des dures, telles que 10 jours ou 12 mois, une date. A partir de lexemple de lditeur de logiciels utilis dans la section prcdente, vous pouvez envisager de dterminer la date laquelle expire le contrat dassistance technique dorigine de chaque client. Le fichier de donnes upgrade.sav contient une variable pour le nombre dannes dassistance sous contrat et une variable pour la date dachat initiale. Vous pouvez donc dterminer la date dexpiration de lassistance initiale en ajoutant le nombre dannes dassistance la date achat. Pour ajouter une dure une date :
E Slectionnez loption Calculer avec des dates et heures dans lcran de prsentation de lAssistant Date et heure, puis cliquez sur le bouton Suivant. E Slectionnez loption Ajout dune dure une date ou Suppression dune dure dune date, puis cliquez sur le bouton Suivant.

143 Modification des valeurs de donnes Figure 9-16 Ajout dune dure une date : Etape 2

E Slectionnez loption Date de la premire licence produit pour la variable Date. E Slectionnez Annes dassistance technique pour la variable de la dure.

Dans la mesure o la variable Annes dassistance technique est uniquement une variable numrique, vous devez indiquer lunit dans laquelle cette variable doit tre ajoute en tant que dure.
E Slectionnez Annes dans la liste droulante Units. E Cliquez sur Suivant.

144 Chapitre 9 Figure 9-17 Ajout dune dure une date : Etape 3

E Entrez DateExpAss comme nom de la variable rsultat. Les variables de rsultat ne peuvent pas

porter le mme nom quune variable existante.


E Entrez Date dexpiration de lassistance comme tiquette de la variable rsultat. Les tiquettes

des variables de rsultat sont facultatives.


E Cliquez sur le bouton Terminer pour crer la nouvelle variable.

145 Modification des valeurs de donnes

La nouvelle variable est affiche dans lditeur de donnes.


Figure 9-18 Nouvelle variable affiche dans lditeur de donnes

Tri et slection de donnes


10

Chapitre

Lorganisation des fichiers de donnes ne rpond pas toujours idalement vos besoins. Pour prparer des donnes pour une analyse, vous avez le choix entre un grand nombre de transformations de fichiers. Vous pouvez effectuer les oprations suivantes :
Trier les donnes : Vous pouvez trier les observations en fonction de la valeur de certaines

variables.
Slectionner des sous-ensembles dobservations : Vous pouvez limiter votre analyse

un sous-ensemble dobservations ou effectuer des analyses simultanes sur diffrents sous-ensembles. Les exemples de ce chapitre utilisent le fichier de donnes demo.sav. Pour plus d'informations, reportez-vous la section Fichiers dexemple dans l'annexe A sur p. 155.

Tri des donnes


Il est souvent utile (et parfois ncessaire) de trier les observations (tri des lignes du fichier de donnes) pour certains types danalyse. Pour rorganiser la squence des observations dans le fichier de donnes en fonction de la valeur de certaines variables de tri, procdez comme suit :
E A partir des menus, slectionnez : Donnes > Trier les observations...

La bote de dialogue Trier les observations est affiche.


Figure 10-1 Bote de dialogue Trier les observations

E Ajoutez les variables Age en annes [ge] et Revenu du mnage en milliers [revenu] la liste

Trier par.
Copyright IBM Corporation 1989, 2011. 146

147 Tri et slection de donnes

Si vous slectionnez plusieurs variables de tri, lordre dans lequel elles apparaissent dans la liste Trier par dtermine celui dans lequel les observations sont tries. Dans cet exemple, bas sur les entres de la liste Trier par, les observations seront tries en fonction de la valeur de la variable Revenu du mnage en milliers [revenu] dans les modalits de la variable Age en annes [ge]. Pour les variables chane, les majuscules prcdent leurs quivalents minuscules dans lordre de tri (par exemple, la variable chane Oui prcde la variable chane oui dans lordre de tri).

Traitement dun fichier scind


Pour scinder le fichier de donnes en groupes distincts pour lanalyse :
E A partir des menus, slectionnez : Donnes > Scinder un fichier

La bote de dialogue Scinder un fichier est affiche.


Figure 10-2 Bote de dialogue Scinder un fichier

E Slectionnez Comparer les groupes ou Sparer rsultats par groupes. (Les exemples qui suivent ces

tapes montrent les diffrences entre les deux options.)


E Slectionnez Sexe [sexe] afin de scinder le fichier en groupes distincts pour ces variables.

Vous pouvez utiliser des variables numriques, des variables chane courte et des variables chane longue comme variables de regroupement. Une analyse distincte est effectue pour chaque sous-groupe dfini par les variables de regroupement. Si vous slectionnez plusieurs variables de regroupement, lordre dans lequel elles apparaissent dans la liste Critres de regroupement dtermine la faon dont les observations sont regroupes.

148 Chapitre 10

Si vous slectionnez Comparer les groupes, les rsultats de tous les groupes du fichier scind seront inclus dans le(s) mme(s) tableau(x), comme dans le tableau des statistiques rcapitulatives suivant gnr par la procdure Frquences.
Figure 10-3 Sortie Scinder un fichier contenant un seul tableau pivotant

Si vous slectionnez Sparer rsultats par groupes et que vous excutez la procdure Frquences, deux tableaux pivotants sont crs : un tableau pour les femmes et un pour les hommes.
Figure 10-4 Sortie Scinder un fichier contenant un tableau pivotant pour les femmes

Figure 10-5 Sortie Scinder un fichier contenant un tableau pivotant pour les personnes de sexe masculin

Tri dobservations pour le traitement dun fichier scind


La procdure Scinder un fichier cre un nouveau sous-groupe chaque fois quelle rencontre une valeur diffrente pour lune des variables de regroupement. Par consquent, il est important de trier les observations en fonction des valeurs des variables de regroupement avant de lancer le traitement du fichier scind.

149 Tri et slection de donnes

Par dfaut, la procdure Scinder un fichier trie automatiquement le fichier de donnes en fonction des valeurs des variables de regroupement. Si le fichier est dj tri dans lordre correct, vous pouvez gagner du temps lors du traitement en slectionnant Le fichier est dj tri.

Activation et dsactivation du traitement dun fichier scind


Une fois le traitement dun fichier scind lanc, il reste actif pour le reste de la session, moins que vous ne le dsactiviez.

Analyser toutes les observations. Cette option dsactive le traitement du fichier scind. Comparer les groupes et Sparer rsultats par groupes. Cette option active le traitement du

fichier scind. Si le traitement du fichier scind est activ, le message Sparer fichier actif apparat sur la barre dtat situe au bas de la fentre de lapplication.

Slection de sous-groupes dobservations


Vous pouvez limiter votre analyse un sous-groupe donn en fonction de critres contenant des variables et des expressions complexes. Vous pouvez galement slectionner un chantillon alatoire dobservations. Les critres utiliss pour dfinir un sous-groupe comprennent :

Plages et valeurs de variables Plages de dates et dheures Nombres dobservations (lignes) Expressions arithmtiques Expressions logiques Fonctions

Pour slectionner un sous-ensemble dobservations analyser, procdez comme suit :


E A partir des menus, slectionnez : Donnes > Slectionner des observations

Cette opration ouvre la bote de dialogue Slectionner des observations.

150 Chapitre 10 Figure 10-6 Bote de dialogue Slectionner des observations

Slectionner des sous-ensembles dobservations laide dune expression conditionnelle


Pour slectionner des observations sur la base dune expression conditionnelle, procdez comme suit :
E Slectionnez Selon une condition logique, puis cliquez sur Si dans la bote de dialogue Slectionner

des observations. Cette opration ouvre la bote de dialogue Slectionner des observations - Si.

151 Tri et slection de donnes Figure 10-7 Bote de dialogue Slectionner des observations : Si

Lexpression conditionnelle peut utiliser des noms de variables existantes, des constantes, des oprateurs arithmtiques, des oprateurs logiques, des oprateurs relationnels et des fonctions. Vous pouvez saisir et modifier lexpression dans la zone de texte comme nimporte quel texte dans une fentre de rsultats. Vous pouvez galement utiliser le pav numrique de la bote de dialogue, la liste des variables et la liste des fonctions pour coller des lments dans lexpression. Pour plus d'informations, reportez-vous la section Utilisation dexpressions conditionnelles dans le chapitre 9 sur p. 136.

Slectionner un chantillon alatoire


Pour obtenir un chantillon alatoire, procdez comme suit :
E Slectionnez Par chantillonnage alatoire dans la bote de dialogue Slectionner des observations. E Cliquez sur Echantillon.

Cette opration ouvre la bote de dialogue Slectionner observations : Echantillon alatoire.

152 Chapitre 10 Figure 10-8 Bote de dialogue Slectionner observations : Echantillon alatoire

Pour la taille de lchantillon, deux options sont disponibles :


Environ : Pourcentage dfini par lutilisateur. Cette option gnre un chantillon alatoire

dobservations dont le nombre correspond approximativement au pourcentage indiqu.


Exactement : Nombre dobservations spcifi par lutilisateur. Vous devez galement indiquer

le nombre dobservations partir duquel lchantillon sera gnr. Ce deuxime nombre doit tre infrieur ou gal au nombre total dobservations dans le fichier de donnes. Si ce nombre dpasse le nombre total dobservations dans le fichier de donnes, lchantillon contiendra proportionnellement moins dobservations que le nombre demand.

Slection dun intervalle de temps ou dobservations


Pour slectionner un intervalle dobservations sur la base de dates, dheures ou de numros (lignes) dobservations, procdez comme suit :
E Slectionnez Dans un intervalle de temps ou dobservations, puis cliquez sur Plage dans la bote de

dialogue Slectionner des observations. Cette opration ouvre la bote de dialogue Slectionner des observations : Intervalle, dans laquelle vous pouvez slectionner un intervalle de numros (lignes) dobservations.
Figure 10-9 Botes de dialogue Slectionner des observations : Intervalle

Premire. Entrez la date de dbut et/ou les valeurs de temps de lintervalle. Si aucune variable

de date nest dfinie, entrez le numro dobservation de dpart (numro de ligne dans lditeur de donnes, sauf si loption Scinder un fichier est active). Si vous nindiquez aucune valeur pour la zone Dernire, toutes les observations partir de la date/lheure de dbut jusqu la fin de la srie chronologique sont slectionnes.

Dernire. Entrez la date de fin et/ou les valeurs de temps pour lintervalle. Si aucune variable

de date nest dfinie, entrez le numro dobservation de fin (numro de ligne dans lditeur de donnes, sauf si loption Scinder un fichier est active). Si vous nindiquez aucune valeur

153 Tri et slection de donnes

pour la zone Premire, toutes les observations partir du dbut de la srie chronologique jusqu la date/lheure de fin sont slectionnes. Pour les donnes de sries chronologiques comportant des variables de date dfinies, vous pouvez slectionner un intervalle de dates et/ou dheures sur la base des variables de date dfinies. Chaque observation reprsente des constatations effectues diffrents moments et le fichier est tri dans lordre chronologique.
Figure 10-10 Bote de dialogue Slectionner des observations : Intervalle (sries chronologiques)

Pour gnrer des variables de date pour des donnes de sries chronologiques, procdez comme suit :
E A partir des menus, slectionnez : Donnes > Dfinir des dates

Traitement des observations exclues


Vous pouvez choisir lune des options suivantes pour traiter les observations exclues :

Filtrez les observations exclues. Les observations exclues ne sont pas incluses dans lanalyse,

mais restent dans lensemble de donnes. Vous pouvez utiliser les observations exclues ultrieurement dans la session si vous dsactivez le filtrage. Si vous slectionnez un chantillon alatoire ou si vous slectionnez des observations sur la base dune expression conditionnelle, une variable nomme filter_$ est gnre ; elle comporte la valeur 1 pour les observations slectionnes et la valeur 0 pour les observations exclues.

Copiez les observations slectionnes dans lensemble de donnes. Les observations

slectionnes sont copies dans un nouvel ensemble de donnes ; lensemble de donnes dorigine reste inchang. Les observations exclues ne sont pas incluses dans le nouvel ensemble de donnes et sont conserves dans leur tat dorigine dans lensemble de donnes dorigine.

Supprimez les observations exclues. Les observations exclues sont supprimes de lensemble

de donnes. Vous pouvez rcuprer les observations supprimes uniquement en fermant le fichier sans enregistrer les modifications et en louvrant nouveau. La suppression des observations est dfinitive si vous enregistrez les modifications apportes au fichier de donnes. Remarque : Si vous supprimez des observations exclues et enregistrez le fichier, vous ne pouvez pas rcuprer ces observations.

154 Chapitre 10

Etat de la slection dune observation


Si vous avez slectionn un sous-ensemble dobservations mais navez pas cart les observations non slectionnes, celles-ci sont identifies dans lditeur de donnes par une ligne verticale dans le numro de ligne.
Figure 10-11 Etat de la slection dune observation

Annexe

Fichiers dexemple

Les fichiers dexemple installs avec le produit figurent dans le sous-rpertoire Echantillons du rpertoire dinstallation. Il existe un dossier distinct au sein du sous-rpertoire Echantillons pour chacune des langues suivantes : Anglais, Franais, Allemand, Italien, Japonais, Coren, Polonais, Russe, Chinois simplifi, Espangol et Chinois traditionnel. Seuls quelques fichiers dexemples sont disponibles dans toutes les langues. Si un fichier dexemple nest pas disponible dans une langue, le dossier de langue contient la version anglaise du fichier dexemple.
Descriptions

Voici de brves descriptions des fichiers dexemple utiliss dans divers exemples travers la documentation.

accidents.sav.Ce fichier de donnes dhypothse concerne une socit dassurance qui tudie

les facteurs de risque lis lge et au sexe dans les accidents de la route survenant dans une rgion donne. Chaque observation correspond une classification croise de la catgorie dge et du sexe.

adl.sav. Ce fichier de donnes dhypothse concerne les mesures entreprises pour identifier les

avantages dun type de thrapie propos aux patients qui ont subi une attaque cardiaque. Les mdecins ont assign de manire alatoire les patients du sexe fminin ayant subi une attaque cardiaque un groupe parmi deux groupes possibles. Le premier groupe a fait lobjet de la thrapie standard tandis que le second a bnfici en plus dune thrapie motionnelle. Trois mois aprs les traitements, les capacits de chaque patient effectuer les tches ordinaires de la vie quotidienne ont t notes en tant que variables ordinales.

advert.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

dtaillant pour examiner la relation existant entre largent dpens dans la publicit et les ventes rsultantes. Pour ce faire, il collecte les chiffres des ventes passes et les cots associs la publicit.

aflatoxin.sav. Ce fichier de donnes dhypothse concerne le test de laflatoxine dans des

rcoltes de mas. La concentration de ce poison varie largement dune rcolte lautre et au sein de chaque rcolte. Un processeur de grain a reu 16 chantillons issus de 8 rcoltes de mas et a mesur les niveaux dalfatoxine en parties par milliard (PPB).

anorectic.sav. En cherchant dvelopper une symptomatologie standardise du comportement

anorexique/boulimique, des chercheurs ont examin 55 adolescents souffrant de troubles alimentaires. Chaque patient a t observ quatre fois sur une priode de quatre annes, soit un total de 220 observations. A chaque observation, les patients ont t nots pour chacun des 16 symptmes. En raison de labsence de scores de symptme pour le patient 71/visite 2, le patient 76/visite 2 et le patient 47/visite 3, le nombre dobservations valides est de 217.

Copyright IBM Corporation 1989, 2011.

155

156 Annexe A

bankloan.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend une

banque pour rduire le taux de dfaut de paiement. Il contient des informations financires et dmographiques sur 850 clients existants et ventuels. Les premires 700 observations concernent des clients auxquels des prts ont t octroys. Les 150 dernires observations correspondant aux clients ventuels que la banque doit classer comme bons ou mauvais risques de crdit.

bankloan_binning.sav. Ce fichier de donnes dhypothse concerne des informations

financires et dmographiques sur 5 000 clients existants.


behavior.sav. Dans un exemple classique , on a demand 52 tudiants de noter les

combinaisons tablies partir de 15 situations et de 15 comportements sur une chelle de 0 9, o 0 = extrmement appropri et 9 = extrmement inappropri . En effectuant la moyenne des rsultats de lensemble des individus, on constate une certaine diffrence entre les valeurs.

behavior_ini.sav. Ce fichier de donnes contient la configuration initiale dune solution

bidimensionnelle pour behavior.sav.


brakes.sav. Ce fichier de donnes dhypothse concerne le contrle qualit effectu dans

une usine qui fabrique des freins disque pour des voitures haut de gamme. Le fichier de donnes contient les mesures de diamtre de 16 disques de 8 machines de production. Le diamtre cible des freins est de 322 millimtres.

breakfast.sav. Au cours dune tude classique , on a demand 21 tudiants en MBA (Master

of Business Administration) de lcole de Wharton et leurs conjoints de classer 15 aliments du petit-djeuner selon leurs prfrences, de 1= aliment prfr 15= aliment le moins apprci . Leurs prfrences ont t enregistres dans six scnarios diffrents, allant de Prfrence gnrale En-cas avec boisson uniquement .

breakfast-overall.sav. Ce fichier de donnes contient les prfrences de petit-djeuner du

premier scnario uniquement, Prfrence gnrale .


broadband_1.sav. Ce fichier de donnes dhypothse concerne le nombre dabonns, par

rgion, un service haut dbit. Le fichier de donnes contient le nombre dabonns mensuels de 85 rgions sur une priode de quatre ans.

broadband_2.sav. Ce fichier de donnes est identique au fichier broadband_1.sav mais contient

les donnes relatives trois mois supplmentaires.


car_insurance_claims.sav. Il sagit dun ensemble de donnes prsent et analys ailleurs

qui concerne des actions en indemnisation pour des voitures. Le montant daction en indemnisation moyen peut tre model comme prsentant une distribution gamma, laide dune fonction de lien inverse pour associer la moyenne de la variable dpendante une combinaison linaire de lge de lassur, du type de vhicule et de lge du vhicule. Le nombre dactions entreprises peut tre utilis comme pondration de positionnement.

car_sales.sav. Ce fichier de donnes contient des estimations de ventes hypothtiques, des

barmes de prix et des spcifications physiques concernant divers modles et marques de vhicule. Les barmes de prix et les spcifications physiques proviennent tour tour de edmunds.com et des sites des constructeurs.

car_sales_uprepared.sav. Il sagit dune version modifie de car_sales.sav qui ninclut aucune

version transforme des champs.

157 Fichiers dexemple

carpet.sav. Dans un exemple courant , une socit intresse par la commercialisation dun

nouveau nettoyeur de tapis souhaite examiner linfluence de cinq critres sur la prfrence du consommateur : la conception du conditionnement, la marque, le prix, une tiquette Economique et une garantie satisfait ou rembours. Il existe trois niveaux de critre pour la conception du conditionnement, suivant lemplacement de lapplicateur, trois marques (K2R, Glory et Bissell), trois niveaux de prix et deux niveaux (non ou oui) pour chacun des deux derniers critres. Dix consommateurs classent 22 profils dfinis par ces critres. La variable Prfrence indique le classement des rangs moyens de chaque profil. Un rang faible correspond une prfrence leve. Cette variable reflte une mesure globale de prfrence pour chaque profil.

carpet_prefs.sav. Ce fichier de donnes repose sur le mme exemple que celui dcrit pour

carpet.sav, mais contient les classements rels issus de chacun des 10 clients. On a demand aux consommateurs de classer les 22 profils de produits, du prfr au moins intressant. Les variables PREF1 PREF22 contiennent les identificateurs des profils associs, tels quils sont dfinis dans carpet_plan.sav.

catalog.sav. Ce fichier de donnes contient des chiffres de ventes mensuelles hypothtiques

relatifs trois produits vendus par une entreprise de vente par correspondance. Les donnes relatives cinq variables explicatives possibles sont galement incluses.

catalog_seasfac.sav. Ce fichier de donnes est identique catalog.sav mais contient en plus

un ensemble de facteurs saisonniers calculs partir de la procdure de dsaisonnalisation, ainsi que les variables de date correspondantes.

cellular.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

oprateur tlphonique pour rduire les taux de dsabonnement. Des scores de propension au dsabonnement sont attribus aux comptes, de 0 100. Les comptes ayant une note gale ou suprieure 50 sont susceptibles de changer de fournisseur.

ceramics.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

fabricant pour dterminer si un nouvel alliage haute qualit rsiste mieux la chaleur quun alliage standard. Chaque observation reprsente un test spar de lun des deux alliages ; le degr de chaleur auquel lalliage ne rsiste pas est enregistr.

cereal.sav. Ce fichier de donnes dhypothse concerne un sondage de 880 personnes

interroges sur leurs prfrences de petit-djeuner et sur leur ge, leur sexe, leur situation familiale et leur mode de vie (actif ou non actif, selon quelles pratiquent une activit physique au moins deux fois par semaine). Chaque observation correspond un rpondant distinct.

clothing_defects.sav. Ce fichier de donnes dhypothse concerne le processus de contrle

qualit observ dans une usine de textile. Dans chaque lot produit lusine, les inspecteurs prlvent un chantillon de vtements et comptent le nombre de vtements qui ne sont pas acceptables.

coffee.sav. Ce fichier de donnes concerne limage perue de six marques de caf frapp .

Pour chacun des 23 attributs dimage de caf frapp, les personnes sollicites ont slectionn toutes les marques dcrites par lattribut. Les six marques sont appeles AA, BB, CC, DD, EE et FF des fins de confidentialit.

contacts.sav. Ce fichier de donnes dhypothse concerne les listes de contacts dun groupe

de reprsentants en informatique dentreprise. Chaque contact est class selon le service de lentreprise o il travaille et le classement de son entreprise. Sont galement enregistrs le

158 Annexe A

montant de la dernire vente effectue, le temps pass depuis la dernire vente et la taille de lentreprise du contact.

creditpromo.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

grand magasin pour valuer lefficacit dune promotion rcente de carte de crdit. A cette fin, 500 dtenteurs de carte ont t slectionns au hasard. La moiti a reu une publicit faisant la promotion dun taux dintrt rduit sur les achats effectus dans les trois mois venir. Lautre moiti a reu une publicit saisonnire standard.

customer_dbase.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend

une socit pour utiliser les informations figurant dans sa banque de donnes et proposer des offres spciales aux clients susceptibles dtre intresss. Un sous-groupe de la base de clients a t slectionn au hasard et a reu des offres spciales. Les rponses des clients ont t enregistres.

customer_information.sav. Un fichier de donnes dhypothse qui contient les informations

postales du client, telles que le nom et ladresse.


customer_subset.sav. Un sous-ensemble de 80 observations de customer_dbase.sav. debate.sav. Ce fichier de donnes dhypothse concerne des rponses apparies une enqute

donne aux participants un dbat politique avant et aprs le dbat. Chaque observation reprsente un rpondant distinct.

debate_aggregate.sav. Il sagit dun fichier de donnes dhypothse qui rassemble les rponses

dans le fichier debate.sav. Chaque observation correspond une classification croise de prfrence avant et aprs le dbat.

demo.sav. Ce fichier de donnes dhypothse concerne une base de donnes clients achete en

vue de diffuser des offres mensuelles. Les donnes indiquent si le client a rpondu ou non loffre et contiennent diverses informations dmographiques.

demo_cs_1.sav. Ce fichier de donnes dhypothse concerne la premire mesure entreprise

par une socit pour compiler une base de donnes contenant des informations denqute. Chaque observation correspond une ville diffrente. La rgion, la province, le quartier et la ville sont enregistrs.

demo_cs_2.sav. Ce fichier de donnes dhypothse concerne la seconde mesure entreprise par

une socit pour compiler une base de donnes contenant des informations denqute. Chaque observation correspond un mnage diffrent issu des villes slectionnes la premire tape. La rgion, la province, le quartier, la ville, la sous-division et lidentification sont enregistrs. Les informations dchantillonnage des deux premires tapes de la conception sont galement incluses.

demo_cs.sav. Ce fichier de donnes dhypothse concerne des informations denqute

collectes via une mthode complexe dchantillonnage. Chaque observation correspond un mnage diffrent et diverses informations gographiques et dchantillonnage sont enregistres.

dmdata.sav. Ceci est un fichier de donnes dhypothse qui contient des informations

dmographiques et des informations concernant les achats pour une entreprise de marketing direct. dmdata2.sav contient les informations pour un sous-ensemble de contacts qui ont reu un envoi dessai, et dmdata3.sav contient des informations sur les contacts restants qui nont pas reu lenvoi dessai.

159 Fichiers dexemple

dietstudy.sav. Ce fichier de donnes dhypothse contient les rsultats dune tude portant sur

le rgime de Stillman. Chaque observation correspond un sujet distinct et enregistre son poids en livres avant et aprs le rgime, ainsi que ses niveaux de triglycrides en mg/100 ml.

dvdplayer.sav. Ce fichier de donnes dhypothse concerne le dveloppement dun nouveau

lecteur DVD. A laide dun prototype, lquipe de marketing a collect des donnes de groupes spcifiques. Chaque observation correspond un utilisateur interrog et enregistre des informations dmographiques sur cet utilisateur, ainsi que ses rponses aux questions portant sur le prototype.

german_credit.sav. Ce fichier de donnes provient de lensemble de donnes German credit

figurant dans le rfrentiel Machine Learning Databases de luniversit de Californie, Irvine.


grocery_1month.sav. Ce fichier de donnes dhypothse est le fichier de donnes

grocery_coupons.sav dans lequel les achats hebdomadaires sont organiss par client distinct. Certaines variables qui changeaient toutes les semaines disparaissent. En outre, le montant dpens enregistr est prsent la somme des montants dpenss au cours des quatre semaines de lenqute.

grocery_coupons.sav. Il sagit dun fichier de donnes dhypothse qui contient des donnes

denqute collectes par une chane de magasins dalimentation qui chercher dterminer les habitudes de consommation de ses clients. Chaque client est suivi pendant quatre semaines et chaque observation correspond une semaine distincte. Les informations enregistres concernent les endroits o le client effectue ses achats, la manire dont il les effectue, ainsi que les sommes dpenses en provisions au cours de cette semaine.

guttman.sav. Bell a prsent un tableau pour illustrer les groupes sociaux possibles. Guttman a

utilis une partie de ce tableau, dans lequel cinq variables dcrivant des lments tels que linteraction sociale, le sentiment dappartenance un groupe, la proximit physique des membres et la formalit de la relation, ont t croises avec sept groupes sociaux thoriques, dont les foules (par exemple, le public dun match de football), laudience (par exemple, au cinma ou dans une salle de classe), le public (par exemple, les journaux ou la tlvision), les bandes (proche dune foule, mais qui serait caractrise par une interaction beaucoup plus intense), les groupes primaires (intimes), les groupes secondaires (volontaires) et la communaut moderne (groupement lche issu dune forte proximit physique et dun besoin de services spcialiss).

health_funding.sav. Ce fichier de donnes dhypothse concerne des donnes sur le

financement des soins de sant (montant par groupe de 100 individus), les taux de maladie (taux par groupe de 10 000 individus) et les visites chez les prestataires de soins de sant (taux par groupe de 10 000 individus). Chaque observation reprsente une ville diffrente.

hivassay.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

laboratoire pharmaceutique pour dvelopper une analyse rapide de dtection dinfection HIV. Lanalyse a pour rsultat huit nuances de rouge, les nuances les plus marques indiquant une plus forte probabilit dinfection. Un test en laboratoire a t effectu sur 2 000 chantillons de sang, la moiti de ces chantillons tant infecte par le virus HIV et lautre moiti tant saine.

hourlywagedata.sav. Ce fichier de donnes dhypothse concerne les salaires horaires

dinfirmires occupant des postes administratifs et dans les services de soins, et affichant divers niveaux dexprience.

160 Annexe A

insurance_claims.sav. Il sagit dun fichier de donnes hypothtiques qui concerne une

compagnie dassurance souhaitant dvelopper un modle pour signaler des rclamations suspectes, potentiellement frauduleuses. Chaque observation correspond une rclamation distincte.

insure.sav. Ce fichier de donnes dhypothse concerne une compagnie dassurance qui tudie

les facteurs de risque indiquant si un client sera amen dclarer un incident au cours dun contrat dassurance vie dune dure de 10 ans. Chaque observation figurant dans le fichier de donnes reprsente deux contrats, lun ayant enregistr une rclamation et lautre non, apparis par ge et sexe.

judges.sav. Ce fichier de donnes dhypothse concerne les scores attribus par des juges

expriments (plus un juge enthousiaste) 300 performances de gymnastique. Chaque ligne reprsente une performance distincte ; les juges ont examin les mmes performances.

kinship_dat.sav. Rosenberg et Kim se sont lancs dans lanalyse de 15 termes de parent

(cousin/cousine, fille, fils, frre, grand-mre, grand-pre, mre, neveu, nice, oncle, pre, petite-fille, petit-fils, sur, tante). Ils ont demand quatre groupes dtudiants (deux groupes de femmes et deux groupes dhommes) de trier ces termes en fonction des similarits. Deux groupes (un groupe de femmes et un groupe dhommes) ont t invits effectuer deux tris, en basant le second sur un autre critre que le premier. Ainsi, un total de six sources a t , dont le nombre de obtenu. Chaque source correspond une matrice de proximit cellules est gal au nombre de personnes dans une source moins le nombre de fois o les objets ont t partitionns dans cette source.

kinship_ini.sav. Ce fichier de donnes contient une configuration initiale dune solution

tridimensionnelle pour kinship_dat.sav.


kinship_var.sav. Ce fichier de donnes contient les variables indpendantes sexe, gnr(ation)

et degr (de sparation) permettant dinterprter les dimensions dune solution pour kinship_dat.sav. Elles permettent en particulier de rduire lespace de la solution une combinaison linaire de ces variables.

marketvalues.sav. Ce fichier de donnes concerne les ventes de maisons dans un nouvel

ensemble Algonquin (Illinois) au cours des annes 19992000. Ces ventes relvent des archives publiques.

nhis2000_subset.sav.Le NHIS (National Health Interview Survey) est une enqute de

grande envergure concernant la population des Etats-Unis. Des entretiens ont lieu avec un chantillon de mnages reprsentatifs de la population amricaine. Des informations dmographiques et des observations sur ltat de sant et le comportement sanitaire sont recueillies auprs des membres de chaque mnage. Ce fichier de donnes contient un sous-groupe dinformations issues de lenqute de 2000. National Center for Health Statistics. National Health Interview Survey, 2000. Fichier de donnes et documentation dusage public. ftp://ftp.cdc.gov/pub/Health_Statistics/NCHS/Datasets/NHIS/2000/. Accs en 2003.

ozone.sav. Les donnes incluent 330 observations portant sur six variables mtorologiques

pour prvoir la concentration dozone partir des variables restantes. Des chercheurs prcdents , , ont dcel parmi ces variables des non-linarits qui pnalisent les approches standard de la rgression.

161 Fichiers dexemple

pain_medication.sav. Ce fichier de donnes dhypothse contient les rsultats dun essai

clinique dun remde anti-inflammatoire traitant les douleurs de larthrite chronique. On cherche notamment dterminer le temps ncessaire au mdicament pour agir et les rsultats quil permet dobtenir par rapport un mdicament existant.

patient_los.sav. Ce fichier de donnes dhypothse contient les dossiers mdicaux de patients

admis lhpital pour suspicion dinfarctus du myocarde suspect (ou attaque cardiaque ). Chaque observation correspond un patient distinct et enregistre de nombreuses variables lies son sjour lhpital.

patlos_sample.sav. Ce fichier de donnes dhypothse contient les dossiers mdicaux dun

chantillon de patients sous traitement thrombolytique aprs un infarctus du myocarde. Chaque observation correspond un patient distinct et enregistre de nombreuses variables lies son sjour lhpital.

poll_cs.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

enquteur pour dterminer le niveau de soutien du public pour un projet de loi avant lgislature. Les observations correspondent des lecteurs enregistrs. Chaque observation enregistre le comt, la ville et le quartier o habite llecteur.

poll_cs_sample.sav. Ce fichier de donnes dhypothse contient un chantillon des lecteurs

rpertoris dans le fichier poll_cs.sav. Lchantillon a t prlev selon le plan spcifi dans le fichier de plan poll.csplan et ce fichier de donnes enregistre les probabilits dinclusion et les pondrations dchantillon. Toutefois, ce plan faisant appel une mthode dchantillonnage de probabilit proportionnelle la taille (PPS Probability-Proportional-to-Size), il existe galement un fichier contenant les probabilits de slection conjointes (poll_jointprob.sav). Les variables supplmentaires correspondant la rpartition dmographique des lecteurs et leur opinion sur le projet de loi propos ont t collectes et ajoutes au fichier de donnes une fois lchantillon prlev.

property_assess.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend

un contrleur au niveau du comt pour maintenir les valuations de valeur de proprit jour sur des ressources limites. Les observations correspondent des proprits vendues dans le comt au cours de lanne prcdente. Chaque observation du fichier de donnes enregistre la ville o se trouve la proprit, lvaluateur ayant visit la proprit pour la dernire fois, le temps coul depuis cette valuation, lvaluation effectue ce moment-l et la valeur de vente de la proprit.

property_assess_cs.sav. Ce fichier de donnes dhypothse concerne les mesures

quentreprend un contrleur du gouvernement pour maintenir les valuations de valeur de proprit jour sur des ressources limites. Les observations correspondent des proprits de ltat. Chaque observation du fichier de donnes enregistre le comt, la ville et le quartier o se trouve la proprit, le temps coul depuis la dernire valuation et lvaluation alors effectue.

property_assess_cs_sample.sav. Ce fichier de donnes dhypothse contient un chantillon

des proprits rpertories dans le fichier property_assess_cs.sav. Lchantillon a t prlev selon le plan spcifi dans le fichier de plan property_assess.csplan et ce fichier de donnes enregistre les probabilits dinclusion et les pondrations dchantillon. La variable supplmentaire Valeur courante a t collecte et ajoute au fichier de donnes une fois lchantillon prlev.

162 Annexe A

recidivism.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend une

agence administrative dapplication de la loi pour interprter les taux de rcidive dans la juridiction. Chaque observation correspond un rcidiviste et enregistre les informations dmographiques qui lui sont propres, certains dtails sur le premier dlit commis, ainsi que le temps coul jusqu la seconde arrestation si elle sest produite dans les deux annes suivant la premire.

recidivism_cs_sample.sav. Ce fichier de donnes dhypothse concerne les mesures

quentreprend une agence administrative dapplication de la loi pour interprter les taux de rcidive dans la juridiction. Chaque observation correspond un rcidiviste libr suite la premire arrestation en juin 2003 et enregistre les informations dmographiques qui lui sont propres, certains dtails sur le premier dlit commis et les donnes relatives la seconde arrestation, si elle a eu lieu avant fin juin 2006. Les rcidivistes ont t choisis dans plusieurs dpartements chantillonns conformment au plan dchantillonnage spcifi dans recidivism_cs.csplan. Ce plan faisant appel une mthode dchantillonnage de probabilit proportionnelle la taille (PPS - Probability proportional to size), il existe galement un fichier contenant les probabilits de slection conjointes (recidivism_cs_jointprob.sav).

rfm_transactions.sav.Un fichier de donnes dhypothse qui contient les donnes de transaction

dachat, y compris la date dachat, le/les lment(s) achet(s) et le montant montaire pour chaque transaction.

salesperformance.sav. Ce fichier de donnes dhypothse concerne lvaluation de deux

nouveaux cours de formation en vente. Soixante employs, diviss en trois groupes, reoivent chacun une formation standard. En outre, le groupe 2 suit une formation technique et le groupe 3 un didacticiel pratique. A lissue du cours de formation, chaque employ est test et sa note enregistre. Chaque observation du fichier de donnes reprsente un stagiaire distinct et enregistre le groupe auquel il a t assign et la note quil a obtenue au test.

satisf.sav. Il sagit dun fichier de donnes dhypothse portant sur une enqute de satisfaction

effectue par une socit de vente au dtail au niveau de quatre magasins. Un total de 582 clients ont t interrogs et chaque observation reprsente la rponse dun seul client.

screws.sav.Ce fichier de donnes contient des informations sur les descriptives des vis, des

boulons, des crous et des clous..


shampoo_ph.sav. Ce fichier de donnes dhypothse concerne le processus de contrle qualit

observ dans une usine de produits capillaires. A intervalles rguliers, six lots de sortie distincts sont mesurs et leur pH enregistr. La plage cible est 4,55,5.

ships.sav. Il sagit dun ensemble de donnes prsent et analys ailleurs et concernant

les dommages causs des cargos par les vagues. Les effectifs dincidents peuvent tre modliss comme des incidents se produisant selon un taux de Poisson en fonction du type de navire, de la priode de construction et de la priode de service. Les mois de service totaliss pour chaque cellule du tableau form par la classification croise des facteurs fournissent les valeurs dexposition au risque.

site.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend une socit

pour choisir de nouveaux sites pour le dveloppement de ses activits. Lentreprise a fait appel deux consultants pour valuer sparment les sites. Ces consultants, en plus de fournir un rapport approfondi, ont class chaque site comme constituant une ventualit bonne , moyenne ou faible .

163 Fichiers dexemple

smokers.sav. Ce fichier de donnes est extrait de ltude National Household Survey of

Drug Abuse de 1998 et constitue un chantillon de probabilit des mnages amricains. (http://dx.doi.org/10.3886/ICPSR02934) Ainsi, la premire tape dans lanalyse de ce fichier doit consister pondrer les donnes pour reflter les tendances de population.

stocks.sav Ce fichier de donnes hypothtiques contient le cours et le volume des actions

pour un an.
stroke_clean.sav. Ce fichier de donnes dhypothse concerne ltat dune base de donnes

mdicales une fois celle-ci purge via des procdures de loption Validation de donnes.
stroke_invalid.sav. Ce fichier de donnes dhypothse concerne ltat initial dune base de

donnes mdicales et comporte plusieurs erreurs de saisie de donnes.


stroke_survival. Ce fichier de donnes dhypothse concerne les temps de survie de patients

qui quittent un programme de rducation la suite dun accident ischmique et rencontrent un certain nombre de problmes. Aprs lattaque, loccurrence dinfarctus du myocarde, daccidents ischmiques ou hmorragiques est signale, et le moment de lvnement enregistr. Lchantillon est tronqu gauche car il ninclut que les patients ayant survcu durant le programme de rducation mis en place suite une attaque.

stroke_valid.sav. Ce fichier de donnes dhypothse concerne ltat dune base de donnes

mdicales une fois les valeurs vrifies via la procdure Validation de donnes. Elle contient encore des observations anormales potentielles.

survey_sample.sav. Ce fichier de donnes concerne des informations denqute dont des

donnes dmographiques et des mesures comportementales. Il est bas sur un sous-ensemble de variables de la 1998 NORC General Social Survey, bien que certaines valeurs de donnes aient t modifies et que des variables supplmentaires fictives aient t ajoutes titre de dmonstration.

telco.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend une socit

de tlcommunications pour rduire les taux de dsabonnement de sa base de clients. Chaque observation correspond un client distinct et enregistre diverses informations dmographiques et dutilisation de service.

telco_extra.sav. Ce fichier de donnes est semblable au fichier de donnes telco.sav mais

les variables de permanence et de dpenses des consommateurs transformes log ont t supprimes et remplaces par des variables de dpenses des consommateurs transformes log standardises.

telco_missing.sav. Ce fichier de donnes est un sous-ensemble du fichier de donnes telco.sav

mais certaines des valeurs de donnes dmographiques ont t remplaces par des valeurs manquantes.

testmarket.sav. Ce fichier de donnes dhypothse concerne une chane de fast foods et ses

plans marketing visant ajouter un nouveau plat son menu. Trois campagnes tant possibles pour promouvoir le nouveau produit, le nouveau plat est introduit sur des sites sur plusieurs marchs slectionns au hasard. Une promotion diffrente est effectue sur chaque site et les ventes hebdomadaires du nouveau plat sont enregistres pour les quatre premires semaines. Chaque observation correspond un site-semaine distinct.

testmarket_1month.sav. Ce fichier de donnes dhypothse est le fichier de donnes

testmarket.sav dans lequel les ventes hebdomadaires sont organises par site distinct. Certaines variables qui changeaient toutes les semaines disparaissent. En outre, les ventes

164 Annexe A

enregistres sont prsent la somme des ventes ralises au cours des quatre semaines de lenqute.

tree_car.sav. Ce fichier de donnes dhypothse concerne des donnes dmographiques et de

prix dachat de vhicule.


tree_credit.sav. Ce fichier de donnes dhypothse concerne des donnes dmographiques

et dhistorique de prt bancaire.


tree_missing_data.sav Ce fichier de donnes dhypothse concerne des donnes

dmographiques et dhistorique de prt bancaire avec un grand nombre de valeurs manquantes.


tree_score_car.sav. Ce fichier de donnes dhypothse concerne des donnes dmographiques

et de prix dachat de vhicule.


tree_textdata.sav. Ce fichier de donnes simples ne comporte que deux variables et vise

essentiellement indiquer ltat par dfaut des variables avant affectation du niveau de mesure et des tiquettes de valeurs.

tv-survey.sav. Ce fichier de donnes dhypothse concerne une enqute mene par un studio

de tlvision qui envisage de prolonger la diffusion dun programme ou de larrter. On a demand 906 personnes si elles regarderaient le programme dans diverses situations. Chaque ligne reprsente un rpondant distinct et chaque colonne une situation distincte.

ulcer_recurrence.sav. Ce fichier contient des informations partielles dune enqute visant

comparer lefficacit de deux thrapies de prvention de la rcurrence des ulcres. Il fournit un bon exemple de donnes censures par intervalle et a t prsent et analys ailleurs .

ulcer_recurrence_recoded.sav. Ce fichier rorganise les informations figurant dans le fichier

ulcer_recurrence.sav pour que vous puissiez modliser la probabilit dvnement pour chaque intervalle de lenqute plutt que la probabilit dvnement de fin denqute. Il a t prsent et analys ailleurs .

verd1985.sav. Ce fichier de donnes concerne une enqute . Les rponses de 15 sujets 8

variables ont t enregistres. Les variables prsentant un intrt sont divises en trois ensembles. Le groupe 1 comprend lge et la situation familiale, le groupe 2 les animaux domestiques et la presse, et le groupe 3 la musique et lhabitat. A la variable animal domestique est appliqu un codage nominal multiple et ge, un codage ordinal ; toutes les autres variables ont un codage nominal simple.

virus.sav. Ce fichier de donnes dhypothse concerne les mesures quentreprend un

fournisseur de services Internet pour dterminer les effets dun virus sur ses rseaux. Il a suivi le pourcentage (approximatif) de trafic de messages lectroniques infects par un virus sur ses rseaux sur la dure, de la dcouverte la circonscription de la menace.

wheeze_steubenville.sav. Il sagit dun sous-ensemble dune enqute longitudinale des effets

de la pollution de lair sur la sant des enfants . Les donnes contiennent des mesures binaires rptes de ltat asthmatique denfants de la ville de Steubenville (Ohio), gs de 7, 8, 9 et 10 ans, et indiquent si la mre fumait au cours de la premire anne de lenqute.

workprog.sav. Ce fichier de donnes dhypothse concerne un programme de ladministration

visant proposer de meilleurs postes aux personnes dfavorises. Un chantillon de participants potentiels au programme a ensuite t prlev. Certains de ces participants ont

165 Fichiers dexemple

t slectionns au hasard pour participer au programme. Chaque observation reprsente un participant au programme distinct.

worldsales.sav Ce fichier de donnes hypothtiques contient les revenus des ventes par

continent et par produit.

Annexe

Remarques
Ces informations ont t dveloppes pour les produits et services offerts dans le monde.

Il est possible quIBM noffre pas dans les autres pays les produits, services et fonctionnalits dcrits dans ce document. Contactez votre reprsentant local IBM pour obtenir des informations sur les produits et services actuellement disponibles dans votre rgion. Toute rfrence un produit, programme ou service IBM nimplique pas que les seuls les produits, programmes ou services IBM peuvent tre utiliss. Tout produit, programme ou service de fonctionnalit quivalente qui ne viole pas la proprit intellectuelle IBM peut tre utilis la place. Cependant lutilisateur doit valuer et vrifier lutilisation dun produit, programme ou service non IBM. IBM peut possder des brevets ou des applications de brevet en attente qui couvrent les sujets dcrits dans ce document. Loctroi de ce document nquivaut aucunement celui dune licence pour ces brevets. Vous pouvez envoyer par crit des questions concernant la licence : IBM Director of Licensing, IBM Corporation, North Castle Drive, Armonk, NY 10504-1785, tats-Unis Pour obtenir des informations de licence concernant la configuration de caractres cods sur deux octets (DBCS), veuillez contacter dans votre pays le dpartement charg de la proprit intellectuelle chez IBM ou envoyez vos commentaires par crit : Intellectual Property Licensing, Legal and Intellectual Property Law, IBM Japan Ltd., 1623-14, Shimotsuruma, Yamato-shi, Kanagawa 242-8502 Japon.
Le paragraphe suivant ne sapplique pas au Royaume-Uni ni aucun pays dans lequel ces dispositions sont contraires au droit local : INTERNATIONAL BUSINESS MACHINES FOURNIT CETTE

PUBLICATION EN LETAT SANS GARANTIE DAUCUNE SORTE, IMPLICITE OU EXPLICITE, Y COMPRIS, MAIS SANS ETRE LIMITE AUX GARANTIES IMPLICITES DE NON VIOLATION, DE QUALITE MARCHANDE OU DADAPTATION POUR UN USAGE PARTICULIER. Certains tats nautorisent pas lexclusion de garanties explicites ou implicites lors de certaines transactions, par consquent, il est possible que cet nonc ne vous concerne pas. Ces informations peuvent contenir des erreurs techniques ou des erreurs typographiques. Ces informations sont modifies de temps en temps ; ces modifications seront intgres aux nouvelles versions de la publication. IBM peut apporter des amliorations et/ou modifications des produits et/ou des programmes dcrits dans cette publications tout moment sans avertissement pralable. Toute rfrence dans ces informations des sites Web autres quIBM est fournie dans un but pratique uniquement et ne sert en aucun cas de recommandation pour ces sites Web. Le matriel contenu sur ces sites Web ne fait pas partie du matriel de ce produit IBM et lutilisation de ces sites Web se fait vos propres risques. IBM peut utiliser ou distribuer les informations que vous lui fournissez, de la faon dont il le souhaite, sans encourir aucune obligation envers vous.
Copyright IBM Corporation 1989, 2011. 166

167 Remarques

Les personnes disposant dune licence pour ce programme et qui souhaitent obtenir des informations sur celui-ci pour activer : (i) lchange dinformations entre des programmes crs de manire indpendante et dautres programmes (notamment celui-ci) et (ii) lutilisation mutuelle des informations qui ont t changes, doivent contacter : IBM Software Group, Attention: Licensing, 233 S. Wacker Dr., Chicago, IL 60606, tats-Unis. Ces informations peuvent tre disponibles, soumises des conditions gnrales, et dans certains cas payantes. Le programme sous licence dcrit dans ce document et toute la documentation sous licence disponible pour ce programme sont fournis par IBM en conformit avec les conditions de laccord du client IBM, avec laccord de licence du programme international IBM et avec tout accord quivalent entre nous. les informations concernant les produits autres quIBM ont t obtenues auprs des fabricants de ces produits, leurs annonces publiques ou dautres sources publiques disponibles. IBM na pas test ces produits et ne peut confirmer lexactitude de leurs performances, leur compatibilit ou toute autre fonctionnalit associe des produits autres quIBM. Les questions sur les capacits de produits autres quIBM doivent tre adresses aux fabricants de ces produits. Ces informations contiennent des exemples de donnes et de rapports utiliss au cours doprations quotidiennes standard. Pour les illustrer le mieux possible, ces exemples contiennent des noms dindividus, dentreprises, de marques et de produits. Tous ces noms sont fictifs et toute ressemblance avec des noms et des adresses utiliss par une entreprise relle ne serait que pure concidence. Si vous consultez la version papier de ces informations, il est possible que certaines photographies et illustrations en couleurs napparaissent pas.
Marques commerciales

IBM, le logo IBM, ibm.com et SPSS sont des marques commerciales dIBM Corporation, dposes dans de nombreuses juridictions du monde entier. Une liste jour des marques IBM est disponible sur Internet ladresse http://www.ibm.com/legal/copytrade.shtml. Adobe, le logo Adobe, PostScript et le logo PostScript sont des marques dposes ou des marques commerciales de Adobe Systems Incorporated aux Etats-Unis et/ou dans dautres pays. Intel, le logo Intel, Intel Inside, le logo Intel Inside, Intel Centrino, le logo Intel Centrino, Celeron, Intel Xeon, Intel SpeedStep, Itanium, et Pentium sont des marques commerciales ou des marques dposes de Intel Corporation ou de ses filiales aux Etats-Unis et dans dautres pays. Java et toutes les marques et logos Java sont des marques commerciales de Sun Microsystems, Inc. aux Etats-Unis et/ou dans dautres pays. Linux est une marque dpose de Linus Torvalds aux Etats-Unis et/ou dans dautres pays. Microsoft, Windows, Windows NT et le logo Windows sont des marques commerciales de Microsoft Corporation aux Etats-Unis et/ou dans dautres pays. UNIX est une marque dpose de The Open Group aux Etats-Unis et dans dautres pays. Ce produit utilise WinWrap Basic, Copyright 1993-2007, Polar Engineering and Consulting, http://www.winwrap.com/.

168 Annexe B

Les autres noms de produits et de services peuvent tre des marques dIBM ou dautres socits. Les captures dcran des produits Adobe sont reproduites avec lautorisation de Adobe Systems Incorporated. Les captures dcran des produits Microsoft sont reproduites avec lautorisation de Microsoft Corporation.

Index
Access (Microsoft), 13 Assistant Date et heure, 138 Assistant de base de donnes, 13 Assistant dimportation de texte, 19 attribution dun nouveau nom aux ensembles de donnes, 54 Attributs de variable Rutilisation, 41 Calcul de nouvelles variables, 132 Collage dune syntaxe Bote de dialogue, 119 copie dattributs de variables, 41 Cration dtiquettes de variable, 32 Data Editor plusieurs fichiers de donnes ouverts, 50 dplacement Elments dans des tableaux pivotants, 88 Elments dans le Viewer, 86 diagrammes Btons, 57, 63 cration de diagrammes, 63 Edition de diagrammes, 69 Histogrammes, 61 Modles, 77 Options de diagramme, 82 Diagrammes en btons, 57 Donnes chane Saisie de donnes, 30 Donnes continues, 55 Donnes de type ratio, 55 Donnes dchelle, 55 Donnes dintervalle, 55 Donnes nominales, 55 Donnes numriques, 27 Donnes ordinales, 55 Donnes qualitatives, 55 Mesures rcapitulatives, 55 Donnes quantitatives, 55 Editeur de donnes Saisie de donnes non numriques, 30 Saisie de donnes numriques, 27 Edition de tableaux pivotants, 93 effectif Tableaux deffectifs, 55 ensembles de donnes renommer, 54 Etiquettes de valeurs Affectation, 33, 35 Contrle de laffichage dans le Viewer, 33, 35 Variables non numriques, 35 Variables numriques, 33 Etiquettes de variable Cration, 32 Excel (Microsoft) exportation des rsultats, 107 exportation des rsultats dans Excel, 107 dans PowerPoint, 107 dans Word, 107 HTML, 118 Expressions conditionnelles, 136 Fentres de syntaxe codage par couleur, 122 Collage de commandes, 119 Excution de commandes, 120, 122 Modification de commandes, 120 points darrt, 123 saisie semi-automatique, 120 Fichiers de base de donnes Lecture, 13 Fichiers de donnes plusieurs fichiers de donnes ouverts, 50 Fichiers de donnes texte Lecture, 19 Fichiers de feuille de calcul Lecture, 11 Lecture des noms de variable, 11 Fichiers de syntaxe Ouverture, 122 fichiers dexemple emplacement, 155 Fichiers Excel Lecture, 11 fonctions dans les expressions, 134 graphiques Btons, 63 cration de diagrammes, 63 Modles, 77 modification de diagrammes, 69 Options de diagramme, 82 Histogrammes, 61 HTML exportation des rsultats, 118 marques commerciales, 167 masquage des lignes et colonnes dans des tableaux pivotants, 94 mentions lgales, 166 Mesures rcapitulatives Donnes qualitatives, 55 Variables dchelle, 59
169

170 Index

niveau de mesure, 55 Niveau de mesure, 55 Observations Slection, 149 Tri, 146, 149 Outil Aide syntaxe, 122 plusieurs fichiers de donnes ouverts, 50 suppression, 54 PowerPoint (Microsoft) exportation des rsultats, 107 Recodage de valeurs, 126 Saisie de donnes, 27, 30 Non numrique, 30 numrique, 27 Slection dobservations, 149 Sous-groupes dobservations Dates et heures, 152 Echantillon alatoire, 151 Expressions conditionnelles, 150 Filtrage des observations exclues, 153 Slection, 149 Selon une condition logique, 150 Suppression dobservations exclues, 153 strates Cration dans des tableaux pivotants, 91 Syntaxe, 119 tableaux de frquences, 55 Tableaux pivotants Accs aux dfinitions, 88 Formatage, 93 Formats de cellule, 94 Masquage de lignes et de colonnes, 94 Masquage du sparateur dcimal, 94 modification, 93 strates, 91 Structure pivotante, 88 Transposition de lignes et de colonnes, 88 Types de donnes des cellules, 94 traitement dun fichier scind, 147 Transposition de lignes et de colonnes dans des tableaux pivotants, 88 Tri dobservations, 146 Types de donnes Pour les variables, 33 Valeurs manquantes manquantes par dfaut, 37 Variables non numriques, 40 Variables numriques, 38

Valeurs manquantes par dfaut , 37 Variables, 27 Etiquettes, 32 Types de donnes, 33 Variables de date et dheure, 138 Variables dchelle Mesures rcapitulatives, 59 Viewer Dplacement du rsultat, 86 Masquage et affichage du rsultat, 86 Word (Microsoft) exportation des rsultats, 107

S-ar putea să vă placă și