Sunteți pe pagina 1din 432

Le Sphinx

Traitement d'enqutes et analyse


statistique de donnes
Manuel d'utilisation

Copyright Sphinx Dveloppement 1986 2001.


Tous droits rservs

Le Sphinx Dveloppement
7, rue Blaise Pascal
74600 Seynod
Tlphone : 04 50 69 82 98
Fax : 04 50 69 82 78
e-mail : contact@lesphinx-developpement.fr
Internet : http://lesphinx-developpement.fr

Avant propos
Ce manuel accompagne la nouvelle version du Sphinx que
vous venez d'acqurir. Nous vous en flicitons.
Ce logiciel sappuie trs fortement sur les interfaces et les
protocoles de Windows. Vous retrouverez ainsi les
habitudes que vous avez dj acquises par lexprience de
ce systme (gestion des fichiers, menus, dialogues, listes
droulantes, raccourcis). Nous nous sommes efforcs de
toujours respecter ces conventions bien tablies. Cest
pour cela que vous parviendrez trs facilement lutiliser.
Vous serez galement guid par votre connaissance du
travail des enqutes, des tudes et de la statistique. Nous
utilisons le langage de ces mtiers et avons structur le
logiciel par rapport aux grandes tapes dune tude :
questionnaire, saisie, dpouillement, analyse Notre souci
constant est de faciliter votre comprhension devant
lcran. A cette fin, de nombreux commentaires sont
affichs pour vous aider vous situer et comprendre les
menus, boutons de commande, options Pour les
oprations les plus complexes, vous tes pris en charge
par un assistant. Enfin, lorsque le sens dun article ou dun
bouton vous chappe, il vous suffira dessayer pour
comprendre trs vite son utilit.
Pour toutes ces raisons, vous naurez aucune difficult
vous servir de votre logiciel et peut-tre pourrez-vous
mme vous passer du manuel. Mais vous risquez alors de
le sous-utiliser ou de vous compliquer inutilement la vie. En
effet, toutes les possibilits qu'il offre ne sont pas
galement visibles ni toujours trs comprhensibles au
premier abord et vous risquez de passer ct de
fonctions trs utiles.
Le premier objectif de ce manuel est de vous faire
dcouvrir tout ce que vous pourrez faire avec le logiciel. A
cette fin, il est organis en doubles pages dveloppant une
tche, une fonction, un rsultat que vous pourrez
entreprendre ou raliser.
La partie de droite vous montre le logiciel, ses crans, ses
menus, ses dialogues et les tats (tableaux, graphiques)
quil permet de produire.

La partie de gauche situe ce que fait le logiciel en terme de


finalit, dutilit et de mthodes mises en uvre. Vous y
trouverez galement une explication dtaille des modes
opratoires.
Si vous tes dj utilisateur du Sphinx, vous pourrez
rapidement identifier les nombreuses nouveauts et vous
retrouverez facilement vos habitudes.
Si vous dcouvrez ce logiciel, vous comprendrez
facilement son organisation et son systme de
fonctionnement. La visite guide que nous vous proposons
en tout dbut du manuel vous accompagnera dans vos
premiers pas. En vous reportant ensuite au manuel vous
apprendrez vous en servir compltement et deviendrez
des experts.
En vous souhaitant un bon travail.
Yves Baulac, Jean Moscarola

Sommaire
Avant de commencer.............................8
1. L'organisation du Sphinx et les
diffrents logiciels ......................................9
2. A l'intention des utilisateurs d'une
version antrieure du Sphinx...................11

Le Sphinx en quelques pages.............14


1.
2.
3.
4.
5.
6.

Bref parcours initiatique...........................15


Llaboration du questionnaire ................19
La saisie des rponses............................22
Les traitements ........................................24
Analyser des donnes textuelles.............31
Utiliser toutes les possibilits du
Sphinx......................................................34

Elaborer le questionnaire ....................38


1. Pour commencer votre travail .................39
2. Les modles de questionnaire ................41
3. Cration dune nouvelle enqute.............43
4. Rdaction des questions .........................45
5. Bibliothque de questions .......................47
6. Questions rponses fermes ...............49
7. Questions ouvertes..................................51
8. Codes, dates et QCM ..............................53
9. Organiser le questionnaire ......................55
10.Groupes de questions .............................57
11.Renvois Restrictions.............................59
12.Modifier le questionnaire pendant et
aprs la saisie..........................................61
13.Mettre en page le questionnaire
papier.......................................................63
14.Options de mise en page ........................65
15.Impression du questionnaire ...................67
16.Exporter le questionnaire ........................69

Saisir les rponses ..............................72


1. Les diffrentes sources de donnes .......73
2. Saisie des rponses ................................75
Sphinx 2000

3. Consultation et modification.................... 77
4. Options et contrles de saisie................. 79
5. Rassembler / Fusionner.......................... 81
6. Importer des rponses*........................... 83
7. Gestion de panels*.................................. 85
8. Documenter depuis le panel ................... 87
9. Scanner et Internet.................................. 89
10.Redresser un chantillon ........................ 91
11.Changer dunit statistique Eclater
des observations*.................................... 93
12.Changer lunit statistique
Regrouper des observations* ................. 95
13.Outils complmentaires sur les
rponses* ................................................ 97

Produire des rsultats .......................100


1. Dpouiller .............................................. 101
2. Environnements de dpouillement et
danalyse ............................................... 103
3. Naviguer dans les tableaux de
rsultats................................................. 105
4. Tableaux rcapitulatifs .......................... 107
5. Utiliser les strates.................................. 109
6. Filtres de slection ................................ 111
7. Produire automatiquement un rapport
complexe (Plan de dpouillement)........ 113
8. Produire des listes................................. 115
9. Caractriser les cellules d'un tableau ... 117

Modifier les donnes en les


recodant..............................................120
1.
2.
3.
4.
5.
6.
7.

Questions et variables .......................... 121


Recoder................................................. 123
Tableaux de listes : codes et dates....... 125
Calculer un barme............................... 127
Transformer une variable...................... 129
Calculer une nouvelle variable* ............ 131
Recalculer une variable et utiliser les
modles* ............................................... 133
8. Combiner des variables*....................... 135
9. Modifier des variables*.......................... 137
10.Dcrire des observations en cours
danalyse ............................................... 139

Avant de commencer

Analyse univarie, les tableaux


plat ......................................................142
1. Les diffrents niveaux danalyse ...........143
2. Tableaux plat des questions
nominales ..............................................145
3. Mettre en forme les tableaux plat .......147
4. Les graphiques plat ............................149
5. Tris plat : tests sur les variables
nominales ..............................................151
6. Tableaux plat des questions
numriques et chelles..........................153
7. Tableaux plat : tests sur les
variables numriques.............................155
8. Dpouiller les questions "Autre,
prcisez" ................................................157

Analyses bivaries, les tableaux


croiss ................................................160
1.
2.
3.
4.

Croiser 2 variables.................................161
Mettre en forme un tableau crois.........163
Tableaux croiss : les graphiques .........165
Tableaux croiss : tests statistiques
et AFC....................................................167
5. Tableaux de moyennes .........................169
6. Graphes de dispersion ..........................171
7. Graphiques "2 critres"..........................173
8. Rduction des dimensions d'un
tableau de moyennes (carte ACP) ........175
9. Prsentation des cartes factorielles.......177
10.Corrlation et nuage de points ..............179
11.Typologies et scores par rapport 2
dimensions.............................................181
12.Reprendre des analyses........................183
13.Dterminer une analyse ........................185

Tableaux et graphiques de
synthse .............................................188
1. Les analyses synthtiques ....................189
2. Les tableaux de groupes et tableaux
accols...................................................191
3. Les tableaux croiss multiples...............193
4. Les tableaux de caractristiques ...........195
5. Elaborer un tableau de
caractristiques......................................197
4

6. Les tableaux de modalits


spcifiques* ........................................... 199
7. Les tableaux composs* ....................... 201
8. Les baromtres ..................................... 203
9. Les dpouillements gnraliss* .......... 205
10.Importance et Performance................... 207

Analyses multivaries* .....................210


1.
2.
3.
4.

Approfondir............................................ 211
Classification automatique .................... 213
Analyser une classification.................... 215
Analyse de la variance 2 facteurs
(MANOVA) ............................................ 217
5. Corrlation et rgression multiple ......... 219
6. Corrlation multiple et graphe de
positionnement ...................................... 221
7. Analyse en composantes principales.... 223
8. Analyse factorielle multiple.................... 225
9. Prsentation des cartes factorielles ...... 227
10.Calcul des facteurs et choix du plan
factoriel.................................................. 229
11.Construire interactivement une
typologie ................................................ 231

Traitement simple des questions


textes ..................................................234
1.
2.
3.
4.

Etudier les textes................................... 235


Faire du verbatim .................................. 237
Tableau de rponses ouvertes.............. 239
Analyse de contenu............................... 241

L'analyse lexicale en bref..................244


1. Les interfaces ........................................ 245
2. Du texte aux formes graphiques lapproximation lexicale ......................... 247
3. Du texte aux structures linguistiques :
la statistique lexicale ............................. 249
4. Latelier lexical en bref .......................... 251
5. Le panneau lexical : produire des
lexiques ................................................. 253
6. Le panneau lexical : segments
rpts et lexiques relatifs .................... 255
7. Le panneau lexical : du bilan aux
rponses caractristiques ..................... 257

La construction des lexiques............260


1. Caractres sparateurs et
environnement.......................................261
2. Rechercher et marquer des lments
dans le lexique.......................................263
3. Rduire les lexiques ..............................265
4. Groupements automatiques ..................267
5. La gestion des dictionnaires..................269
6. Les diffrents types de dictionnaires .....271
7. Lexique des expressions** ....................273
8. Rechercher les segments rpts**......275

Navigation lexicale et recherche


de contexte .........................................278
1. Du lexique au corpus : la navigation
lexicale...................................................279
2. Situer un mot dans son contexte
textuel ....................................................281
3. Les lexiques relatifs** ............................283
4. Production d'extraits ..............................285
5. Rsum des diffrentes manires de
produire des extraits ..............................287

Analyse syntaxique et
lemmatisation** ..................................290
1.
2.
3.
4.

La lemmatisation ...................................291
Lancer la lemmatisation ........................293
Analyser un texte lemmatis .................295
Modifier le corpus ..................................297

La statistique lexicale** .....................300


1.
2.
3.
4.
5.

Les indicateurs lexicaux ........................301


Bilan lexical............................................303
Construire un tableau lexical .................305
Listes des mots spcifiques ..................307
Slections dans un tableau lexical ou
dans des listes de mots spcifiques......309
6. L'indice de spcificit.............................311
7. Comparer un lexique de rfrence.....313

Sphinx 2000

Codification automatique des


textes...................................................316
1. Crer de nouvelles variables
dorigine lexicale.................................... 317
2. Codification lexicale .............................. 319
3. Mesures lexicales.................................. 321
4. Modification du contenu d'une
variable texte......................................... 323
5. Fractionner une variable texte .............. 325

Ouvrir un fichier de donnes


textuelles**..........................................328
1. Du corpus textuel la base de
donnes ................................................ 329
2. Ouvrir un texte analyser..................... 331
3. Texte balis........................................... 333
4. Prparer et ouvrir un fichiers
d'entretiens semi-directifs ..................... 335
5. Texte annot ......................................... 337
6. Exemples de textes annots................. 339
7. Macro commandes pour la
prparation des textes .......................... 341

Travailler avec le Sphinx ...................344


1. Enregistrements et fichiers ................... 345
2. Imprimer, publier, prparer les
rapports ................................................. 347
3. Inclure dans le rapport .......................... 349
4. Aperu rapide........................................ 351
5. Prfrences........................................... 353
6. Acclrateurs et raccourcis................... 355
7. Travailler avec des donnes externes .. 357
8. Ouvrir un fichier de donnes................. 359

Eurka ! le compagnon du Sphinx ...362


1. Amliorer la communication grce
aux modules complmentaires ............. 363
2. Mettre en forme les questionnaires
Papier .............................................. 365
3. Enqutes "Internet et Email" ................. 367
4. Enqutes "Disquette ou Rseau".......... 369
5. Communiquer les rsultats ................... 371

Avant de commencer

Mthodologie......................................374
Rappel des principes de lenqute par
questionnaire .........................................375
Les diffrentes formes d'enqutes..............377
Un modle pour concevoir un bon
questionnaire .........................................379
Des questions qu'on se pose aux
questions qu'on pose.............................381
La manire de poser les questions.............383
L'art du questionnaire : la logique de
l'entretien ...............................................385
L'art du questionnaire : la logique de
l'analyse .................................................386
Thorie des sondages et estimation
statistique...............................................387
Dfinir le bon chantillon ............................389
Les formes de l'analyse de donnes ..........391
L'analyse univarie .....................................393
L'analyse bivarie .......................................395
Lanalyse bivarie : Chi2 et AFC ................397
L'analyse bivarie : corrlation ...................399
L'analyse bivarie : analyse de la
variance .................................................401
Analyse multivarie : objectifs et
mthodes ...............................................403
L'analyse factorielle : les principes .............405
L'analyse factorielle : interprter les
rsultats .................................................407
Corrlation et rgression multiple ...............409
Classification automatique..........................411

Table des matires dtaille .............414


Bibliographie ......................................428

Sphinx 2000

Avant de commencer

Avant de
commencer

1. L'organisation du Sphinx et les


diffrents logiciels

ouvrir et analyser tout fichier contenant des nombres


et/ou du texte. Outil danalyse statistique ouvert, le
Sphinx vous permet danalyser toutes vos donnes quelle
que soit leur origine.

Le Sphinx Lexica

Les quatre stades d'une tude


Les logiciels du Sphinx suivent les grandes tapes d'une
tude : la ralisation du questionnaire, la saisie des
rponses, les traitements quantitatifs, l'analyse des
donnes qualitatives et la rdaction du rapport dtude.

Les trois niveaux de logiciels


Les logiciels du Sphinx existent sous trois formes : Le
Sphinx Primo, Le Sphinx Plus et Le Sphinx Lexica.
Chaque logiciel permet d'accomplir toutes les tapes dune
tude : le questionnaire, la saisie, les traitements
quantitatifs et qualitatifs. Ils se distinguent cependant au
niveau :
des traitements par des comptences plus tendues en
analyse quantitative pour Plus, qui ajoute notamment
des possibilits d'analyse multivarie, et pour Lexica qui
approfondit encore les possibilits d'analyse lexicale
introduites dans Plus ;
de l'ouverture de donnes : Primo est limit sur les seules
donnes qu'il permet de saisir, Plus permet de traiter des
bases de donnes existantes et Lexica ouvre n'importe
quel texte.

Le Sphinx Primo
Avec le Sphinx Primo, vous pouvez :
concevoir votre questionnaire, saisir vos rponses et
dpouiller vos propres enqutes. Du questionnaire au
rapport, vous disposez dun outil pratique et puissant ;
dtailler vos donnes denqutes. Quil sagisse de
vrifier les rsultats et corriger les donnes, de prparer
et diter des listes, de rechercher les particularits de
certains individus, vous pourrez trs facilement naviguer
dans vos donnes. Le Sphinx est aussi un puissant
explorateur de donnes.

Le Sphinx Plus2

Enfin avec Le Sphinx Lexica, vous pourrez enrichir


considrablement les possibilits danalyse de contenu et
danalyse lexicale dj prsentes dans Primo ou Plus.
Vous aborderez ainsi indiffremment les questions
ouvertes de vos enqutes, vos interviews non directives,
vos compte-rendus dentretiens ou tout autre texte quelle
quen soit lorigine :
Construire et grer des listes de mots et dexpressions,
Effectuer des analyses thmatiques,
Produire des extraits de textes et restituer des phrases
caractristiques,
Calculer des statistiques lexicales qui permettent de
quantifier vos textes
Dans la suite du manuel, lorsque cela sera ncessaire,
nous mentionnerons respectivement par (*) et (**) les
fonctions spcifiques Plus et Lexica.

Version 2000 et versions antrieures


Cette version de Sphinx Primo, Plus et Lexica reconnatra
bien sr toutes les enqutes que vous avez pu crer avec
dautres versions de Sphinx (Version 2000 pour Windows,
Versions 1 et 2 pour Windows, Version Macintosh). Et
linverse, si vous voulez reprendre, dans des versions
antrieures de Sphinx, des enqutes cres dans cette
version, utilisez larticle Enregistrer sous / Convertir
lenqute du menu Fichier.

Eurka !
Le Sphinx est totalement compatible avec Eurka ! le
logiciel compagnon du Sphinx qui vous permettra par
exemple :
La publication d'une enqute sur Internet
La mise en forme de formulaires de haute qualit
La programmation de tableaux de bord automatiss.

Le Sphinx Plus vous permettra en outre de :


approfondir vos analyses grce aux techniques
statistiques avances de lanalyse multidimensionnelle:
analyse factorielle, classification, typologie, analyse de la
variance ;
enrichir votre base de donnes initiale en calculant de
nouvelles variables ;
Sphinx 2000

Avant de commencer

Rdiger le
questionnaire

Traitements
quantitatifs

10

Saisir les
rponses

Analyse des donnes


textuelles

Les questions

Aide en ligne

Les rponses

Aperu

Les rsultats

Eurka!

2. A l'intention des utilisateurs


d'une version antrieure du Sphinx
Si vous possdez dj une ou plusieurs licences des
logiciels Sphinx, la version 2000 prsente une mise jour
trs significative pour Primo, Plus et Lexica.

Les nouveauts
Les principes et lesprit restent les mmes : vous
retrouverez les fonctions que vous connaissez dj.
Avec Windows 95, Windows 98, Windows NT et les
nouveaux systmes, la capacit dadressage 32 bits
autorise le traitement de donnes trs volumineuses sans
sacrifier la rapidit. Le Sphinx 2000 y gagne une capacit
de traitement illimite et encore plus de vivacit. Termines
les limitations 32000 observations, 1000 variables..., les
mgabases soffrent vous comme les enqutes les plus
monstrueuses comptes en millions dobservations. Mais
comme tout se paie, vous ne pourrez pas les faire
fonctionner sous Windows 3.1 !
Cette nouvelle puissance a aussi permis de donner au
logiciel son nouveau look, la matire est plus riche,
linterface plus sduisante mais toujours aussi efficace.
Les nouvelles capacits enrichissent les trois stades : la
dfinition des questionnaires, la saisie des rponses, le
traitement des donnes ainsi que lanalyse lexicale qui,
dans Lexica, fait lobjet dun nouveau stade.
Vous dcouvrirez galement un nouvel environnement
pour la prsentation des rsultats des questions ouvertes,
des codes et des variables dates, ainsi quune intgration
forte avec 2 autres produits du Sphinx : le module de saisie
par scanner et le logiciel Eurka!

Compatibilit avec les anciennes


versions
Vous pourrez reprendre tous vos anciens fichiers, le Sphinx
2000 les reconnatra. Dans le sens inverse, utilisez loption
de conversion du format 2000 aux formats antrieurs
(Menu Fichier, Article Enregistrer sous / Convertir
lenqute pour Sphinx V2).

Sphinx 2000

Avant de commencer

11

Les principales nouvelles fonctions


Traitements et analyses

Elaboration du questionnaire

Titre des parties


Dplacement par bloc de questions
Grouper des questions
Questions codes et dates
Barme associ aux questions
Permutation des modalits
Ne rpondre que si
Modification en cours de saisie
Mise en page
Saisie scanner
Saisie via Internet

Saisie des rponses

Options de saisie
Restriction la saisie
La gestion de panel
Fusionner 2 enqutes
Changement dunit statistique
Scanner et autres modes de saisie
Redressements dchantillons multicritres
Strates pour les redressements
Comparer des fichiers
Importer une base de donnes (ODBC)
Supprimer les doublons

Travailler avec Le Sphinx

12

Lecture de toutes les anciennes versions


Rorganisation des fichiers
Retrouver une enqute
Sauvegarde de scurit
Nombre de rponses illimit
Rorganisation des menus
Nouvel environnement pour les tableaux
Passerelles Atelier lexical/Tableaux de texte
Conversion au format de la version 2
Passerelle avec Eurka!

Tableaux de rponses textes


Tableaux de codes
Tableaux de dates
Tableaux croiss de questions ouvertes
Dpouillements gnraliss
Tableaux composs
Calculer un barme
Graphiques 3D
Radars, Anneaux
Paramtrage des graphiques
Baromtre
Lisibilit des cartes factorielles
Enregistrer les dpouillements
Tableaux croiss de moyennes
Manova
Analyse de contenu
Annoter et dcrire
Calcul de nouvelles variables
Modles de calcul
Assistant pour dterminer une analyse

Analyse de donnes textuelles

Ouvrir un texte
Panneau lexical
Segments rpts
Noms, verbes, adjectifs
Phrases caractristiques
Mots spcifiques
Traits grammaticaux (temps verbaux)
Conservation des groupements
Groupements automatiques par racine
Comparer un lexique de rfrence

Sphinx 2000

Avant de commencer

13

Le Sphinx en
quelques pages

14

1. Bref parcours initiatique


Le Sphinx se conduit comme tout logiciel Windows en
droulant un menu, en cliquant sur un bouton ou en
rpondant un dialogue Les conventions habituelles de
Windows sont respectes, des garde-fous contre les
oprations illicites prviennent les fausses manuvres,
des instructions sont donnes ds que cest ncessaire.

Pour rdiger la question suivante, deux possibilits soffrent


vous : vous cliquez sur le bouton Nouvelle question ou
vous cliquez sur le bouton OK pour revenir sur la liste des
questions et vous faites un double-clic dans la partie vierge
de lcran. Vous pouvez alors rdiger la question suivante
dont les lments sont reproduits dans la figure ci-dessous.

Si vous hsitez, essayez, vous ne risquez rien et bien


souvent les choses sclairciront delles-mmes. Vous
pouvez galement consulter laide en ligne (par la touche
F1 ou larticle Index de laide du menu ?).
Pour vous aider dcouvrir lorganisation gnrale du
logiciel, voici un bref parcours initiatique au travers dun
mini sondage Sortie des urnes.
Dans le document qui suit, les mots en caractres gras et
italiques correspondent des mots qui apparaissent sur
lcran dans les menus ou les dialogues. Les textes entre
guillemets et en caractres italiques sont recopier dans
les zones indiques.

Crer une nouvelle enqute


Dmarrez le logiciel en cliquant sur son icne. Dans le
dialogue qui apparat, cliquez sur le bouton Nouvelle
enqute et loption Nouveau questionnaire vierge.
Une fentre prsente les attributs Titre, Commentaire,
Priode, Organisme. Inutile de les remplir. Allez tout de
suite rdiger les questions en validant loption Commencer
par la dfinition des questions.

Dfinir le questionnaire
Il sagit alors de dcrire la premire question dans le
dialogue qui apparat. Cliquez dans la zone Libell et
tapez le texte de la question : Pouvez-vous me dire pour
qui vous venez de voter ?. Cliquez dans la zone Variable
et tapez VOTE. Ce nom abrg servira pour reprer la
question lors des dpouillements.
La question attend une seule rponse et il y a 5 candidats.
La question est dite ferme unique (slectionnez ce type
dans la liste propose) et les noms des candidats sont les
modalits de rponses. Cliquez dans la zone Modalits et
tapez Lenoir ; Leblanc ; Lebleu ; Lerouge ; Levert.

Sphinx 2000

Cliquez sur le bouton OK. Les deux questions apparaissent


dans la liste. La troisime concerne le rsultat envisag de
llection : A votre avis, quels sont les trois candidats ayant
le plus de chances de lemporter ?. Cette question aura les
mmes modalits de rponses que la premire question.
Plutt que de taper le nom des candidats une seconde fois,
oprez de la manire suivante.
Dans la liste des questions, cliquez sur la question n1 qui
apparat en inverse vido, et dans le menu Rdiger,
choisissez larticle Dupliquer les questions. Le dialogue
de dfinition dune troisime question vous est prsent
avec les lments de la premire.
Changez le libell de la question, et tapez PROBABLES
dans la zone Variable. Attention, cette question peut
amener plusieurs rponses, une personne interroge
pouvant envisager llection probable de plusieurs
candidats. Slectionnez donc le type Ferme multiple et
tapez 3 dans la zone Nombre de rponses possibles.
Cliquez sur OK. La liste des questions saffiche lcran.
Droulez les menus Rdiger et Organiser, pour voir la
liste des diffrentes fonctions (Utiliser la bibliothque,
Dfinir des renvois, Grouper des questions,) dont
vous aurez sans doute besoin lors de vos tudes.

Le Sphinx en quelques pages

15

Saisir des rponses


Vous avez fini de rdiger votre questionnaire, vous allez
passer la saisie des rponses. Dans le menu Stade,
choisissez larticle Saisie des rponses.
Votre enqute na pas encore t enregistre sur le disque
dur de votre ordinateur, il est ncessaire de le faire
maintenant dans le dialogue qui vous est prsent. Dans la
zone Nom de fichier, tapez election puis cliquez sur OK.
Lcran qui apparat est la plaque tournante de ce stade :

Pour saisir la rponse la troisime question, cliquez sur


les noms des candidats retenus (vous remarquez que cette
fois les cases sont des carrs et que plusieurs rponses
peuvent tre coches).
Le bouton de passage la question suivante est devenu
Enreg..
En effet, cest la dernire question saisir ; en cliquant sur
ce bouton, vous validez ce questionnaire, qui sera
enregistr automatiquement, et vous passez un nouvel
individu pour saisir sa rponse la premire question.
Des indications sont donnes sur ltat de la saisie, les
fonctions principales sont accessibles par les boutons de
droite, dautres fonctions sont runies dans les menus
Saisir et Grer.

Continuez ainsi pour saisir une dizaine dobservations. Au


lieu de cliquer sur le nom dun candidat, vous pouvez aussi
taper le numro correspondant. Cliquez sur le bouton
Termin lorsque vous en avez fini.

Droulez ces menus, ici aussi dans le seul but de voir les
diffrentes fonctions (Rassembler/Fusionner par exemple
qui vous permettra de runir plusieurs enqutes partielles
pour les dpouiller ensemble).

Si vous avez fait une erreur dans le questionnaire en cours,


vous pouvez utiliser le bouton
pour revenir en arrire. Si
lerreur est dans un questionnaire antrieur, vous utiliserez
la fonction Consulter et Modifier.

Vous allez saisir quelques rponses factices. Cliquez sur le


bouton Saisie directe. Lcran propose la premire
question, chaque modalit de rponse (cest--dire chaque
candidat) est affubl dun rond. Vous allez cocher le rond
du candidat choisi par le premier individu interrog.
Tapez une valeur, 2 par exemple, puis passez la question
suivante en utilisant la touche ENTREE du clavier. Si vous
vous tes tromp, corrigez en cliquant sur le bon candidat.

16

Dpouiller et analyser les rsultats


Maintenant, si vous navez pas fait derreur et si vous avez
saisi tous vos questionnaires, passez au stade des
Traitements et analyses. Pour cela, cliquez sur le bouton
Traitements de lcran principal. Le contenu de cet cran
change : les boutons sont maintenant libells au nom des
principales fonctions de ce stade.

Cliquez sur le bouton Rsultats. Le Sphinx construit alors


tous les tableaux de rsultats et vous les propose lcran.
Cest dabord le rsultat la premire question qui est
propos. Pour chaque candidat, on lit le nombre de fois o
il a t cit et le pourcentage correspondant.
Cliquez sur le bouton-radio Graphique, en bas gauche,
pour voir le dpouillement de cette question sous une
forme graphique.

Aprs un court temps de calcul, le Sphinx vous montre le


tableau crois dans une fentre munie de boutons de
commande qui vous permettront plus tard daccder aux
diffrents tests et options. Cliquez simplement sur le
bouton Graphique pour visualiser le rsultat sous une
forme graphique et revenez sur le tableau.

Les boutons
et
ainsi que la liste droulante des
variables en bas droite de lcran permettent daccder
aux autres tableaux. Vous prenez connaissance des
rsultats, question par question. Droulez les menus
Dpouiller, Recoder et Analyser. Ces menus proposent
laccs aux fonctions danalyse de donnes qui vous
permettront de produire des statistiques sur une ou
plusieurs questions simultanment.
Par exemple, vous pouvez tudier lhypothse que les
individus sont optimistes et que le candidat pour qui ils ont
vot a des chances dtre lu. Vous allez donc construire le
tableau crois de la variable VOTE par la variable
PROBABLE, en choisissant larticle Tableaux croiss
dans le menu Analyser.
Le dialogue qui apparat vous permet de dfinir un ou
plusieurs tris croiss. Droulez la liste Variable 1 et
choisissez la ligne VOTE. Droulez la liste Variable 2 et
choisissez la ligne PROBABLE. Cliquez maintenant sur le
bouton Croiser V1 et V2 puis sur le bouton Analyser.

Sphinx 2000

Faites un double-clic sur une des cases du tableau. Le


Sphinx vous indique alors, dans un nouveau dialogue,
quels sont les individus qui correspondent cette case.
Vous pourrez facilement les retrouver, les corriger, faire
apparatre leurs rponses une autre variable et leur
spcificit. Cliquez sur Fermer pour faire disparatre ce
dialogue dexploration.

Prparer le rapport
Vous allez, pour finir, conserver une trace de ce premier
rsultat : dans le menu Fichier, choisissez larticle
Imprimer, puis cliquez sur OK dans le dialogue propos. Si
une imprimante est connecte, une page contenant le
tableau et le graphique sera produite. Enfin, vous allez
pouvoir commencer un rapport sur cette brillante tude :
dans le menu Fichier, choisissez larticle Inclure dans le
rapport. Dans le dialogue suivant, slectionnez le
traitement de textes que vous utilisez et cliquez sur OK. Le
Sphinx recopie les lments de votre analyse dans votre
traitement de textes, l o le curseur est plac. Un
message vous signale la fin de lopration.
Utilisez la combinaison de touches ALT+TAB (cest un des
secrets du travail efficace avec Windows) pour visualiser le
rsultat dans le traitement de textes. Utilisez nouveau
ALT+TAB pour revenir dans Sphinx.

Le Sphinx en quelques pages

17

Ce bref synopsis vous a permis de vous familiariser avec la


manipulation des menus et des dialogues du Sphinx. Vous
avez galement not la structuration du travail en trois
tapes : la conception du questionnaire, la saisie des
rponses, les traitements et les analyses. En effet, les
logiciels du Sphinx, quelle que soit leur version (Primo,
Plus ou Lexica), sont organiss autour des 3 stades que
comporte habituellement toute enqute d'opinion ou tude
par observation directe :
llaboration du questionnaire ou grille dobservation ;
la saisie des rponses ou des observations ;
les traitements, dpouillements et analyses.
Ces trois tapes font lobjet du menu Stade. Selon
lavancement du travail, ce menu permet de se placer dans
lun des environnements suivants : Questionnaire,
Rponses, ou Traitements :

Allez la dcouverte de chacune de ces tapes en vous


reportant aux chapitres suivants.

18

2. Llaboration du questionnaire
Le questionnaire est la liste des questions poses
lchantillon (lensemble des personnes interroges). Dans
le cas de la construction dune grille dobservation, chaque
lment composant la grille est assimil une question.

1.1 Dfinition des questions


La premire tape consiste rdiger successivement
toutes les questions en dfinissant, dans les crans prvus
cet effet, tous les lments qui composent chacune des
questions. Toutes les options disponibles pour crer les
questions sont accessibles dans le menu Rdiger :

Dans le cadre de la dfinition des questions, on distingue,


selon la forme de la rponse attendue :

Les questions rponse(s) ferme(s) :


Les modalits de rponses possibles sont numres a
priori :
Ferme unique : une seule possibilit de rponse parmi
les modalits proposes ;
Ferme chelle : parmi les modalits disposes sur une
chelle ordonne, une seule rponse peut tre choisie ;
Ferme multiple : plusieurs possibilits de rponses
peuvent tre slectionnes simultanment, avec la
possibilit ventuelle de les ordonner selon un ordre de
prfrence.

Les questions rponse(s) ouverte(s) :


les rponses ne sont pas numres a priori :
numrique : la rponse est un nombre dont lunit est
dfinie dans la question ;
texte : la rponse est un ensemble de mots, une phrase
ou un texte ;
Sphinx 2000

code : la rponse est un code alpha-numrique ;


date : la rponse est une date ou une heure dont le
format peut tre prcis.
Aprs avoir choisi larticle Nouvelle enqute du menu
Fichier, vous pouvez vous inspirer dun des modles de
questionnaires que nous vous proposons ou commencer
une nouvelle enqute en lui donnant un titre. Pour dfinir
votre premire question, utilisez dans le menu Rdiger
larticle Nouvelle Question ou effectuez un double clic sur
la page blanche, puis documentez les lments prsents
dans la fentre de dfinition des questions.

Entrez le texte de la question, le nom de la variable


correspondante (cest--dire un titre abrg), et indiquez la
nature de la rponse attendue en slectionnant un type de
variable. Pour les questions rponses fermes, numrez
les modalits en les sparant par un point virgule. Affinez
ventuellement la dfinition de vos questions avec le
bouton Contrles.
Si vous manquez dinspiration, ou si vous voulez gagner du
temps, le bouton Bibliothque vous donne accs des
questions pralablement dfinies dans le Sphinx.
Slectionnez la question que vous souhaitez intgrer dans
votre questionnaire et recopiez-la en utilisant le bouton
Remplir.
Vous pourrez galement crer votre propre bibliothque de
questions ou enrichir celle que nous vous proposons en lui
ajoutant les questions que vous tes amen utiliser
frquemment dans vos enqutes.

Le Sphinx en quelques pages

19

Organisation du questionnaire
Pour amliorer la prsentation de votre questionnaire, de
nombreuses options permettent dorganiser et de structurer
votre liste de questions. Et pour le rendre plus souple, de
nombreuses possibilits de modification sont disponibles.
Utilisez pour cela le menu Organiser.

Edition du questionnaire

Grce aux fonctions Nouveau titre et Insrer un titre,


vous pouvez structurer votre questionnaire en grandes
parties auxquelles vous attribuez un titre. Ces options vous
permettent aussi dindiquer, sur votre questionnaire, des
consignes aux enquteurs ou aux rpondants.
Avec le menu Organiser, vous avez la possibilit de
construire des tableaux de questions. Pour cela, dfinissez
dabord chacune des questions du groupe, puis
slectionnez-les dans la liste des questions et utilisez la
fonction Grouper des questions.
Par ailleurs, des renvois entre questions peuvent tre
dfinis ainsi que des conditions de prsentation des
questions. Ces options provoqueront des sauts et des
contrles automatiques au moment de la saisie.
Vous pouvez aussi restructurer votre questionnaire tout
moment en modifiant, en ajoutant ou en supprimant vos
questions et vos modalits de rponses. Enfin, il est
possible de dplacer une question ou un groupe de
questions : il suffit pour cela de placer le curseur sur la
bande gauche de la liste des questions (il prend la forme
dune main) et de le faire glisser lendroit souhait.

20

Vous terminerez votre travail sur le questionnaire dans la


fonction Mettre en page du menu Fichier en choisissant la
prsentation adapte vos attentes. Ces options offrent
une grande souplesse dans la mise en page du
questionnaire : dition du questionnaire sur plusieurs
colonnes, position des modalits de rponses, contenu de
len-tte du questionnaire, etc.
La mise en page du questionnaire tant effectue dans le
Sphinx, le questionnaire peut tre imprim. Vous
obtiendrez alors les documents professionnels que vous
attendez, comme vous le montrent les deux exemples
suivants.
Si vous souhaitez bnficier doptions supplmentaires de
prsentation qui vous permettront de personnaliser votre
questionnaire, nous vous conseillons alors de le transfrer
dans votre traitement de textes (fonction Inclure dans le
rapport du menu Fichier). Vous pourrez alors lui apporter
toutes les modifications que vous souhaitez. Pour raliser
la mise en page, dans le but de relire les rponses par
lecture optique, vous pouvez disposer dun module
complmentaire qui cre automatiquement un formulaire
prt scanner.

Prsentation du questionnaire avec rponses


en vis--vis des questions :

Sphinx 2000

Prsentation du questionnaire avec rponses


sous les questions :

Le Sphinx en quelques pages

21

3. La saisie des rponses


Au stade de la saisie, le Sphinx vous offre plusieurs
possibilits pour saisir les rponses. Celles-ci sont
accessibles dans le menu Saisir.

En saisie rapide, toutes les questions dun individu,


repres par leur nom de variable, sont prsentes sur le
mme cran. La saisie se fait au clavier en tapant le
numro de la modalit retenue. Le passage la question
suivante est automatique, ce qui permet de faire de la
saisie au kilomtre. Les codes errons sont refuss.

De nombreuses possibilits vous sont offertes pour la


collecte des donnes :
Saisie clavier en mode direct ou rapide ;
Saisie par lecture optique ou via Internet ;
Importation de fichiers existants.

Les nouvelles technologies de saisie


Saisie directe ou saisie rapide
En saisie directe, apparat lcran une seule question ou
un tableau de questions dans le cas des questions
groupes. On saisit la rponse en cliquant dans la case de
la modalit retenue ou en entrant le numro de la modalit
au clavier. Cest le mode CATI particulirement adapt
ladministration tlphonique de questionnaires.

Vous pouvez lire avec un scanner les questionnaires


raliss dans le Sphinx et imprims depuis le module Le
Sphinx pour le scanner . Vous lancerez le module de
lecture par scanner partir du menu Saisir.
Vous pouvez aussi administrer vos questionnaires via
Internet : le module Le Sphinx et lInternet transforme
un questionnaire construit dans Sphinx en format Html et
permet la rcupration de toutes les rponses dans un
fichier Sphinx qui peut tre directement dpouill.

Consultation et correction
Les vrifications et les corrections de donnes sont
considrablement facilites par lusage de larticle
Chercher qui permet de ne revoir et corriger que les
observations rpondant aux conditions que vous fixez.
Vous pourrez galement complter aprs coup une saisie
en vous plaant sur la strate de votre choix pour organiser
ainsi une saisie slective.
Enfin, en mode tableur, vous visualiserez dun seul coup
dil toute votre base de donnes, avec affichage des
individus en ligne et des variables en colonne.
22

(*) Si vous grez des panels, avec le Sphinx Plus, vous


pourrez trs simplement effectuer toutes les tches
ncessaires lexploitation dun panel : dfinir la base de
donnes qui contient les informations concernant les
panlistes, slectionner les panlistes, documenter les
campagnes, et mettre jour le panel. Toutes ces
possibilits sont offertes dans larticle Grer un panel.
(*) Des redressements dchantillons peuvent tre
effectus selon la rpartition dune ou plusieurs variables
de la base. Il faut pour cela utiliser la fonction Redresser /
Dfinir des quotas. Ces redressements donnent lieu la
cration de nouvelles strates ou de nouvelles enqutes
dont les rpondants respectent les quotas spcifis.

Organisation de la saisie
Outre la saisie classique, le Sphinx propose des fonctions
de gestion de donnes dans le menu Grer :

(*) Vous pouvez enfin changer dunit statistique en cours


dtude pour ddoubler chaque observation en nouvelles
fiches correspondant aux diffrentes parties dun
questionnaire par exemple. Ex : dans le cas du
recensement, ltude est ralise dabord sur les
logements, puis sur les individus qui lhabitent.

Vous pouvez rpartir la saisie dune enqute sur plusieurs


postes et runir tous les fichiers de rponses dans une
mme enqute en utilisant larticle Rassembler /
Fusionner.
(*) Si vous avez des donnes saisies dans dautres
logiciels (traitements de textes ou tableurs par exemple),
elles peuvent tre importes dans le Sphinx Plus ou le
Sphinx Lexica aprs dfinition du questionnaire
correspondant (Importer des donnes). A linverse, toutes
les versions des logiciels Sphinx permettent de transfrer
des donnes vers des fichiers de format Ascii (fonction
Enregistrer sous / Exporter les donnes du menu
Fichier).

Sphinx 2000

Le Sphinx en quelques pages

23

4. Les traitements
Une fois les rponses saisies, le Sphinx offre un trs grand
nombre dinvestigations propres satisfaire toutes les
curiosits, des plus simples aux plus complexes.
A ce stade, on sintresse au contenu des rponses. On
parle alors de variables (nominales, numriques ou textes)
car il sagit dexaminer la diversit des rponses apportes,
leur variation, leur rptition dun individu lautre, et les
relations que ces variations permettent de mettre en
vidence.
Les dnombrements et calculs que la statistique autorisent
sont alors utiliss pour rechercher les proprits et
structures remarquables des donnes.
Les quatre menus du stade Traitements et Analyses
organisent ces possibilits selon une graduation de
complexit croissante.

sur une strate : les dpouillements peuvent tre calculs


sur une strate cest--dire sur un sous-ensemble
dindividus qui rpondent un ou plusieurs critres. La
fonction Strates du menu Dpouiller permet de dfinir de
nouvelles strates et de modifier le sous-chantillon sur
lequel les rsultats sont calculs.

Lancer automatiquement une srie


danalyses
Cette option permet de prparer le travail de dpouillement
en choisissant les variables analyser, les relations quon
souhaite tudier, les prsentations les plus adaptes pour
ces rsultats. Vous pouvez alors les lancer simultanment
sur lchantillon total, ou sur une ou plusieurs strates.
Par exemple : dpouiller les rsultats concernant les
ouvriers uniquement, puis ceux concernant les employs

Dpouiller les rsultats


Ce menu permet de consulter rapidement lensemble des
rsultats de premier niveau sous forme de tableaux,
graphiques ou listes, de dfinir des plans de dpouillement,
et de lancer la production de rapports.

Sortir des listes ou des fiches

Voir les rsultats


Le Sphinx donne la possibilit de visualiser rapidement les
rsultats qui peuvent tre calculs :
sur lchantillon total : larticle Dpouillement automatique
permet davoir un aperu des rsultats sous forme de
tableaux ou graphiques (histogrammes, secteurs, barres,
profils, aires, radars, anneaux). Les sorties sont
effectues indiffremment limprimante, dans un fichier
ou directement dans votre traitement de textes.
24

Plutt que de travailler sur des tableaux statistiques, il est


parfois intressant de lister les donnes individuelles.
Larticle Produire des listes permet ainsi de restituer
certaines des informations saisies, en les regroupant
ventuellement par catgories.
Par exemple : lister le texte de la rponse une question
ouverte, en affichant la profession et le sexe du rpondant
et en prsentant cette liste classe par tranche dge. On
obtient ainsi la liste des rponses, la profession et le sexe
pour les moins de 20 ans dabord et ainsi de suite

Calculer un score (barme)

MARQUE
10%

Pour valuer vos QCM ou pour attribuer une note en


fonction des rponses obtenues, vous pouvez tablir des
barmes en affectant une valeur aux modalits de chaque
question ferme. Larticle Appliquer un barme permettra
ensuite de crer une nouvelle variable dont la valeur est le
score calcul partir du barme.

15%

Non- rponse
Renault

11%

Peugeot
Citron

11%

Talbot
Ford
Fiat

7%

Volkswagen
Opel
Japonaise

Analyser les rsultats

Autre

9%

Les articles de ce menu vous placent dans lenvironnement


danalyse des rsultats de premier niveau. Vous pourrez
ainsi exercer votre rflexion, effectuer des tests
statistiques, mettre en forme et choisir la prsentation de
vos rsultats pour les inclure enfin dans votre rapport.

14%
4%

6%

11%

2%

16%

16%
13%

13%

13%

12%
10%
8%

7%

4%

3%

3%
Ren
ault

Peug
eot

Citro
n

Talbot

Ford

Fiat

Volksw
agen

Opel

Japon
aise

Autre

MARQUE

Du survol des rsultats lanalyse


Rsultats fait passer directement de lenvironnement
danalyse dun tableau particulier la consultation des
rsultats, comme on peut le faire partir du menu
Dpouiller. Inversement, depuis cet environnement de
visualisation des rsultats, le bouton Analyser le tableau
conduit directement lanalyse du tableau.

Renault
Peugeot
Citron
Talbot
Ford
Fiat
Volkswagen
Opel
Japonaise
Autre

13%
10%
13%
3%
7%
4%
16%
8%
13%
12%

MARQUE
Opel

Japonaise

13%
Volkswagen

16%

Autre

8%
12%

Analyse univarie
Fiat

Larticle Tableaux plats permet de choisir une variable


pour lanalyser : dnombrer, calculer des pourcentages,
des moyennes, des carts types et des intervalles de
confiance, comparer des frquences, des distributions
(Chi). Les rsultats des tris plat apparaissent dans des
tableaux mais vous pouvez aussi choisir de les prsenter
dans un des nombreux graphiques proposs ci-contre :
Sphinx 2000

13% Renault

4%
3%

7%

10%
Ford

Le Sphinx en quelques pages

Peugeot
13%
Talbot

Citron

25

Analyser les relations entre


2 variables
Avec les articles Tableaux croiss, Tableaux de
moyennes, ou Corrlations, on peut analyser la relation
entre deux variables en construisant un tableau crois ou
en reprsentant un nuage de points. On a ainsi accs,
selon le type des variables tudies, aux 3 tests
statistiques classiques : le test du Chi, lanalyse de la
variance et la corrlation. On peut aussi raliser de
nombreux graphiques, tracer une carte factorielle ou une
droite de rgression
Les tris croiss : pour tudier la relation entre deux
variables nominales, on utilise la fonction Tableaux
croiss qui permet de slectionner les deux variables
analyser. Les rsultats sont prsents dans un tableau,
dans un graphique ou, sur une carte danalyse factorielle
des correspondances.

Les corrlations : larticle Corrlations du menu Analyser


permet dtudier les relations entre deux variables
numriques et de rechercher sil existe une relation
mathmatique entre celles-ci.
Les tableaux de moyennes : le Sphinx tudie la relation
existante entre une variable nominale et une ou plusieurs
variables numriques en construisant un tableau de
moyennes qui prsente, pour chaque modalit de la
variable nominale, la moyenne, la somme, lcart type
des variables quantitatives. Les cases encadres sont
celles qui se distinguent de lensemble de la population
en tant significativement suprieures (ou infrieures)
la moyenne gnrale.

Les cellules encadres signalent les carts significativement diffrents de la


moyenne totale selon les tests de Student et Fisher.

Les cellules encadres signalent les carts significatifs selon le test du Chi.
Axe 2 (20.6%)
20 25000
Fiat

Japonaise
Volkswagen
Talbot

5 7000
Citron
Axe 1 (39.8%)

-5000 Autre

16 20000

Peugeot

Ford

7 10000

Opel

Renault

13 16000

10 13000

26

25 30000

Synthtiser et rsumer
La rdaction dun rapport dtude doit viter laccumulation
de chiffres et de rsultats statistiques ; cest ce que
permettent les tableaux synthtiques.
Ils rsument plusieurs rsultats, et mettent en vidence les
traits les plus caractristiques.
A cet effet, la fonction Tableaux multiples du menu
Analyser permet de construire des tableaux accols ou
des tableaux de questions groupes qui synthtisent les
rsultats de plusieurs variables de mmes modalits :

Une reprsentation graphique de ce tableau peut tre


le baromtre, particulirement intressant dans les
tudes de satisfaction.
Dans ce type de graphique, on ne prsente quune partie
des informations contenues dans le tableau en
slectionnant les modalits faire apparatre.

Mais on peut aller plus loin dans la synthse en remplaant


lanalyse de plusieurs tableaux croiss par un seul tableau
regroupant les informations les plus caractristiques. Ainsi
larticle Tableaux de caractristiques permet de prsenter
des tableaux dcrivant les modalits dune variable par leur
spcificit relativement plusieurs autres.
Par exemple : caractriser des marques achetes par le
type de produit, les prfrences et lidentit de ceux qui les
possdent, comme on le fait avec le tableau suivant. Ce
tableau
rsume
automatiquement
lessentiel
de
linformation rsultant de lanalyse de 4 tableaux croiss.
La slection des lments figurant dans le tableau est
effectue en fonction de lcart observ entre la rpartition
propre une catgorie (frquence locale) et la rpartition
sur lensemble (frquence globale).
On peut le vrifier en consultant les rsultats des tableaux
quil rsume. Ainsi :
le tableau crois affichant les pourcentages en ligne
montre que le prix est un critre principalement cit par
les possesseurs de Citron (31% contre 14% pour
lensemble) et la consommation par les possesseurs de
Renault (31% contre 13%).
lexamen des contributions au Chi met en vidence un
excs significatif de modles de moins de 4 CV pour les
marques Renault, Citron, Talbot et de plus de 9 CV pour
la marque Peugeot.
la carte reprsentant le premier plan factoriel dune
analyse factorielle des correspondances fait apparatre
lattraction que prsente Citron pour les revenus les plus
bas. A loppos, les marques trangres attirent les
revenus plus levs.
MARQUE

PUISSANCE

Sphinx 2000

SEXE

REVENU

Renault

- de 4CV

Consommation
S.A.V. Entretien

13 16000

Peugeot

9CV et plus

Confort

16 20000

Citron

- de 4CV
Prix
6 7CV S.A.V. Entretien

5 7000
7 10000

Talbot

- de 4CV

Etrangres

Dans le baromtre prsent ci-dessus, on choisit par


exemple de ne faire apparatre que la premire et la
dernire modalit de chaque chelle : les barres de ce
graphique seront alors interprtes comme une jauge
indiquant les diffrences dopinion, ventiles par rapport au
contenu dune autre variable.

CRITERES

ENSEMBLE

Distributeur
Prix

Homme

Confort
Scurit
4 5CV (39) Consomm. (80)
8 9CV (37)
Vitesse (74)

20 25000
5 7000
25 35000
20 25000

Femme (89)
Homme (74)

5 7000 (39)
10 13000 (25)

Pour chaque modalit de la variable "23.MARQUE " et pour


chaque critre d'valuation en colonne, le tableau donne les
modalits les plus caractristiques. L'indicateur est le rapport des
frquences. Seules les modalits les plus remarquables sont
affiches.

Le Sphinx en quelques pages

27

Recoder les donnes


A ce niveau, on aborde une seule variable la fois pour en
analyser le contenu et/ ou la transformer. Etudier les
textes, Mettre les numriques en classes, Interprter
les codes, Convertir les dates, Dcrire des images : ces
articles permettent de prendre connaissance du contenu
dune variable texte, numrique, code, date ou image pour
les dcrire sous forme de variables fermes. Par exemple :
rsumer des opinions par les thmes quelles voquent,
passer du code postal au dpartement ou la rgion,
convertir une date en jour de la semaine, en mois, en
anne, calculer une dure entre deux dates

Etudier les questions ouvertes textes

Aprs avoir cr les classes, loption Recoder sur une


chelle permet de crer une nouvelle variable ayant pour
modalits de rponses les classes pralablement dfinies.
Ces manipulations sont notamment utiles pour traiter une
question sur lge : on passera automatiquement de lge
aux tranches dge.

Interprter les codes


Pour analyser les questions ouvertes codes, on utilise
loption Interprter les codes qui permet de comptabiliser
les diffrentes rponses dans un tableau deffectifs. Il est
aussi possible de croiser les rsultats dune question code
avec une autre variable.
Grce aux boutons Rduire et Dictionnaire, les codes
peuvent tre modifis pour ne retenir quune partie du code
(Ex : le code postal peut tre rduit au dpartement en ne
slectionnant que les deux premiers caractres) ou pour
leur associer une liste de codes relis des catgories (par
exemple, le code postal peut tre transform en
dpartement, associ une rgion administrative et un
dcoupage gographique personnalis). On crera alors
automatiquement de nouvelles variables dont le contenu
correspond aux catgories auxquelles le code est associ
(bouton Recoder).

Le traitement des questions ouvertes textes fera lobjet dun


dveloppement particulier dans le chapitre suivant.

Mettre les numriques en classes


Avec larticle Mettre les numriques en classes, on peut
observer la distribution dune variable numrique, ses
valeurs remarquables, et dfinir des classes dintervalles
dont le nombre et lamplitude sont dtermins avec les
boutons Ajouter, Supprimer et Rpartir.

Convertir les dates


Linterprtation des dates est un cas particulier des codes :
le tableau plat des dates est construit automatiquement
par le Sphinx, qui propose galement un croisement de
cette question avec une autre variable de la base. La
conversion des dates en mois, en anne, en jour de la
semaine, est automatique, de mme que le calcul des
dures entre deux dates de la base, ou entre une date de
la base et une autre date donne.
28

Transformer les donnes


Il est souvent utile aprs analyse de revenir sur la dfinition
initiale dune ou plusieurs variables. Le dernier article du
menu Recoder offre de nombreuses possibilits pour
modifier ainsi la base de donnes.
Par exemple : transformer le type dune variable, regrouper
les modalits de rponses dune variable ferme, crer des
variables calcules par combinaison de variables
existantes, supprimer des variables inutiles

La matrise de ces mthodes conduit des analyses plus


synthtiques et plus slectives. Si vous ne les connaissez
pas encore, le Sphinx Plus vous aidera les dcouvrir et
les mettre en uvre.

Synthtiser et discriminer
Les tableaux de moyennes croises permettent dvaluer
les modalits dune variable ferme selon plusieurs critres
quantitatifs. Grce lAnalyse de la variance un ou 2
facteurs, les critres discriminants sont automatiquement
mis en vidence. Par exemple : positionner des groupes
dindividus selon leur opinion exprime sur plusieurs
chelles.
On exploite le tableau contenant en ligne les individus et en
colonne leurs valuations. A partir de ces donnes, on
pourra construire des typologies et chercher les dimensions
sous-jacentes de lopinion.

Construire des typologies


Pour rduire la complexit des donnes, on peut construire
une typologie en regroupant en classes homognes des
individus dcrits par de nombreuses variables.

Approfondir les analyses*


Pour vous permettre daller plus loin dans lanalyse de vos
enqutes, le Sphinx met votre disposition des mthodes
avances danalyse de donnes multivaries.

On peut pour cela utiliser une mthode de classification


automatique (article Classification automatique) ou
procder plus intuitivement partir de lexamen dune carte
factorielle (articles Analyse factorielle multiple, ou
Analyse en composantes principales).

Le menu Approfondir donne ainsi accs aux mthodes


danalyse multidimensionnelle et de modlisation. Ces
techniques permettent de rduire la complexit des
donnes par :
la mise en vidence des facteurs sous-jacents ;
la dfinition de types ou classes homognes ;
le calcul de nouvelles variables.

Sphinx 2000

Le Sphinx en quelques pages

29

Dans le premier cas, le logiciel met en uvre lalgorithme


des nues dynamiques qui vous propose automatiquement
plusieurs classifications de tailles croissantes. Dans le
deuxime cas, vous dcidez, en fonction de votre
perception de la carte, quels regroupements oprer. Si la
position du nom des modalits sur vos cartes noffre pas
une lisibilit optimale, vous pouvez dplacer, avec la
souris, les vignettes contenant leurs noms.

Dcouvrir des facteurs sous-jacents


Une autre manire de rduire la complexit consiste
remplacer une description utilisant de trs nombreuses
variables par la rfrence un plus petit nombre de
dimensions. Pour cela, on analyse la structure des
donnes pour mettre en vidence des facteurs sousjacents. On parvient ainsi reprsenter et analyser plus
simplement des donnes complexes.
Les articles Analyse factorielle multiple et Analyse en
composantes principales permettent ainsi de calculer ces
facteurs, de les reprsenter laide de cartes factorielles et
de produire les rsultats classiques (% de variance
explique, contributions, coordonnes factorielles).
Lexemple met en vidence le systme dopinion de nos
touristes. Suivant les 2 axes de la carte, la perception des
vacances sorganise selon deux dimensions opposant,
dune part le dynamisme la passivit, et dautre part
lorganisation lautonomie.

Expliquer et modliser
Lanalyse des relations entre deux variables numriques
peut tre gnralise en vue de mettre en vidence des
modles plus complexes. Avec larticle Corrlations
multiples, on peut analyser les relations entre une variable
expliquer et plusieurs variables explicatives, et estimer un
modle explicatif par le procd de la rgression multiple.

30

On obtient ainsi les rsultats classiques dans ce type de


mthode. Par exemple : expliquer la dpense totale par la
dure du sjour, lge des touristes, les dpenses de
loisirs

Calculer des variables


Afin denrichir la base de donnes initiale, de nombreuses
possibilits sont offertes pour crer de nouvelles variables
par des formules de calcul (dfinition dindice, ratios) ou
par des dfinitions plus complexes de combinaisons de
variables existantes.
Pour crire ces dfinitions de calcul programmes en
Visual Basic, vous tes assist par des modles
doprations courantes. A chaque changement de votre
base de donnes initiale, les calculs sont relancs pour
mettre jour les informations.

5. Analyser des donnes textuelles


Le Sphinx permet danalyser les textes des questions
ouvertes. Lexica ajoute cette possibilit celle douvrir
nimporte quel autre texte pour lanalyser en offrant un
stade supplmentaire Etudier des Textes (menu Stade). Il
sadresse ainsi ceux qui souhaitent analyser des textes
quelle quen soit lorigine :
Questions ouvertes dans les enqutes ;
Interviews non directives ;
Documents techniques ou littraires ;
Bases de donnes textuelles (bases bibliographiques,
bases de brevets, fichiers dadresses) ;
Documents dauteurs.
Le Sphinx met disposition des utilisateurs des fonctions
et des outils de porte trs gnrale qui peuvent faire
lobjet de 4 approches diffrentes :
Le verbatim : extraire un sous-ensemble de rponses en
fonction de leur contenu ou de leur contexte.
La prsentation en tableau : dresser un tableau de
frquences des rponses identiques et/ou des mots
contenus dans les rponses en les croisant
ventuellement avec une autre variable de la base.
Lanalyse de contenu : lire et interprter les rponses
pour les codifier dans de nouvelles variables.
Lanalyse lexicale : mettre en uvre les techniques
danalyse lexicale dans lenvironnement spcifique de
latelier lexical (Plus et Lexica uniquement) ou en lanant
les procdures standards de Lexica.

Le verbatim
Cette fonction consiste produire des extraits de textes en
fonction de leur contexte (autre variable) ou de leur
contenu (vocabulaire de la rponse), et restituer la liste
des rponses obtenues et des mots du texte.
Cette liste peut concerner tous les individus interrogs ou
une partie de la population interroge (rpondant
certaines caractristiques). Elle peut tre organise par
catgories de rponses, elle peut tre illustre par le
numro des individus, ou par leurs rponses dautres
variables

Prsentation en tableau
On peut prsenter les rponses aux questions ouvertes
textes dans un tableau qui indique la frquence des
rponses identiques ou celle des mots contenus dans le
texte. Cette possibilit dtude est accessible par loption
Tableau des rponses de la fonction Etudier des textes
dans le menu Recoder ou en construisant le tableau plat
de la question ouverte texte.
Par dfaut, le logiciel propose la liste des rponses
identiques en affichant leurs effectifs et leurs frquences
(Cf tableau 1 qui suit). Mais vous pouvez aussi construire la
liste des mots contenus dans les rponses en cliquant sur
le bouton Mots (Cf tableau 2 qui suit).
Les effectifs de ces listes peuvent tre ventils selon une
autre variable caractrisant les rpondants (bouton
Croiser). En cliquant sur le bouton Analyser lorsque vous
avez la liste lcran, vous retrouvez lenvironnement
danalyse des tris plat et des tris croiss avec toutes les
possibilits graphiques et les tests statistiques classiques.
Vous pouvez ainsi associer chaque catgorie dindividus
les mots quils utilisent.
Ces fonctions sont particulirement adaptes dans le cas
de rponses trs rptitives.

Linclusion de ces extraits dans un rapport permet de


rendre compte de lenqute par une illustration raisonne.

Sphinx 2000

Le Sphinx en quelques pages

31

Vous les utilisez aussi pour runir dans un mme tableau le


rsultat dune question ferme ayant une rubrique
Autre , et dune question ouverte Autre, prcisez .
Pour cela, construisez le Tableau gnralis des deux
questions concernes dans loption Tableaux multiples du
menu Analyser.
Tableau 1 : Tableau des rponses :

Lanalyse de contenu
Lanalyse de contenu consiste lire le texte en vue de
caractriser son contenu et dfinir les principaux thmes
quil voque.
Cette mthode est accessible dans le bouton Analyse de
contenu de la fonction Etudier des textes. Au fur et
mesure de la lecture, on dfinit les modalits quon retient
et on coche les rponses en fonction du contenu des textes
cits.
Cette fonction vous place devant lcran suivant de
recodage : en haut de lcran, dans la partie droite, sont
affiches les rponses donnes par les diffrents individus
la question analyse et en bas de lcran, sont
prsentes les modalits que vous tes en train de
redfinir et de saisir.
Ainsi, vous passez en revue lensemble des rponses
donnes la variable texte et, au fur et mesure que vous
prenez connaissance de leur contenu, vous crez de
nouvelles modalits de rponses et vous cochez les
modalits qui correspondent au texte de la rponse.

Tableau 2 : Tableau des mots :

32

Vous pouvez galement faire afficher gauche de lcran


le lexique des mots qui vous permet de faire de la
navigation lexicale : en slectionnant un des mots du
lexique, vous passerez successivement en revue toutes les
rponses dans lesquelles ce mot a t utilis.

Lanalyse lexicale*
Lanalyse lexicale donne un aperu du contenu du texte en
dressant le lexique (liste des mots quil contient, classe
par frquence dapparition).
Diverses mthodes sont utilises pour permettre
dapprocher le texte tout en rduisant au mieux les
ambiguts de la langue :
le calcul de diffrents lexiques : lexiques sans les motsoutils, regroups par racines, lemmatiss avec affichage
du statut grammatical [Rduire, Lemmatiser] ;

la gestion du lexique de mots : suppression de mots qui


napportent aucune information, regroupements sous un
mme thme (boutons Supprimer, Regrouper,
Dictionnaire, Marquer) ;

la navigation lexicale : recherche des rponses qui


contiennent un ou plusieurs mots slectionns ;

la cration et la gestion de dictionnaires thmatiques :


regroupement de tous les mots qui voquent un mme
thme dans un fichier appel dictionnaire (boutons
Dictionnaire, Marquer) ;

la recherche dexpressions et de segments rpts dans


le texte (Expressions dans la liste droulante Lexique) ;

la production de tableaux lexicaux et de listes de mots


spcifiques, relativement une autre variable de la base
(Tableau lexical et Mots spcifiques dans la liste
droulante Vue) ;

le calcul de statistiques lexicales qui va appuyer sur des


rsultats chiffrs la frquence dapparition et le poids
relatif de certains thmes. Ces calculs sont notamment
bass sur la cration automatique de nouvelles variables
(bouton Recoder).

Sphinx 2000

Le Sphinx en quelques pages

33

6. Utiliser toutes les possibilits du


Sphinx
Rdiger un rapport dtude

Les lignes et les colonnes du fichier initial deviennent alors


respectivement les individus et les variables de la base. Le
Sphinx analyse alors le contenu de la base et reconnat la
nature de chaque variable : ferme, chelle, numrique ou
texte. Cest lutilisateur de valider ou non la cration de
chacune des variables de la base.

Le Sphinx calcule, analyse, met en page, fait des


commentaires automatiques. Il ne vous reste plus qu
composer le rapport et ajouter vos propres commentaires
et interprtations. Cette phase ultime du travail est
considrablement facilite par les fonctions Copier/Coller
et Inclure dans le rapport.
A tout moment, on peut en effet recopier un tableau et/ou
un graphique indiffremment dans un traitement de textes
ou dans un tableur en utilisant toutes les ressources
rendues disponibles par Windows et les traitements de
textes (style, mode, plan).
La fonction Inclure dans le rapport est particulirement
intressante pour construire un rapport au fur et mesure
quon analyse les rsultats dans Sphinx. A la premire
utilisation de cette fonction, le Sphinx adaptera votre
traitement de textes en installant des macros qui seront
utilises pour tous les transferts faire sur ce poste. Si
votre ordinateur nest pas configur dune manire
standard, le Sphinx vous demandera dindiquer le
rpertoire dans lequel se trouve le traitement de textes.
Il existe aussi des procdures qui automatisent la
communication des rsultats de Sphinx vers un traitement
de textes : la fonction Dpouillement automatique / Dans
le rapport et lexcution dun Plan de dpouillement
permettent de lancer en une seule fois une srie danalyses
que vous pourrez ouvrir dans votre traitement de textes.

Ouvrir une base de donnes


Le Sphinx Plus et le Sphinx Lexica ouvrent toutes les
bases de donnes votre disposition afin de leur appliquer
leurs fonctions danalyse quantitative et qualitative.
Sil sagit de fichiers de donnes enregistrs dans un
format Ascii, vous utiliserez larticle Ouvrir un fichier de
donnes / Des donnes formates du menu Fichier. Il
suffit dindiquer la nature des sparateurs dlments et de
variables pour que le logiciel intgre ces donnes dans une
base Sphinx.

34

Si les donnes que vous souhaitez analyser dans le Sphinx


Plus ou le Sphinx Lexica proviennent dune autre base
(Access, D-Base, Paradox, et toute base pour laquelle il
existe un pilote ODBC), vous pourrez les ouvrir avec la
fonction Ouvrir un fichier de donnes / Une base de
donnes.
Le choix de la table et des champs intgrer dans le
Sphinx est effectuer lors de louverture par lutilisateur,
qui confirmera aussi la nature des variables qui constituent
la base Sphinx.

Caractriser
Le Sphinx est galement un puissant gestionnaire de
donnes : retour aux donnes brutes, recherche et
navigation dans la base, dition des donnes relatives
nimporte quel sous-ensemble.
Que vous lappliquiez vos donnes denqutes ou
dautres sources, il offre une trs grande souplesse pour
exploiter les bases de donnes composites en utilisant
toutes les ressources de la statistique et de la gestion de
fichiers.
Face un tableau ou un graphique, on prouve trs
souvent le dsir den savoir plus sur le dtail des lments
qui le composent. Pour rpondre ce besoin, le Sphinx est
dot de puissants moyens de retour aux donnes brutes. A
partir des cellules dun tableau, des points individus dans
une reprsentation graphique, ou mme des mots dun
corpus texte, le logiciel permet de connatre
instantanment la nature et les caractristiques des
observations concernes.
Cette facult permet instantanment de vrifier lorigine de
tel rsultat et de tenter de lexpliquer. Pour consulter les
donnes brutes, il suffit deffectuer un double clic sur la
cellule concerne dun tableau, sur le point dune carte ou
sur un mot en analyse lexicale.

Il est ainsi possible, tout moment, en cours danalyse, de


marquer certains individus en fonction des rsultats
observs. Ainsi, dans le cadre de la qualification de fichiers
ou doprations de marketing direct, vous pouvez tre
amen dcrire les individus en les codant un par un ou
globalement pour les proprits quils rvlent en cours
danalyse. Ce marquage se fait dans la variable de votre
choix (une variable existante ou une variable que vous
crez).

Dcouvrir les statistiques


En statistique, la mthode danalyse dpend de la nature
des variables. Pour vous simplifier le travail, un assistant
vous guide vers lanalyse la plus pertinente en fonction des
variables que vous voulez analyser.
Vous aurez ainsi la possibilit de dcouvrir des mthodes
que vous ne connaissez peut-tre pas sans vous soucier
de savoir dans quelle fonction on les obtient. Pour lancer
cet assistant, cliquez sur le bouton Dterminer une
analyse dans lcran central du stade Traitements.
Cette fonction ouvre un dialogue dans lequel vous
slectionnez les variables que vous souhaitez tudier. Le
Sphinx propose alors les traitements quil est possible de
leur appliquer. A lutilisateur de choisir lanalyse qui est la
plus adapte ses attentes et ce quil souhaite montrer.

Ces manipulations vous permettront ainsi de dcrire les


individus concerns :
en listant leur numro de rpondant, ce qui peut tre
utile pour reprer des anomalies dans des donnes par
exemple ;
en les dcrivant par leurs rponses une autre
variable de la base. Cest ajouter une dimension
supplmentaire au tableau En analyse lexicale, on
obtient ainsi lidentit des auteurs de la rponse ;
en mettant en vidence la spcificit de cet chantillon
par rapport lensemble des rpondants. On parvient
ainsi trs vite savoir si les effectifs considrs ont ou
non des traits particuliers qui les distinguent de
lensemble de la population interroge.
En faisant dfiler les informations relatives aux individus
concerns, vous pouvez aussi faire dventuelles
modifications sur les donnes de ces individus, grce au
bouton Dcrire accessible dans le dialogue Dcrire les
observations caractrises.

Sphinx 2000

Le Sphinx en quelques pages

35

Le Sphinx en direct
Votre visite guide se termine.
Lambition de cette visite guide est doffrir un aperu
rapide des nombreuses fonctions disponibles dans votre
logiciel. Par consquent, nous avons abord succinctement
certains thmes, tels que lanalyse lexicale, la gestion de
donnes et lanalyse statistique. Vous trouverez une
description exhaustive de toutes les fonctions du logiciel
dans les pages qui suivent ainsi que leur raison d'tre et
leur mode d'emploi.
Vous pouvez enfin bnficier des services prioritaires du
Sphinx en Direct pour toute assistance mthodologique ou
logiciel. Si vous n'tes pas inscrits ce service payant,
contactez Le Sphinx Dveloppement :
Tl. : 04 50 69 82 98
Fax
: 04 50 69 82 78
Mel
: contact@lesphinx-developpement.fr
Internet : http://www.lesphinx-developpement.fr

36

Sphinx 2000

Le Sphinx en quelques pages

37

Elaborer le
questionnaire

38

1. Pour commencer votre travail


Ds votre arrive dans le Sphinx, vous vous trouvez dans
lune des situations suivantes :
cration dune nouvelle enqute ;
reprise dune enqute dj cre ;
recherche dune enqute sur votre poste de travail ;
ouverture dun fichier de donnes externes ;

Crer une nouvelle enqute


Aucun travail na t effectu pralablement. Vous serez
donc amen crer un questionnaire de toutes pices,
avant den organiser la saisie puis deffectuer les
traitements.
Dans cet objectif, cliquez sur le bouton Nouvelle Enqute
de lcran de dmarrage. Si le logiciel est dj ouvert sur
une autre tude, choisissez la fonction Nouvelle enqute
du menu Fichier.

Reprendre une enqute existante


Comme dans la plupart des logiciels Windows, le Sphinx
vous propose un raccourci pour reprendre les 6 derniers
fichiers les plus rcemment ouverts.

indiquer le rpertoire dans lequel vous recherchez votre


enqute (bouton Parcourir) ;
faire apparatre toutes les enqutes enregistres dans un
rpertoire de travail (bouton Chercher) ;
faire apparatre toutes les enqutes du poste de travail
(bouton Chercher partout).

Ouvrir un fichier de donnes externes


Si les donnes que vous souhaitez analyser dans Sphinx
existent dj dans un autre format pour avoir t cres
dans un autre logiciel, vous pouvez bien sr les rcuprer
sans avoir les saisir de nouveau.
Vous utiliserez pour cela le bouton Fichier de donnes de
lcran de dmarrage ou la fonction Ouvrir un fichier de
donnes du menu Fichier.
Vous accderez ainsi louverture dun fichier de donnes
pralablement enregistr au format Texte (option Des
donnes formates). Vous pourrez galement ouvrir un
texte analyser, une base dimages, un tableau deffectifs,
une tude statistique provenant du logiciel SPSS, ou de
tout autre logiciel de gestion de donnes fonctionnant sous
un pilote ODBC : Excel, Access, Paradox, D-Base par
exemple

Dans lcran de dmarrage, il suffit de slectionner, dans la


fentre prvue cet effet, la ligne correspondant
lenqute souhaite et de cliquer sur le bouton Reprendre
pour la relancer.
Si le Sphinx est ouvert, il sagit simplement de slectionner,
dans le menu Fichier, la ligne correspondant lenqute
souhaite.
Si votre enqute ne figure pas parmi les 6 propositions,
vous pourrez y accder grce au bouton Ouvrir disponible
dans lcran de dmarrage ou par la fonction Ouvrir une
enqute du menu Fichier. Ces options, selon la dmarche
habituelle de tout logiciel Windows, vous demandent
dindiquer la localisation de votre enqute sur le poste de
travail.

Rechercher une enqute


Mais peut-tre avez-vous oubli la localisation prcise de
votre enqute Aidez-vous des options de recherche
disponibles dans Sphinx : le bouton Chercher de lcran de
dmarrage ou la fonction Chercher une enqute du menu
Fichier vous permettent de :
Sphinx 2000

Elaborer le questionnaire

39

La dernire enqute ouverte


est automatiquement propose

Les 6 dernires enqutes


ouvertes sont disponibles

Accder toutes
les enqutes
du rpertoire de travail

40

2. Les modles de questionnaire


Au moment de la cration dune nouvelle enqute, vous
avez la possibilit dutiliser des modles de questionnaire,
qui sont pr-dfinis dans le Sphinx et qui vous simplifient la
tche de rdaction des questions tout en vous donnant
quelques sources dinspiration. Dans cet objectif, vous
slectionnez loption Choisir un modle de questionnaire
lors de la cration dune nouvelle enqute.

Utiliser un modle de questionnaire


Les modles de questionnaires servent de base la
rdaction de votre propre questionnaire. Vous pouvez les
utiliser tels quils sont proposs en ne changeant que
quelques mots. Mais vous serez plus vraisemblablement
amen conserver certaines questions du modle, en
supprimer dautres pour en crer de nouvelles, modifier
des modalits de rponses, dplacer certaines
questions...

Choisir un questionnaire-type
Les modles de questionnaires sont disponibles dans un
rpertoire cr cet effet au sein du dossier Sphinx 2000.
Par dfaut, quelques modles vous sont proposs : ils sont
dcrits par un rsum de lobjectif du questionnaire, et ils
correspondent des enqutes de satisfaction (Clinique et
Transport) ou des observatoires touristiques (Touristes).

Crer la nouvelle enqute

Enrichir la liste des modles


A linverse, vous pouvez tre intress par la cration de
nouveaux modles de questionnaires qui vous seront
particulirement utiles dans le droulement de vos
prochaines tudes.
En effet, si vous coordonnez la ralisation de plusieurs
enqutes sensiblement identiques sur des zones
gographiques diffrentes, vous pouvez dfinir une trame
de questionnaire au niveau national, puis vous la dclinez
ensuite un chelon rgional.
Vous pouvez alors rdiger un modle de questionnaire qui
servira de base de travail (plus ou moins stricte) vos
diffrents interlocuteurs. Le Sphinx leur proposera alors le
modle de questionnaire correspondant. Leur travail
consistera ensuite utiliser ce questionnaire tel quel ou
adapter cette trame leurs contextes locaux respectifs.
La cration dun nouveau modle de questionnaire est
raliser lorsque le questionnaire initial est termin. Vous
choisissez la fonction Enregistrer sous du menu Fichier,
puis vous prcisez que vous souhaitez Faire une copie du
questionnaire en slectionnant loption En tant que
modle de questionnaire.
Le modle est enregistr dans le rpertoire courant des
modles (Modles de questionnaires dans le dossier
Sphinx2000) mais vous avez toujours la possibilit de
modifier cet emplacement. La liste des modles prsente
dornavant ce questionnaire.

Avant douvrir le modle de questionnaire pour lutiliser ou


le modifier, vous devrez indiquer le nom de la nouvelle
enqute que vous tes en train de crer ainsi que le
rpertoire o elle sera enregistre. Par dfaut, le logiciel
attribue un nom cette enqute mais vous pouvez inscrire
le nom que vous souhaitez dans le cadre prvu cet effet.
De mme, vous pouvez modifier le rpertoire
denregistrement, propos par dfaut par le logiciel, en
utilisant le bouton .
Une fois cette opration effectue, le questionnaire est
ouvert et vous pouvez commencer votre travail : utilisation
du modle tel quel, ajouts ou suppressions de questions,
dplacements dans le questionnaire...

Sphinx 2000

Elaborer le questionnaire

41

Slectionner le rpertoire daccs


aux modles de questionnaires
pr-dfinis sont accessibles

Slectionner
le modle utiliser

Indiquer ou crer
le rpertoire o
lenqute est sauvegarde

42

Indiquer le nom
de lenqute

3. Cration dune nouvelle enqute


Avant de crer votre questionnaire dans le Sphinx,
assurez-vous davoir consacr le temps ncessaire pour sa
rdaction. Couvre-t-on tous les objectifs de lenqute ? La
structure est-elle claire ? La longueur du questionnaire estelle adapte au contexte de son administration ? Les
questions sont-elles convenablement rdiges ? A-t-on
pens toutes les rponses possibles ? Les options prises
ds ce premier stade de ltude sont dcisives car on
pourra trs difficilement corriger une erreur ou un oubli par
la suite.

Dfinir un titre denqute


Il sagit du titre de lenqute. Celui-ci figurera en en-tte du
questionnaire que vous imprimerez depuis Sphinx.

La rdaction par questions consiste crer la liste


complte de toutes les questions. Celles-ci seront ensuite
structures selon un ordre prcis et regroupes
ventuellement en grandes parties.
La rdaction par parties, quant elle, implique que la
structure de votre questionnaire soit dj clairement
dfinie. Vous rdigerez alors le titre de la premire partie
du questionnaire puis les questions qui la composent. Puis
vous rdigerez le titre de la deuxime partie et ainsi de
suite...
Quelle que soit la mthode de rdaction que vous
choisissez, il est vident que vous pourrez effectuer des
modifications, des ajouts ou des suppressions de questions
et de parties.

Rdiger des commentaires


En dessous du titre de lenqute, vous pouvez faire figurer
des commentaires.
Des remerciements, des consignes ou toute autre
information peuvent tre destins aux rpondants dans le
cas o le questionnaire est auto-administr. Exemple :
Nous ralisons cette enqute pour mieux connatre vos
attentes afin damliorer la qualit de nos services. Merci
de consacrer quelques minutes pour rpondre nos
questions. Si une question ne vous concerne pas, ne notez
rien et passez la question suivante.
Dans cet emplacement, on peut galement noter des
consignes lattention des enquteurs qui administrent le
questionnaire.

Inscrire lorganisme et la priode


Dans len-tte du questionnaire, vont galement apparatre
lorganisme qui coordonne lenqute, et la priode de
ralisation.
Ces deux informations peuvent figurer sur le questionnaire
imprim selon les options de mise en page que vous aurez
dfinies.

Rdiger par questions ou par parties ?


Aprs la rdaction du titre de lenqute, des ventuels
commentaires, de lorganisme responsable et de la priode
de ltude, vous devez opter pour une construction de votre
questionnaire par parties ou par questions.
Sphinx 2000

Elaborer le questionnaire

43

Titre de
lenqute

Consignes pour les enquteurs


ou pour les rpondants

Cration des parties

Par grandes parties

44

Question par question

4. Rdaction des questions


Pour laborer votre questionnaire, vous procderez en
dfinissant successivement chacune des questions qui le
composent ou en vous aidant d'un modle.

Partir dun modle


Si vous choisissez dutiliser un modle prdfini lors de la
cration dune nouvelle enqute, un assistant vous permet
de slectionner, parmi les modles de la liste, celui qui se
rapproche le plus de votre enqute. Vous enregistrez alors
ce nouveau questionnaire dans le rpertoire que vous
souhaitez et sous un nom appropri, puis vous dfinissez
les attributs de len-tte du questionnaire (Titre,
Commentaires, Priode, Organisme). Ce modle de
questionnaire est en gnral une base de travail laquelle
vous allez apporter des changements. Vous pouvez faire
des ajouts, des suppressions, des modifications, des
dplacements, sur les questions et sur les modalits.

Crer une nouvelle question


Le questionnaire se prsente comme une liste. Vide au
dbut, elle s'accrot chaque nouvelle question cre. Un
double clic dans la partie vierge de lcran fait apparatre le
dialogue de dfinition des questions. Vous pouvez aussi
utiliser l'article Nouvelle question du menu Rdiger.
Rdigez le texte de votre question dans la partie rserve
au libell. Dfinissez ensuite la variable correspondante,
cest--dire un titre abrg qui la rsume le plus clairement
possible. Ceci facilitera votre travail au moment de
l'analyse. Indiquez ensuite le type de la question dans
loption correspondante. Ce choix conditionne la forme
sous laquelle vous enregistrerez la rponse.
Pour les questions rponses fermes, vous entrez au
clavier la liste des rponses possibles dans le cadre Nom
des modalits en les sparant par un point virgule. Le
bouton Contrles vous permet d'ajouter certaines
conditions propres chaque type de question, quil sagisse
de question ferme ou de question ouverte.

Les flches figurant en bas gauche de la fentre


permettent de se dplacer dans la liste des questions dj
dfinies. En faisant OK, vous validez votre question qui
s'ajoute ainsi la fin de la liste. Et depuis la liste de
questions, vous revenez dans lcran de dfinition dune
nouvelle question en faisant un double-clic sur la partie
vierge de lcran ou en utilisant la fonction Nouvelle
Question du menu Rdiger.
Si vous voulez vrifier et ventuellement modifier la
dfinition dune des questions existantes, il suffit alors,
dans la liste, de faire un double-clic sur la question
concerne pour revenir son dialogue de dfinition.
Larticle Modifier une question du menu Rdiger a le
mme effet.

Insrer et dupliquer
Pour insrer une question, slectionnez dans la liste, la
question avant laquelle vous souhaitez faire votre insertion,
puis choisissez Insrer une question du menu Rdiger.
Attention pour insrer une question aprs un titre,
slectionnez la question qui suit le titre (on insre toujours
avant!).
Si votre questionnaire comporte des questions similaires,
vous pouvez utiliser des procdures de duplication des
questions. Dans la liste, slectionnez la question ou les
questions qui vous intressent puis choisissez l'article
Dupliquer les questions. Vous pouvez aussi, aprs avoir
slectionn les lignes correspondantes dans la liste, utiliser
les touches Ctrl+C pour copier les questions, puis Ctrl+V
pour les coller la fin de la liste. Si vous voulez simplement
recopier le libell des modalits, il faut slectionner les
modalits qui vous intressent dans le dialogue de
dfinition de la question approprie, puis utiliser Ctrl+C
pour les copier, et dans le cadre des modalits de lcran
de dfinition de la nouvelle question, vous activez Ctrl+V.
.

Lorsque tous les attributs de la question sont dtermins,


cliquez sur le bouton Nouvelle question pour passer la
question suivante, ou Nouveau titre si vous abordez une
nouvelle partie de votre questionnaire.

Sphinx 2000

Elaborer le questionnaire

45

Dfinir les questions

Texte de la
question
Nom de la
variable
Type de la
variable
Contrles et
paramtres
Dplacement
dans la liste

Utiliser la bibliothque
Choisir une question...
Copier dans le questionnaire

Recopier du
questionnaire vers la
bibliothque
46

5. Bibliothque de questions
Le Sphinx permet de grer une ou plusieurs bibliothques
de questions dans lesquelles le charg d'tudes ira puiser
la fois pour le guider dans le choix des questions mais
aussi pour acclrer les tches rptitives de la dfinition
de questions.
Une bibliothque est fournie avec le logiciel. Les
utilisateurs avertis enrichiront cette bibliothque ou mieux,
creront leur propre bibliothque de questions.

Pour crer une bibliothque, il suffit de crer un nouveau


questionnaire et de l'enregistrer avec l'extension .bib (en
choisissant la ligne correspondante dans la liste des types
de fichiers disponibles dans le dialogue d'enregistrement.).
Pour modifier une bibliothque existante, il faut choisir la
mme ligne dans le dialogue d'ouverture de fichier
dclench par la fonction Ouvrir une enqute.
En cours de rdaction d'un questionnaire le bouton Autre
permet de changer la bibliothque de rfrence.

Utiliser la bibliothque
Il y a deux manires d'invoquer la bibliothque : depuis la
liste des questions ou depuis lcran de dfinition d'une
question.
Depuis la liste des questions, on choisit l'article Utiliser la
bibliothque du menu Rdiger. La liste des questions de
la bibliothque s'affiche. On slectionne une question puis
on clique sur le bouton Insrer. On peut ritrer l'opration
plusieurs fois sans quitter la bibliothque.
Depuis le dialogue de dfinition d'une question, on choisit
le bouton Bibliothque. Aprs avoir choisi la question, on
clique sur le bouton Remplir et la question en cours de
dfinition prend les caractristiques de la question
slectionne dans la bibliothque.
Les questions sont classes par thme et sous-thme. On
peut rduire la liste un thme donn pour visualiser les
questions proposes dans une liste plus courte et ainsi
choisir plus rapidement celle qui nous intresse.

Enrichir la bibliothque
Le bouton Enrichir permet d'ajouter une question la
bibliothque. On indique alors les thmes et sous-thmes
qui la caractrisent.

Crer une bibliothque


Une bibliothque est en fait un questionnaire dans lequel
les questions sont assorties d'un thme et d'un sousthme. Pour les diffrencier des questionnaires classiques,
le fichier associ la bibliothque a une extension ".bib".

Sphinx 2000

Elaborer le questionnaire

47

Chercher dans la
bibliothque par thme

Enrichir ponctuellement la bibliothque

Crer / Ouvrir une bibliothque

Rdiger la bibliothque comme un questionnaire

Type de fichiers *.bib

Thme

48

6. Questions rponses fermes


Dans le cas des questions fermes, la liste des rponses
est dfinie a priori. Le rpondant est aid par la liste qu'on
lui propose, ou l'enquteur est guid pour interprter sa
rponse. Le traitement sera ainsi facilit puisque toutes les
rponses possibles sont a priori connues. En revanche, on
se prive de toute dcouverte : les informations ne
mesureront que la frquence relative de chaque modalit et
on risque d'influencer le rpondant par la nature et l'ordre
des choix proposs. Le Sphinx distingue 4 cas. Le choix se
fera en fonction de l'information recueillir et de la manire
dont on souhaite l'analyser. Il influence la prsentation du
questionnaire et des rsultats.

Rponses fermes uniques


C'est le cas le plus simple. Une seule rponse est choisir
dans une liste de 50 modalits au plus. Cette limitation
s'impose pour faciliter ensuite la construction des tableaux
de rsultats de ces questions.

Rponses fermes multiples


Le rpondant peut choisir plusieurs rponses parmi les
modalits proposes. Le nombre de rponses autorises
(X rponses possibles) est fix dans la fentre de
dfinition des questions. Ce type de question est quivalent
autant de questions oui/non qu'il y a de modalits.
Cocher une modalit revient rpondre oui. Ainsi, au
moment des traitements, si cela savre ncessaire, vous
pourrez passer aisment dun cas de figure lautre en
utilisant larticle Transformer/Combiner dans Recoder :
Loption Transformer une variable / Variable ferme n
modalits en n variables fermes Oui/Non permet
d'clater une ferme multiple en n questions Oui/Non ;
Loption Combiner des Variables/Multi Oui/Non pour
regrouper n questions Oui/Non en une ferme multiple.

Rponses fermes ordonnes

au moment du traitement, les modalits cites en


premier, en deuxime... seront dpouilles dans des
colonnes diffrentes.
Enfin, dans le stade des traitements, loption Transformer
une variable ordonne n modalits en n variables
fermes chelles de larticle Transformer/Combiner du
menu Recoder permet de crer partir de ce type de
variable autant de variables chelles que de modalits. Les
chelons correspondent alors aux rangs de citations.

Questions chelles
On utilise ce type de question pour mesurer une opinion,
une prfrence, une satisfaction ou toute numration
ordonne. Ce type de question est quivalent une ferme
unique dont chaque modalit est affecte d'une note
correspondant au rang de l'chelon. Par dfaut, la note est
fixe suivant l'ordre dentre des chelons. Mais elle peut
tre change en slectionnant dans la fentre de dfinition
des chelons, le menu Valeurs associes et en
dfinissant pour chaque chelon la valeur de son choix. Au
moment du dpouillement, ces valeurs seront traites
comme celles d'une variable numrique.
Si vous utilisez une batterie dchelles qui ont des
modalits similaires, vous pouvez viter de saisir chaque
fois les modalits de rponses. A cet effet, le bouton
Echelles, disponible dans lcran de dfinition des
questions chelles, vous donne la liste des modalits de
toutes les chelles que vous avez dj dfinies sur ce
poste. Slectionnez dans la liste celle qui vous intresse :
elle sera automatiquement recopie dans le cadre des
chelons.

Indiquer les modalits


Tant que la saisie des rponses nest pas commence,
vous faites un double clic, dans la liste des questions, sur
celle que vous voulez modifier. Vous pourrez alors, dans
son dialogue de dfinition, apporter tous les changements
souhaits.

En cochant la case Rponses ordonnes dans le


dialogue de dfinition dune question ferme multiple, on
affecte le recueil des donnes et leur traitement :
le rpondant est invit numrer, dans l'ordre de sa
prfrence (dimportance...), les modalits quil choisit. En
saisie, la premire case gauche correspond son
premier choix et ainsi de suite...

Sphinx 2000

Elaborer le questionnaire

49

Ferme unique

Ferme multiple

Ferme multiple ordonne

Ferme chelle

Modalits et valeurs associes

Modalits

Valeurs associes
traites comme
numriques

50

Questions "Autre, prcisez"

7. Questions ouvertes
Les rponses aux questions ouvertes ne sont pas connues
a priori. Il peut s'agir d'un nombre (ouverte numrique),
d'un mot ou d'une suite de mots (ouverte texte), d'une
image, dun code ou dune date.

Ouvertes numriques
Les rponses attendues sont des grandeurs dfinies par
rapport une unit donne. Elles gnrent une variable
numrique qui sera traite comme telle ou comme une
question rponses fermes dont les modalits sont des
classes d'intervalles. Il est trs intressant de recueillir au
dpart des informations numriques dont la prcision
permettra des analyses plus fines (corrlation, ACP...),
quitte revenir ensuite sur des classes dintervalles.
En dfinissant une question numrique, on peut prciser s'il
s'agit de valeurs entires ou dcimales dans le bouton
Contrles disponible dans lcran de dfinition de
question. Ce bouton donne galement la possibilit de fixer
des bornes minimales et maximales, qui auront pour effet
dinterdire la saisie des valeurs qui ne respectent pas ces
conditions.

Ouvertes textes

Pour grer de type de question, le Sphinx propose une


procdure automatise. Il faut dabord crer la variable
ferme en dfinissant toutes les modalits de rponses
avec une dernire rubrique Autre , et dans le dialogue
de dfinition de cette question, on clique sur le bouton
Contrles pour cocher la rubrique Associer une
question ouverte texte Autre prcisez . Cette
manipulation a pour effet :
l'ajout automatique dans le questionnaire d'une question
ouverte texte ;
l'apparition la saisie d'une zone texte si la dernire
modalit de la question ferme a t coche (c'est la
position et non le libell de la modalit qui provoque
linterrogation sur la prcision apporter) ;
au moment du dpouillement, le contenu de la question
"autre, prcisez..." pourra tre intgr celui de la
question ferme.

Questions images

La rponse attendue peut aller d'un seul mot tout un


discours. On peut dfinir le nombre de lignes de la zone de
recueil de la rponse dans le bouton Contrles.
Il sagit, au moment de ladministration du questionnaire, de
recueillir toutes les informations afin de pouvoir saisir la
rponse dans son intgralit et dans un format libre, ce qui
posera bien sr des problmes particuliers lors de
l'exploitation. On aura le choix entre :
lire toutes les rponses pour les fermer a posteriori selon
leur contenu (Etudier des textes/Analyse de contenu) ;
restituer les rponses prsentes de faon slective et/ou
classes par catgories (Produire des listes du menu
Dpouiller ou Etudier les textes / Verbatim) ;
procder de manire automatique en dnombrant les
rponses identiques ou les mots qu'elles contiennent
(Etudier les textes / Tableaux de rponses ou Tableaux
de mots) ;
effectuer des calculs statistiques sur la frquence
dapparition de certains thmes dans le contenu des
rponses (Etudier les textes / Atelier lexical).

Sphinx 2000

Lorsqu'on ne pense pas tre capable de prvoir une liste


exhaustive de modalits de rponses, il est prfrable
dajouter, toutes les modalits proposes, une rubrique
"Autre" en donnant la possibilit au rpondant de prciser
sa rponse. Cette question Autre, prcisez est
enregistre comme une question ouverte texte attache
une question ferme.

Ce dernier type de "question" permet de recueillir


l'information sous forme d'image. La "rponse" est
enregistre comme un fichier image (de format bmp) qui
doit se trouver dans le mme rpertoire que le fichier des
rponses. Au moment de la saisie, on rentrera le nom de
ce fichier qui sera ainsi utilisable au moment des
traitements :
Analyser le contenu (Recoder / Dcrire des images) ;
Dtailler : faire apparatre la ou les images correspondant
aux cellules d'un tableau ou aux points d'une carte.

Elaborer le questionnaire

51

Ouverte numrique

Indiquer des limites


(minimum et maximum)

Accepter des nombres


dcimaux

Ouverte texte
Autre, prcisez

EXTRAITS VERBATIM

ANALYSE DE CONTENU

TEXTE

RECODIFICATION
52

ANALYSE LEXICALE

Questions dates

8. Codes, dates et QCM


Les questions codes et dates peuvent tre considres
comme des questions ouvertes dans la mesure o elles
permettent d'enregistrer une trs grande varit de
rponses. Elles s'en distinguent par le fait qu'on peut
facilement les recoder avec un dictionnaire ou un
calendrier.
Dautre part, il est possible d'associer des valeurs
numriques des questions fermes, notamment pour
calculer des scores ou valuer des QCM en application
d'un barme.

Questions codes
Un code est une squence de caractres alpha
numriques, souvent de taille fixe, dont les lments ont
une signification particulire dfinie par leur position dans
le code. Par exemples : les deux premiers caractres du
code postal renvoient au dpartement ; dans le numro
Insee, le premier caractre indique le sexe, les deux
suivants lanne de naissance.
On associe au code le dictionnaire qui donne en clair la
signification de chaque lment qui le compose. Un mme
lment peut sinterprter de diffrentes manires : par
exemple, 73 est le code dpartemental de la Savoie et
indique une appartenance la rgion Rhne Alpes.
Le dictionnaire ncessaire linterprtation des codes
postaux contient ainsi une ligne par code. Chaque ligne est
constitue selon le modle suivant :
73=Savoie=Rhne Alpes
74=Haute Savoie=Rhne Alpes
75=Paris=Ile de France

Le type date est utiliser dans le cas o la rponse


attendue est une date ou une heure. Le bouton Contrles
vous donne la possibilit de fixer un format
lenregistrement de vos dates. Si vous respectez ce format
la saisie, au moment de lanalyse, vous aurez de trs
riches possibilits pour interprter vos dates selon
diffrents points de vue (jour de la semaine, mois, anne,
calcul de dure...).

Associer des valeurs aux questions


fermes
On peut associer chaque modalit dune variable ferme
une valeur que lon rentre au clavier. Larticle Valeurs
associes (menu accessible dans lcran de dfinition de
questions) permet, en regard de chaque modalit dune
question ferme, de dfinir une valeur numrique. Vous
pourrez ainsi calculer un score global en fonction des
rponses apportes (valuation de prospects par exemple)
ou construire le barme dun QCM.
Au dpouillement, la fonction Appliquer un barme crera
la variable dans laquelle le rsultat de la note est
enregistr.
Dans le cas des questions chelles, la mme fonction vous
permet dassocier aux chelons les valeurs de votre choix.
Un bouton Num. Auto vous propose mme des jeux de
valeurs adapts votre cas. Au dpouillement, ces valeurs
seront utilises pour calculer la valeur moyenne et lcart
type de votre chelle. Cest elles qui seront galement
prises en compte pour tous les traitements numriques
(corrlation, ACP, moyennes croises).
Vous pourrez ainsi traiter vos chelles au plus juste comme
des variables numriques.

Le bouton Contrles, prsent dans lcran de dfinition


des questions codes, ouvre un dialogue qui vous permet
dassocier un dictionnaire au code que vous tes en train
de dfinir Associer une liste de codes, Liste des codes).
Vous aurez alors accs cette liste au moment de la saisie
et des analyses. Vous pouvez crer vos dictionnaires dans
nimporte quel traitement de textes en suivant la procdure
dcrite prcdemment dans lexemple des dpartements,
ou encore dans un tableur en inscrivant le numro du
dpartement dans la premire colonne, le nom du
dpartement dans la seconde, la rgion dans la 3me

Sphinx 2000

Elaborer le questionnaire

53

Codes et dictionnaires de codes

Dfinir des QCM ou adapter des chelles

54

Basculer entre les noms des


modalits et les valeurs associes

9. Organiser le questionnaire
La qualit d'un questionnaire tient beaucoup la clart de
ses questions mais aussi sa structuration. Cest pourquoi
il est souvent utile de revenir globalement sur lorganisation
du questionnaire, aprs avoir rdig l'ensemble des
questions. C'est alors que l'on peut revoir la suite logique
des questions, affiner les thmes voqus dans le
questionnaire, regrouper des questions, dfinir des renvois,
ajouter des consignes...

Titres, consignes et parties


Vous pouvez structurer vos questionnaires en grandes
parties, auxquelles vous attribuez un titre. Nous vous
conseillons de commencer ainsi, et dajouter les questions
aprs chaque titre. Les articles Nouveau titre et Insrer
un titre du menu Organiser vous permettent dajouter des
titres en cours de travail. Si vous travaillez sur un
questionnaire long, utilisez la liste des parties avec le menu
droulant
Parties pour
vous
dplacer
dans
le
questionnaire.
La fonction Insrer un titre peut tre galement utilise
pour prciser les consignes aux rpondants ou aux
enquteurs.

Dplacer des questions ou des parties


Pour dplacer une ou plusieurs questions, slectionnez-les
dans la liste des questions et placez-vous sur la bande
gauche de la liste (le curseur prend alors la forme dune
main) puis dplacez-les en les faisant glisser lendroit
dsir. Si vous cliquez sur un titre, vous dplacerez au
choix le titre seul ou lensemble de la partie contenant le
titre et les questions concernes. C'est trs pratique pour
restructurer le questionnaire en ragenant les questions.
De tels dplacements peuvent tre effectus tout
moment, y compris aprs que la saisie ait commenc.

Si la saisie des rponses est dj commence, un dialogue


spcial apparat pour vous permettre de dplacer, dajouter
ou de supprimer des modalits de questions fermes. Ce
dialogue est accessible par le bouton Modifier dans lcran
de dfinition de questions. Un bouton Changer le type est
disponible dans ce mme cran : il permet de modifier le
type dune question alors que la saisie est dmarre. Enfin,
pour regrouper ou supprimer des modalits de rponses,
vous
passerez
par
loption
Transformer
une
variable/Modifier les modalits dune variable ferme
dans larticle Transformer/Combiner du menu Recoder.
Pour ajouter de nouvelles questions au sein du
questionnaire, vous slectionnez la question avant laquelle
vous voulez en intgrer une nouvelle puis, vous choisissez
Insrer une question du menu Rdiger. Pour crer une
nouvelle question la fin de la liste, vous faites un double
clic dans la partie vierge de lcran ou vous utilisez
Nouvelle question du menu Rdiger.
Enfin, sil sagit pour vous de supprimer des questions,
vous slectionnez dans la liste les questions supprimer et
vous choisissez la fonction Supprimer du menu Rdiger.

Grouper des questions


Pour grouper entre elles plusieurs questions et les faire
apparatre sous forme de tableaux, il suffit de les
slectionner dans la liste et dactiver larticle Grouper des
questions du menu Organiser.

Renvois et restrictions la saisie


La fonction Dfinir des renvois permet de passer
automatiquement un ensemble de questions qui ne
concernent pas le rpondant. Elle est complte par la
dfinition de restrictions, qui permettent dindiquer quune
question ne concerne que ceux qui ont rpondu de telle
manire une ou plusieurs autres questions. A la saisie, si
ces conditions ne sont pas remplies, la question nest pas
propose.

Modifier des questions


Les modifications de questions ainsi que la suppression ou
linsertion de questions peuvent se faire tout moment,
mme aprs avoir commenc la saisie : le fichier des
donnes est automatiquement mis jour.
Pour modifier une question existante, vous faites un double
clic dans la liste des questions sur celle qui vous intresse.
Ceci vous ouvrira son dialogue de dfinition dans lequel
vous pourrez apporter tous les changements ncessaires.
Sphinx 2000

Elaborer le questionnaire

55

Liste des parties


Groupes
Variable

Libell

Modalits de rponses

Zone de
dplacement

Renvois

56

Restrictions

10. Groupes de questions


Les questions de mme nature peuvent tre groupes,
c'est dire qu'elles seront prsentes ensemble sous
forme de tableaux, et ce dans la mise en page du
questionnaire, dans les crans de saisie ou bien dans les
tableaux de rsultats.
Ces groupes de questions concernent soit un ensemble de
questions fermes ou chelles ayant exactement les
mmes modalits, soit un ensemble de questions
numriques.
Les batteries d'chelles sont ainsi trs utiles dans les
questionnaires de satisfaction :
le formulaire est beaucoup plus concis et clair ;
le rpondant ne lit les chelons qu'une seule fois pour se
construire sa propre chelle de valeurs et ensuite rpond
beaucoup plus rapidement toute la batterie. En outre,
on garantit ainsi une homognit de ses rponses aux
diverses questions ;
les rsultats sont prsents dans un seul tableau, ce qui
permet la comparaison des diffrentes questions.
Les questions numriques peuvent tre groupes sur
plusieurs colonnes et former un tableau trs rapide
remplir par l'interview.
Par exemple si on a pour des entreprises les variables CA
FINANCES 98, CA FINANCES 99, CA SERVICES 98, CA
SERVICE 99, CA PRODUITS 98, CA PRODUITS 99, cela
reprsente 9 questions que l'on runit dans un groupe de
trois lignes (FINANCE, SERVICE, PRODUITS) et deux
colonnes (98, 99).

L'option Reprendre le nom du groupe dans le libell des


questions va, si elle est coche, modifier le libell de la
question en le faisant prcder du nom du groupe (et de la
colonne si ncessaire) suivi du caractre DEUX POINTS ':'.
Pour reproduire l'exemple des chiffres d'affaires ci-dessus :
Crer trois variables numriques :

Variable
Libell
SERVICES98
PRODUITS98
FINANCES98

Fourniture des services


Vente de produits
Produits financiers

Slectionner ces trois questions et choisir l'article


Dupliquer.
Slectionner les six questions et choisir Grouper les
questions.
Taper Chiffres d'affaires comme libell du groupe, choisir
prsenter sur 2 colonnes, Activer la case Reprendre le
nom du groupe dans le libell des questions.
Le questionnaire devient automatiquement :
Variable
Libell
SERVICES98
1998
PRODUITS98
FINANCES98
SERVICES99
PRODUITS99
FINANCES99

CA : Fourniture des services :


CA
CA
CA
CA
CA

:
:
:
:
:

Vente de produits : 1999


Produits financiers : 1998
Fourniture des services: 1999
Vente de produits: 1998
Produits financiers : 1999

Les groupes peuvent tre dsactivs ou activs soit au


stade de l'laboration du questionnaire dans le dialogue
Modifier les groupes soit au stade de la saisie des
rponses dans le dialogue Options de saisie.

Les questions d'un mme groupe apparaissent l'cran


avec un trait bleu dans la liste des questions.
Pour grouper des questions, il suffit de les slectionner puis
de choisir l'article Grouper les questions dans le menu
Organiser ou dans le menu contextuel. Un message
indiquera si le groupement n'est pas possible (questions de
structure diffrente par exemple).
Dans le dialogue, on indiquera un libell pour ce groupe
(mais cela n'est pas indispensable) ainsi qu'un nom court
(pour le retrouver dans les listes).
Pour les groupes numriques plusieurs colonnes, on
indiquera le nom de chaque colonne.
Sphinx 2000

Elaborer le questionnaire

57

Dfinition des groupes

Groupe de 5 questions chelles

Groupe de 3 questions numriques

Tableau de groupe
Nonrponse

58

Peu important
Assez
Sans
important
importance

Trs
important

TOTAL

VITESSE

144

162

CONFORT

62

39

20

39

162

SECURITE

157

162

CONSOMMATION

155

162

PRIX

146

162

Ensemble

79

45

315

363

810

11. Renvois Restrictions


Lorsque le questionnaire devient complexe, il arrive
souvent que certaines questions ne s'appliquent pas tous
les individus.
Dans ce cas, on souhaite que l'indication en soit faite sur le
formulaire et que lors de la saisie, les crans
correspondant aux questions non pertinentes ne soient pas
prsents.
Il existe dans le Sphinx trois manires de programmer la
pertinence d'une question : les renvois, les restrictions de
saisie, les questions "Autre, prcisez"

Renvoi
Un renvoi est un aiguillage que l'on place sur une question
et qui renverra le rpondant (et l'oprateur de saisie) sur
une autre partie du questionnaire ds lors que la rponse
la question de dpart remplit une condition.
Un dialogue permet d'exprimer tous les renvois en
dsignant pour chacun l'origine, la condition et la
destination de l'aiguillage.
L'origine du renvoi est une des questions que l'on choisit
dans la liste droulante.
Le renvoi peut tre conditionnel et on exprime la condition
sous la forme d'un filtre de slection (Voir le paragraphe
correspondant pour plus de dtails).
Le renvoi peut tre inconditionnel, si par exemple on a fini
une partie spcifique et que l'on veut revenir au tronc
commun.
La destination est une autre question du questionnaire que
l'on choisit galement dans une liste. Cette destination peut
tre aussi la fin du questionnaire lorsque toutes les
questions restantes ne sont pas pertinentes.

Restrictions de saisie
Les renvois sont des aiguillages qui ne peuvent pas
rpondre toutes les situations.

On slectionne dans la liste les questions auxquelles on


souhaite associer une condition de prsentation et on
choisit l'article Dfinir des restrictions dans le menu
Organiser.
Ces conditions s'expriment sous la forme de filtres de
slection, comme pour les renvois mais la diffrence que
la condition peut tre ici dfinie sur plusieurs critres.
Pour supprimer ensuite une restriction de saisie, on active
le mme article et on supprime tous les filtres.
La mise en place de ces restrictions est aussi possible
partir du dialogue des Contrles de saisie.

Autre, prcisez
Une condition de prsentation classique concerne les
questions semi-fermes. On souhaite laisser l'interview
la possibilit de rpondre autre chose que les modalits
proposes.
Dans le dialogue dclench par le bouton Contrles de la
question ferme, on coche l'option Associer une question
texte, "Autre, prcisez".
Une question texte est automatiquement cre aprs la
question ferme mais celle-ci ne sera propose la saisie
que si la dernire modalit de la question ferme est
coche.
Attention, la question est associe la dernire modalit,
pas la modalit Autre. Ainsi si les modalits sont "Xxxx ;
Yyyyy ; Zzzzz ; Autre ; Ne sait pas" la question texte sera
associe la modalit "Ne sait pas".

Lgende de la liste des questions


Sur la partie gauche de la liste des questions, des couleurs
rappellent les contrles placs sur ces questions :
Bleu : les questions sont groupes ;
Rouge : la question est lorigine d'un renvoi ;
Magenta : la question est la destination d'un renvoi ;
Jaune : la question est assortie d'une condition de
prsentation ;
Vert : la question texte est associe la dernire
modalit de la question ferme ;
Cyan : la rponse la question est obligatoire.

Pour complter la panoplie des outils d'organisation du


questionnaire, le Sphinx permet d'exprimer sur une ou
plusieurs questions des conditions qui devront tre
remplies pour que la question soit prsente.
Sphinx 2000

Elaborer le questionnaire

59

Dfinir des restrictions de


prsentation

Renvoi
inconditionnel

tablir un
renvoi

Cliquer pour
ajouter un second
renvoi

cran de saisie dune question


ferme associe une question
Autre, prcisez

60

Renvoi la fin

Cette modification ne peut pas se faire en tapant les


nouvelles modalits comme lors de la rdaction initiale car
nul ne saurait quelle modalit affecter les individus dj
saisis.

12. Modifier le questionnaire


pendant et aprs la saisie
Avant le dbut de la saisie, toutes les modifications sont
bien entendu possibles sans aucun prjudice.
Aprs le dbut de la saisie, toutes les modifications sur le
questionnaire sont dsormais possibles (ce ntait pas le
cas avec les versions antrieures du Sphinx).
Toutefois, ces modifications seront irrversibles et elles
peuvent amener des pertes dinformations. Cest pour
cela que les modifications ne sont lances qu aprs une
confirmation explicite de lutilisateur.
En outre, il est recommand de conserver
sauvegardes de fichiers avant toute modification.

des

Changer le type dune question


Le changement de type nest plus autoris de faon directe
aprs le dbut de la saisie et les boutons-radios
correspondants sont dsactivs.
Le bouton Changer de type permet de rectifier un
questionnaire sans perdre les informations dj saisies.
On pourra par exemple transformer une variable ferme en
variable texte si on saperoit pendant le recueil des
donnes que la liste de modalits proposes tait trop
limitative.
On pourra corriger des erreurs de type, par exemple passer
dune question numrique une question code ou bien
passer dune variable numrique une variable numrique
dcimale,
Dans le dialogue propos, on choisit le nouveau type de la
variable.
Certains changements sont toutefois impossibles dans ce
contexte parce quils relvent dun vritable recodage. On
utilisera alors les fonctions du menu Recoder au stade des
traitements et analyses.

Cette modification se fait donc dans un dialogue spcifique


qui permet de corriger le nom dune modalit, de rajouter
ou denlever des modalits et de rorganiser cette liste
sans perturber les rponses dj saisies.
Attention toutefois aux manipulations incohrentes.
Prenons la variable SEXE qui a comme modalit Homme
et Femme. Pour permuter ces deux modalits, il faut utiliser
les boutons Monter ou Descendre. Il ne faut pas modifier
la modalit Homme (en tapant Femme) puis la modalit
Femme (en tapant Homme) car dans ce cas on permuterait
le sexe de tous les individus.

Supprimer des variables


Les variables inutiles (variables initialement prvues mais
non renseignes) peuvent tre supprimes mais une fois
encore, de manire irrversible.
Pour supprimer des variables, on les slectionne dans la
liste et on choisit l'article Supprimer du menu Organiser.
Il n'est pas ncessaire de repasser implicitement au stade
du questionnaire. Utiliser le bouton outil "questionnaire" (le
plus gauche) dans le panneau central.
Il n'est pas ncessaire non plus de passer explicitement par
la fonction Supprimer du menu Organiser. Vous pouvez
aussi utiliser le raccourci clavier Ctrl + Suppr.
On supprimera ainsi les nouvelles variables calcules qui
n'ont plus d'intrt.

Modifier les contrles de saisie


Il est possible de modifier sans limitation les contrles de
saisie, les renvois, les restrictions ou les groupements de
questions.
Dans les options de saisie, ces divers types de contrle et
d'organisation peuvent tre dsactivs.

Modifier les modalits


Pour les variables fermes, on peut tre amen changer
les modalits de rponses.
Sphinx 2000

Elaborer le questionnaire

61

Changer les modalits d une


question ferme

Unique <--> Multiple

Changer le type d une


variable :
ferme <--> ouverte
nombre <--> code
.

62

13. Mettre en page le questionnaire


papier
Si le questionnaire que vous diffusez auprs de
lchantillon choisi se prsente sur un support papier, vous
avez plusieurs solutions possibles pour produire le
document.

Traitement de textes ou Sphinx ?


Pour rpondre aux besoins les plus courants des enqutes
que vous menez, le Sphinx dispose dun menu trs complet
pour la mise en page de votre questionnaire. Toutes les
options de prsentation vous permettent dobtenir une
version papier de votre enqute, sur-mesure et prte
lemploi.
Si toutes ces possibilits ne vous suffisent pas pour
produire le document que vous souhaitez, vous pouvez
raliser le questionnaire dans un traitement de textes ou
dans un logiciel de publication assiste par ordinateur.
Cette option offre dinnombrables possibilits de mise en
page, mais vous perdez la continuit et lintgration dans
votre travail denqute. Afin de limiter le temps que vous
perdrez dans le droulement de ces tapes, vous pouvez
rcuprer facilement dans un autre logiciel les questions
que vous avez saisies dans Sphinx.

Une prsentation sur mesure


Le Sphinx propose de nombreuses options de prsentation
ncessaires ldition dun document professionnel et
personnalis. En effet, vous trouvez dans la fonction
Mettre en page du menu Fichier toutes les possibilits de
travail sur la prsentation de votre questionnaire :
choisir la disposition gnrale du questionnaire ;
choisir le nombre de colonnes sur lequel le questionnaire
est prsent ;
choisir la taille des caractres pour les libells, les
modalits, les consignes, etc ;
prsenter les questions dans des cadres ;
insrer des couleurs dans les titres des parties ;
insrer un logo ou des informations particulires en entte ;
numroter ou non les questions et les modalits de
rponses ;
afficher des consignes ;
affiner la prsentation des groupes de questions que
vous avez constitus ;
Sphinx 2000

dfinir la nature des cases cocher pour les rponses


aux questions fermes : rondes, carres, ombres ;
diter une chelle gradue pour les questions fermes
chelles ;
dfinir les zones de rponses aux questions ouvertes :
ligne, cadre ;

Aperu du questionnaire avant


impression
Vous avez alors lanc un module indpendant qui vous
aidera galement imprimer mais avant cela, trouver la
meilleure prsentation de votre questionnaire. Vous pouvez
donc obtenir un aperu avant impression.
En bas droite, une loupe agit comme un zoom sur votre
questionnaire. En bas gauche, un curseur vous
permettra, une fois la saisie effectue, de faire dfiler
chaque questionnaire pour le visualiser ou limprimer.
Licne de gauche figurant un questionnaire permet de
revenir au questionnaire vierge.
Laperu que vous obtenez dans un premier temps peut
tre modifi avec toutes les fonctions disponibles dans le
bouton Mise en page.

Amlioration du questionnaire dans un


traitement de textes
Si lensemble des options de mise en page disponibles
dans Sphinx sont insuffisantes pour crer le questionnaire
que vous souhaitez diter, une procdure automatique
vous permet dinclure le questionnaire, tel quil a t saisi
dans Sphinx, dans un traitement de textes.
Vous pourrez alors lui apporter toutes les modifications que
vous souhaitez en utilisant toutes les options spcifiques
aux traitements de textes ou aux logiciels de prsentation.

Elaborer le questionnaire

63

Faire dfiler les questionnaires remplis

Une mise en forme sur mesure

Textes ou images en en-tte

64

Utiliser le zoom

Crer les zones de rponses

14. Options de mise en page


Le module de mise en page comprend six rubriques :
Disposition, En-tte, Numrotation, Zones, Polices et
Rponses.

Choisir une disposition


Le premier onglet Disposition permet dopter pour un
format portrait ou paysage, pour une prsentation du
questionnaire sur une ou plusieurs colonnes. Vous
complterez ces options en choisissant de placer les
rponses sous les questions ou en vis--vis des libells de
questions. Vous pouvez galement crer des cadres autour
des questions et insrer des bordures ou des couleurs
dans les titres des parties.

Dfinir len-tte
Le bouton En-tte est utilis pour insrer du texte ou des
images en en-tte, au-dessus du titre de lenqute qui
figure automatiquement en haut au centre de la premire
page. On peut ainsi prvoir un espace pour un numro de
questionnaire ou pour une date.
On peut insrer un logo en indiquant le nom du fichier
image et son chemin daccs entre crochets :
[c:\ sphinx2000 \ SphPrSc \ Automobi \ tortue.bmp] par
exemple.
Il est galement possible de faire figurer en en-tte la
valeur dune variable (nom de lindividu ou de lentreprise
par exemple) pour des questionnaires nominatifs prremplis. La variable doit tre aussi inscrite entre crochets.

Longlet Zones offre toutes les possibilits pour prsenter


les zones de rponses :
pour les questions fermes : forme des cases (rondes,
carres, grandes, petites, ombres), alignement des
modalits. La forme peut varier selon le type : ronde pour
les fermes uniques et carre pour les fermes
multiples ;
pour les chelles : choisissez les cases cocher ou le
trait continu ;
pour les questions ouvertes : optez pour des lignes, des
cases ou des cadres pour recueillir les rponses. Pour les
cases, on prcisera le format attendu en indiquant le
nombre de cases faire figurer et le texte qui les
accompagne ventuellement :
ans pour lge
par exemple (onglet Formats). Pour les cadres, on
indiquera le nombre de lignes dsir en cliquant sur
longlet Tailles.

Adapter les polices de caractres


Dans le menu Polices, vous avez la possibilit dadapter
une police de caractres chaque catgorie de texte de
votre questionnaire : en-tte, titre de lenqute et des
parties, commentaires, titres des questions, modalits de
rponses, consignes et rponses.

Indiquer les rponses


Quand les questionnaires sont dj remplis, et quils
doivent tre visualiss ou imprims, longlet Rponses
permet dindiquer si les rponses seront indiques par des
cases remplies ou coches ou encore par la modalit
souligne.

Numroter les questions et les


modalits
Dans le menu Numrotation, diffrentes options sont
disponibles pour diter ou non les numros des questions,
des modalits de rponses, pour afficher ou non des
consignes. Cette rubrique permet aussi de travailler la
prsentation des groupes de questions en faisant figurer le
nom des modalits de rponses ou leurs numros
correspondants en en-tte de chaque colonne (voir cicontre).

Sphinx 2000

Elaborer le questionnaire

65

Numrotation des modalits et des questions

Formes des zones de rponses et des cases cocher

66

15. Impression du questionnaire


Lorsque vous avez rdig votre questionnaire, il reste le
produire sur un support adapt votre enqute. Un module
vous permet de le convertir en page Html pour une
publication et un recueil des donnes sur le net.

Prparer la mise en page du


questionnaire
Les articles Mettre en page et Imprimer
module indpendant qui vous aidera trouver
prsentation pour votre questionnaire. Vous
aperu qui peut tre modifi avec toutes
disponibles dans le bouton Mise en page.

lancent un
la meilleure
obtenez un
les options

Choisir une disposition


Le premier onglet Disposition permet dopter pour un
format portrait ou paysage et pour une prsentation sur une
ou plusieurs colonnes.

Faire figurer les rponses


Aprs le recueil des donnes, vous pouvez faire apparatre
dans les questionnaires les rponses enregistres pour
chaque individu. Les cases correspondantes sont coches
et les valeurs numriques ou textes figurent dans les
espaces prvus cet effet. Choisissez vos options grce
longlet Rponses.
Cette possibilit est trs utile des fins de contrle, mais
aussi pour prparer des questionnaires dj documents
en partie. Ainsi pour consulter un panel, vous pouvez faire
figurer lidentit de vos panlistes sur le questionnaire.
Pour faire apparatre les rponses dans les questionnaires,
cliquez sur les flches en bas gauche de lcran : elles
permettent de faire dfiler laperu des questionnaires pour
chaque rpondant. Avec le bouton Imprimer, vous pouvez
imprimer le questionnaire courant, une srie ou la totalit
des questionnaires. Licne de gauche, figurant un
questionnaire, permet de revenir au questionnaire vierge.

Vous complterez ces options en choisissant de placer les


rponses sous les questions ou en vis--vis, et en insrant
des bordures ou des coloriages sur les titres de parties.
Longlet Zones permet de choisir, selon le type de
questions, les conventions graphiques utiliser (type et
disposition des cases cocher). Les options daffichage
des consignes, de numrotation de questions et de
modalits, sont accessibles par longlet Numrotation.

Affiner la prsentation
Avec les onglets Polices et En-tte, vous personnalisez
vos questionnaires en variant les polices selon les
lments du questionnaire. Rdigez vos en-ttes en
distinguant la premire page des pages suivantes ou en y
insrant votre logo.

Imprimer le questionnaire
Le bouton Imprimer lance limpression conformment
vos choix de mise en page. Vous pouvez galement utiliser
Inclure dans le rapport pour reprendre votre
questionnaire dans un document Word.

Sphinx 2000

Elaborer le questionnaire

67

Mettre en page
le questionnaire

Faire dfiler
les questionnaires
et visualiser
les rponses

68

16. Exporter le questionnaire


Si toutes les options de mise en page disponibles dans le
Sphinx ne correspondent pas la prsentation que vous
souhaitez obtenir, vous avez encore la possibilit
dexporter le questionnaire dans un traitement de textes.

Inclure dans le rapport


L'article Inclure dans le rapport du menu Fichier lance
votre traitement de textes et reproduit votre questionnaire
dans Word. Vous retrouverez ainsi une partie de la mise en
page que vous avez dfinie. C'est la solution la plus
pratique mme si vous avez dautres solutions de
rcupration du questionnaire dans un autre logiciel.

Modifications dans le traitement de


textes
Que vous ayez choisi la fonction Inclure dans le rapport
ou lenregistrement dans du questionnaire dans un format
Texte, votre travail consiste maintenant utiliser les
diffrentes options disponibles dans votre traitement de
textes prfr pour obtenir la prsentation que vous dsirez
et essayer de faire mieux que le Sphinx
Sauf cas exceptionnel, prenez garde de ne pas introduire
de modifications dans lordre des questions, sinon la saisie
qui va sensuivre risque dtre beaucoup moins pratique et
vous prendra donc beaucoup plus de temps.

Enregistrement du questionnaire au
format Texte
Dans le stade Elaboration du questionnaire, le menu
Fichier permet daccder la fonction Enregistrer sous.
Dans cette fentre, choisissez loption Faire une copie du
questionnaire puis Dans un fichier texte dans le menu
droulant.
Votre questionnaire est alors enregistr dans un format
texte (xxx.txt) dans le rpertoire que vous avez choisi.
Lancez le traitement de textes que vous utilisez
couramment puis ouvrez le fichier texte contenant votre
questionnaire.
Pour accder votre questionnaire, demandez votre
traitement de textes dafficher tous les types de fichiers.
Parfois, il ne vous propose que les fichiers qui sont dans
son format (xxx.doc par exemple pour Microsoft Word).
Votre questionnaire est maintenant dans un traitement de
textes. Le Sphinx a export les textes des questions, les
consignes, les modalits proposes ainsi quune case pour
accueillir chaque rponse.
La manire dont le Sphinx exporte le questionnaire nest
pas paramtrable. En fait, il envoie le questionnaire dans le
traitement de textes dans une prsentation la plus simple
possible, afin que tout nouvel amnagement soit possible.

Sphinx 2000

Elaborer le questionnaire

69

Copier le questionnaire
en format texte

Eventuelles modifications
dans lenvironnement
du traitement de textes

70

Sphinx 2000

Elaborer le questionnaire

71

Saisir les
rponses

72

Enqutes ncessitant un
environnement de saisie particulier

1. Les diffrentes sources de


donnes
Avant dtre analys, un fichier de rponses Sphinx peut
tre constitu selon plusieurs mthodes, en fonction des
objectifs de ltude et des moyens matriels disponibles. La
saisie manuelle via le clavier dun ordinateur reste la
technique la plus couramment utilise mais vous avez
aujourdhui accs de nombreuses autres possibilits.

Enqutes simples peu volumineuses


Pour les tudes qui concernent quelques centaines de
rpondants sur quelques dizaines de questions, la saisie
manuelle reste la solution la plus rentable. Elle peut
sorganiser sur un ou plusieurs postes de saisie. Le Sphinx
permet de mettre en place facilement une saisie multipostes puis de rassembler toutes les donnes dans un
mme fichier.

Enqutes utilisant des donnes prexistantes

Vous avez peut-tre choisi de mener une enqute dans


laquelle vous demandez aux rpondants de saisir
directement leurs rponses partir dun questionnaire
quils consultent sur un cran (borne interactive par
exemple). Lenvironnement de la saisie doit tre ici
particulirement agrable. Dans cet objectif, utilisez le
module Sphinx Multimedia, qui permet de crer des
questionnaires droulants qui intgrent images, sons et
vidos.

Enqutes en rseau
Si lensemble des rpondants a accs un rseau interne
ou externe, le module Le Sphinx et lInternet vous permet
de concevoir un questionnaire au format adquat, pour
linstaller en rseau et organiser la collecte des rponses
dans un fichier dtermin. Voir le paragraphe Scanner et
Internet ce sujet.

Dans certains cas, les fichiers de rponses vont tre


constitus dune part de donnes recueillies par un
questionnaire et dautre part de donnes qui existent dans
un fichier quelconque (tableur ou base de donnes en
gnral). On va par exemple interroger des clients pour
une enqute de satisfaction et lon dispose par ailleurs de
diffrentes informations figurant dans une base de donnes
(identit, volume daffaires etc). Dans ce cas, le Sphinx
permet de regrouper les rponses lenqute et les
donnes pr-existantes.
Pour cela, il est recommand dutiliser les fonctions de
Gestion de panels et de Fusion de 2 enqutes
prsentes dans les pages suivantes.

Enqutes traitant un gros volume de


rponses
Pour grer les enqutes gros volume (plus de 1000
observations par exemple), la saisie manuelle peut savrer
longue et coteuse. Il est alors intressant dutiliser la
saisie par scanner qui est dcrite dans le paragraphe
Scanner et Internet. Celle-ci est particulirement rentable
quand le questionnaire ne comprend que des questions
fermes.

Sphinx 2000

Saisir les rponses

73

74

Aprs la saisie de la dernire question, le bouton


devient
Enreg. Il vous suffit de cliquer sur ce bouton pour valider
lenregistrement de cette rponse.

2. Saisie des rponses


Aprs l'laboration du questionnaire, abordons le deuxime
stade dans la ralisation d'une enqute : la saisie des
rponses. C'est l'objet de l'article Saisie des rponses du
menu Stade. On peut saisir des rponses dans deux
modes diffrents : le mode direct et le mode rapide. On
slectionne le mode de saisie partir des boutons
disponibles dans le panneau central du stade des
Rponses ou en passant par le menu Saisir.
La saisie des rponses est enregistre automatiquement
par le logiciel. Il nest donc pas ncessaire de procder
lenregistrement des donnes. Cependant, nous vous
conseillons de faire des copies de sauvegarde de vos
enqutes en cours de saisie et la fin de la saisie. Utilisez
pour cela la fonction Enregistrer sous / Faire une
sauvegarde de lenqute et choisissez le rpertoire dans
lequel vous souhaitez enregistrer votre copie.

Saisie directe
Ce mode organise la saisie question par question. Dans le
cas des questions groupes, la fentre de saisie directe
prsente un tableau de questions (si les groupes de
questions sont activs).
Lorsque la rponse est ferme, on coche l'cran la
modalit retenue ou on tape le numro correspondant. On
passe la question suivante avec la touche entre ou en
cliquant sur la flche de droite correspondant au dfilement
des questions. On dcoche une case dj slectionne en
cliquant nouveau sur celle-ci. Lorsque la question est
ouverte, on entre au clavier le texte ou le numro souhait.
Vous noterez que les cases sont rondes lorsque la rponse
est unique, et carres quand plusieurs rponses sont
autorises. La saisie est contrle : on ne peut pas entrer
de code inexistant ou de valeur hors bornes, ni cocher plus
de rponses que le nombre maximum autoris.
Ce mode de saisie est particulirement appropri pour les
enqutes tlphoniques, puisquil permet de visualiser le
libell complet des questions et des modalits de rponses
proposer dans un cran qui offre donc tout ce qui est
ncessaire tant pour administrer les questionnaires que
pour recueillir les donnes.

Sphinx 2000

Saisie rapide
Ce mode de saisie fait apparatre toutes les questions dun
rpondant dans la mme fentre. On peut faire de la saisie
au kilomtre en rentrant les donnes au clavier.
Dans ce cas, on entre le numro des modalits retenues
sans avoir valider aprs chaque question ou chaque
observation. En ce qui concerne les questions ouvertes, on
saisit les textes ou les nombres au clavier. La saisie des
questions multiples se fait en entrant successivement les
rponses dans les cases et le passage la case suivante
seffectue avec la touche Tabulation ou la touche Espace.
Si la question est rponses ordonnes, on entre dans la
premire case la rponse donne au rang 1, dans la
seconde case, la rponse donne au rang 2 Enfin, dans
ce mode de saisie, les questions groupes napparaissent
pas sous forme de tableaux.
Le passage la question suivante est automatique ds que
le nombre de caractres attendu est atteint. Un cas
particulier se prsente donc pour les questions ayant plus
de 10 modalits puisque le logiciel attendra deux
caractres : vous pouvez donc saisir 01 au lieu de 1 pour
forcer le passage la question suivante (Voir Options de
saisie). Le passage lobservation suivante est
automatique ds que la dernire question du questionnaire
est renseigne.

Les options communes aux deux


modes de saisie
Si une question na pas provoqu de rponse chez
linterview, vous passerez directement la question
suivante pour signifier quil sagit dune non rponse.
Quil sagisse du mode direct ou rapide, le bas de la fentre
de saisie propose :
le bouton Annuler pour supprimer les rponses saisies
pour lobservation en cours ;
le bouton Complter pour mettre non rponses toutes
les questions de la fin du questionnaire en cours de
saisie ;
le bouton Termin pour sortir de lcran de saisie.

Saisir les rponses

75

Saisie rapide :
toutes les questions sur
le mme cran

Utiliser les options de


passage automatique
(page suivante)

2 exemples d crans
de saisie directe

Pour utiliser le clavier


ici, il faut taper 2
caractres
76

12

43

3. Consultation et modification
Si aprs avoir saisi vos rponses, vous souhaitez aller
consulter lensemble des donnes, vous pouvez le faire en
utilisant le mode de consultation/modification disponible
dans le stade de la saisie des rponses.
Cet environnement peut tre prsent en mode direct (une
question par cran ou un tableau de questions dans le cas
des questions groupes) ou en mode rapide (toutes les
questions dun rpondant sur une mme fentre). Il existe
aussi un mode tableur qui permet de visualiser et de
modifier les donnes dans un tableau qui indique tous les
individus en ligne et toutes les questions en colonne.
On accde la consultation et modification des donnes
par le panneau central de la saisie des rponses, en
cliquant sur le bouton Consulter/Modifier ou par le menu
Saisir en choisissant loption Consulter/Modifier. Dans
lcran de consultation des donnes, on passe dun mode
lautre grce licne situ en bas gauche de lcran.
La possibilit daccder uniquement aux donnes dune
sous-population rpondant un profil est galement
propose par le Sphinx, ce qui acclre encore la
navigation dans les donnes.

Le mode direct
Le mode direct de consultation / modification est
particulirement adapt lorsquon souhaite vrifier la
rponse une question dun individu donn. Des flches
de navigation ainsi que des listes droulantes permettent
de passer rapidement dune question une autre et dun
individu un autre.

Les boutons Impr. et Suppr. permettent respectivement


dimprimer et de supprimer les rponses de linterview en
cours de consultation.

Le mode tableur
Ce mode est propos pour la vrification des donnes. Il
permet de parcourir la base d'un seul coup d'il en se
concentrant ventuellement sur une seule variable (bouton
une variable / toutes les variables). On passe dune
observation lautre avec le retour chariot ; ce qui permet
de modifier rapidement un ensemble de valeurs en entrant
les nouvelles donnes au clavier et en cliquant sur la
touche Retour Chariot.
Attention : vous ne pouvez pas modifier les rponses aux
questions textes en mode tableur. Revenez dans un des
autres modes.
Pour aller encore plus vite dans les modifications
d'ensemble sur la base, vous pouvez utiliser le bouton
Remplacer qui permet de changer des valeurs sur une ou
plusieurs variables, et ceci, pour toutes les observations ou
pour un sous-ensemble d'observations dfinies par un
profil.

Consulter un profil dindividus


En effet, le bouton N disponible dans les diffrents modes
de consultation / modification des donnes permet de
chercher les observations par :
leur numro (bouton N) ;
leur rponse une variable (bouton Par sa valeur) :
slectionner la variable et crire dans le cadre qui suit le
contenu de la recherche ;
leur profil que vous pouvez dfinir sur une ou plusieurs
conditions (bouton Par son profil).

Une option vous permet dindiquer si vous voulez


seulement consulter les donnes ou si vous souhaitez
aussi les modifier.
Pour sortir de la consultation des rponses sans enregistrer
les modifications saisies, utilisez le bouton Annuler.

Le mode rapide
Vous pouvez consulter toutes les rponses dun individu
dans un mme cran si vous choisissez le mode rapide.
Sur un mme questionnaire, vous passez dune question
lautre avec le Retour Chariot. Le bouton Annuler ferme la
fentre consultation/modification sans enregistrer les
modifications apportes.
Sphinx 2000

Saisir les rponses

77

Afficher les modalits


par leur nom et / ou
leur numro

Naviguer
Atteindre

Supprimer
Imprimer

Boutons de commandes en mode direct

Illustrer
Changer de mode

Modification rapide en
mode tableur

Slectionner un sousensemble
d observations

Modifier partout
78

4. Options et contrles de saisie

Enfin, on peut dfinir des raccourcis (Ctrl+1, Ctrl+2) pour


saisir les textes ou expressions frquemment rpts dans
les questions ouvertes. Cette option est valable dans les
deux modes de saisie.

En dfinissant les questions, on peut fixer des contrles qui


sappliqueront au moment de la saisie. On facilite ainsi le
travail en amliorant sa fiabilit. Dautre part, de
nombreuses options sont maintenant offertes pour adapter
lenvironnement de saisie chaque cas particulier.

Options de saisie
On les fixe partir de larticle Options de saisie du menu
Saisir. Elles dpendent du mode de saisie choisi.
En mode rapide, la solution par dfaut conduit passer
automatiquement litem suivant aprs documentation
complte (variables fermes, numriques et codes). Cette
option est propose par dfaut mais vous pouvez optez
pour une autre solution en cochant la case Attendre
Retour Chariot pour passer la question suivante.
Si vous conservez loption propose par dfaut, ceci oblige,
lorsque la question contient plus de 10 modalits, taper
deux caractres pour les modalits de code infrieur 10
(03 par exemple) avant de passer la suivante. On peut
standardiser en obligeant dans tous les cas saisir deux
caractres : case Attendre toujours 2 caractres pour
une modalit.
En mode direct, on passe la question suivante en faisant
un retour chariot aprs avoir indiqu la rponse (ou en
agissant sur la flche vers la droite). Pour les rponses
textes, on aura le mme comportement en cochant loption
Pas de retour chariot dans les questions textes. Pour
les questions fermes, on peut faire afficher plusieurs
modalits par ligne ou une seule, et faire ou non apparatre
leurs numros.

Contrles automatiques de saisie


Les renvois et les restrictions, ainsi que les contrles de
saisie tels que la saisie obligatoire ou la vrification de
valeurs numriques, sont activs respectivement par les
cases Activer les renvois, Activer les restrictions et
Activer les contrles de saisie.
Dans le cas des questions groupes, il faut cocher Activer
le groupement de questions pour les faire apparatre en
mode direct.

Sphinx 2000

Saisir les rponses

79

Saisir ou consulter
Contraintes
de saisie

Mode de consultation
par dfaut

Options de saisie en
mode rapide

Options de saisie en
mode direct

Rechercher des
observations

80

Consolidation d'enqutes ayant une


partie commune*

5. Rassembler / Fusionner
L'article du menu Grer permet de crer une enqute
unique partir de plusieurs enqutes.

Rassemblement d'enqutes
strictement identiques

Deux (ou plusieurs) enqutes sont sensiblement


diffrentes. Elles ont des questions communes mais
d'autres sont spcifiques. Par exemple on fait une enqute
de satisfaction avant et aprs la mise disposition d'un
service. Les deux questionnaires sont presque identiques
mais pas compltement.

C'est le cas lorsque l'on fait de la saisie multipostes.


Chaque oprateur a sur sa machine une copie du
questionnaire et un fichier contenant les rponses qu'il a
saisies.

La consolidation consiste crer une nouvelle enqute


dans laquelle on a toutes les observations (avant ou aprs)
mais uniquement les variables communes aux deux
questionnaires.

L'opration consiste mettre bout bout les diffrents


fichiers de rponses.

On choisira dans les dialogues les enqutes consolider,


puis les variables conserver.

Le rassemblement de plusieurs fichiers de rponses


saisies sur des postes diffrents est possible sils ont t
faits sur un questionnaire strictement identique. Pour
prparer les postes de saisie, faire une copie du
questionnaire (fichier ayant une extension .que) sur chaque
poste en utilisant dans le menu Fichier la fonction
Enregistrer sous et Faire une copie du questionnaire /
Pour une nouvelle enqute.

Une variable "SOURCE" sera automatiquement rajoute


pour identifier chaque questionnaire et ensuite faire des
comparaisons avant aprs.

Lorsque la saisie est termine, faire une copie de toutes les


enqutes, sauf une qui restera sur un disque dur. Faites
ces copies sur disquette ou sur tout autre disque
accessible depuis le poste o vous allez faire le
rassemblement. Donner un nom diffrent chaque fichier
de saisie nest pas indispensable si vous faites des copies
sur des supports diffrents mais cela vous aidera
retrouver vos divers fichiers.
Ouvrez maintenant dans Sphinx lenqute qui est reste
sur
le
disque
dur
et
choisissez
larticle
Rassembler/Fusionner du menu Grer et loption
Rajouter des observations dune enqute identique.
Slectionner le fichier ayant une extension .rep qui se
trouve sur la premire disquette introduite ou sur le support
que vous ouvrez. Aprs avoir valid, lenqute sur votre
disque dur est augmente des rponses de la disquette.
Rptez ces manipulations pour chaque fichier de saisie. Il
est conseill de noter l'ordre dans lequel les saisies
partielles ont t ajoutes les unes aux autres. Cela vous
permettra ensuite de classer les observations selon leur
groupe de saisie.

Sphinx 2000

Fusion d'enqutes*
Deux enqutes prsentent une variable commune
permettant d'identifier une observation, par exemple deux
questionnaires portant sur des sujets diffrents ont t
proposs au personnel d'une socit. Dans chacune de
ces enqutes, on retrouve le nom de la personne.
La fusion des deux enqutes consiste crer une nouvelle
enqute dans laquelle on aura pour chaque personne les
rponses aux questions du premier questionnaire ET celles
du second. On pourra ainsi croiser les variables qui taient
au dpart dans des enqutes diffrentes.
On choisira dans les dialogues l'enqute fusionner avec
l'enqute courante, puis la variable permettant d'identifier
une observation, et enfin les variables conserver dans
l'enqute fusionne.

Saisir les rponses

81

Rassembler des observations


concernant une mme enqute

Rassembler des enqutes


partiellement identiques

Fusionner deux enqutes portant


sur la mme population

82

Ouvrir un fichier de donnes

6. Importer des rponses*


Larticle Importer des donnes du menu Grer permet
douvrir dans Sphinx des donnes cres dans un autre
logiciel, en vue de les analyser grce aux mthodes
danalyse quantitative et qualitative. A linverse, vous
pouvez aussi rcuprer toutes les donnes saisies dans
Sphinx dans un autre logiciel en exportant les donnes par
la fonction Enregistrer sous / Exporter les donnes du
menu Fichier.

Importer des rponses


Les donnes importer doivent tre enregistres au format
texte (Ascii) et avoir une structure rgulire (entre 2
sparateurs d'observations, il faut le mme nombre de
sparateurs de variables). Un tableau Excel vous garantit
cette rgularit. Il faut d'autre part avoir dfini dans le
Sphinx un questionnaire qui corresponde exactement la
structure des donnes importer (mme nombre de
variables que de colonnes sauf dans le cas des fermes
multiples qui comptent autant de colonnes que de rponses
possibles.)

Cette procdure d'importation de rponses ncessite


d'avoir dfini un questionnaire au pralable dans Sphinx.
Sous certaines conditions, on peut s'en affranchir en
passant par la procdure Ouvrir un fichier de donnes du
menu Fichier.

Exporter les rponses


L'opration inverse de l'importation est galement possible.
C'est dans un dialogue identique que les donnes
exporter et leur aspect (nom ou numros des modalits)
seront choisis.
Cette exportation permettra ensuite de traiter les donnes
dans un autre logiciel.

Dans l'cran ouvert par l'article Importer des donnes du


menu Grer, vous avez la possibilit de :
slectionner les variables importer. Le Sphinx suit
l'ordre de la table ;
vrifier que les sparateurs correspondent ceux de
votre fichier ;
indiquer si le fichier de donnes contient des codes
numriques ou si les modalits sont crites en clair ;
prcisez si la premire ligne contient ou non les noms de
variables ;
slectionnez enfin le fichier de donnes en validant :
l'importation se fait automatiquement.

Importer des complments de


rponses
Il est possible de complter un fichier d'enqute : indiquez
si vous souhaitez crer de nouvelles observations
s'ajoutant celles qui existent dj (Crer de nouvelles
observations) ou si vous voulez qu'elles se substituent
aux informations existantes (Modifier les observations
existantes). C'est ce qu'on fait quand on veut complter
une saisie avec des donnes dont on dispose par ailleurs.

Sphinx 2000

Saisir les rponses

83

Importer des donnes

3/ Choisissez un
mode
dimportation
1/ Slectionnez les
variables
importer

2/ Dfinissez le contenu
de vos donnes

84

4/ Ouvrez le fichier
des donnes

7. Gestion de panels*
Le Sphinx Plus2 comporte un systme complet de gestion
de panel. Cette activit consiste exploiter un fichier de
personnes, les panlistes, rgulirement consultes sur
diffrents sujets. Il contient des donnes permanentes
didentit. On appel campagne lactivit consistant
consulter par questionnaire tout ou partie du panel.
A chaque campagne, on est ainsi amen crer un
questionnaire pour ladresser une slection de panlistes.
On saisit leurs rponses pour ensuite les enrichir des
donnes permanentes contenues dans le panel.

La liste peut tre transfre vers un traitement de textes,


vers un fichier, ou limprimante en adaptant son contenu
aux besoins (adresses pour un mailing, liste de noms et
numros). Utilisez pour cela les boutons Transfrer et
Editer.
Si vous voulez enfin remplir votre fichier de campagne avec
les renseignements sur les panlistes de votre slection,
lancez : Ajouter aux observations existantes, (ou
Remplacer les observations existantes). Les donnes
du panel correspondant aux individus et aux variables
slectionnes (Editer) seront reportes dans lenqute
courante.

Les tches accomplir sont les suivantes :


Rdiger le questionnaire de campagne : il contient une
variable didentification des panlistes (numro de
panlistes ou autre), et les questions propres la
campagne.
Slectionner les panlistes que lon souhaite consulter en
sappuyant sur les variables didentit contenues dans le
panel.
Expdier un questionnaire vierge rduit aux questions de
la campagne et au numro de panliste ou comportant
galement des variables didentit pr-remplies partir
du panel.
Saisir les rponses de la campagne.
Eventuellement complter les donnes de la campagne
par dautres donnes en provenance du panel.
La fonction Grer un panel accessible partir du menu
Grer permet de raliser successivement ces tches.

Choisir un panel
A partir du questionnaire de la campagne, avec le bouton
Changer, on dsigne le fichier du panel et le nom de la
variable clef, celle qui permettra dassocier aux rpondants
de la campagne les informations contenues dans le panel.

Slectionner des panlistes


Avec le bouton Modifier, on dfinit le profil des panlistes
consulter en fixant les conditions auxquelles les interviews
doivent rpondre. Le bouton Rechercher permet den
extraire la liste ventuellement restreinte un effectif fix
(Restreindre ).
On peut affiner la liste la main en slectionnant des
lments de la liste (boutons Oter et Mettre).
Sphinx 2000

Saisir les rponses

85

Choisir le fichier
du panel

Extraire des panlistes

Affiner la slection

Copier les panlistes dans


lenqute

86

La mise jour porte sur les seules questions du panel.


Cette fonction permet notamment denregistrer les
modifications didentit constates au moment des
campagnes.

8. Documenter depuis le panel


Saisir les donnes de campagne
Vous saisirez les rponses des panlistes slectionns
dans votre questionnaire de campagne. Bien videmment,
il vous faudra rentrer leur identit (nom ou numro
correspondant la variable clef) : cela vous servira ensuite
pour rcuprer les autres informations contenues dans le
panel.
Pour faciliter ce travail de saisie, envoyez aux rpondants
des questionnaires pr-remplis contenant au moins le
numro de panliste. Reportez ces numros dans votre
enqute en utilisant la fonction Grer un panel.
Pour cela, faites Slectionnez les panlistes, Ajouter ou
Remplacer
les
observations
existantes.
Vous
imprimerez vos questionnaires pr-remplis en slectionnant
Tous les questionnaires dans le dialogue dimpression
(stade Questionnaire).

Fusionner deux enqutes


Un dialogue analogue celui de la gestion de panel permet
la fusion de deux enqutes. On commence par associer
lenqute courante celle avec laquelle on dsire la
fusionner. Lenqute que lon veut ajouter joue ici le rle du
panel.
Dans le dialogue suivant, on slectionne les questions que
lon souhaite ajouter lenqute courante.
Ces questions viendront sajouter la fin du premier
questionnaire
et
les
rponses
correspondantes
complteront le fichier de donnes.

Le plus simple pour effectuer la saisie est de supprimer de


votre enqute toutes les rponses cres ltape
prcdente. Utilisez un renvoi pour sauter les ventuelles
donnes du panel que vous documenterez ltape
suivante.

Complter avec le panel


Lorsque vous aurez termin la saisie des donnes de
campagne, vous pourrez ajouter des informations
complmentaires contenues dans le panel.
La fonction Complter avec le panel permet dajouter
votre enqute les donnes concernant les individus du
panel. La correspondance se fait grce variable clef.
Dans le dialogue, ces questions sont prcdes par le
signe . Vous avez galement la possibilit dajouter
votre enqute des questions du panel qui ny figurent pas.
Les questions et rponses correspondantes viendront
sajouter automatiquement. Utilisez pour cela les boutons
Marquer et Enlever.

Mettre jour le panel


Cette fonction a pour effet de mettre jour le panel en
remplaant les donnes conformment au contenu de la
campagne.
Sphinx 2000

Saisir les rponses

87

Indiquer la variable clef


prsente dans
les 2 enqutes

Slectionner les questions


ajouter
lenqute courante

Mettre jour

CAMPAGNE
ENQUETE 1

Documenter avec le panel


Fusionner 2 enqutes

PANEL
ENQUETE 2

Slectionner lenqute
ajouter
lenqute courante

88

Le Sphinx et lInternet

9. Scanner et Internet
Le Sphinx vous donne accs aux nouvelles technologies
de saisie : la lecture de questionnaires par scanner et
lutilisation dInternet. Pour mettre en uvre ces fonctions,
vous devez vous procurer les modules spcialiss
correspondants.

La saisie par scanner


Lorsque vous aurez dfini votre questionnaire dans le
Sphinx, vous pourrez le mettre en page et limprimer dans
un format directement lisible par un scanner. Si votre
questionnaire ne comporte que des questions fermes,
vous pourrez ainsi compltement automatiser la saisie. Sil
contient des questions ouvertes ou numriques, les
rponses seront enregistres comme des images et vous
devrez les entrer au clavier.
Le module de lecture par scanner vous guide trs
simplement pour lensemble de ces tches. Il est
accessible directement partir de Sphinx par l'article
Lecture par scanner du menu Saisir de Sphinx.
Son interface de fonctionnement est trs simple. Un bouton
Imprimer lance l'impression du questionnaire qui sera
dupliqu (imprimante, photocopie, offset,...). Un bouton
Scanner lance la lecture automatique des imprims
remplis. Les rponses peuvent tre consultes et
compltes avant dtre enregistres.

Internet peut tre un moyen trs efficace de consulter une


population. Il est notamment adapt dans le cas dun
Intranet. Grce au module Le Sphinx et lInternet, vous
pourrez trs simplement produire un questionnaire sous la
forme de page html.
Tout est automatis, il vous suffit dindiquer quelles options
de prsentation vous conviennent le mieux (cases
cocher, listes) et dun seul clic, les fichiers html sont
gnrs. Il vous restera les installer sur votre serveur et
orienter vos interlocuteurs vers le questionnaire. Ils
rpondront directement et vous naurez qu ouvrir le fichier
Sphinx qui se trouvera ainsi document sur votre serveur.
Vous aurez mis en place un outil trs efficace pour votre
communication. En vous vitant la tche de saisie, vous
pourrez encore plus rapidement restituer vos rsultats. Une
option vous permet mme de les faire apparatre lorsque
vos interlocuteurs ont fini de rpondre.

Publier les rsultats


Vous pourrez enfin publier sur Internet le rapport que vous
aurez rdig depuis le Sphinx. Si vous utilisez Eurka!,
lopration sera entirement automatique.

Le bouton Mise en page permet d'adapter la prsentation


du questionnaire tous les types d'enqutes.
Le bouton Rglages permet de configurer le
fonctionnement de la reconnaissance pour l'adapter au
scanner utilis.
Les cases cocher seront reconnues automatiquement
avec un taux de succs suprieur 99%. Les ratures sont
traites automatiquement. Les coches sont reconnues
mme si elles ne sont pas parfaitement dessines.
Vous trouverez dans le manuel du module de lecture par
scanner tout ce qui fait sa grande souplesse dutilisation et
la facilit de sa mise en uvre.

Sphinx 2000

Saisir les rponses

89

1/ Rdaction du questionnaire dans Sphinx

2/ Impression

2/ Cration dun questionnaire html

3/ Collecte des rponses

4/ Saisie
manuelle

4/ Saisie
scanner

3/ Publication sur un serveur

4/ Rcupration des
rponses

5/ Traitements et analyses

6/ Edition dun
rapport papier

6/ Publication automatique du rapport sur


le Web avec Eurka!

Quelques exemples (agrandis) de coches reconnues

et quelques cases non reconnues

Par dfaut, ceci sera


la limite de la case

Par dfaut, ceci sera


rature

assez intelligente!

Scanner : gain de temps et fiabilit

90

Internet : communication directe, rapidit,


interactivit

Si vous souhaitez indiquer des quotas croiss (hommes


ayant le permis, femmes ayant le permis), il vous faudra
au pralable dfinir la variable qui croise ces conditions
(Menu Recoder, Transformer/Combiner, Combiner des
variables, Fusion croise).

10. Redresser un chantillon


On dit quun chantillon est biais lorsque, sur un ou
plusieurs critres, sa rpartition diffre dune population de
rfrence.

Appliquer des quotas


Redresser un chantillon consiste lui substituer un nouvel
chantillon proportionnel la population de rfrence. On
procde en indiquant, pour chacune des variables de
redressement, les quotas quelles doivent respecter.
Le Sphinx dfinit alors une strate ou cre une nouvelle
enqute dont la composition dcoule de lapplication des
quotas.
Par exemple, on veut redresser lenqute Automobiles
pour obtenir un chantillon o le taux de dtention de
permis et le rapport homme/femme soient proportionnel
la rpartition de la population franaise, savoir, 60% de
personnes ayant le permis et 45% dhommes. On indiquera
pour la variable permis : 60% de oui, 40% de non, et pour
la variable sexe : 45% dhommes, 55% de femmes.
Le Sphinx recherche le sous-ensemble le plus nombreux
correspondant aux conditions fixes. Dans le cas prsent, il
trouve une strate de 50 observations dont la rpartition
respecte les quotas fixs.
Le Sphinx vous place automatiquement dans cette strate
dfinie par lappartenance ou non lchantillon redress.
Cette information est enregistre dans une nouvelle
variable. La strate vous permet ultrieurement de retrouver
votre chantillon redress sans avoir rpter la dfinition
des quotas. Il vous suffira de vous replacer sur la strate
correspondante.

Choisir les variables de redressement

Extraction alatoire
On peut ajouter la dfinition des quotas une condition de
taille de lchantillon. Celle-ci ne pourra tre remplie que si
leffectif rsultant de lapplication des quotas lui est
suprieur.
Dans ce cas, la rduction se fait dune manire alatoire.
Attention, si les chantillons sont faibles, lajout dune telle
condition risque de vous loigner de la rpartition vise.
Cette fonction est surtout utile lorsquon travaille sur des
donnes trs nombreuses. Elle peut alors servir
slectionner de plus petits chantillons.

Aide lchantillonnage
Le bouton Aide dans le dialogue de dfinition des quotas
renvoie un rappel de la thorie des sondages et un outil
de simulation de la prcision et de la taille de lchantillon.
On peut dans ces conditions :
Calculer la prcision dune estimation en fonction de la
taille de lchantillon.
Dterminer la taille dun chantillon en fonction dune
prcision recherche.
Cette fonction vous permet donc de choisir lune des deux
options et de simuler leffet des paramtres intervenant
dans le calcul dune estimation :
La taille de lchantillon.
La proportion estimer.
Lerreur maximum admise (ou imprcision de lestimation)
en terme dintervalle de confiance.
Le risque accept mesur par la probabilit que la valeur
estime soit en dehors de lintervalle de confiance.

Le redressement dchantillons est raliser au stade de la


Saisie des rponses, dans larticle Redresser / Dfinir
des quotas du menu Grer, qui ouvre un dialogue dans
lequel vous slectionnez vos variables.
Vous pouvez dfinir jusqu trois critres de redressement
parmi les variables fermes uniques de votre enqute. Par
dfaut, une rpartition qui-rpartie vous est propose,
modifiez-la en rentrant vos valeurs au clavier.
Sphinx 2000

Saisir les rponses

91

Slectionner les
variables

Dfinir
les
quotas

Extraction alatoire

Dtails de la
strate

Cration de la
variable dfinissant
lchantillon redress

92

11. Changer dunit statistique


Eclater des observations*
Questionnaires en grappes
Il est frquent que certaines enqutes contiennent des
informations correspondant des niveaux statistiques
diffrents. Par exemple dans une enqute sur les
mnages, on dcrit le mnage (type dhabitation, revenu,
C.S.P. du chef de famille, taille de la famille) puis on
dcrit les membres du mnage. Cette description donne
alors lieu la rptition dun groupe de questions comme
Age, Sexe, C.S.P. On peut envisager 2 niveaux
danalyse :
celui du mnage dont lunit est le questionnaire pris
dans son ensemble ;
celui de la personne dont lunit correspond aux
questions dcrivant chaque membre.
On rencontre dautres configurations : par exemple dans
une enqute de consommation, on pose une question
ouverte sur des marques connues dans un domaine.
Lanalyse peut se faire au niveau des personnes
interroges ou au niveau des marques cites. On est alors
amen dpouiller autant dobservations que de marques
cites dans la question ouverte.
Tous ces cas correspondent ce quon appelle des
structures en grappes. On peut dsirer analyser la
population des grappes ou celle des grains. Cest ce quon
appelle changer dunit statistique.

Eclater selon des questions


Les grains sont dfinis par un ensemble de n questions
identiques. Chaque observation sera clate en autant
d'observations que de questions.

Eclater selon le contenu dune


question texte
Cest le cas des marques cites ci-dessus. On cre autant
de nouvelles observations quil y a de fragments dans le
texte (fragment = marque).

Eclater selon la valeur dune question


numrique
Par exemple, on veut pondrer la statistique des mnages
par leur taille. On crera alors autant dobservations que le
mnage comporte dindividus.

Gnration de la nouvelle enqute


Dans tous les cas, les caractristiques communes (la
grappe) seront rptes autant de fois quil y a de grains
(questions ou groupes de questions, mots pour une ouverte
texte, valeur pour une numrique).
Une nouvelle enqute est cre dont le nombre
dobservations est multipli par le nombre de grains, de
fragments de la question texte ou de la valeur de la
numrique. Une variable supplmentaire lui est rajoute :
cest une clef qui tablit la correspondance avec lenqute
de dpart (N du grain, contenu du fragment.).

Le Sphinx permet de grer les questionnaires en grappes


en proposant 4 manires de changer dunit statistique.
Chacune delle conduit gnrer une nouvelle enqute
correspondant la nouvelle unit statistique (le grain). On
accde ces choix par la fonction Changer dunit
statistique du menu Grer.

Eclater selon des parties


C'est le cas le plus courant. Dans le questionnaire on
trouve une partie gnrale puis un ensemble de parties
identiques portant chacune sur un grain (membre de la
famille, produit utilis, )
On slectionne ces parties dans la liste des parties. Elles
doivent tre bien sr parfaitement homognes. Chaque
observation donnera lieu a autant d'observations que de
parties identiques.
Sphinx 2000

Saisir les rponses

93

Avant

Aprs

14 questions
2 + 4 *3

4 observations

7 questions
2 + 4 +1

10 observations
3*4 -2 (1 personne ne sest pas exprime
sur 2 des marques
Tableau crois pour
l ensemble des marques

Pas d analyse possible sur


l ensemble des marques

94

FREQUENCE
SEXE

Nonrponse

Jamais

Rare
ment

Souvent

TOTAL

Un homme

Une femme

TOTAL

10

12. Changer lunit statistique


Regrouper des observations*
Cette opration
prcdemment.

est

linverse

de

lclatement

dcrit

Lunit statistique est le grain et on veut faire des analyses


sur la grappe.
Lopration va consister crer une nouvelle enqute avec
autant de lignes que de grappes.
Pour chacune des variables, on indiquera quelle valeur on
attribuera la grappe en fonction des valeurs de chaque
grain.
Le mode de calcul dpend de la nature de la variable.

Pour certains types de variables, on pourra choisir une


mthode de calcul plus labore :
Variables fermes : fusionner les rponses dans une
question ferme multiple ;
Variables textes : runir tous les textes ;
Variables numriques : faire la somme ou la moyenne
des valeurs.
Dans un premier temps, il est ncessaire dindiquer quelle
est la variable qui va permettre didentifier les observations
regrouper.
Ensuite, on slectionnera une ou plusieurs variables et on
indiquera le mode de transformation dans la liste
droulante.
Enfin, il faudra donner le nom attribuer la nouvelle
enqute qui sera immdiatement ouverte.

Prenons lexemple dun ensemble de factures pour


lesquelles on a une variable CODE CLIENT suivie des
caractristiques de la facture (DATE, MONTANT, NOM DU
PRODUIT,
QUANTITE,
MODE
COMMANDE,
NO_FACTURE).
Pour faire une analyse par client, on regroupera toutes les
factures correspondant un mme client.
DATE : on veut conserver la date de la dernire facture ;
MONTANT : on cherche obtenir le montant total des
factures de chaque client ;
NOM DU PRODUIT : on veut, dans cette variable texte,
la liste de tous les produits achets ;
QUANTITE : la donne la plus intressante est la
moyenne dachats par facture ;
MODE COMMANDE : cette variable ferme unique a
trois modalits "Tlphone", "Minitel", "Internet". On veut
conserver toute linformation et donc obtenir une variable
ferme multiple dans laquelle une modalit est coche si
le client a effectu une commande au moins par ce biais ;
NO_FACTURE : il na aucune signification dans le
traitement des clients et on ignorera cette variable ;
En outre, il est intressant davoir une variable
NB_FACTURE qui indique le nombre de factures de
chaque client.
Les modes de calcul possibles sont les suivants :
Pour tous les types de variables, on pourra conserver la
premire apparition, conserver la dernire apparition ou
bien ignorer cette variable.

Sphinx 2000

Saisir les rponses

95

Avant

Cette variable est


inutile dans le
regroupement
AAA a utilis les
trois modes de
commande
400 +1080 +500 +200 = 2180

Aprs

96

CCC a pass deux


commandes

13. Outils complmentaires sur les


rponses*
Supprimer les doublons
La prsence de doublons dans une enqute ou dans un
fichier de donnes est toujours possible : mauvaise
organisation de la saisie, fichier de donnes mal qualifies,
saisie par Internet mal rgule,

Pour chacune des variables prsentant des diffrences, on


retrouve dans une liste les observations concernes et les
valeurs correspondantes.
Cette table de comparaison pourra tre imprime ou
transfre dans un fichier texte pour tre ensuite
confronte aux questionnaires papier par exemple.

Lorsque les observations sont identifiables par une variable


(nom, numro de dossier, code, ), il est possible de
supprimer ces doublons.
On indiquera dans le dialogue quelle est la variable
permettant didentifier les individus.
On indiquera ensuite comment traiter ces doublons en
conservant la premire apparition ou bien la dernire
apparition de chaque individu.
En outre, il est possible de combiner les observations
correspondant au mme individu (Voir la fonction
Regrouper des observations).

Trier les observations


La fonction permet de trier dfinitivement les observations
selon une ou plusieurs variables.

Comparer des fichiers de rponses


La fonction permet de comparer deux fichiers de rponses
une mme enqute.
Cette comparaison peut servir valider systmatiquement
une double saisie (la comparaison des tableaux de
rsultats nest quune sorte de preuve par neuf qui dnote
une forte probabilit mais pas une certitude de lidentit des
deux fichiers de saisie).
La comparaison est aussi utile pour comparer plusieurs
versions dune mme enqute et retrouver la bonne
rvision.
On indique lenqute que lon comparera lenqute
courante.
Pour les textes, la comparaison est effectue sans tenir
compte des majuscules, des accents et des caractres
sparant les mots.
Sphinx 2000

Saisir les rponses

97

Supprimer
les doublons

Trier
les rponses

Comparer deux fichiers


de rponses

98

Sphinx 2000

Saisir les rponses

99

Produire des
rsultats

100

Plan de dpouillement

1. Dpouiller
Les articles du menu Dpouiller offrent une premire
approche des rsultats base sur la restitution plat des
donnes. Vous prenez ainsi rapidement connaissance des
rsultats pour les sortir dans un rapport.

Dpouillement automatique
A lcran, limprimante, dans un rapport ou dans un
fichier, vous prenez connaissance des rsultats
lmentaires (tableaux plat, tris croiss dj dfinis,
tableaux rcapitulatifs) en excutant Dpouillement
automatique du menu Dpouiller.

Strates
Le Sphinx analyse soit lchantillon total, soit une strate
(sous-ensemble dindividus rpondant un profil
particulier). Larticle Strates du menu Dpouiller permet de
dfinir ce profil en le spcifiant par rapport une ou
plusieurs variables. Les strates sont conserves et vous
pouvez en changer en les slectionnant dans le dialogue et
en utilisant les boutons Modifier, Nouvelle et Appliquer.
Le bouton Caractriser permet de dcrire les individus de
la strate.

Options de dpouillement
Dans larticle Options de dpouillement du menu
Dpouiller, vous indiquez si vous souhaitez voir, dans les
rsultats, les lignes ou colonnes deffectif nul ainsi que les
non rponses. Cet article vous permet galement
dindiquer la prcision de vos rsultats, que ce soit pour les
effectifs ou pour les pourcentages.

Dans le plan de dpouillement, vous dressez la liste des


analyses et rsultats que vous souhaitez faire figurer dans
votre rapport (cadran Quels types danalyses). Vous les
slectionnez par type de tableau ou mthode en cochant la
case Mettre dans le plan et en slectionnant les analyses
retenues dans la liste (Quelles analyses). Vous pouvez en
ajouter de nouvelles (Ajouter). Vous avez le choix entre
diffrents modes de prsentation (tableaux, graphiques..)
en cochant dans le cadran Quels lments. Enfin, vous
pouvez lancer les traitements sur lchantillon total, sur les
strates que vous avez dfinies ou sur celles qui
correspondent aux modalits dune variable choisir (Sur
quelles observations).
En cliquant sur Excuter, les rsultats que vous avez
demands seront inclus et mis en page dans votre
traitement de textes. Vous pourrez alors ajouter vos
commentaires et imprimer votre rapport.

Produire des listes


Avec cet article, vous pouvez dpouiller vos donnes en
produisant des listes dindividus, dcrits par les variables
de votre choix. Ces rponses peuvent tre prsentes par
catgories et peuvent concerner un profil dtermin.

Appliquer un barme
Cette fonction permet de calculer la valeur dun score
global dfini par un barme.

Tableaux de bord
Cet article permet de lancer Eurka! et de bnficier de
ses riches possibilits de prsentation.

Cest donc cet article que vous devez vous reporter en


cours danalyse pour modifier les affichages.

Sphinx 2000

Produire des rsultats

101

Dfinir une strate

Options de dpouillement
Plan de dpouillement

Produire des listes


1. Choisir les variables
et la prsentation

102

2. Organiser et restreindre
la liste

2. Environnements de
dpouillement et danalyse
Avec le Sphinx, vous retrouverez la possibilit de voir vos
rsultats en les survolant (Dpouiller / Dpouillement
Automatique / A lcran Analyser / Rsultats) ou de
les analyser un par un (Analyser, Tableaux Plat,
Tableaux croiss). Un nouvel environnement vient
homogniser le dpouillement et lanalyse des questions
ouvertes (codes, dates et textes).

Dpouiller les rsultats


Les fonctions Rsultats du menu Analyser et
Dpouillement Automatique / A lcran du menu
Dpouiller, ainsi que le bouton Rsultats, disponible dans
lcran central du stade des traitements, ouvrent une
fentre permettant de visualiser les rsultats les uns aprs
les autres en utilisant la bote de dfinition des variables et
des tableaux.

classer les lments de la liste selon la frquence, lordre


alphabtique, lordre dapparition ou la longueur des
rponses ;
imprimer la totalit ou un sous-ensemble de la liste ;
croiser cette liste avec nimporte quelle autre variable
pour obtenir un tableau de frquences ;
caractriser chaque lment de la liste en revenant aux
donnes brutes ;
transformer les lments de la liste en interprtant les
codes, convertissant les dates ou en calculant le lexique
(liste des mots) ;
recoder la variable ouverte en crant une nouvelle
variable partir des lments de la liste (interprtation
des codes, conversion des dates, codification des textes
selon le lexique) ;
analyser le tableau en basculant dans lenvironnement
danalyse pour la mise en forme graphique et lapplication
de tests statistiques.

On peut ainsi voir : les tableaux plat des variables


fermes, les tableaux croiss dj dfinis, les tableaux de
groupes, et les tableaux rcapitulatifs rsumant ltude par
type de variables.
Dans cette fentre, le bouton Analyser le tableau fait
basculer dans lenvironnement danalyse.

Analyser les rsultats


Cet environnement, qui peut aussi tre ouvert partir du
menu Analyser, offre toutes les possibilits danalyse sur
les tableaux et graphiques.
Le passage dun tableau un autre est facilit par les
boutons Suivant et Autre. Suivant fait passer au tableau
suivant pour passer en revue les rsultats comme on le fait
dans lenvironnement de dpouillement. Autre permet
daccder directement au tableau dune autre variable de la
base.

Produire des tableaux de questions


ouvertes
Le dpouillement des questions ouvertes (textes, codes et
dates) seffectue dans un environnement particulier. Celuici permet de :
prsenter sous forme de tableau la liste dnombrant les
rponses identiques ;
Sphinx 2000

Produire des rsultats

103

Survoler
Choisir
la prsentation
des rsultats

Naviguer :
choisir les variables
dpouiller

Analyser
Mettre en forme
Calculer
Tester

Tableaux listes :
textes, codes, dates
Prsenter
Transformer
Croiser
104

3. Naviguer dans les tableaux de


rsultats
Le Sphinx permet de parcourir les rsultats pour en
prendre connaissance et de les transformer en modifiant
leur prsentation ou en compltant les analyses. Ces 2
tches font l'objet de 2 environnements diffrents : une
fentre Rsultats et une fentre Analyse. On passe
indiffremment dun environnement lautre en conservant
le contenu des tableaux mais en changeant les possibilits
d'action sur les cellules.

La fentre de consultation des


rsultats
La consultation des rsultats passe par le bouton
Rsultats disponible dans le panneau central du stade des
traitements, par la fonction Rsultats du menu Analyser,
ou encore par l'article Dpouillement automatique du
menu Dpouiller.
On peut voir indiffremment des tableaux plat des
questions fermes, des tableaux croiss dj dfinis, des
tableaux de groupes, et des tableaux rcapitulatifs
rsumant ltude par type de variable.
Le choix du type danalyse visualiser s'effectue grce aux
boutons situs en bas de la fentre et au centre. A gauche,
deux boutons offrent la possibilit de prsenter les rsultats
sous forme de tableaux ou de graphiques. A droite, un
menu droulant permet de choisir dans une liste les
traitements quon veut visualiser, quil sagisse de tris
plat, de tableaux croiss, de tableaux rcapitulatifs ou de
tableaux de groupes. Des flches compltent ce dispositif
de navigation et permettent ainsi de parcourir trs aisment
et trs rapidement l'ensemble des rsultats.
Le bouton Analyser le tableau permet de quitter cet
environnement et vous place dans la fentre d'analyse o
vous pourrez effectuer toutes les modifications ou
complments d'analyses que vous dsirez. Un double-clic
dans la fentre provoque le mme effet et vous place
automatiquement dans l'environnement d'analyse.

La fentre d'analyse
On y accde en venant de la fentre des rsultats par le
bouton Analyser le tableau ou aprs avoir slectionn,
partir du menu Analyser, un Tableau plat, un Tableau
crois ou un Tableau multiple.
Sphinx 2000

Quel que soit son contenu, cette fentre reproduit le


rsultat que l'on souhaite analyser et propose une barre
d'outils place en haut de la fentre. Les boutons
disponibles dpendent du type de tableau quon tudie
mais on trouve toujours les boutons Suivant et Autre qui
facilitent la navigation dans les diffrentes analyses. Ils
permettent en effet de passer au tableau suivant du mme
type ou d'en slectionner un autre dans la liste. La
description des autres actions possibles dans cette fentre
fait l'objet des chapitres consacrs l'analyse de chacun
des types de tableaux.
Depuis la fentre d'analyse, on revient dans lcran des
rsultats par l'article Rsultats du menu Analyser ou en
faisant Echap suivi d'un clic sur le bouton Rsultats.

La fentre de caractrisation des


observations
A partir de tous les tableaux, l'exclusion des rcapitulatifs,
on peut revenir au dtail des donnes en faisant un double
clic sur une cellule du tableau. Cette fonction complte la
navigation dans les rsultats par la possibilit de naviguer
dans les donnes.

Produire des tableaux de questions


ouvertes
Le dpouillement des questions ouvertes (textes, codes et
dates) seffectue dans un environnement particulier. Celuici permet de :
prsenter sous forme de tableau la liste dnombrant les
rponses identiques et classer les lments de la liste
selon la frquence, lordre alphabtique, lordre
dapparition ou la longueur des rponses ;
imprimer la totalit ou un sous-ensemble de la liste ;
croiser cette liste avec nimporte quelle autre variable
pour obtenir un tableau de frquences ;
caractriser chaque lment de la liste en revenant aux
donnes brutes ;
transformer les lments de la liste en interprtant les
codes, convertissant les dates ou en calculant le lexique
(liste des mots) ;
recoder la variable ouverte en crant une nouvelle
variable partir des lments de la liste (interprtation
des codes, conversion des dates, codification des textes
selon le lexique) ;
analyser le tableau en basculant dans lenvironnement
danalyse pour la mise en forme graphique et lapplication
de tests statistiques.

Produire des rsultats

105

Voir et analyser les rsultats

Environnement
de consultation

Choisir un type de rsultat


Outils danalyses

Environnement
danalyse

Fentre des
caractristiques

106

Passer au tableau suivant


Passer dun rsultat lautre

Tableaux rcapitulatifs des questions


textes

4. Tableaux rcapitulatifs
Ces tableaux donnent un aperu synthtique des donnes
recueillies en les regroupant par types de questions :
questions fermes, questions numriques, questions
textes. C'est une manire pratique de se faire une ide
rapide des rsultats.
On accde aux tableaux rcapitulatifs par le bouton
Rsultats, ou par la fonction Dpouillement automatique
du menu Dpouiller en slectionnant le type de traitement
adapt. Vous pouvez aussi utiliser l'article Tableaux
multiples du menu Analyser. On arrivera dans ce dernier
cas directement dans la fentre d'analyse.

Ce tableau prsente les variables textes en donnant pour


chaque variable : le nombre de non-rponses, le nombre
total de mots (taille du corpus), la longueur moyenne de la
rponse (en nombre de mots), la richesse (nombre de mots
diffrents), le nombre d'hapax (mots uniques), la frquence
du mot le plus cit, et le mot le plus cit.
Sous le tableau, on peut lire la liste des 10 mots les plus
frquemment cits dans chaque question texte.
Dans la fentre d'analyse, on peut supprimer des lignes ou
des colonnes pour prsenter ce type de tableau sa
convenance.

Tableaux rcapitulatifs des questions


fermes
Ce tableau prsente les variables nominales et chelles.
Les 2 premires colonnes donnent le nom des modalits
les plus cites, la troisime celui de la moins cite. La
dernire colonne indique le nombre de non-rponses. Dans
la fentre d'analyse, on peut supprimer les lignes ou les
colonnes slectionnes dans le tableau.

Tableaux rcapitulatifs des questions


ouvertes
Ce tableau prsente les variables numriques et les
chelles en donnant sur 6 colonnes les valeurs de la
moyenne, du minimum, du maximum, du nombre de nonrponses, de l'cart type et de la somme.
Pour les chelles, ces valeurs sont calcules en fonction
des valeurs associes aux modalits. Elles peuvent tre
modifies avec le bouton Barme.
Dans la fentre d'analyse, on peut supprimer des lignes ou
des colonnes dans ces tableaux. On peut galement faire
un test de comparaison de moyennes entre 2 variables
avec le bouton Comparer. Il faut pour cela slectionner les
lignes correspondantes (Maj+Clic sur les repres des
modalits comparer avant de cliquer sur les modalits
comparer).

Sphinx 2000

Produire des rsultats

107

Tableaux rcapitulatifs
Dpouiller

Analyser

Variables nominales
et chelles

Supprimer
lignes,
colonnes
Variables
numriques et
chelles

Variables textes

108

Comparer des
moyennes

Changer de strate

5. Utiliser les strates


Il est parfois intressant d'analyser une partie seulement
des individus saisis. Par exemple pour dpouiller les
rponses par catgorie ou pour analyser une souspopulation particulire. Par dfaut, le Sphinx vous place sur
la totalit des rponses (Echantillon total), mais vous
pouvez tout moment choisir de ne travailler que sur un
sous-ensemble appel Strate. Tous les traitements que
vous effectuerez, quel que soit le stade, ne prendront en
considration que les individus de cette strate et ceci
jusqu' ce que vous choisissiez de revenir l'chantillon
total ou de vous placer sur une autre strate. La dfinition de
la strate courante est affiche dans les panneaux centraux
de chaque stade et dans l'en-tte des fentres.

Dfinir une strate


On peut crer plusieurs strates dont les conditions de
dfinition sont conserves. Pour dfinir une nouvelle strate,
choisissez Strates (menu Dpouiller) ou Changer de
strate (menu Analyser), ou encore le bouton Changer de
strate disponible dans les stades Rponses et
Traitements. Toutes ces options ouvrent un dialogue dans
lequel on peut crer une nouvelle strate en dfinissant les
conditions de slection des individus qui la composent.
Une strate peut rsulter de l'application de plusieurs filtres.
Un filtre est dfini par le choix de la variable filtre, et par les
conditions que doivent vrifier les individus retenus. Pour
les variables nominales, on slectionne les modalits
acceptes (=) ou rejetes (# ), et pour les numriques, on
dfinit lintervalle dans lequel les rponses doivent se
trouver.

Le bouton Appliquer donne les rsultats que vous


souhaitez sur la strate que vous venez de dfinir. Le
bouton Ok a seulement pour effet de valider la dfinition
qui vient d'tre donne de la strate.
Lorsque plusieurs strates sont dfinies, il faut slectionner
dans la liste celle que vous voulez tudier et activer le
bouton Appliquer. Il en va de mme pour revenir
l'chantillon total : vous slectionnez la ligne Echantillon
total et cliquez sur le bouton Appliquer.

Dpouiller plusieurs strates


Dans le Plan de dpouillement (menu Dpouiller), on
peut lancer automatiquement les analyses du plan sur
chaque strate dfinie.

Eliminer des individus aberrants


Il est pratique de dfinir une strate pour liminer des points
aberrants dans un graphe de corrlation par exemple. Le
calcul du coefficient de corrlation et de la droite de
rgression seront automatiquement actualiss.

Contrler la saisie sur une strate


Ceci permet de ne voir par exemple que les individus qui
nont pas rpondu, et ensuite la strate des individus bien
saisis... La cration de strate entre aussi en vigueur lorsque
le Sphinx dfinit les chantillons redresss.

Le bouton Ajouter permet de dfinir un nouveau filtre dans


la dfinition dune strate. Les conditions successives
peuvent tre combines selon les oprateurs logiques :
et : les 2 filtres doivent tre vrifis,
ou : l'un au moins doit tre vrifi,
sauf : le deuxime ne doit pas tre vrifi.
Le Sphinx numrote chaque strate cre mais un cadre
vous permet aussi de la nommer, ce qui simplifiera
linterprtation de vos analyses. Et avec le bouton
Modifier, vous changez les conditions entres au pralable
pour la cration dune strate.

Sphinx 2000

Produire des rsultats

109

Changer de strate

Choisir une strate

Nom de la strate courante

Modifier une strate


Dfinir une strate

Nommer la strate
Choisir la variable filtre
Dfinir le filtre

Filtre 1

Filtre 2

Ajouter et supprimer
un filtre
Dfinir et enregistrer
110

Choisir comme strate courante

6. Filtres de slection
Dans diverses fonctions lors de la saisie ou lors des
traitements, il est ncessaire d'effectuer une slection
d'observations, par exemple :
pour dfinir une strate ;
pour obtenir une liste structure rduite un profil ;
pour dfinir une variable "PROFILS" ou "SCORE" ;
pour dfinir des renvois ou des restrictions.
Cette slection peut tre monocritre, c'est--dire que la
condition ne porte que sur une variable ou bien
multicritre lorsque la condition porte simultanment sur
plusieurs variables.
On choisit la question dans la liste droulante puis on
exprime la condition qui change selon le type de la
question.

Conditions de slection
Questions fermes : on slectionne dans la liste des
modalits la ou les modalits concernes.
On peut aussi procder par limination. Ainsi, pour
slectionner toutes les rponses l'exception des
possesseurs de Renault, on choisira l'option "#" (diffrent
de) et on cliquera sur Renault.
Questions fermes multiples : on procde de la mme
manire, les rponses slectionnes seront celles qui
montreront l'une ou l'autre des modalits slectionnes.
Questions fermes ordonnes : il est en outre possible
d'indiquer le rang auquel on devra trouver la ou les
modalits choisies dans la liste.
Questions numriques : on indiquera la condition de
slection par un ensemble de valeurs avec deux syntaxes
possibles :
Entre : on dfinit la slection par la valeur minimum et /
ou la valeur maximum attendue (une seule de ces deux
valeurs peut suffire).
Parmi : on dfinit la slection par un ensemble de valeurs
possibles sous la forme : 5 ; 8 ; 10-15 ; 20. Seront
slectionnes les observations pour lesquelles la variable
vaut 5 ou 8 ou une valeur comprise entre 10 et 15 ou
encore 20.

Questions ouvertes codes : on indique le code


rechercher. Il est possible d'utiliser des caractres
gnriques (* et ?) pour slectionner plusieurs codes. Le
point d'interrogation remplace un caractre quelconque,
l'toile un ou plusieurs caractres quelconques. Exemple :
38* slectionne tous les codes postaux commenant par 38
Questions ouvertes textes : on indique le mot ou le dbut
du mot retrouver dans le texte.

Enchanements des filtres


Les boutons Ajouter et Supprimer permettent de modifier
la liste des filtres.
Il est aussi ncessaire d'indiquer l'enchanement logique de
ces filtres : et, ou, sauf.
Et : les deux conditions devront tre runies ;
Ou : l'une ou l'autre des conditions doit tre remplie ;
Sauf : la premire condition doit tre remplie et la
deuxime non.
Attention, il arrive souvent que dans le langage courant on
utilise un "et" alors que l'ordinateur attend un "ou".
Ainsi pour slectionner les jeunes et les amateurs de
football, il faudra crire SPORT="Football" OU AGE<25.

Quelques filtres complexes


Une question ferme multiple "MUSIQUE" a trois modalits
: Jazz, Rock, Classique. Une personne peut avoir coch
une, deux ou trois modalits. Pour slectionner les
individus qui n'aiment que le jazz, on crit la condition avec
deux filtres portant sur la mme variable :
MUSIQUE = {" Jazz "} ET MUSIQUE # {" Rock; Classique
"}
La question ouverte code "No_SS" est le numro de
scurit sociale. La slection porte sur les personnes
(hommes ou femmes) nes dans les annes cinquante
dans l'Isre. La condition s'crit No_SS = ?5?38*
Dans certains cas, la slection ne pourra pas tre exprime
par une simple suite de filtres sans parenthses et il pourra
tre ncessaire de crer une variable intermdiaire de type
"FUSION".

Questions dates : on indique la priode par une date de


dbut et / ou une date de fin.
Sphinx 2000

Produire des rsultats

111

Conditions de slection
Question FERMEE UNIQUE ou MULTIPLE

Question CODE ou TEXTE

Question NUMERIQUE

Question FERMEE ORDONNEE

Enchaner
plusieurs filtres

112

Modification du
filtre

7. Produire automatiquement un
rapport complexe (Plan de
dpouillement)
Pour gagner du temps dans la production des rapports, on
peut enchaner automatiquement le lancement de
traitements de natures diffrentes et l'dition des rsultats
correspondants. Cela est particulirement intressant
lorsque les mmes analyses doivent tre rptes pour
des sous-populations diffrentes (par exemple un rapport
par agence, par catgorie d'individus...).
Pour cela, on dfinit tout d'abord un plan de dpouillement,
pour l'excuter ensuite. La possibilit de mmoriser
diffrents plans donne beaucoup de souplesse.

Dfinir un plan de dpouillement


L'article Plan de dpouillement du menu Dpouiller ouvre
une fentre qu'on utilise comme un centre de commandes.

Slectionner les traitements


A gauche, figurent les diffrents types de traitements
disponibles. Chaque traitement peut s'appliquer
diffrentes analyses qui s'affichent dans la fentre de droite
ds qu'on a slectionn un type. On peut alors choisir,
parmi les analyses dj ralises, celles qui nous
intressent. Il faut cocher le bouton Ajouter pour se donner
la possibilit dintgrer de nouvelles analyses, puis cocher
la case Mettre dans le plan pour pouvoir spcifier les
traitements retenir dans le plan pour chaque type. Seules
les analyses slectionnes dans la liste seront produites
dans le rapport. Le nombre affich en regard de chaque
type de traitement correspond au nombre danalyses
retenues dans chaque catgorie.

Les rsultats peuvent tre prsents sous diffrentes


formes. A cet effet, la partie Quels lments ? nous
amne choisir la reprsentation graphique de chaque
type de traitement : on slectionne les options retenues
(tableau, ou graphique choisir dans la liste droulante, ou
carte). Le contenu des tableaux est paramtrable avec les
boutons Valeurs et Tests alors que les graphiques sont
paramtrables dans le bouton ... .

Excuter un plan
Pour excuter le plan de dpouillement que vous avez
sous les yeux, utilisez le bouton Excuter. Le dialogue
Mise en forme du rapport vous permet de prciser le
traitement de textes utilis et la forme dans laquelle vous
souhaitez rcuprer les tableaux.
Le plan s'excute dans votre traitement de textes partir
duquel vous pourrez l'imprimer. Si vous souhaitez l'enrichir
ou le modifier, l'utilisation du mode plan dans le traitement
de textes vous facilitera beaucoup le travail.

Utiliser plusieurs plans de


dpouillement
Les plans de dpouillements sont mmoriss. Utilisez le
bouton Nouveau pour dfinir un nouveau plan. Vous
retrouverez l'ancien dans la liste droulante en haut
gauche.

Dfinir les strates


Dans la partie en bas gauche de lcran, on indique sur
quel(s)
ensemble(s)
d'observations
effectuer
les
traitements. Ils peuvent tre calculs sur une seule strate
(Sur la strate) ou sur plusieurs strates.
Dans ce dernier cas, les traitements seront rpts pour
chaque
sous-population
(Sur
les
x
strates
successivement ou Pour chaque modalit dune
variable).
Dterminer la forme des rsultats
Sphinx 2000

Produire des rsultats

113

Slectionner les analyses


prsenter

Choisir les
traitements

Choisir les ensembles sur


lesquels rpter le plan de
dpouillement

Crer et conserver diffrents plans

114

Fixer les contenus et les


mises en forme

Structurer la liste

8. Produire des listes


En annexe de votre rapport, vous souhaitez disposer dune
liste de rponses bien prsente. Vous voulez exporter
dans un fichier certaines caractristiques des personnes ou
des entreprises interroges afin de prparer une opration
de marketing direct.
Dans le menu Dpouiller, il vous possible de Produire des
listes dindividus, dcrits par les variables de votre choix,
et prsentes selon des options que vous aurez
dtermines. Ces listes peuvent tre visualises lcran,
imprimes ou envoyes dans un fichier que vous ouvrez
dans un traitement de textes ou un tableur.

Slectionner les variables prendre en


compte
La premire opration consiste choisir les variables
prsenter dans la liste. Un menu droulant vous permet
dindiquer les variables retenues (pour choisir plusieurs
variables non conscutives, appuyez sur la touche Ctrl
pendant la slection).
Si vous voulez restituer les rponses dune seule variable,
qui est de type texte, vous aurez peut-tre intrt prfrer
loption Verbatim dans lanalyse lexicale.

Prsenter la liste

La liste de rponses peut ensuite tre structure selon


diffrents modes. Il est possible de la trier selon les
modalits dune des variables de la liste. Cochez la case
prvue cet effet et slectionnez dans le menu la variable
utiliser comme cl du tri. Dans lcran ci-contre en haut,
les rponses sont tries par agences.
Vous pouvez galement restreindre la liste de rponses
un sous-ensemble de la population qui correspond des
caractristiques donnes. Cochez la case Uniquement les
observations telles que et cliquez le bouton Modifier pour
dfinir le profil souhait.
Dans lexemple ci-contre en bas, la liste est limite aux
individus qui sont globalement peu satisfaits .

Modifier la liste
A ce stade, vous avez lcran la liste souhaite, selon les
critres que vous avez dfinis. Des modifications sont
encore possibles grce aux onglets qui figurent en bas de
page : Autre liste permet de revoir la slection des
variables prendre en compte, Prsenter vous ramne
lordonnance et au format de la liste, et Structurer permet
de modifier le tri et le profil des individus figurant dans la
liste.

Utiliser la liste
Longlet Analyser vous donne accs au dpouillement de
votre liste par loption du tableau gnralis.

Vous avez ensuite la possibilit de dfinir des options de


prsentation de la liste.
Le logiciel propose par dfaut dintgrer les variables selon
lordre quelles suivent dans le questionnaire mais un
dialogue vous donne la possibilit de modifier cet ordre.
Pour cela, slectionnez la variable dplacer et cliquez sur
Remonter ou Descendre et ainsi de suite jusqu
obtention de lorganisation souhaite.

Enfin, licne Transfrer doit tre finalement utilis pour


imprimer ou pour exporter vos listes de rponses dans un
rapport ou dans un fichier.
Dans notre exemple, on prparerait des listes de clients
non satisfaits rappeler, classs par agence pour les
distribuer aux chargs de clientle concerns.

Le format ddition peut tre galement choisi : table, liste


ou fiche, avec ou sans le nom des variables, cinq formats
sont disponibles. Vous pouvez complter ces possibilits
en crant ventuellement un format personnalis qui
respecte le paramtrage utilis pour les formats prexistants.

Sphinx 2000

Produire des rsultats

115

Les variables prsenter


sont ici slectionnes
FORMAT LISTE

Trie selon la variable Agence

FORMAT FICHE avec noms de variables

Rduite la strate des


peu satisfaisant
sur la variable Satisfaction globale
116

9. Caractriser les cellules d'un


tableau
Le Sphinx permet toujours de revenir aux donnes de
base. C'est trs utile pour expliquer un rsultat ou vrifier
immdiatement les ides qu'il suggre. Cette fonction
s'applique aux tableaux plat ou croiss, aux cartes et aux
lments du lexique identifis dans l'atelier lexical. Elle
permet de :
lister et analyser les valeurs caractristiques prises par
les effectifs concerns pour n'importe quelle variable ;
parcourir en dtail toutes les donnes des observations
concernes pour les consulter ou les corriger.

Double clic sur la cellule d'un tableau


Il suffit d'un double clic sur la cellule d'un tableau (ou de
slectionner Caractriser dans le menu contextuel associ
aux mots du corpus) pour que s'ouvre une fentre dans
laquelle on pourra analyser les proprits des observations
correspondantes.

Rpartition et spcificits
On peut examiner, pour la sous-population tudie, les
valeurs de la variable choisie en les numrant
(Observations), en calculant leur rpartition (Rpartition),
ou encore en cherchant mettre en vidence la spcificit
de leurs rponses (Spcificits).
On compare pour cela la rpartition ou la moyenne de la
variable dans la catgorie (local) sa rpartition ou
moyenne pour la totalit des effectifs (global). L'cart est
qualifi par le rapport des frquences (il est suprieur 1
pour les modalits sur-reprsentes), par le test du Chi, ou
par le test de comparaison de frquences (Options...).
Quand la variable est numrique, on utilise le test de
Student.
Afin de mieux mettre en vidence les spcificits de la
catgorie tudie, le haut du classement affiche les
modalits les plus reprsentes.

A gauche, 3 boutons offrent le choix entre :


N des observations : pour reprer les observations par
leur numro.
Valeurs de la variable : cette option conduit slectionner
une variable dont on voit s'afficher les valeurs, la
rpartition ou les spcificits, selon la slection opre
dans la partie droite de la fentre.
Toutes les variables : dans ce cas, les effectifs concerns
sont dcrits par leur valeur moyenne pour les variables
numriques ou par leur modalit la plus frquente pour
les autres variables.
Les flches en haut droite de la fentre permettent de
passer automatiquement de l'analyse de la cellule d'un
tableau celle de la cellule suivante. La dfinition des
effectifs tudis est rappele dans le titre.

Dtailler, corriger, transfrer


En bas de la fentre, des boutons permettent de voir le
dtail de chaque fiche. On peut ainsi consulter dans le
dtail les observations concernes (Dtailler), ou en
prendre note en les transfrant vers un document
(Transfrer). Enfin si ncessaire, le bouton Corriger vous
place au stade des rponses sur la strate des effectifs
tudis qu'on peut ainsi corriger.

Sphinx 2000

Produire des rsultats

117

1/ Cliquer dans le tableau


2/ Choisir la variable

Caractriser la cellule dun tableau

Passer
dune cellule lautre

N dobservation
et valeur

Rpartition
selon la variable

Spcificit :
comparaison des rpartitions dans
la cellule et dans tout le tableau

Contexte : valeur dominante


pour toutes les autres variables

118

Dtailler et
corriger

Sphinx 2000

Produire des rsultats

119

Modifier les
donnes en les
recodant

120

Ces nouvelles variables sont donc des nouvelles colonnes


dont le contenu est dtermin automatiquement par le
logiciel.

1. Questions et variables
Diffrents vocabulaires
Le Sphinx est un logiciel de traitement d'enqutes et, ce
titre, il utilise le jargon des enqutes. On parle ainsi de
questions, de rponses, d'individus, de questionnaires, etc.

Ces colonnes correspondent donc des "questions" (bien


qu'elles n'aient pas t effectivement poses) et se
retrouvent dans la liste des questions au mme titre que les
questions initiales.

Mais le Sphinx permet aussi l'analyse des fichiers de


donnes provenant de bases de donnes dans lesquelles
le vocabulaire est diffrent et les variables tudies ne sont
pas forcment des "questions". De mme, lorsque l'on
tudie des textes avec le Sphinx Lexica, l'unit statistique,
qui est le fragment de texte (paragraphe ou chapitre par
exemple), est trs loigne de la notion de rponse.

Elles sont alors la disposition de l'analyste pour tre


consultes, dpouilles, croises, intgres dans des
analyses multivaries.

Le tableau ci-contre pose le vocabulaire correspondant


dans les diffrents mondes que sont le traitement des
enqutes, la gestion des bases de donnes, les feuilles de
calcul d'un tableur, les logiciels de statistiques.

Nous rappelons ci-dessous les modes de recodage les plus


frquemment utiliss :
Transformer une variable ferme : regrouper les
modalits similaires et peu cites.
Recoder une question ouverte : mettre l'ge en classes,
regrouper des codes postaux en rgions, convertir des
dates en annes.
Combiner des variables : dterminer des profils de
rpondants, fusionner deux variables.
Calculer arithmtiquement : moyenne de plusieurs notes.
Utiliser les rsultats des analyses factorielles : score sur
l'axe factoriel.
Typologie interactive : regrouper les individus selon leur
position sur un graphique.
Classification automatique : crer une variable ferme
"Classes".
Crer des variables fermes partir des questions
ouvertes : prsence d'un mot, nombre de mots de la
rponse,

Lignes et colonnes
Pour bien comprendre les diverses phases de l'enqute, il
est bon de se la reprsenter comme une feuille de calcul
comme on les voit dans un tableur.
La premire ligne est le questionnaire (avec le nom des
variables).
Les autres lignes reprsentent chacune une rponse (ou
observation, individu, unit statistique, enregistrement).
Chaque colonne reprsente une variable, une question.
Dans une cellule, on a la rponse d'un individu une
question. Ce peut tre un nombre (Quel est votre ge ?) ou
un texte long (Racontez une dcision que vous avez prise).

Nouvelles variables
Les donnes, telles qu'on les a recueillies, ne permettent
pas toujours de produire directement les rsultats
escompts. Il est ncessaire d'appliquer des traitements
ces variables.

Le Sphinx propose de trs nombreuses fonctions de


recodage qui sont dcrites dans ce manuel leur place
respective.

Supprimer les variables


Les nouvelles variables calcules pourront tre supprimes
en les slectionnant dans le questionnaire puis en
choisissant l'article Supprimer du menu Organiser.

Les traitements consistent crer de nouvelles variables,


rsultant d'une opration arithmtique ou logique sur une
ou plusieurs variables initiales.

Sphinx 2000

Modifier les donnes en les recodant

121

Vocabulaires

Une question
Une observation

La rponse dun
individu une
question

122

Nouvelle variable
calcule ou
recode

Interprter des codes et convertir des


dates

2. Recoder
La recodification consiste transformer le format ou les
proprits des donnes saisies lorigine pour les rendre
plus maniables en cours danalyse. Cest notamment le cas
lorsquon prfre traiter une variable numrique en crant
des tranches, lorsquon veut remplacer un code postal par
un intitul de rgion, ou complter ltude dune question
ouverte par une grille thmatique. Le Sphinx offre dans
cette perspective une trs grande souplesse. On procdera
toujours en dsignant la variable transformer, et la
nouvelle variable cre. La transformation opre
dpendra de larticle de menu choisi.

Etudier des textes


Cette fonction trs utile pour recoder les rponses aux
questions ouvertes textes est abondamment dcrite dans
les derniers chapitres de ce manuel (Analyse de contenu,
codification et mesure lexicale).

Mettre des numriques en classes


Le Sphinx prsente systmatiquement le dpouillement
des variables numriques en classes dintervalles. Il
applique par dfaut un dcoupage en classes dgale
amplitude, mais cette solution peut tre modifie partir de
larticle Mettre les numriques en classes.
Un histogramme permet de visualiser la distribution de la
variable. Les seuils peuvent tre modifis manuellement en
dplaant les triangles qui matrialisent les seuils ; ce qui
permet de modifier lamplitude des classes en mettant
immdiatement en vidence leffet sur les effectifs. Cet
cran propose aussi les boutons Ajouter et Supprimer
pour faire varier le nombre de classes. Il est galement
possible de rentrer les seuils des nouvelles classes au
clavier grce au bouton Editer.

En utilisant un dictionnaire de codes on remplace


linformation code par sa signification en clair. On procde
dune manire analogue pour les dates que lon convertira
en mois, en jour de la semaine, en dure Toutes ces
oprations peuvent donner lieu la cration dune nouvelle
variable et sont dcrites dans le chapitre Tableaux de
listes : codes et dates.

Transformer et combiner*
Ce menu offre une bote outils grce laquelle vous
pourrez reprendre toutes vos variables et vous sortir de
toutes les difficults.
Transformer : il est possible de modifier la base initiale
pour regrouper les modalits dune variable nominale,
crer partir dune seule variable plusieurs autres
(chelles, uniques, oui/non), calculer le nombre de
rponses dune ferme multiple, ou changer le statut
dune variable.
Combiner : dans ce cas, on combine lanalyse de
plusieurs variables pour en crer une nouvelle (fusion,
croisement, profil ou compteur).
Redfinir les variables : cette fonction permet de passer
des chelles aux numriques et de modifier rapidement
les noms et intituls des variables.
Cacher des variables : les variables caches ne
figureront plus temporairement dans les listes
droulantes.
Modifications globales : ce chapitre regroupe un
ensemble de fonctions utiles pour modifier les donnes
(remplacer les non rponses, supprimer les colonnes
vides).

Ce dcoupage en classes peut tre conserv. A cet effet et


dans le but denrichir la base initiale, on cre une nouvelle
variable en utilisant le bouton Recoder sur une chelle.

Sphinx 2000

Modifier les donnes en les recodant

123

Mettre en classes une numrique

Modifier les classes

Transformer / combiner

Nommer la nouvelle variable

124

3. Tableaux de listes : codes et


dates
Fonctions communes aux codes et
aux dates
Dans le menu Recoder, les articles Interprter les codes
et Convertir les dates ouvrent des tableaux partir
desquels on peut effectuer des regroupements pour les
codes et des conversions pour les dates. Par ailleurs, un
ensemble de fonctions communes sont disponibles et
actives par les boutons suivants :
Croiser prsente chaque lment de la liste en ventilant
ses lments selon les modalits dune autre variable.
Choisir la variable dans la liste et cocher Croiser le
tableau avec la variable. Dcocher cette option pour
revenir au tableau simple. Le bouton Valeurs, actif dans
le cas du tableau crois, permet de slectionner le type
de valeurs afficher (citations, pourcentages en ligne, en
colonne ou au total).
Analyser fait passer dans lenvironnement danalyse et
donne accs tous ses graphiques et tests. Attention,
seuls sont transfrs les lments slectionns ou les 50
premiers.
Caract. donne le dtail des observations relatives
llment slectionn dans la liste. Un double clic sur la
ligne concerne provoque le mme effet.
Recoder permet de crer une nouvelle variable dans
laquelle on remplace la valeur du code ou de la date
originale par la catgorie laquelle le code ou la date
appartient : par exemple, une rgion pour un code postal,
un jour de la semaine pour une date

Interprter des codes


Cette fentre prsente diverses possibilits proposes en
agissant sur les boutons :
Rduire et Dictionnaire permettent de slectionner dans
le code les lments considrer et douvrir le
dictionnaire ncessaire leur interprtation. Ainsi, pour
interprter un code postal avec le dictionnaire des
dpartements, on slectionne les deux premires
positions du code.
Interprter selon les catgories du dictionnaire : le menu
droulant en regard du bouton Dictionnaire permet de
regrouper les codes selon lune des catgories dfinies
dans le dictionnaire. Rappel : la structure du dictionnaire
rpond la syntaxe suivante :

Sphinx 2000

code= catgorie1= catgorie2= catgorie3


73= Savoie= Rhne Alpes= Montagne
89= Yonne= Bourgogne= Nord

Recoder : on peut crer autant de nouvelles variables


que de catgories prsentes dans le dictionnaire des
codes. (Ex : crer la variable Dpartement et la variable
Rgion partir du code postal).

Convertir des dates


Les dates sont des codes de type particulier. On na pas
besoin de dictionnaire pour les transformer en anne, en
mois, en jour de la semaine, ou pour calculer une dure.
Lexploitation du format particulier aux dates et le calendrier
interne de la machine permettent de faire ces conversions
de manire automatique.
Un menu droulant propose de choisir comment convertir
les dates de la liste.
Ces regroupements se font par jour de la semaine (lundi
Dimanche), par mois (JanvierDcembre), par anne ou
mme par mois/anne (Janvier 1999 Dcembre 1999
Janvier 2000Dcembre 2000)
La conversion en dure ncessite une attention
particulire. On peut calculer une dure jusqu une date
donne ou depuis une date donne. Il est galement
possible de calculer une dure entre deux dates.

Heures et minutes
Les variables de type date permettent aussi dindiquer des
heures. De la mme manire ces valeurs peuvent tre
regroupes, en heures rondes par exemple.
Remarque : si on veut calculer par exemple une dure de
sjour au service des urgences, on aura une variable heure
darrive et une variable heure de sortie.
La diffrence ne se calcule pas aussi simplement parce
quelle peut tre suprieure 24 heures.
Dans ce cas on utilisera la procdure de calcul dune
nouvelle variable avec le code suivant :
Si HEURE_SORTIE < HEURE_ARRIVEE Alors
DUREE = 24 + HEURE_SORTIE HEURE_ARRIVEE
Sinon
DUREE = HEURE_SORTIE HEURE_ARRIVEE
Fin Si

Modifier les donnes en les recodant

125

Liste des codes

Produire la liste
des codes

Interprter
les catgories du
code
Crer
une nouvelle
variable

126

Rduire les codes

Dictionnaire des codes

Exploiter la liste du barme

4. Calculer un barme
Un barme est un ensemble de valeurs associes aux
modalits dune variable nominale ou dune chelle. Ces
valeurs sont quivalentes une note affecte en fonction
de la rponse donne. Calculer un barme, cest faire la
somme de toutes ces notes en fonction des rponses.

Etablir un barme
On tablit le barme en affectant des valeurs aux modalits
des questions fermes (Voir le paragraphe Associer des
valeurs aux questions fermes). On peut galement
revenir sur cette dfinition au moment du calcul du barme.
La fonction Appliquer un barme du menu Dpouiller
affiche un dialogue dcrivant les rsultats du barme
(cran de bas ci-contre). On peut revenir sur la dfinition du
barme en cliquant sur le bouton Barme.

La liste des individus affects de leur score peut tre


transfre vers limprimante, dans un rapport, ou dans un
fichier (Transfrer). On peut au pralable vrifier le dtail
des observations sur lesquelles on peut avoir un
doute (bouton Dtailler ou double clic sur la ligne pour voir
la fiche correspondante).
Ce type dexploitation est trs utile pour valuer les QCM
ou pour prparer des oprations de marketing direct (en
donnant un score chaque personne contacter).

Crer une variable score


On peut enfin enregistrer le rsultat du barme dans une
nouvelle variable score. Le bouton Variable conduit
nommer la nouvelle variable. En validant, vous ajoutez la
liste des variables une nouvelle variable numrique
disponible pour toute autre analyse.

Il suffit pour cela de rentrer au clavier la valeur de chaque


modalit en regard de son intitul. On passe la valeur
suivante en se servant des flches du clavier ou en cliquant
sur la modalit concerne.
Le bouton Num. Auto permet, pour les chelles
notamment, de gagner du temps en appliquant, aux
modalits de la question sur laquelle se trouve le curseur,
lun des systmes dvaluation proposs.
On peut galement sauvegarder un barme ou ouvrir un
barme dj dfini (boutons Ouvrir et Enregistrer). Ceci
permet de tester plusieurs systmes dvaluation diffrents.

Calculer le barme
Larticle de menu Appliquer un barme
directement une fentre donnant, pour
observation, la valeur du barme.

conduit
chaque

La case cocher Dtail du score permet dafficher les


diffrentes valeurs de lobservation dont le score est la
somme. La valeur maximum possible est rappele au
dnominateur.
On a galement la possibilit de faire afficher la valeur
dune variable de rfrence pour la confronter au rsultat
du score. Cela peut tre un nom ou tout autre lment
susceptible dexpliquer le score global.

Sphinx 2000

Modifier les donnes en les recodant

127

Activer/
dsactiver
le barme

Liste de
questions et
modalits

Valeurs
associes
Numrotation
automatique

Dfinition
du barme

Supprimer le
barme
Charger
un barme
Enregistrer le
barme
Editer
la valeur
Dfinition du
barme

Application
du barme

Score calcul

Dtail du score

Cration de la
variable score

128

5. Transformer une variable


Au moment de l'analyse, il est frquent de s'apercevoir que
la dfinition des variables dans le questionnaire n'est pas la
plus adquate. On voudrait par exemple regrouper
certaines modalits, en supprimer d'autres, transformer une
question rponses multiples en autant de variables
Oui/Non. En crant une ou plusieurs nouvelles variables,
on facilitera la suite de l'analyse. Slectionner pour cela le
bouton
Transformer
une
variable
(article
Transformer/Combiner du menu Recoder). On peut
distinguer 3 cas.

Transformer une variable ferme


Modifier les modalits d'une variable ferme : choisissez
la variable modifier dans la liste puis dans la fentre
suivante, slectionnez les modalits et cliquez sur le
bouton appropri. Terminez en choisissant de crer une
nouvelle variable ou de remplacer l'existante. Dans ce
dernier cas, l'information originale sera perdue.
Variable ferme n modalits : partir de la variable
slectionne, on cre une variable par modalit
enregistrant la prsence ou l'absence du critre
correspondant.

Transformer une variable en variable


ferme
On peut ainsi transformer une numrique en chelle ; ce
qui est intressant quand la numrique a peu de valeurs
diffrentes.

La cration de nouvelles variables


Lorsque la transformation ne gnre qu'une nouvelle
variable, on lui donne un nom avec la possibilit de la
substituer la variable originale lorsque cela a un sens.
Quand la transformation gnre plusieurs variables, le nom
des nouvelles variables est donn automatiquement en
ajoutant une extension. Pour ventuellement revenir sur
ces appellations, utilisez l'option Redfinir les variables
du dialogue Transformer / Combiner. Vous pouvez
galement revenir le faire au stade du questionnaire mais
ceci est plus long.
Attention : Lorsque le nom est donn automatiquement,
vous pouvez avoir l'impression que rien ne s'est pass. La
consultation de la liste des variables (raccourci F3) vous
convaincra du contraire.

Extraire de l'information sur les


fermes multiples
Une variable ferme multiple peut tre complte par une
nouvelle variable qui enregistre le nombre de rponses
simultanes.
A partir dune variable ordonne n modalits et p
rponses possibles, on peut crer n variables fermes
chelles (chaque variable enregistre le rang pour lequel
la modalit est cite) ou p variables fermes uniques
(chaque variable enregistre la modalit cite en premier,
en second, ... au rang p).

Transformer une variable en variable


ouverte
Ouverte numrique : transformer une ferme chelle ou
unique en numrique.
Ouverte texte : transformer une variable quelconque en
variable texte. C'est intressant quand on part d'une
ferme multiple contenant de nombreuses rponses.
Variable ferme multiple : pour connatre le nombre de
rponses des interviews. Trs intressant pour les
questions de notorit assiste. On calcule ainsi le
nombre de marques ou d'objet connus.
Sphinx 2000

Modifier les donnes en les recodant

129

Transformer une variable

Transformer
une ordonne

...

Regrouper des modalits

130

6. Calculer une nouvelle variable*


Vous pouvez en toute libert calculer de nouvelles valeurs
partir de vos donnes. Par exemple, un budget global en
additionnant les dpenses diffrents postes, tablir un
score de satisfaction partir de plusieurs chelles,
convertir des units, compter le nombre dobservations
sans rponse plusieurs variables
Le langage Visual Basic est maintenant intgr au logiciel ;
ce qui vous donne toute latitude pour dfinir vos formules
ou les procdures plus complexes que vous programmerez
directement dans Sphinx. Un assistant vous guide pas
pas et si vous ne connaissez rien la programmation, des
modles vous sont proposs. Ils couvrent les cas les plus
courants et vous donneront ainsi loccasion de vous initier
Visual Basic.
Le calcul ou le programme est directement excut et vous
pouvez contrler les rsultats obtenus avant de les
enregistrer dans une nouvelle variable. La dfinition est
conserve ; ce qui vous permettra de mettre jour les
valeurs calcules aprs des saisies supplmentaires ou
aprs des modifications dans les donnes.

Par exemple ci-contre, on a choisi Fonctions


mathmatiques et parmi celles-ci, la fonction Log. Dans la
fentre, V=Log( ) se trouve affich. Pour prciser la
variable dont on veut calculer le logarithme, on slectionne
Variables (liste de gauche) puis Dpense. On complte
enfin la formule au clavier : V=Log(DEPENSE)/2. Le
bouton Syntaxe permet de rectifier la formule ou renvoie
un message derreur.
Dans le cas prsent, on utilise le bouton Options pour
prciser que les non-rponses doivent tre remplaces par
la valeur moyenne de la variable.

Crer une nouvelle variable


Lorsque la formule est crite, on passe la suite avec
Suivant. Si la formule est correcte, le rsultat du calcul est
affich pour chaque observation.
Il faut enfin donner un nom la nouvelle variable en
compltant ventuellement son libell et en prcisant son
type. La formule est conserve en mmoire et pourra tre
excute de nouveau pour recalculer la variable en cas de
modification des donnes.

Choisir un mode de calcul


On lance les fonctions de calcul dans le menu
Approfondir, avec larticle Calculer une nouvelle
variable.
Trois choix sont offerts : Calculer une nouvelle variable,
Recalculer une variable, Excuter un calcul
quelconque.
Dans tous les cas, on est amen dfinir un mode de
calcul. Un assistant vous guide dans cette tche.

Dfinir un mode de calcul ou crire un


programme
On crit la formule de calcul dans la fentre qui apparat
aprs le premier choix. Deux menus droulants donnent la
liste des variables de ltude et des fonctions disponibles.
On peut crire la formule dsire en cliquant dans ces
listes.

Sphinx 2000

Modifier les donnes en les recodant

131

Choisir un type
de calcul

Options
Liste
des fonctions de calcul

Ecrire la formule ou le
programme de calcul

Liste des
variables

Vrifier
le rsultat du
calcul

132

Nommer
la nouvelle variable

V=n

7. Recalculer une variable et


utiliser les modles*

Calculer une variable centre rduite :


(V1 - V1.Moyenne) / V1.EcartType

Nombre entier compris entre - 100 et 100 :


V = PartieEntiere(100*(0.5ValAlatoire(1)))

Recalculer une variable peut rpondre 2 objectifs : mettre


jour les valeurs calcules aprs une nouvelle saisie ou
modifier les valeurs de la saisie originale pour lui substituer
de nouvelles valeurs. Dans tous les cas, on commencera
par dfinir la variable modifier.

Les modles sont enregistrs dans un fichier, dont le


chemin daccs est le suivant :

Recalculer les valeurs dune variable

Sphinx2000\SphCalc\modles.txt.

On choisit la variable que lon veut recalculer dans la liste


droulante qui se trouve en haut de la zone de dfinition.
On dfinit ensuite le mode de calcul en appliquant les
mmes mthodes que pour la cration dune nouvelle
variable. Le rsultat du calcul viendra se substituer aux
valeurs initiales de la variable.

Chaque modle est compos de deux lignes de


commentaires nom du modle et texte de dfinition .
Suivent les lignes de programme.

Crer vos propres modles

En ajoutant vos modles la fin de ce fichier, ils


apparatront dans la liste droulante de lassistant.

Mettre jour les calculs de variables


On slectionne la variable recalculer. Sa formule apparat
dans la zone de dfinition. Il suffit alors de valider en
choisissant Suivant. Dans le cas dune nouvelle saisie,
cette opration devra tre rpte pour chacune des
variables recalcules.

Utiliser les modles


On peut crire dans la zone de dfinition, des programmes
en Visual Basic. Le bouton Modles en propose un certain
nombre, correspondant des applications courantes.
Dans le modle, le nom des variables nest pas spcifi.
Cest vous de le rentrer en utilisant les listes droulantes
proposes cet effet.
Dans le cas du calcul dune nouvelle variable, celle-ci est
toujours dnomme V. Toutes les autres doivent tre
dsignes par leur nom dans la base. On peut entrer leur
nom directement ou partir de la liste des variables
(moyen le plus fiable pour viter les erreurs de frappe).
Voici quelques exemple de modles :
Qualifier un individu par le nombre de non rponses 2
questions :
n = 0
Si V1.EstNonreponse Alors
n = n + 1
FinSi
Si V2.EstNonreponse Alors
n = n + 1
FinSi

Sphinx 2000

Modifier les donnes en les recodant

133

Slectionner la
variable
recalculer

Choisir un
modle ...

et le complter

Le rsultat du calcul
remplace
les donnes initiales

134

8. Combiner des variables*


Un questionnaire forme un tout et c'est en examinant les
rponses donnes plusieurs questions qu'on peut le
mieux caractriser le rpondant : dfinir des profils, donner
une note en fonction des choix effectus, dfinir de
nouvelles catgories... Le dialogue Combiner des
variables (de larticle Transformer / Combiner dans le
menu Recoder) offre dans cette perspective de
nombreuses possibilits.

Calculer un score en pondrant les


rponses
On donne un poids certaines modalits de rponses. En
fonction des choix effectus par le rpondant, on lui
attribue une note qui est la somme des points obtenus. On
utilise pour cela une variable Compteur. Pour la dfinir, il
faut indiquer quelles modalits de quelles variables
interviennent dans le calcul et pour quel poids. Le dialogue
permet de slectionner les variables (liste Variable), les
modalits (en cliquant dans la fentre) et de fixer les poids
(Poids). Le bouton Ajouter permet dajouter une nouvelle
condition dans la liste des lments dfinissant le
compteur.

Dfinir une variable ferme dont les


modalits sont des profils
Il est courant d'utiliser des nomenclatures complexes
combinant diffrents profils. Un profil est le rsultat de
plusieurs conditions dfinies partir de plusieurs variables.
Le dialogue Profils permet de les dfinir et d'en faire les
modalits d'une seule variable ; ce qui permettra de
combiner les rsultats de plusieurs variables pour les faire
apparatre dans une mme analyse. Ceci est
particulirement utile pour faire apparatre les profils des
diffrentes strates dans un mme tri plat ou dans un
tableau crois avec une autre variable.
Dans la partie gauche du dialogue, le bouton Dfinir le
profil permet de choisir les variables et les modalits qui le
dfinissent. On obtient un profil en ajoutant plusieurs
conditions
(bouton
Ajouter).
On
dfinit
ainsi
successivement plusieurs profils qui viennent s'ajouter
dans la liste de gauche (bouton Ajouter pour ajouter un
nouveau profil).

Sphinx 2000

Dfinir une variable combinant les


modalits de 2 variables
Fusion simple : ceci permet d'ajouter les modalits de 2
variables pour crer une nouvelle variable ajoutant les
modalits de la premire celles de la seconde (les
modalits identiques sont rptes).
Fusion compose : elle permet de runir les modalits de
2 variables sans que les modalits identiques ne soient
rptes, mme si leurs effectifs s'ajouteront dans la
statistique de la nouvelle variable. Ce type de fusion est
utile quand deux questions ont des modalits communes.
Fusion croise : les modalits de la nouvelle variable
croisent les modalits d'origine. Le nombre de modalits
de la nouvelle variable est le produit des modalits des
deux variables de dpart.

Multi Oui/Non
Dans le questionnaire, l'usage des questions Oui/Non
facilite les rponses, mais alourdit le traitement. On peut
alors crer aprs coup une seule variable rponses
multiples regroupant plusieurs variables Oui/Non.

Verbose
Permet de prsenter sous la forme d'un texte l'ensemble
des rponses un questionnaire.

Reprer les observations


L'identificateur permet de donner un numro ou un code
d'identification.

Variable Strates
Il sagit de crer une variables dont les modalits sont
parmi les strates cres. La variable sera unique ou multiple,
le nombre de rponses possibles sera calcul
automatiquement.
Cette combinaison est plus intressante que les profils
dans la mesure o les dfinitions de strates sont
conserves. Il sera ainsi plus simple de relancer le
processus aprs modification des donnes :
Supprimer la variable prcdemment calcule
Recrer une variable sur ces mmes strates

Modifier les donnes en les recodant

135

Compteur
Profil

Fusion

136

9. Modifier des variables*


On prouve souvent, en cours de travail, le besoin de
modifier une ou plusieurs variables, de rduire l'ensemble
des variables analyser ou de reprendre la base de
donnes pour la clarifier.

Cette possibilit est particulirement intressante lorsqu'on


traite des textes longs, fragments en phrases ou
paragraphes. On pourrait ainsi calculer, pour chaque
fragment, dans quelle partie du sous-ensemble considr il
se situe (dbut, milieu, fin... de l'interview, du document...).
Cocher Reconstituer x parties pour dfinir par rapport
quel dcoupage vous souhaitez reprer les observations.

Modifier la dfinition d'une variable


Toutes les oprations consistant modifier la dfinition
d'une variable peuvent bien sr tre effectues dans le
stade du questionnaire.
Mais il existe une procdure simplifie qui permet de le
faire au stade des traitements. Ainsi, dans le dialogue
Redfinir les variables, disponible dans larticle
Transformer / Combiner du menu Recoder, vous pourrez
plus rapidement changer le nom de la variable ou modifier
son statut (Unique / Echelle et Multiple / Ordonne) pour
revenir immdiatement sur lanalyse souhaite.

Cacher des variables


Le bouton Cacher des variables, propos dans la fonction
Transformer/Combiner du menu Recoder, affiche la liste
des variables. En agissant sur les boutons Cacher et
Montrer, on marque et dmarque les variables
slectionnes.
Les variables caches, marques d'un x, n'apparatront
plus ni dans les listes droulantes de slection des
variables dans le stade des traitements, ni dans la mise en
page et l'impression des questionnaires. Cette fonction est
trs utile quand on travaille sur des donnes contenant un
grand nombre de variables.

Numroter les observations


Cette fonction, voisine de la fonction Identificateur dcrite
dans le paragraphe Combiner des variables, permet
d'affecter chaque observation un numro d'ordre
correspondant son rang dans la table des donnes.
Elle permet galement de dfinir des parties dans
l'ensemble de la base ou dans un sous-ensemble
dindividus dfinis par les modalits d'une variable ferme.

Sphinx 2000

Modifier les donnes en les recodant

137

Actions sur lensemble des variables

Crer des variables numro

Modifier la dfinition des variables

138

Cacher (questionnaire et listes de variables)

10. Dcrire des observations en


cours danalyse
Il est frquent quen cours danalyse, on ait envie de
marquer certains individus. A titre dexemple, ce besoin
peut se manifester dans les cas suivants.
Qualification de fichier : chaque fois quon observe des
non rponses dans un tableau, on peut tre amen
marquer les individus correspondants pour faire une
strate des bonnes rponses et liminer dun seul coup les
mauvaises rponses ou les corriger.
En marketing direct, dans lanalyse des tableaux plat ou
croiss, on repre des cas auxquels on est amen
appliquer diffrentes stratgies de prospection. On
souhaite alors noter les individus correspondants en les
marquant dans une variable quon reprendra ensuite pour
organiser un mailing.
En analyse lexicale, on peut dsirer marquer les
diffrenciations smantiques rvles par la navigation
lexicale en faisant une analyse de contenu la vole.

Dcrire partir de latelier lexical


Dans latelier lexical, le bouton Dcrire mne au mme
dialogue. Dans la fentre de codification, on a le choix
entre : marquer une seule observation, marquer
lobservation courante (Coder) ou marquer toutes les
observations contenant le ou les mots marqus dans le
lexique (Coder tout).
Cela permet de vrifier dabord le contenu des
observations ayant cit le mot slectionn dans le lexique,
puis de les marquer une une ou de toutes les marquer
la fois.

Dans tous ces cas, on souhaite pouvoir dcrire des


individus en les codant, un par un ou globalement, pour les
proprits quils rvlent au cours dune analyse (tableau
plat, tableau crois). Cette fonction Dcrire est
disponible lintrieur du dialogue Caractriser applicable
aux diffrentes analyses (tableaux plat et croiss, cartes)
et dans le contexte de latelier lexical. Elle fonctionne dune
manire analogue lanalyse de contenu.

Dcrire les individus dans un tableau


Pour marquer tous les individus correspondant la cellule
dun tableau, il suffit de faire un double clic sur celle-ci. La
fentre Caractriser souvre sur ce sous-ensemble. Elle
permet de prendre connaissance des individus concerns
et comporte un bouton Dcrire qui ouvre sur un dialogue
analogue celui de lanalyse de contenu. Choisissez la
variable cible dans laquelle vous voulez marquer vos
individus, crez une nouvelle variable si ncessaire. Dans
le dialogue Dcrire les observations caractrises, vous
cocherez les modalits appropries ou en crerez de
nouvelles si ncessaire. En agissant enfin sur Coder, vous
lancerez la modification de la variable cible. Un dialogue
vous avertit de ce fait (les donnes correspondant au
tableau analys restent, elles, inchanges).

Sphinx 2000

Modifier les donnes en les recodant

139

Dcrire depuis un tableau

Double
clic

Choisir ou crer une


variable cible

Dcrire
lobservation
courante

Dcrire
la strate

140

Dcrire depuis latelier lexical

Sphinx 2000

141

Analyse
univarie, les
tableaux plat

142

1. Les diffrents niveaux danalyse


Ce menu vous conduira analyser le dpouillement de vos
donnes en intervenant sur leur mise en forme :
composition des tableaux, choix des graphiques, ralisation
de tests statistiques. Il vous permet de vous concentrer sur
une seule variable la fois (Tableaux plat) ou sur les
relations entre 2 variables (Tableaux croiss, Tableau de
moyennes, Corrlations).

Mettre en forme les tableaux


Les rsultats du dpouillement se prsentent dabord sous
forme de tableau ou graphique :
Tableau plat pour une seule variable
Tableau crois pour 2 variables nominales
Tableau de moyennes pour une nominale et une ou
plusieurs numriques
Nuage de points pour deux variables numriques
Une barre doutils permet de mener lanalyse en autorisant
un grand nombre doprations :
modifier la prsentation des tableaux en supprimant /
regroupant / ordonnant des lignes ou des colonnes, en
dfinissant le mode de calcul des indicateurs (Valeurs) ;
tudier les effectifs correspondant chaque cellule du
tableau : liste et caractristiques des individus concerns
(Caractriser) ;
rdiger des commentaires ou lgendes (Lgende) et
sortir le rsultat (Fichier / Inclure dans le rapport ou
Edition / Copier et Coller).

Effectuer des tests statistiques


Le Sphinx propose des tests statistiques que lon active
avec les boutons Tester et Comparer. Tester sapplique
tout le tableau, Comparer ne porte que sur la comparaison
des lignes ou colonnes slectionnes. Selon lanalyse en
cours, on appliquera diffrents tests statistiques :
2
Tableau plat : Intervalle de confiance et Test du Chi
(comparaison une rpartition de rfrence ou
comparaison de 2 effectifs) ;
2
Tableau crois : Test du Chi (comparaison lqui
rpartition et mise en vidence des carts les plus
significatifs) ;
Tableau de moyennes : Test danalyse de la variance
(analyse de la distribution des valeurs moyennes - test de
Fisher et comparaison de moyennes test t) ;
Nuage de points : Test de corrlation (Pearson) :
indication de la qualit de lajustement la droite de
rgression.

Changer de strate
En changeant de strate, on actualise lanalyse en cours sur
les effectifs de la nouvelle strate.

Reprendre une analyse


Cet article permet de relancer une analyse dj effectue.
Pour les analyses plus complexes, on peut utiliser
lassistant qui vous guidera vers les mthodes les plus
appropries (Voir la fonction Dterminer une analyse).

Dans le cas de 2 variables numriques, on peut analyser le


tableau crois aprs mise en classes ou reprsenter les
observations comme un nuage de points. Le trac de la
droite de rgression rsume la dispersion du nuage.

Choisir les graphiques


De nombreuses possibilits graphiques sont offertes pour
les tris plat et croiss. Les tris croiss et les tableaux de
moyennes peuvent aussi tre rsums par une carte
factorielle (AFC et ACP). On peut amliorer la lisibilit de
ces cartes en dplaant avec la souris les libells des
modalits qui se chevauchent.

Sphinx 2000

Analyse univarie, les tableaux plat

143

Tableau plat

Tableau crois

Tableau de moyennes

MARQUE
Renault
Peugeot
Citron
Talbot
Ford
Fiat
Volkswagen
Opel
Japonaise
Autre
TOTAL

144

18.KILOM 19.DEP
ETRAGE ENSE
1404
2771
1249
1604
2403
1287
3065
2803
3203
2166
2202

1061
1576
1022
1280
1483
803
1676
1633
1544
1360
1377

Corrlation et
nuage de points
KILOMETRAGE

313.25
198.08

DEPENSE

2. Tableaux plat des questions


nominales
On est en prsence de variables nominales, le traitement
consiste compter le nombre de citations de chaque
modalit (effectifs) et calculer le pourcentage
correspondant (frquence). Tous les tableaux se
prsentent de la mme manire sur 2 colonnes : l'une pour
les effectifs, l'autre pour la frquence. Cependant, les
traitements diffrent selon que la question est rponses
uniques, multiples ou ordonnes.

Questions rponse unique


C'est le cas le plus simple : une seule rponse tant
admise, la somme des modalits cites est gale au
nombre total d'observations. La frquence est le
pourcentage de l'effectif de la modalit par rapport
l'effectif de l'chantillon total ou de la strate tudie.

Questions rponses multiples


Un mme individu peut apporter plusieurs rponses : le
nombre total de citations peut donc tre suprieur
l'effectif de l'chantillon ou de la strate (nombre
d'observations).
Il y a par consquent deux manires de calculer les
pourcentages dans ces tableaux : par rapport au nombre
d'observations ou par rapport au nombre de citations. La
premire solution a toujours une signification, mais la
deuxime peut galement tre intressante.

Questions rponses ordonnes


Si la case Rponses ordonnes du dialogue de dfinition
des questions multiples a t coche, le tableau donne
l'effectif et le pourcentage des modalits pour chaque
rang : en premier rang, en deuxime rang..., et au total quel
que soit le rang de citation. La dernire ligne Total donne
le nombre de citations en premier rang, en deuxime
rang...
Suggestion : Pour complter ltude de ce type de
question, vous pouvez transformer une question ordonne
en autant de variables chelles que la question comporte
de modalits (Transformer une variable du menu
Recoder). La valeur de ces variables chelles sera le rang
de citation de chaque modalit.

Traitement des non-rponses


Les non rponses ou donnes manquantes sont
automatiquement indiques sous la forme d'une modalit
non-rponse. La possibilit de Supprimer les lignes et les
colonnes de non-rponses annule cet automatisme
(Options de dpouillement du menu Dpouiller).
Attention, dans ce cas, vrifiez bien les options de calcul
des frquences dans vos tableaux (Observations ou
Citations).

Options de dpouillement
Avec cet article, vous pouvez spcifier de ne pas afficher
les modalits d'effectif nul et modifier la prcision
d'affichage des rsultats.

Par exemple, en analysant les rponses la question


quelle(s) marque(s) d'automobile avez-vous dans votre
mnage ? , on obtient le taux d'quipement des mnages
pour une marque en calculant le pourcentage par rapport
aux observations et la part de march de cette marque en
faisant le calcul par rapport au total des citations.
Le bouton Valeurs prsent dans la barre d'outils de la
fentre d'analyse des tableaux plat permet de choisir l'un
des deux modes de calcul. La ligne Total affiche, selon le
choix effectu, le nombre d'observations ou de citations
selon lequel les pourcentages sont calculs. Le dernier
choix est retenu comme solution par dfaut dans les
analyses suivre.

Sphinx 2000

Analyse univarie, les tableaux plat

145

Questions fermes
rponse unique

Cest le tableau le plus simple.


Chaque individu ne donne quune
rponse. La somme des effectifs par
modalit est gale au nombre
dindividus observs.

Questions fermes rponses multiples


6.CRITERES. Quels sont dans la liste suivante les trois principaux points
prendre en considration pour lachat dune automobile ?

Options de dpouillement

Calcul des frquences selon


le nombre dobservations :
CRITERES

Nb. cit.

Calcul des frquences selon


le nombre de citations :

Frq.

CRITERES

Non- rponse
15
9,3%
Vitesse
73 45,1%
Confort
44 27,2%
Scurit
36 22,2%
Consommation
80 49,4%
Prix
56 34,6%
Publicit
29 17,9%
Distributeur
14
8,6%
S.A.V. Entretien
22 13,6%
TOTAL OBS.
162
Le nombre de citations est suprieur au
nombre d'observations du fait de rponses
multiples (3 au maximum).

Nb. cit.

Frq.

Non- rponse
15
4,1%
Vitesse
73 19,8%
Confort
44 11,9%
Scurit
36
9,8%
Consommation
80 21,7%
Prix
56 15,2%
Publicit
29
7,9%
Distributeur
14
3,8%
S.A.V. Entretien
22
6,0%
TOTAL CIT.
369 100%
Le nombre de citations est suprieur au
nombre d'observations du fait de rponses
multiples (3 au maximum).

Questions fermes rponses ordonnes


6.CRITERES. Classez dans la liste suivante selon votre ordre de prfrence les 3
principaux points prendre en compte pour lachat dune auto ?
CRITERES
Vitesse
Confort
Scurit
Consommation
Prix
Publicit
Distributeur
S.A.V. Entretien
TOTAL CIT.

Nb. cit. Frq.


(rang 1)
57
11
4
45
19
6
0
5
147

38,8%
7,5%
2,7%
30,6%
12,9%
4,1%
0,0%
3,4%

Nb. cit. Frq.


(rang 2)
6
28
26
25
34
11
7
5
142

4,2%
19,7%
18,3%
17,6%
23,9%
7,7%
4,9%
3,5%

Nb. cit. Frq. Nb. cit. Frq.


(somme)
(rang 3)
10
5
6
10
3
12
7
12
65

15,4%
7,7%
9,2%
15,4%
4,6%
18,5%
10,8%
18,5%

73
44
36
80
56
29
14
22
354

20,6%
12,4%
10,2%
22,6%
15,8%
8,2%
4,0%
6,2%
100%

La question est 3 rponses multiples ordonnes. Le tableau donne les effectifs pour chaque rang
et pour la somme. Les pourcentages sont calculs par rapport au nombre de citations.

146

3. Mettre en forme les tableaux


plat
La prsentation des rsultats peut tre adapte aux
besoins de la communication ou complte par l'application
de tests statistiques. Utilisez cet effet la barre d'outils,
disponible dans la fentre d'analyse des tableaux plat. On
y accde par le bouton Analyser le tableau dans lcran
de rsultats ou par l'article Tableaux plat du menu
Analyser. Les oprations dcrites ci-dessous s'appliquent
tous les types de questions.

Toutes les modifications que vous faites dans cet cran


sont temporaires. Vous ne les retrouverez pas en revenant
ultrieurement sur le tableau. Il faut donc les insrer dans
un rapport ou les imprimer pour en garder trace. Pour
conserver des regroupements ou suppressions de lignes,
vous pouvez aussi utiliser loption Transformer une
variable disponible dans l'article Transformer / Combiner
du menu Recoder ou revenir modifier la liste de vos
modalits dans le questionnaire.

Revenir au tableau initial


Le bouton Revenir rtablit le tableau dans sa prsentation
initiale.

Modifier les dimensions

Calcul des pourcentages


Le bouton Valeurs permet de fixer le mode de calcul des
pourcentages. L'option de calcul par rapport aux
Observations est de loin la plus sre car toujours
pertinente. Nanmoins, dans le cas des questions ferms
rponses multiples, le calcul des frquences par rapport
aux citations est intressant.

Visualiser les pourcentages


En cochant loption Rectangles d'intensit dans le
dialogue ouvert par Valeurs, on fait apparatre dans le
tableau une reprsentation visuelle des pourcentages.

Regrouper, Supprimer, Permuter des


lignes
Vous pouvez modifier les tableaux en agissant sur les
lignes qui le composent. Cliquez pour cela dans les
marques triangulaires places en regard des modalits sur
lesquelles vous voulez agir.

Le bouton Dimensions vous permet de jouer sur la taille


des colonnes et des lignes. Utilisez galement les
raccourcis F5 et Maj+F5 pour agrandir et rduire la taille
des tableaux.

Choisir les polices


Paramtrez vous-mme vos polices (article Polices du
menu Edition). Les petites polices concernent les
commentaires et les lgendes.

Options de dpouillement
Avec cet article du menu Dpouiller, vous affichez ou non
les modalits d'effectif nul et les non-rponses, et vous
indiquez la prcision de l'affichage. Ces choix, comme ceux
des polices, s'appliquent tous les tableaux et sont
conservs comme choix par dfaut.

Gardez la touche Maj. enfonce pour slectionner


simultanment plusieurs lignes, et cliquez le bouton adapt
l'action dsire (Regrouper, Supprimer, Permuter).
Donnez un nom aux modalits que vous souhaitez
regrouper. Par cette action, vous pouvez aussi modifier le
libell d'une modalit (slectionnez-la, et cliquez sur
Regrouper). Si vous cliquez sur les boutons Supprimer et
Regrouper sans avoir marqu de ligne, la liste des
modalits slectionner est propose ; ce qui est pratique
pour les grands tableaux.

Sphinx 2000

Analyse univarie, les tableaux plat

147

Mettre en forme un tableau plat

Regrouper
Supprimer
Permuter

Modifier le contenu dun tableau

Modifier les dimensions


Raccourcis :
F5 et Maj+F5

Modifier les polices et les options

148

Dimensions du graphique

4. Les graphiques plat


Le Sphinx
graphiques.

comporte

de

nombreuses

possibilits

On peut les classer en 4 catgories de complexit


croissante :
Graphiques plat : ils reprsentent le tableau dune seule
variable ;
Graphiques croiss : ils reprsentent le tableau crois de
2 variables ;
Graphiques de valeurs numriques : ils reprsentent un
nuage de points ou une dispersion ;
Graphiques complexes : plus labors, ils peuvent mettre
en uvre des techniques avances danalyse statistique
(ACP, AFC).

On peut jouer sur la taille du graphique et sur celle de ses


lments en fixant des valeurs dans le bouton Dimensions
ou en les faisant varier avec les touches F5, F6, F7 et F8.
Cette dernire mthode est de loin la plus pratique. La
touche Majuscule de votre clavier inverse le sens de
variation.
Modifier la taille de tout le graphique : agrandir (F5),
rduire (Maj + F5) ;
Modifier la hauteur du graphique (histogrammes) :
augmenter (F6), diminuer (Maj + F6 ) ;
Modifier la taille des repres (profil, radar) : agrandir (F7),
diminuer (Maj + F7) pour le premier, (F8) et (Maj + F8)
pour les suivants.

Choisir une reprsentation graphique


On dispose de 8 types de graphiques diffrents pour
reprsenter un tableau plat. Ils sont prsents dans le
menu droulant, activ par Graphique, de la fentre
danalyse des tableaux plat : Histogrammes, Secteurs,
Barres, Profils, Aires, Radars, Anneaux, Histogrammes de
surface.
Le choix dpend de la nature de la variable et de leffet
recherch. Par exemple, la reprsentation en secteurs est
trs adapte des questions fermes uniques comportant
peu de modalits, le diagramme en barres convient mieux
aux fermes multiples ou aux questions ayant un plus
grand nombre de modalits.
Le graphique reprsente le tableau dans la forme o il se
trouve lcran. On peut toutefois le modifier directement
en utilisant les boutons Supprimer ou Ordonner, sinon on
revient au tableau pour faire les autres modifications
dsires (Regrouper, Renommer).

Paramtrage des graphiques


Le bouton Options donne accs aux possibilits offertes
pour la prsentation des graphiques :
aspect gnral : encadrer le graphique, afficher un titre et
le dfinir, prsentation en 3D, choix des couleurs ;
indicateurs statistiques : afficher ou non les valeurs, en
effectifs ou en pourcentages ;
fixer lchelle des graphiques : valeurs extrmes du
graphique, fixes ou non en fonction des donnes ;
changer les couleurs ou les polices de caractres.
Sphinx 2000

Analyse univarie, les tableaux plat

149

histogramme

MARQUE

MARQUE

secteurs

13,1%

41,4%

Renault

67

Peugeot

10,2%

Citron
Talbot

48,9%

Ford
Fiat
Etrangres

11,1%

8,6%

11,1%

13,1%
6,2%
2,5%

3,7%

4,4%
Ren
ault

Peu
geo
t

Citr
on

Tal
bot

Ford

MARQUE

barres

Renault

11,1%

Peugeot

8,6%

Citron
Talbot

Fiat

Etr
ang
re

profil, aire

7,3%

2,9%

MARQUE

22,0%

11,1%
2,5%

Ford

6,2%
3,7%

Fiat
Etrangres

41,4%

4,0%
Ren
ault

Peu
geo

Cit
ro

Tal
bot

Ford

Fiat

Vol
ksw

Opel

Jap
ona

Autre

MARQUE

radar

anneaux

Fiat

MARQUE
18

Etrangres
67

Renault
Peugeot
Citron

Ford

14

Ford
Fiat

6
10

Talbot

18

Renault

Etrangres

67

14
18

Talbot

18
Peugeot

Citron

Paramtrer les
graphiques
150

Ajuster
la taille

10

F5

tout

F6
F7
F8

hauteur
repres

5. Tris plat : tests sur les


variables nominales
Lorsqu'on tudie les donnes d'un chantillon alatoire, les
tests statistiques, en application de la thorie des
sondages, permettent de gnraliser la population mre
les rsultats observs dans l'chantillon. C'est ce qu'on
appelle l'estimation statistique. Les tests utiliss dans le
Sphinx ne sont valides que pour les chantillons d'au moins
30 observations. Ils permettent de :
calculer un intervalle de confiance : celui-ci donne la
fourchette dans laquelle on peut assurer, pour un risque
d'erreur accept, que se trouve la valeur du paramtre
estim ;
comparer 2 pourcentages (comparaison de frquences)
ou 2 rpartitions (Chi).

Pourcentage par rapport aux


observations ou citations
Les tests s'appliquent au type de calcul choisi en agissant
sur le bouton Valeurs.

Comparer 2 distributions : test du Chi


Dans le dialogue ouvert par le bouton Tests, vous pouvez
cocher la case Chi. Activez aussi le bouton Options pour
faire afficher le dialogue tendu de toutes les possibilits
offertes dans cette fonction.
Le test du Chi est un test d'indpendance qui compare la
distribution des modalits du tableau une distribution de
rfrence :
l'qui-rpartition qui correspond une hypothse de
rpartition alatoire des rponses entre les modalits,
une rpartition de rfrence que vous pouvez rentrer au
clavier en cliquant le bouton Autre rpartition.
Le rsultat obtenu indique si les deux rpartitions diffrent
significativement ou non. En outre, si vous avez coch la
case Encadrer les cases significatives, les cellules pour
lesquelles les carts sont les plus forts sont encadres en
bleu (effectifs sur-reprsents) ou en rose (effectifs sousreprsents).
Enfin, vous pouvez faire afficher, selon votre choix, les
carts aux effectifs thoriques ou les contributions au Chi
(absolues ou relatives).

Calcul de l'intervalle de confiance


Dans la barre d'outils de lcran danalyse, le bouton Tests
ouvre un dialogue dans lequel on choisit de calculer
l'intervalle de confiance ou la frquence.
En cochant loption Intervalle de confiance, on peut
choisir le risque d'erreur maximum accept r en fixant la
probabilit de ne pas se tromper p=1-r.
Pour chaque modalit, une fourchette s'affiche la place
de la colonne des frquences.
Elle signifie qu'au niveau choisi de probabilit, c'est dans
cette fourchette que se trouve la vraie valeur de la
frquence, pour la population mre.

Comparer 2 pourcentages
Slectionnez 2 lignes du tableau en cochant les triangles
repres, puis activez le bouton Comparer. Le logiciel
compare les frquences et affiche dans une fentre le
rsultat du test. Il vous indique si vous pouvez estimer que,
dans la population totale, les deux pourcentages sont
significativement diffrents.

Sphinx 2000

Analyse univarie, les tableaux plat

151

Pourcentages
(Observations ou Citations)

Intervalles de confiance

Comparaison de frquences
et de rpartitions

152

6. Tableaux plat des questions


numriques et chelles
L'analyse des variables numriques offre des possibilits
supplmentaires : calcul de moyennes, dcarts types... Il
est galement possible de les prsenter en dfinissant des
classes d'intervalles prsentes comme les modalits d'une
question rponse ferme chelle. On peut ainsi se faire
une ide de la distribution des valeurs de la variable.

Mise en classes automatique des


numriques
Le logiciel dfinit automatiquement 6 classes rparties de
faon gale entre la valeur minimale et la valeur maximale.
Le tableau de rsultat des variables numriques propos
par dfaut prsente alors le nombre de rponses de
chaque classe et le pourcentage correspondant. Le logiciel
complte ce tableau par laffichage dautres indicateurs
numriques (minimum, maximum, somme, moyenne, cart
type).

Dfinir des valeurs associes aux


chelons
On peut, au moment de l'analyse, revenir sur la dfinition
des valeurs associes.
Si cela n'a pas t fait au stade du questionnaire, les
valeurs 1, 2, 3... correspondant l'ordre dans lequel sont
numrs les chelons, ont t associes par dfaut. Cela
peut tre trs gnant, notamment lorsque l'numration va
en sens inverse de l'indication apporte par la valeur
associe. Par exemple Trs satisfait 1, Satisfait 2, Peu
satisfait 3... On prfrerait que la valeur indique un degr
de satisfaction...
Le bouton Barme permet, au stade des traitements, de
dfinir la pondration la plus adapte.
Les calculs de moyenne et d'cart type se trouveront alors
modifis.

Dfinir une autre mise en classes


La mise en classes propose par dfaut par le Sphinx peut
tre modifie en cliquant sur le bouton Mise en classes. Il
donne la possibilit de supprimer ou dajouter des seuils
(boutons Ajouter et Supprimer), mais aussi de dplacer
les seuils de faon interactive, ou de les saisir au clavier
dans le bouton Editer.

Dpouillement des chelles


De mme qu'on peut traiter les questions numriques
comme des fermes dans des tableaux plat, il est
possible dtudier les chelles comme des numriques.
Il suffit pour cela d'admettre qu'on peut associer chaque
chelon un nombre dont on pourra calculer la moyenne et
l'cart type. Mais attention, ceci n'a de sens que si les
valeurs associes traduisent correctement les diffrences
d'ordre qui existent entre les chelons. La possibilit
d'associer les valeurs de son choix permet de corriger si
ncessaire les valeurs attribues par dfaut par le logiciel.

Sphinx 2000

Analyse univarie, les tableaux plat

153

Tableau de variables
numriques
Mise en classes
automatique

Tableau de variables
numriques: dfinition
contrle des classes

Tableau dchelles :
frquence et indicateur de
moyenne

154

7. Tableaux plat : tests sur les


variables numriques
Les rponses numriques peuvent tre mises en classes et
traites comme des variables nominales sur lesquelles on
peut, en outre, calculer la valeur moyenne, la mdiane et
plusieurs indicateurs de dispersion (cart type, quartiles,
dciles... ).

Mettre en classes une variable


numrique
Les variables numriques sont mises en classes
automatiquement par le logiciel qui construit 6 classes
d'amplitude gale entre la valeur minimale et la valeur
maximale. Loption Mettre les numriques en classes
ouvre une fentre dans laquelle on peut :
Modifier la mise en classes automatique (Dfinition des
classes) ;
Faire afficher les valeurs remarquables (Valeurs
remarquables) ;
Recoder en crant une nouvelle variable chelle dont les
modalits sont les classes redfinies ;
Produire le Tableau des valeurs listant les diffrentes
valeurs de la variable, assorties de leur frquence.

Intervalle de confiance
Les variables numriques tant traites comme des
variables nominales aprs mise en classes, tous les tests
relatifs ce type danalyse sont disponibles.
De plus, la connaissance de l'cart type et de la moyenne
donne la fourchette qui situe la valeur de la moyenne dans
la population totale. Elle est gale [m-2,m+2] 95%
(risque 5%).

Comparaison de moyennes
On peut dsirer comparer les moyennes de 2 variables
numriques. Il faut pour cela aller consulter le tableau
rcapitulatif des variables numriques (option Tableaux
rcapitulatifs dans la fonction Rsultats du menu
Analyser) et l'analyser (bouton Analyser le tableau). On
peut alors, en slectionnant les lignes correspondant aux
variables que l'on souhaite comparer, lancer le test de
comparaison de moyennes (Comparer).
Signalons enfin qu'il est possible de comparer les valeurs
moyennes prises par une variable numrique pour
diffrentes catgories, dfinies par les modalits d'une
autre variable nominale. Ceci peut se faire en analysant le
tableau de moyennes correspondant (Analyser, Tableau
de moyennes).

Pour dfinir une nouvelle classification, on peut, au choix,


dplacer les seuils de classes, matrialiss par les
triangles, ou saisir directement les nouveaux seuils dans le
dialogue ouvert par le bouton Editer.

Choisir les indicateurs et valeurs


remarquables
Grce au bouton Tests, on choisit les paramtres afficher
sous le tableau : Minimum, Maximum, Moyenne, Ecart
type, Somme.
Les calculs de ces indicateurs peuvent tre effectus en
considrant les non-rponses comme des valeurs nulles ou
en les ignorant. Il est souvent plus pertinent de les ignorer.
Pour connatre les autres paramtres (mdiane, quartiles,
dciles, valeur la plus frquente), il faut activer le bouton
Valeurs remarquables dans la fentre de mise en classes.

Sphinx 2000

Analyse univarie, les tableaux plat

155

Analyser des variables numriques

Modifier la dfinition des classes

Dplacer les seuils

Entrer au clavier

Calculer les indicateurs statistiques

Produire le tableau des valeurs


Crer une nouvelle variable

156

8. Dpouiller les questions "Autre,


prcisez"

Dans ce dernier cas, slectionnez, dans la liste des


variables, le nom de celle que vous souhaitez remplacer.
Attention, en procdant ainsi, vous perdrez l'information
originale.

Les questions Autre, prcisez viennent complter les


questions fermes et gnrent des questions ouvertes
textes, dpouilles indpendamment. On peut toutefois
regrouper dans un mme tableau, les rponses apportes
la question Autre, prcisez et celle de la question
ferme de dpart.
On passe pour cela par un tableau de liste, partir duquel
vous pourrez ventuellement dfinir une nouvelle variable,
dans laquelle la liste des modalits initialement prvues
sera complte par les rponses textes. Cette mthode
donne toute la souplesse ncessaire au traitement de ces
questions.

Slectionner la question de dpart


Placez-vous dans la fentre des rsultats (Rsultats) et
allez sur la variable ferme contenant la modalit Autre .
Si la question contient un branchement sur une question
Autre, prcisez , vous trouverez en bas de lcran un
bouton Tableau tendu.
Il ouvre la fentre des tableaux de liste o vous trouverez,
dans un mme tableau, les modalits de la premire
question, suivies des rponses de la question texte.
Ce tableau peut bien sr tre transfr dans un rapport ou
imprim, mais vous pouvez aussi effectuer toutes les
oprations autorises pour les tableaux de liste,
notamment croiser ce rsultat avec une autre variable.

Choisir les modalits retenir


Dans la liste, choisissez les modalits que vous souhaitez
retenir, cest--dire celles qui figureront dans une nouvelle
question tendue aux modalits apportes par les
rponses Autre, prcisez .

Crer une nouvelle variable


Le bouton Recoder vous permet de crer une nouvelle
variable ou de remplacer la variable de dpart par une
variable aux modalits tendues.

Sphinx 2000

Analyse univarie, les tableaux plat

157

Question : Autre,
prcisez

Fentre des rsultats

Tableau de liste

158

Nouvelle variable incluant les


modalits de : Autre,
prcisez

Sphinx 2000

Analyse univarie, les tableaux plat

159

Analyses
bivaries, les
tableaux croiss

160

Options de calcul

1. Croiser 2 variables
L'analyse bivarie consiste examiner simultanment les
rponses 2 questions diffrentes en vue de rechercher
des influences, causalits ou concidences. La signification
des questions qu'on rapproche guide leur choix, et l'analyse
statistique permet d'indiquer si les donnes confirment ou
non les ides qui ont conduit les rapprocher. C'est ce
qu'on appelle aussi tester une hypothse.
Selon le type et les proprits statistiques des variables
tudies, les analyses diffrent. Nanmoins, vous pouvez
les slectionner pour les tudier dans des tableaux croiss
sans vous soucier a priori du traitement.

Programmer des tris croiss


On peut indiffremment utiliser le bouton Tableaux croiss
dans lcran central des traitements, ou l'article Tableaux
croiss du menu Analyser. Il est galement possible
d'oprer partir du bouton prsent dans la fentre des
rsultats. Ces options ouvrent un dialogue Programmer
des tris croiss, qui propose des listes droulantes
permettant de choisir les variables.

On vous propose cependant, quand l'une au moins des


variables tudies est numrique, de mettre en uvre la
mthode la mieux approprie :
Si les 2 variables sont numriques : reprsenter chacun
des individus en fonction de ses coordonnes dans un
repre cartsien (nuage de points), calculer la corrlation
entre les variables et la droite de rgression. Cette
mthode est quivalente ce qu'on aurait obtenu par
l'article Corrlations du menu Analyser.
Si une des variables est numrique et lautre nominale :
calculer pour chaque catgorie d'individus, correspondant
aux modalits de la variable nominale, la valeur moyenne
de la numrique. On obtient ainsi un tableau de
moyennes quivalent ce que donne l'article Tableau de
moyennes du menu Analyser.
Ces options font l'objet d'un message qui propose la
mthode danalyse la plus adapte. En rpondant Oui,
vous tes orient sur la mthode suggre. Si vous
rpondez Non, le logiciel met en classes la (les)
numrique(s) et calcule un tableau d'effectifs.

Aprs avoir slectionn les deux variables, il sagit de


cliquer le bouton Croiser V1 et V2 pour ajouter ce
croisement la liste des tris croiss. Pour dfinir plusieurs
tris d'un seul coup, on choisit la premire variable, puis on
clique le bouton Croiser V1 avec plusieurs. Par dfaut,
toutes les variables diffrentes de la premire sont
slectionnes. Utilisez la touche Ctrl pour dslectionner
les variables qui ne vous intressent pas.
On peut aussi restreindre l'affichage de la liste aux seules
variables correspondant au type slectionn dans le
dialogue ouvert par le bouton ....

Lancer un tri crois


Pour tudier un tri crois, il faut le slectionner dans la liste
puis agir sur le bouton Analyser. Un double-clic sur un des
lments de la liste de tableaux produit le mme effet.
Le logiciel calcule un tableau d'effectifs qui dfinit tous les
cas obtenus par croisement des modalits de chacune des
variables. Si l'une des variables est numrique, les
modalits correspondent au dcoupage en classes de la
variable.

Sphinx 2000

Analyses bivaries, les tableaux croiss

161

Croiser 2 variables
Croiser une variable
avec plusieurs variables

Slectionner les
variables
croiser

Lancer les calculs


Options de calcul

V1 et V2 nominales

Tableau deffectifs

V1 et V2 numriques

Graphe de points

V1 ou V2 numriques

Tableau de moyennes

162

2. Mettre en forme un tableau


crois
Pour faciliter la lecture des tableaux d'effectifs, il est
important de bien choisir leur contenu (effectifs /
pourcentages) et leur prsentation.

Pourcentage en ligne ou en colonne ?


Il est plus ais de lire des pourcentages que des effectifs
car ils facilitent les comparaisons. Le choix des
pourcentages en ligne ou en colonne dpend de
l'orientation de la lecture. On prfre en gnral calculer les
pourcentages par rapport la variable explicative.
Par exemple le sexe a-t-il une influence sur le choix d'une
marque ? Dans le tableau ci-contre, on calcule des
pourcentages en colonne pour comparer 100 hommes et
100 femmes.

Pourcentage selon le nombre


d'observations ou de citations
Lorsque l'une au moins des questions est rponses
multiples ou lorsqu'on a supprim des lignes ou des
colonnes, il faut se poser la question.

La mise en forme du tableau


La barre d'outils permet d'adapter la prsentation du
tableau aux besoins de la communication.
On peut jouer en supprimant des lignes ou des colonnes
(Supprimer : non rponses, faibles effectifs...), ou en en
regroupant d'autres (Regrouper). On slectionne les
repres des lignes ou colonnes concernes et on clique le
bouton adapt. Les effets des manipulations effectues
dans cet cran sont temporaires. Pour les conserver,
passez par loption Transformer une variable de larticle
Transformer/ Combiner du menu Recoder.
Transposer permet d'orienter le tableau selon les
proportions de l'cran ou du document de sortie. Ordonner
dispose les lignes ou colonnes selon l'ordre de la modalit
choisie en colonne ou en ligne. Permuter inverse la
position des lments slectionns.
Le bouton Dimensions permet de choisir la largeur des
colonnes et la hauteur des titres. Vous pouvez aussi utiliser
les touches F5 et Maj+F5 pour augmenter et rduire les
dimensions des tableaux croiss. On peut enfin modifier les
polices dans loption Polices du menu Edition.
Le bouton Revenir rtablit la prsentation de dpart du
tableau. Vous perdrez alors toutes les modifications que
vous venez de raliser dans cet cran.

La solution la plus pertinente est en gnral de calculer par


rapport au nombre d'observations... mme si la somme des
pourcentages natteint pas 100.

Les options de calcul


Le bouton Valeurs ouvre un dialogue qui permet de
prciser ses choix :
Afficher les effectifs (Nb de citations), ou les
pourcentages (% en ligne, % en colonne ou % au total)
ou encore les effectifs et les pourcentages (Pourcentages
et Afficher galement les effectifs).
Dfinir le mode de calcul des pourcentages par rapport
aux Observations (nombre d'individus ayant telle
rponse), ou aux Citations (nombre de fois o telle
rponse est cite).
Choisir un mode d'affichage pour visualiser les
diffrences (Rectangles d'intensits), afficher ou non les
symboles des pourcentages.

Sphinx 2000

Analyses bivaries, les tableaux croiss

163

Caractriser les cellules


(double clic)

Effectifs et pourcentages

Transformer le tableau
Supprimer, Regrouper
Ordonner, Permuter
Transposer
Dimensions
Revenir
164

3. Tableaux croiss : les


graphiques
Ces graphiques reprsentent les tableaux croiss. Ils sont
activs par le bouton Graphique de la fentre danalyse
des tableaux croiss. On retrouve les mmes
reprsentations que pour les tableaux plat.

Choisir une reprsentation


Ce choix est encore plus important que pour les graphiques
plat. Par exemple, le graphe en secteurs ne permet de
reprsenter quune colonne ou une ligne dun tableau
crois.

Le baromtre
Ce graphique particulier permet de ne reprsenter quune
partie des modalits colonnes dun tableau en les opposant
sur la droite et la gauche dune mme ligne.
Les traits sinterprtent comme une jauge indiquant les
diffrences de comportement des modalits en ligne par
rapport celles quon a choisi de slectionner dans les
colonnes.
Le dialogue doption permet de choisir les modalits
opposer en offrant la possibilit galement dindiquer les
pourcentages relatifs une troisime colonne.

Et pour obtenir un rsultat lisible, il peut tre utile de ne


slectionner que quelques lments du tableau. Enfin, le
sens dans lequel on reprsente le tableau nest pas
indiffrent notamment pour les profils et les radars.

Contenu du graphique
Le bouton Carrousel permet de voir le graphique en le
rduisant lune de ses lignes ou colonnes. Cest trs
pratique pour mieux dchiffrer le graphique de lensemble.
Il suffit de cliquer sur Carrousel pour faire dfiler les profils
ou les radars de chaque colonne ou ligne. Le bouton
Transposer fait basculer de lune lautre.
On peut galement limiter les lments reprsents dans le
graphique en les slectionnant au pralable dans le
tableau. Par exemple, pour comparer 2 profils, on
slectionne les 2 colonnes correspondantes, puis on lance
le graphique.

Paramtrer les graphiques


Les choix sont identiques ceux proposs pour les
graphiques plats (encadr, titre, indicateurs statistiques,
chelle, taille des lments, taille de lensemble). On
utilisera de la mme manire les boutons Options et
Dimensions, et les raccourcis F5, F6, F7, F8.
Le seul ajout a trait la possibilit de choisir si les courbes
des profils ou les radars correspondent aux lignes ou aux
colonnes du tableau.

Sphinx 2000

Analyses bivaries, les tableaux croiss

165

5.MARQUE x 7.CRITERES

Marque selon les critres


18

28 Renault
34 Peugeot
34 Citron
7 Talbot
16 Ford
119 Etrangres

238 TOTAL
Vitesse

Confort

Consommation

Prix

Vitesse

Confort

Scurit

Conso
mmati

Renault

Citron

Volkswagen

Prix

Publicit

Distr
ibute

S.A.V.
Entretien

Scurit

Prix

CRITERES x MARQUE
34
Consommation

34

30

21

19

18

Vitesse

15
9 8

9
5

Scurit

Vitesse

8
3

Confort

5
1
Scurit

Confort

Baromtre

Renault

Peugeot

Ford

Etrangres

Citron

13
10
7
2

Conso
mmatio
n

Prix

Talbot

Reprsenter les lignes / colonnes


dun tableau

Paramtrer et fixer les dimensions

F5
F6
F7
F8
166

4. Tableaux croiss : tests


statistiques et AFC
La lecture et l'interprtation d'un tableau crois renvoient au
test d'hypothse. On peut pour cela utiliser le test du Chi
et l'analyse factorielle des correspondances.

Un exemple
Le critre de choix a-t-il une influence sur la marque de
voiture achete ? On peut rpondre cette question en
comparant dans le tableau ci-contre les pourcentages en
colonne. Par exemple, ceux qui sont sensibles au confort
sont relativement plus nombreux choisir une Volkswagen
(27% contre 13% au total pour cette population). Ils sont
certainement attirs par cette marque. Tout l'inverse, ces
personnes boudent Renault.
On peut systmatiser cette analyse des carts en
effectuant un test du Chi. Ce test consiste comparer les
effectifs rels du tableau ceux quon devrait avoir
thoriquement si les critres n'avaient aucune influence sur
la marque. L'analyse des carts permet d'identifier les
cellules du tableau o ces carts sont les plus importants.
Dans l'exemple ci-contre, on encadre en bleu les carts
positifs et en rose les carts ngatifs.

Une lgende donnant le rsultat


automatiquement au bas du tableau.

du

test

s'affiche

Comparaison de 2 lignes ou colonnes


En slectionnant 2 lignes ou 2 colonnes puis en faisant
Comparer, on lance le test du Chi sur les distributions de
frquences correspondant aux lments choisis.

Analyse factorielle des


correspondances
On clique sur AFC pour obtenir une carte reprsentant les
carts l'indpendance. Le bouton Options permet
d'amliorer la prsentation de la carte : vous pouvez
Cacher et Relier des modalits, faire varier les dimensions
de la carte (F5), ou celle des points (F7) dont la taille est
proportionnelle l'effectif de la modalit, afficher les % de
variance explique par les axes... Si le nom des modalits
nest pas bien lisible sur la carte, vous pouvez les dplacer
en les cliquant et en les faisant glisser.
Le bouton Axes permet de faire d'autres projections
choisies parmi les 5 premiers facteurs. Il indique galement
le % de variance explique par chacun d'eux. On en dduit
alors la qualit de la carte.

On peut enfin rendre cette analyse encore plus visuelle en


faisant
une
carte
d'analyse
factorielle
des
correspondances. En marge de la carte sont disposs les
marques et les critres pour lesquels les carts sont les
plus forts. Au centre, on lit la relative indpendance. On
vrifie ainsi que le confort attire Volkswagen et les marques
japonaises, alors quil est loign de Renault, marque trs
proche de la consommation ; ce qu'on vrifie dans le
tableau.

Test du Chi sur le tableau


Le bouton Tests permet de lancer le test et de choisir
comment mettre en valeur ces rsultats dans le tableau.
On peut marquer les cellules de plus forte contribution au
Chi, cest--dire celles pour lesquelles les carts sont les
plus forts (Encadrer les cases significatives).
On peut aussi remplacer dans le tableau le nombre de
citations par les carts au tableau thorique ou par les
contributions au Chi.

Sphinx 2000

Analyses bivaries, les tableaux croiss

167

Test du Chi

Analyse factorielle des correspondances

168

5. Tableaux de moyennes
On obtient ce type de tableau en croisant une variable
ferme nominale avec une ou plusieurs variables
numriques. Pour chaque catgorie de la variable
nominale, le logiciel calcule la moyenne de la variable
numrique ainsi que d'autres indicateurs tels que lcart
type et la somme. On applique les tests de comparaison de
moyennes et d'analyse de variance (Fisher) ces rsultats.
Ils permettent d'tablir s'il existe des diffrences
significatives entre les catgories tudies.

Lancer un tableau de moyennes


L'article Tableau de moyennes, disponible dans le menu
Analyser, ouvre un dialogue dans lequel on choisit la
variable nominale ( gauche) et les variables numriques
ou chelles ( droite).
Les tableaux de moyennes permettent en effet de
slectionner plusieurs variables numriques ou chelles, ce
qui nest pas le cas lorsquon passe par larticle Tableaux
croiss du menu Analyser. Cette dernire option, mme si
elle oriente automatiquement vers un tableau de moyennes
lorsque le type des variables tudies le ncessite, permet
de croiser une variable nominale avec une seule variable
numrique. Ltude de variables numriques selon une
nominale se fait galement par l'article Approfondir /
Analyse de la variance.

Test de comparaison de moyennes


Il s'agit du test de Student. On lance ce test en activant le
bouton Tests et en slectionnant Encadrer les moyennes
significativement diffrentes. Les valeurs suprieures
la moyenne sur l'ensemble de l'chantillon (au risque
slectionn) s'affichent en bleu, les valeurs infrieures en
rose. Le bouton Comparer effectue le mme test appliqu
aux moyennes des catgories slectionnes.

Test d'analyse de la variance


Ce test s'applique globalement la distribution des
moyennes sur l'ensemble des modalits de la variable. Il
repose sur l'analyse du rapport entre la variance des
moyennes entre catgories (variance inter) et la variance
des moyennes dans chaque catgorie (variance intra).
La case cocher Afficher les rsultats du test de Fisher
fait apparatre la valeur du rapport F ainsi que les lments
qui permettent de le calculer. Le diagnostic global s'affiche
dans la lgende.
Le libell des colonnes pour lesquelles la distribution des
moyennes met en vidence des diffrences significatives
se trouve encadr en bleu ou rose quand on coche la case
Encadrer les critres discriminants.

Mettre en forme un tableau de


moyennes
On dtermine le contenu du tableau dans le bouton
Valeurs. En plus des indicateurs classiques, il permet de
calculer la part que reprsente la somme des valeurs
numriques, calcules pour les effectifs de chaque
modalit, par rapport la somme sur toute la population.
Les boutons Supprimer, Ordonner, Regrouper,
Renommer fonctionnent comme pour les autres tableaux.
Cliquez sur les repres triangulaires pour slectionner les
lments et utilisez le bouton appropri. Attention, les
transformations effectues sur ces tableaux sont
temporaires. Pour les conserver, il faut donc les imprimer
ou les inclure dans le rapport.

Sphinx 2000

Analyses bivaries, les tableaux croiss

169

Choisir les variables croiser


Choisir les indicateurs afficher

Modifier le tableau
Lancer les tests

170

6. Graphes de dispersion
De nombreuses possibilits sont offertes pour visualiser un
tableau de moyennes sous forme graphique : barres,
profils, aires, radars, dispersions, graphiques 2 critres. On
fait son choix dans la liste ouverte par le bouton
Graphique.

Prsentation des graphiques


La prsentation d'un graphique peut tre adapte en jouant
sur les boutons Options, Dimensions et Supprimer.
Avec Options, vous pouvez faire varier le contenu du
graphique, Dimensions permet d'agir sur sa taille (essayer
aussi les raccourcis F5 et F7), et Supprimer est utile pour
supprimer des lignes ou des colonnes sur le graphique
sans devoir repasser par le tableau. Passez par l'article
Options de dpouillement du menu Dpouiller pour
indiquer la prcision des affichages.
Le bouton Carrousel adapte le graphique l'ensemble du
tableau ou chacune de ses colonnes / lignes. Cliquez
plusieurs fois pour faire dfiler.

Dispersion "Critre" Dispersion


"Modalit"
Avec ce graphique, on visualise la dispersion d'un critre
par rapport aux modalits en ligne (Dispersion critre) ou
la valeur d'une modalit selon diffrents critres
(Dispersion modalit).
Ce graphique montre la fois la valeur moyenne et l'cart
type. On choisit le contenu afficher avec le bouton
Options.

Sphinx 2000

Analyses bivaries, les tableaux croiss

171

Graphe de dispersion

Adapter les graphiques


Graphe deux critres

Visualiser les carts types

172

7. Graphiques "2 critres"


Comparer deux valuations
Ce graphique permet de comparer graphiquement deux
valuations d'un ensemble de critres ( partir d'un
Tableau de questions numriques) ou bien deux
valuations d'un critre pour les diffrentes modalits d'une
question ferme ( partir d'un Tableau de moyennes).

Dplacer les tiquettes


La lisibilit de la carte peut tre amliore en dplaant la
lgende de chaque point modalit, en la slectionnant et en
la faisant glisser.

Lecture du graphique

Quelques exemples d'utilisation sont :


Importance Performance
Performance Evolution
Performance Influence
Satisfaction avant Satisfaction aprs

Ces graphiques ressemblent aux cartes factorielles mais


ne s'interprtent pas du tout de la mme faon.
Les axes du graphique partagent l'espace en quatre
quadrants.

Nommer les valuations


Les valuations ont comme nom par dfaut Evaluation 1 et
Evaluation 2. Pour mettre les noms souhaits, il suffit de
les mettre dans la chane de caractres du titre du
graphique (dialogue Options) en mettant le caractre ':'
(deux points) entre les noms. Par exemple :
Satisfaction l'accueil : Performance :
Importance

Le graphique aura pour nom "Satisfaction l'accueil", l'axe


des abscisses "Performance" et l'axe des ordonnes
"Importance".

Ordre des critres


Pour les tableaux de questions numriques, les critres
peuvent tre rangs de deux manires :
les deux valuations se suivent pour un mme critre ;
on trouve la premire valuation pour tous les critres,
puis la seconde valuation pour tous les critres. Pour
obtenir le graphique dans ce dernier cas, cocher la case
Evaluations alternes.

Options d'affichage
Diffrentes options permettent de mettre les lments
prpondrants en valeur :
afficher les valeurs sur les axes ;
afficher les valeurs pour chaque critre / catgorie ;
dimensionner les lments proportionnellement aux
carts types. L'lment prend la forme d'un losange dont
les diagonales sont fonction des carts types des critres
pour chacune des deux valuations ;
Sphinx 2000

l'origine du graphique peut tre place la moyenne des


valeurs, la moyenne des moyennes, ou bien une
valeur fixe ;
les bornes du graphique sont paramtrables de la mme
manire.

Chaque catgorie est situe sur la carte selon sa valeur


pour chacun des critres. On peut mettre ainsi en vidence
les proximits ou les oppositions entre catgories et les
effets convergents ou divergents des critres.
Prenons le cas de deux batteries d'chelles donnant deux
valuations d'un ensemble de critres.
Les axes reprsentent selon l'option choisie :
l'chelon moyen propos dans le questionnaire ;
la moyenne gnrale de l'valuation pour tous les
critres ;
une valeur fixe, par exemple l'objectif atteindre.
Le quadrant en haut droite contient les critres pour
lesquels les deux valuations sont "bonnes".
Le quadrant en bas gauche contient les critres pour
lesquels les deux valuations sont mauvaises.
Les deux derniers quadrants (en bas droite et en haut
gauche) contiennent les critres pour lesquels les deux
valuations sont diffrentes.
L'interprtation de cette rpartition dpendra bien entendu
de la nature des valuations.

Analyses bivaries, les tableaux croiss

173

174

8. Rduction des dimensions d'un


tableau de moyennes (carte ACP)
Quand un tableau de moyennes a plus de 2 colonnes, il
n'est pas possible de reprsenter dans un plan tous les
critres et toutes les modalits. Il faudrait pour cela
rsumer toute l'information du tableau dans 2 dimensions.
C'est le principe de l'analyse en composantes principales.
Cette mthode consiste rechercher quel est le tableau
2 colonnes qui rsume le mieux l'information de dpart. On
y parvient en calculant les 2 nouvelles dimensions selon
lesquelles on pourra situer sur une carte les modalits les
unes par rapport aux autres. Les axes de cette carte
correspondent aux 2 composantes qui rsument le mieux
le tableau.

La carte d'analyse en composantes


principales
Le bouton ACP lance une analyse en composantes
principales du tableau de moyennes. Cette carte situe
chaque modalit figure par les points par rapport aux 2
dimensions qui rsument le mieux le tableau de dpart. Les
critres reprsents par les axes critres (ou les triangles)
donnent leur signification aux axes de la carte.

Modifier les cartes


On peut jouer sur les dimensions de la carte grce au
bouton Dimensions ou avec les raccourcis F5 et F7. On
peut amliorer la lisibilit de la carte en dplaant
directement les lgendes des modalits l'cran.
Il est enfin possible avec le bouton Axes de calculer
d'autres composantes (jusqu' la 7me) et d'afficher les
cartes correspondantes.
Pour complter l'analyse, on peut afficher la matrice ou le
graphe de corrlation ainsi que les contributions.

ACP sur tableaux de moyennes et sur


les individus
On applique la mme technique dans le menu
Approfondir (Analyse en composantes principales)
mais dans ce cas, les donnes sont individuelles et non
agrges.
C'est la raison pour laquelle on obtient en gnral une
moins bonne restitution de l'information (% de variance
explique par les axes).

De gauche droite, l'valuation des catgories varie


comme les critres placs les plus droite ou les plus
gauche. Plus l'angle est aigu, plus la corrlation est leve.
Un angle obtus indique une forte corrlation inverse. Les
critres placs au centre de la carte n'ont qu'un faible
pouvoir d'interprtation.
La qualit de la reprsentation dpend du pourcentage
d'information restitue par chacun des axes (% de
variance).
Attention : si les analyses de variance ne sont pas
significatives, les diffrences mises en vidence par la
carte ne le sont pas non plus.
On peut choisir entre deux modes de reprsentation. Dans
un cas, en cochant Cercle de corrlation, le cercle de
corrlation (de rayon 1) figure sur la carte et facilite ainsi
l'estimation de la corrlation de chacun des critres avec
les axes. Si la corrlation est parfaite, le critre se trouve
sur le cercle.
Dans l'autre cas, les critres sont figurs sous forme de
triangles proportionnels leur valeur moyenne sur
l'chantillon.
Sphinx 2000

Analyses bivaries, les tableaux croiss

175

Carte ACP dun tableau de


moyennes

Carte factorielle

Matrice et graphe
de corrlation

176

9. Prsentation des cartes


factorielles
Le Sphinx permet de construire des cartes factorielles
rsultant dune AFC (Analyser, Tableaux croiss, AFC)
ou dune ACP (Analyser, Tableaux de moyennes, ACP).

Jouer globalement sur les dimensions dune ACP : F5 et


MajF5 pour augmenter et diminuer lchelle des individus,
F6 et MajF6 pour augmenter et diminuer lchelle des
critres.
Faire varier la reprsentation des points modalits (F7 et
MajF7) ou des triangles critres (F8 et MajF8).

Dplacer les vignettes sur les cartes


On peut directement dplacer le nom des modalits ou des
variables figurant sur la carte et remdier ainsi aux
chevauchements. Il suffit de cliquer sur le texte et de le
faire glisser. Si on sloigne trop du point correspondant, un
trait apparat pour le relier au texte.
Cette possibilit est particulirement utile pour analyser les
cartes souvent trs denses provenant de lanalyse lexicale.

Prsenter les cartes AFC


Plusieurs options permettent de modifier laspect de la
carte :
Afficher ou non le pourcentage de variance explique par
les axes. Reprsenter les axes proportionnellement au
pourcentage de variance explique (bouton Options).
Mettre les noms de modalits en couleur, les pavs
proportionnels aux effectifs, relier les modalits (bouton
Options).
Lgende spare et reprsentation des modalits par des
formes (AFC sur tableaux croiss uniquement).

Prsenter les cartes ACP


Pour les ACP sur les tableaux de moyennes, on peut
reprsenter le cercle de corrlation et projeter les
dimensions dorigine ou reprsenter les variables par des
triangles dont la surface est proportionnelle la valeur
moyenne.

Raccourcis pour redimensionner la


carte
Ces raccourcis sont trs utiles pour obtenir une carte lisible
et expressive :
Jouer globalement sur les dimensions dune carte AFC :
augmenter F5, diminuer MajF5.

Sphinx 2000

Analyses bivaries, les tableaux croiss

177

AFC
Cliquez sur un nom de
modalit
et dplacez-le

Montrer ou cacher
les pourcentages sur
les axes

Coder des modalits


par taille et forme
Distinguer
plus facilement
les noms
des modalits

La taille est
proportionnelle la
moyenne quand le cercle
de corrlation nest pas
prsent

ACP
178

10. Corrlation et nuage de points


L'analyse des relations entre 2 variables numriques (ou
chelles) offre des possibilits graphiques intressantes.
En reprsentant chaque individu par ses coordonnes, on
peut visualiser leur rpartition. La forme du nuage obtenu
renseigne sur la relation, plus ou moins forte, entre les 2
variables. Si le nuage est trs effil, la valeur de l'une des
variables se dduit assez exactement de la connaissance
de l'autre. La corrlation est bonne et l'quation de la droite
de rgression dfinit bien la relation. Dans le cas d'un
nuage trs rparti, le coefficient de corrlation sera proche
de 0 et l'ajustement par la droite de rgression trs
incertain.

Slectionner les variables analyser


L'article Corrlations disponible dans le menu Analyser
ouvre un dialogue comportant 2 listes droulantes. A
gauche, on choisit la variable explicative (reprsente en
abscisse), et droite, la variable explique (reprsente en
ordonne).
Dans la liste, seules les variables numriques et chelles
sont proposes. Vous obtenez le mme rsultat avec
larticle Tableaux croiss du menu Analyser si les
variables que vous slectionnez sont numriques.
Le rsultat s'affiche sous forme d'une carte (un point = un
individu). Pour faire apparatre la droite, cocher la case
Rgression.

Visualisation des donnes


individuelles
Sur la carte, chaque point reprsente un individu. On fait
apparatre ses coordonnes en le cliquant, et en cas de
superposition, une liste s'affiche. Un double-clic donne la
fiche dtaille de l'individu correspondant. La touche F7
permet de varier la taille des points.
On peut amliorer la reprsentation graphique grce aux
diffrentes options proposes par le bouton Prsentation.
Il est notamment possible de colorier chaque point en
fonction de sa rponse une autre variable (Colorier
selon les modalits de) ou de faire afficher le libell de
cette rponse (Libell par la valeur de... ventuellement
tronqu x caractres). Le bouton Prsentation permet
aussi une reprsentation par zones plutt que par points
(Regrouper sur une grille). La carte est divise en mailles
dont on affiche le quadrillage (Nombre d'observations par
maille) ou que l'on reprsentera par un point de taille
proportionnelle aux individus prsents dans la maille
(Points de taille proportionnelle l'effectif...).

Dimensions de la carte
On peut faire varier la grandeur du graphique avec la
touche F5 ou le bouton Echelles. Par dfaut, l'origine des
axes est fixe aux valeurs minimales des 2 variables. On
peut choisir des chelles identiques ou diffrentes selon les
axes, ce qui modifiera beaucoup la perception.

Test de corrlation et droite de


rgression
Le test de corrlation est lanc automatiquement. Son
rsultat s'affiche sous la carte et dans la fentre de la
lgende.
Il indique la valeur du coefficient de corrlation. Plus sa
valeur absolue est leve, meilleur est l'ajustement. On le
vrifie avec l'indication du % de variance explique. Si la
case Rgression est coche, l'quation de la droite
complte l'analyse de la relation.

Sphinx 2000

Analyses bivaries, les tableaux croiss

179

Nuage de
points

Double clic

Droite de
rgression

Test de
corrlation

Illustrer

Regrouper

180

11. Typologies et scores par


rapport 2 dimensions
L'examen d'un nuage de points met en vidence des
groupes d'individus situs de manire analogue sur la
carte. On peut exploiter cette information en crant de
nouvelles variables.

Crer une variable typologie ou score


La classification et les scores peuvent tre enregistrs
dans de nouvelles variables qui viennent se rajouter votre
base de donnes. Utilisez pour cela le bouton Variables.
Choisissez ce que vous voulez faire puis nommez la
variable qui va tre cre. Vous la retrouverez ajoute la
fin de la liste des variables.

Construction d'une typologie


interactive
Le principe consiste placer sur la carte des pastilles
auxquelles seront rattachs les points les plus proches. En
choisissant le nombre et la disposition des pastilles, on
peut construire une typologie rendue apparente par le
coloriage des points.
Le bouton Typologie ouvre le dialogue dans lequel on
dfinit le nombre et le nom des pastilles placer ensuite
sur la carte. Celles-ci sont d'abord places au hasard. A
vous de les disposer de manire faire apparatre les
groupes d'individus coloris les plus homognes. Pour
changer les couleurs, utiliser la fonction Couleurs du menu
Edition.
Attention : si les variables que vous croisez sont dans des
units diffrentes, votre perception peut changer beaucoup
selon que vous optez pour des chelles identiques ou
diffrentes.

Calculer un score
Le logiciel vous donne la possibilit de calculer pour
chaque individu :
la valeur thorique de la variable expliquer pour la
donne observe de la variable explicative ;
l'cart entre la valeur observe et la valeur calcule (le
rsidu).
Ces indicateurs peuvent tre trs intressants pour tablir
des prvisions ou des plans d'action. On les calcule partir
du bouton Variables.

Sphinx 2000

Analyses bivaries, les tableaux croiss

181

Typologie par rapport 2 dimensions

Echelles identiques
Regrouper les individus en
classes de proximit

Echelles diffrentes

Crer de nouvelles
variables
182

Typologie
Score

12. Reprendre des analyses


Retrouver un rsultat dj effectu
Le Sphinx garde la trace de tous les traitements effectus
au pralable. On peut les retrouver grce l'article
Reprendre une analyse du menu Analyser. Il suffit de
slectionner dans la liste le traitement que vous souhaitez
tudier de nouveau puis cliquez sur le bouton Relancer
pour voir les rsultats correspondants. Attention, seul le
traitement est mmoris : quand on le relance, il s'applique
la strate courante.
En bas de la liste, les 3 boutons permettent de faire
apparatre :
la liste des variables pour lancer un tableau plat ;
la liste des tris croiss ;
le dialogue de Dterminer une analyse dans lequel vous
pourrez slectionner n'importe quel sous-ensemble de
variables que vous voulez analyser simultanment (Voir
le paragraphe Dterminer une analyse).

Relancer simultanment plusieurs


traitements
On peut reprendre les traitements dont on garde la trace
pour les reproduire dans un rapport. Il faut pour cela vrifier
le contenu du plan de dpouillement et y intgrer toutes les
analyses souhaites puis excuter de nouveau le plan
(article Plan de dpouillement du menu Dpouiller).
A la diffrence de la fonction Reprendre une
plan de dpouillement ne permet pas de voir
les rsultats l'cran. Son objectif est
simultanment plusieurs traitements pour
automatiquement dans le rapport dtude.

Sphinx 2000

analyse, le
directement
de lancer
les inclure

Analyses bivaries, les tableaux croiss

183

Retrouver une analyse


pour la voir lcran

Lancer une nouvelle


analyse

Lancer un plan de
dpouillement dans un
rapport

184

13. Dterminer une analyse


En statistique, la mthode danalyse dpend de la nature
des variables. Pour faciliter votre rflexion, un assistant
vous guide vers lanalyse la plus pertinente en fonction des
variables que vous voulez analyser.
Concentrez-vous sur vos hypothses, sur la signification de
vos donnes, le Sphinx vous orientera vers les mthodes
mettre en uvre. Mieux, il les lancera directement.
Vous dcouvrirez ainsi des mthodes que vous ne
connaissez peut tre pas et vous naurez plus vous
soucier de savoir dans quel menu aller pour les obtenir.
Pour lancer cet assistant, cliquez sur le bouton Autres
analyses dans lcran central du stade des Traitements.

Choisir les variables analyser


Le bouton Autres analyses ouvre un dialogue proposant la
liste des variables de lenqute. Dans cette liste, choisissez
les variables que vous souhaitez analyser. Faites-les
passer dans la fentre de droite : le Sphinx vous proposera
les traitements quon peut leur appliquer.

Les principes de lexpertise


Les mthodes sont proposes par rapport la
configuration des variables slectionnes (nombre et type).
Une notation abrge dcrit cette configuration : F pour
une variable ferme, N pour une numrique, T pour une
variable texte. On note la prsence de plus de deux
variables dun mme type par une toile.
Par exemple, un tableau crois de variables nominales est
not FF, un tableau de moyennes croises FN*
Une mme configuration peut conduire plusieurs types
danalyses : par exemple, F* peut conduire un tableau
plat accol, une analyse factorielle multiple, ou un
tableau gnralis. A vous de choisir la mthode qui
rpond le mieux ce que vous voulez montrer.
Chaque cas est dcrit par une indication abrge (F pour
ferme, N pour numrique, T pour texte). En fonction de la
configuration, les mthodes adquates sont proposes.

Chaque traitement, figur par un bouton, est brivement


dcrit dans le cadran de gauche. Slectionnez celui qui
vous convient le mieux. Faites OK, le Sphinx lance la
mthode et vous livre le rsultat.
Vous pouvez ainsi essayer diffrentes manires de mener
vos analyses. Pour tester une autre analyse, revenez au
panneau central avec la touche Esc et slectionnez
nouveau Autres Analyses.

Paramtrer le choix des variables


Vous pouvez limiter la liste des variables aux variables dun
certain type. Cela peut faciliter la recherche.
Vous pouvez aussi dcider du statut des questions
chelles pour leur traitement : numriques ou nominales.
En fonction de votre choix, cochez ou non la case Echelle
= Nombre.

Sphinx 2000

Analyses bivaries, les tableaux croiss

185

Choix
des variables
analyser
Limiter
la liste
des variables

Mthodes
pertinentes

Slectionner et
lancer
une mthode

186

Sphinx 2000

Analyses bivaries, les tableaux croiss

187

Tableaux et
graphiques de
synthse

188

Tableaux de caractristiques

1. Les analyses synthtiques


Pour produire des rsultats plus synthtiques et plus
lisibles, on peut regrouper dans un mme tableau les
rsultats plat ou croiss de plusieurs variables
numriques ou de plusieurs variables comportant des
modalits identiques.
On dfinit ces tableaux avec larticle Tableaux multiples
du menu Analyser. Grce larticle Tableaux de
caractristiques, vous serez conduit sur des tableaux
synthtiques fondes sur la slection des informations les
plus significatives.
Enfin, les dpouillements gnraliss et les tableaux
composs apportent une libert encore plus grande dans la
prsentation synthtique des rsultats.

Tableaux multiples
Diffrents types de tableaux multiples peuvent tre
construits :
Tableaux rcapitulatifs : ces tableaux sont identiques
ceux quon obtient par le dpouillement. Ils donnent, par
type de variable, un rsum des principaux rsultats
(modalits les plus cites, moyennes, cart type).
Tableaux de groupes : ces tableaux prsentent en une
seule fois les rsultats des questions qui ont t
groupes dans le questionnaire.
Tableaux plat accols : ces tableaux regroupent
plusieurs variables numriques ou plusieurs variables
fermes ayant les mmes modalits. Ils sont quivalents
aux tableaux de groupes pour les variables nominales.
Tableaux croiss juxtaposs : ils prsentent cte cte
les tris croiss de plusieurs variables avec une mme
variable.
Tableaux croiss ventils : ils croisent les modalits dune
variable avec une liste de modalits provenant de
plusieurs autres variables.
Tableaux deffectifs quelconques : cette fonction permet
de rentrer au clavier ou de coller des tableaux deffectifs
quelconques pour les analyser ensuite avec les outils du
Sphinx (produire une carte dAFC par exemple).

Sphinx 2000

Ces tableaux permettent de restituer linformation la plus


significative rsultant du croisement dune variable avec
plusieurs autres. On prsente en ligne les modalits de la
variable analyser et en colonne les variables avec
lesquelles on souhaite la caractriser.
Dans les cellules de ce tableau, on fait figurer soit les
informations dominantes (les moyennes par catgorie ou
les effectifs les plus nombreux), soit les informations les
plus spcifiques de chaque catgorie prsente en ligne.
En se concentrant ainsi sur les seules modalits dont les
effectifs sont sur-reprsents ou les moyennes
significativement diffrentes de lensemble, on va
lessentiel dans la caractrisation de la variable tudie.

Dpouillement gnralis*
Ce type danalyse, dcrit plus haut, repose sur une autre
stratgie : examiner simultanment plusieurs variables
nominales, et prsenter les rsultats sans tenir compte du
dcoupage en variables, comme si on analysait le texte
form de la suite des modalits cites. Dans une enqute
de satisfaction on pourra ainsi, en croisant les points de
vue avec les services valus, comparer directement les
frquences de Trs satisfait, satisfait quelle que soit la
variable analyse.

Les tableaux composs*


Ils permettent dtre encore plus pertinent en structurant
librement et en comparant des donnes externes.

Tableaux et graphiques de synthse

189

Tableaux plat accols


Sans
importance
8.VITESSE
9.CONFORT
10.SECURITE
11.CONSOMMATION
12.PRIX
Ensemble

Peu
important

Assez
important

Trs
important

25
38
0
8
23
94

18
23
15
39
34
129

70
33
145
83
69
400

47
66
0
30
34
177

TOTAL
160
160
160
160
160
800

Tableaux croiss accols

Tableaux multiples

SEXE
Homme
Femme
TOTAL

PERMIS
Oui

PERMIS
Non

60
77
137

14
11
25

POSSESSI POSSESSI POSSESSI


ON Non ON Voiture ON Voiture
des parents personnelle
19
5
24

33
33
66

22
50
72

Tableaux croiss ventils


CRITERES MARQUE
Vitesse
Renault
SEXE
Homme
Femme
TOTAL

19%
81%
100%

78%
22%
100%

PERMIS
Oui
0%
100%
100%

Tableaux de caractristiques
MARQUE

Tableaux gnraliss

Renault (18)

Peugeot (14)

Citron (18)

8.VITESSE

10.SECURITE
Assez important (4)

11.CONSOMMATION
Trs important (17)

Peu important (4)

Trs important (12)

Talbot (4)

Distributeur (2)
Publicit (2)
Prix (3)

Peu important (2)


Assez important (1)

Ford (10)

Scurit (8)
S.A.V. Entretien (4)

Peu important (5)

Sans importance (5)


Assez important (5)

Confort (11)

Assez important (4)


Trs important (14)

Assez important (9)


Sans importance (5)

Japonaise (18)

ENSEMBLE (163)

190

7.CRITERES

S.A.V. Entretien (5) Sans importance (14)


Consommation (18)
Peu important (4)
Publicit (4)
Confort (9)
Peu important (12)
Scurit (5)
Vitesse (9)
Prix (13) Sans importance (10)
S.A.V. Entretien (5)

Assez important (1)

Peu important (1)


Assez important (2)

2. Les tableaux de groupes et


tableaux accols
Les questions groupes dans le questionnaire peuvent tre
directement analyses dans un seul tableau synthtique.
De mme a-t-on la possibilit a posteriori de traiter
plusieurs questions de nature identique dans un mme
tableau.

Le tableau accol de ces variables donne, pour chaque


variable tudie, des valeurs numriques (moyenne,
somme, cart type, minimum, maximum, nombre de nonrponses).
Ces tableaux vous permettent de faire des tests de
comparaison de moyennes entre deux variables. Pour cela,
slectionnez les lignes reprsentant les variables tudier
et cliquez sur Comparer.

On parle de tableau plat accol si les questions sont


fermes (elles doivent avoir les mmes modalits de
rponses) et de tableau de groupes pour les variables
numriques ou pour les chelles.
Les tableaux de groupes apparaissent dans la fentre de
rsultats alors quon dfinit les tableaux plat accols et
les tableaux de questions numriques dans la fonction
Tableaux multiples du menu Analyser.

Tableaux de groupes
Choisir le groupe tudier dans la liste des groupes
prdfinis.

Tableaux plat accols


On choisit, dans la liste des variables nominales, les
variables afficher dans le tableau accol.
Si la slection porte sur des variables qui ont les mmes
modalits de rponses, on obtient un tableau dont les
lignes contiennent les noms des variables slectionnes, et
les colonnes les modalits communes toutes les
variables.
On peut afficher, dans ce tableau, les effectifs et les
pourcentages (en ligne ou au total), et effectuer le test du
Chi. Il est galement possible de construire une carte
danalyse factorielle des correspondances, tout comme on
le ferait sur un tableau crois.

Tableaux de questions numriques


On choisit, dans une liste, les variables numriques et
chelles afficher dans le tableau. Dans ce type danalyse,
les chelles seront traites comme des numriques.

Sphinx 2000

Tableaux et graphiques de synthse

191

Tableaux de groupes, tableaux accols et tableaux de questions chelles et numriques

Questions groupes
dans le questionnaire
ou variables nominales ayant les
mmes modalits

Cliquer pour slectionner


les lignes / colonnes
supprimer ou regrouper

Chi, AFC

Comparaison de moyennes

Variables numriques
ou chelles

192

3. Les tableaux croiss multiples


On est souvent tent de croiser plusieurs variables entre
elles. C'est l'objet des mthodes d'analyse multivarie
(AFC multiple, ACP, classification automatique..). Il est
nanmoins possible de procder plus simplement en
produisant des tableaux multiples auxquels vous pouvez
accder par la fonction Tableaux multiples du menu
Analyser.

Tableaux croiss juxtaposs


Cela revient placer cte cte plusieurs tableaux croiss
ayant tous les mmes modalits en ligne. On slectionne
pour cela la variable en ligne, puis les autres variables. On
analyse le tableau obtenu comme n'importe quel autre
tableau crois, la nuance prs que certaines oprations,
qui nont pas de sens dans ce cas, ne sont pas disponibles
(par exemple calculer des pourcentages en ligne).

Tableaux ventils
Comme prcdemment, on choisit la variable en ligne. Les
colonnes sont dfinies une une en slectionnant des
modalits parmi l'ensemble des variables. On peut ainsi
rapprocher des lments appartenant diffrentes
variables sans avoir considr toutes leurs modalits. On
obtiendrait le mme rsultat en construisant un tableau
crois juxtapos et en supprimant ensuite des colonnes.

Tableaux croiss n dimensions


On peut produire des tableaux dont les effectifs rsultent
du croisement de plus de 2 variables en utilisant la
possibilit des fusions croises. On cre une variable dont
les modalits sont le produit du croisement de 2 autres. En
la croisant avec une troisime, on passe 3 dimensions, et
si la deuxime variable est elle-mme le produit d'une
fusion croise, on passe 4 dimensions...

Tableaux de caractristiques et listes


de modalits spcifiques
Les tableaux croiss multiples sont en gnral de trs
grands tableaux : leur lecture est donc souvent mal aise.
Les tableaux de caractristiques et les listes de modalits
spcifiques permettent d'obtenir des rsultats bien plus
synthtiques.

Sphinx 2000

Tableaux et graphiques de synthse

193

Tableau crois 3
dimensions

Tableau crois accol

Tableau crois ventil

194

4. Les tableaux de caractristiques


On a souvent besoin dans un rapport d'tude de prsenter
les rsultats de manire synthtique en mettant en valeur
les traits les plus remarquables quitte ngliger certaines
informations. C'est l'objet des tableaux de caractristiques.
Ceux-ci permettent, dans le cas du croisement dune
variable avec plusieurs autres, de remplacer la lecture de
plusieurs tableaux croiss par un seul tableau ne contenant
que les informations juges les plus remarquables. En ligne
figurent les modalits de la variable caractriser, et en
colonne les variables par rapport auxquelles on veut la
caractriser. Dans le tableau, on lira les informations
slectionnes. Si la variable en colonne est nominale, on
s'intressera aux modalits les plus frquentes ou
uniquement celles qui sont sur-reprsentes ou sousreprsentes (spcifiques). Si la variable est numrique, on
indiquera la valeur moyenne ou uniquement les valeurs
significativement diffrentes de la moyenne par rapport la
population totale.
Dans un cas, on affiche les traits dominants. Dans l'autre,
on se limite aux traits significativement distincts ou
spcifiques.

Choisir les variables prendre en


compte
L'article Tableau de caractristiques du menu Analyser
permet de choisir gauche la variable caractriser et
droite les variables auxquelles on la confronte. Le rsultat
apparat dans une fentre partir de laquelle on pourra
affiner la prsentation du tableau. Le bouton Valeurs
permet de choisir le type de slection recherche :
modalits les plus frquentes ou modalits les plus
spcifiques.

Calculer les modalits les plus


frquentes
Slectionnez loption Modalits les plus frquentes dans
le bouton Valeurs et indiquez le nombre maximum de
modalits. Elles s'afficheront par ordre de frquences
dcroissantes. Vous pouvez limiter un effectif minimum
(bouton Tests, case cocher Uniquement pour les
modalits dont l'effectif est suprieur ...). Choisissez
aussi les indicateurs afficher (nombre de citations,
pourcentages, moyennes...).

Calculer les modalits spcifiques


Dans le bouton Valeurs, slectionnez Modalits les plus
spcifiques : seules seront affiches les modalits dont
l'indicateur de spcificit est suprieur au seuil de
spcificit. On peut modifier le seuil grce au bouton Tests.
Pour les nominales, vous avez le choix entre : le rapport
des frquences et le test de comparaison de frquences.
Pour les numriques, il s'agit du test de comparaison de
moyennes. Seules les modalits dont la spcificit est
suprieure au seuil apparatront. Le signe + indique une
sur-reprsentation et le signe - une sousreprsentation.
On peut affiner la slection en cochant les cases
Uniquement pour les modalits sur-reprsentes ou
Uniquement les moyennes plus leves.

Caractriser
Un double clic sur une case de ce type de tableau permet
d'expliquer les slections opres dans les cellules.
Cliquez alors loption Spcificits.

Le bouton Tests permet d'affiner les conditions de


slection pour la mise en vidence des spcificits.

Sphinx 2000

Tableaux et graphiques de synthse

195

Modalits
sur-reprsentes
uniquement

Modalits les plus


frquentes

Fixer les critres


et seuils de slection

Limiter en nombre

Slectionner les plus spcifiques


196

Mettre en vidences toutes les


spcificits

5. Elaborer un tableau de
caractristiques
Un tableau de caractristiques doit permettre de
communiquer l'information considre comme essentielle
de la manire la plus efficace.
On peut privilgier l'information dominante, celle qui met en
vidence les caractristiques les plus frquentes. Elle se
rpte souvent d'une catgorie l'autre et recoupe en
gnral ce qui domine dans l'ensemble de l'chantillon.
On peut s'intresser au contraire ce qui fait l'originalit de
chaque catgorie en ligne, ce en quoi elle se distingue des
autres. Selon la nature des donnes, cette information vient
confirmer les faits dominants ou les nuancer.
On peut souhaiter argumenter l'aide de chiffres, ou au
contraire vouloir prsenter l'information sans rfrence
statistique aucune, en se contentant de qualifier par les
libells slectionns.
La barre d'outils des tableaux de caractristiques offre
toutes ces liberts en permettant de reprendre le tableau
(suppression de lignes et de colonnes), mais surtout en
dterminant le contenu des tableaux de caractristiques.

Afficher les traits dominants


A la diffrence des tableaux accols, on peut mlanger
variables nominales et numriques et choisir le nombre de
modalits les plus frquentes afficher (Valeurs, Nombre
maximum de modalits).

Le dialogue du bouton Tests permet de fixer les indicateurs


seuils dfinissant la spcificit. On peut dcider d'afficher
les spcificits positives et ngatives (modalits surreprsentes
ou
sous-reprsentes,
moyennes
significativement suprieures ou infrieures l'ensemble).
Dans ce cas, les modalits ou valeurs moyennes se
trouvent prcdes d'un signe + ou - pour indiquer
le sens de la spcificit. Dcochez pour cela les cases
Uniquement pour les modalits sur-reprsentes et
Uniquement les moyennes plus leves. Et si vous
voulez voir l'indicateur de spcificit, cochez la case
Afficher la valeur de l'indicateur.

Focaliser sur les originalits


En ne montrant que les spcificits positives et en prenant
la prcaution de ngliger celles dont l'effectif est trop faible
(Uniquement les modalits sur-reprsentes et
Uniquement les modalits d'effectif suprieur ), on
peut faire ressortir les traits les plus marquants rsultant du
croisement des variables tudier. Les cellules vides
signalent l'absence d'lments remarquables.

Tests et jugement
La possibilit de choisir un indicateur et de paramtrer les
seuils permet d'essayer diffrentes solutions jusqu'
parvenir au tableau le plus synthtique pour communiquer.
Dans cet exercice, le jugement doit guider le choix des
seuils et des tests.

On peut galement empcher l'affichage de la modalit la


moins cite (Ignorer la modalit la moins cite) ou des
modalits d'effectif trop faible (bouton Tests, case cocher
Uniquement pour les modalits dont l'effectif est
suprieur ).
On peut enfin faire apparatre ou non les indicateurs
statistiques.

Sphinx 2000

Tableaux et graphiques de synthse

197

Rcapituler par les valeurs dominantes

Mettre en vidence toutes les spcificits

Focaliser sur les originalits les plus significatives

198

6. Les tableaux de modalits


spcifiques*
On a souvent envie de voir d'un seul coup d'il tout ce qui
caractrise les modalits d'une variable (classe d'ge,
CSP, agence, type de clients, catgorie de patients...). La
fonction Tableaux de modalits spcifiques du menu
Analyser permet de rpondre ce besoin d'exploration de
donnes (datamining).
Elle permet au choix de voir :
si les modalits de la variable tudie appellent des
rponses exclusives (faites uniquement par les individus
appartenant une mme catgorie) ;
sil existe des rponses sur-reprsentes (celles qui
caractrisent le mieux chaque modalit de la variable
tudie en la distinguant des autres).
Cette fonction repose sur les mmes principes que :
les tableaux de caractristiques mais elle est plus
efficace pour explorer tout un questionnaire et produire
des rsultats encore plus synthtiques ;
les listes de mots spcifiques limits au traitement des
questions ouvertes. Par analogie, on peut considrer que
la fonction Tableaux de Modalits spcifiques permet de
traiter tout le questionnaire comme une seule rponse
texte.

l'indicateur de spcificit indiquant dans quelle mesure on


peut dire quune modalit est sur-reprsente (Seuil de
l'indicateur) ;
un nombre maximum de modalits spcifiques par
question. On limite ainsi le nombre d'informations
restitues aux lments les plus frquents ou les plus
spcifiques (Nb. de lignes par variables).
On peut galement jouer sur les ensembles de modalits
figurant dans le rsultat :
en prsentant toutes celles qui rpondent aux conditions
ou en se limitant aux modalits exclusives ou communes.
en limitant la prsence d'une modalit une seule des
colonnes du tableau (celle o elle est la plus nombreuse,
la plus spcifique...). A dfaut, on peut les distinguer en
les coloriant.

Prsentation des listes


Les modalits slectionnes peuvent tre prsentes dans
une liste continue ou structure par question. On se
rapproche alors des tableaux de caractristiques.
On peut faire afficher ou non les indicateurs statistiques et
faire prcder le libell d'une modalit par celui de la
variable laquelle elle appartient en cochant la case Nom
de la variable.

Lancer une recherche de modalits


spcifiques
Slectionner la variable analyser (liste de gauche), puis
les variables par rapport auxquelles on cherche des
caractristiques spcifiques (liste de droite). Les modalits
de la variable analyser dfinissent chacune une colonne
o s'affichent les modalits spcifiques.

La slection des rponses spcifiques


Cette fonction explore toutes les variables l'exclusion des
textes et codes. Les variables numriques sont mises en
classes pour le calcul des modalits spcifiques.
Les possibilits de slection portent sur les conditions
selon lesquelles une rponse est considre comme
spcifique :
l'effectif minimum : ceci permet de ngliger les petits
effectifs (Effectif minimum) ;

Sphinx 2000

Tableaux et graphiques de synthse

199

Choix des
variables

Options

Rduire
Calculer
Prsenter
Afficher

Toutes les modalits,


classes par question

Classement toutes
questions confondues

Uniquement les
lments remarquables

200

7. Les tableaux composs*


Il est souvent intressant de prsenter plusieurs rsultats
dans un mme tableau. Par exemple, dans une enqute de
satisfaction, on cherchera mettre en vidence les
volutions par rapport lenqute prcdente et
distinguer la satisfaction selon diffrents services ou selon
diffrents publics. Pour construire un tel tableau, il faut
prsenter des informations provenant de diffrentes
variables ou mme de diffrentes sources (autre enqute,
rfrence externe). Cest ce que permet loption
Tableaux composs de la fonction Tableaux multiples
du menu Analyser.

Le dialogue Tableau compos


Ce dialogue permet de dfinir les lignes et les colonnes
dun tableau quon construit pas pas.
On dfinit chaque ligne du tableau individuellement en lui
affectant les effectifs dune ou de plusieurs variables
appartenant lenqute en cours ou toute autre enqute
ou base. Le menu droulant Description de la ligne offre
un large ventail de choix, y compris celui de dfinir des
sous-titres, des interlignes ou des totalisations partielles.
Les boutons Ajouter, Dupliquer, Supprimer, Monter,
Descendre permettent de crer des lignes et den
organiser la liste.

Modalit cumule : donne les effectifs cumuls dune


mme modalit appartenant plusieurs variables
slectionnes.
Autre enqute : donne les effectifs qui correspondent
une autre enqute dont on slectionne le fichier
(XXX.que) sur le disque.
Valeurs fixes : effectifs de rfrence rentrs au clavier.
Le libell de chaque ligne peut tre prcis en entrant au
clavier le texte dsir. Une case cocher permet de lcrire
en gras.
Lorsque la dfinition est termine, le tableau saffiche dans
lenvironnement des tableaux croiss. Le bouton Autre
permet douvrir nouveau le dialogue pour modification.

Enregistrer et reprendre un tableau


Les boutons Enregistrer et Ouvrir permettent de sauver et
de reprendre la dfinition dun tableau en le dnommant.
On peut ainsi dfinir plusieurs tableaux composs pour une
mme enqute.

Dans le cas dun Tableau compos plat, le tableau na


quune colonne donnant leffectif de chaque ligne. Dans le
cas dun Tableau compos crois, les colonnes sont
fixes par les modalits de la variable slectionne. Les
effectifs en ligne sont ventils selon les modalits des
colonnes.

Composer les lignes du tableau


Lignes de prsentation : on les active par les articles
Sous titre, Interligne et Sous total. On rentre le contenu
du sous-titre dans la case Titre de la ligne. La totalisation
partielle se fait sur les variables qui prcdent.
Modalit dune variable : on choisit la variable et la
modalit dans les listes droulantes qui apparaissent en
bas du panneau. Le bouton Dupliquer permet de
slectionner rapidement plusieurs modalits d'une mme
variable.
Echantillon total, Profil multicritre, ou Strate : affiche
leffectif de lchantillon de la strate ou du profil
slectionn.
Sphinx 2000

Tableaux et graphiques de synthse

201

Contenu des lignes

Crer et
organiser
les lignes
Dfinir le
contenu des
lignes
Slectionner
les lments
Complter les
libells

Modifier la
dfinition du
tableau

Reprsenter
par un
baromtre

Analyser et
modifier la
prsentation
202

8. Les baromtres
Le baromtre est un type de graphique utilis dans les
tudes de satisfaction. Il a lavantage de donner une vue
synthtique et slective dun tableau crois, dun tableau
de groupe, dun tableau plat accol ou dun tableau
compos.
Le principe est de faciliter la comparaison des lignes dun
tableau en concentrant lanalyse sur les oppositions entre
des valeurs slectionnes en colonne.
On slectionne ce type de reprsentation dans la liste
droulante proposant les diffrents graphiques disponibles.
La mise en forme du baromtre se fait dans un dialogue
spcifique ouvert par le bouton Options.

Slectionner les modalits


reprsenter
En regard de chaque ligne du graphique (correspondant
celle du tableau), on indique par des barres limportance
des modalits correspondant une slection de colonnes.
Lintrt de ce type de graphique est de ne pas prsenter
toutes les informations du tableau.

Dimensions du graphique : on les dfinit en distinguant la


zone des libells (Zone de titre) et des graphiques (Zone
des barres). La touche F5 agit globalement.

Cas des tableaux plat accols


Dans le cas des tableaux plat accols, on peut croiser les
modalits des variables slectionnes avec une autre
variable. Par exemple en croisant une batterie dchelles
de satisfaction avec la variable dfinissant le produit ou le
service valu.
On obtient autant de sous graphiques que de variables de
dpart. Chacune donne les rsultats correspondant aux
modalits de la variable avec laquelle on les croise. On
peut adapter la prsentation du graphique en ajoutant des
lignes sparatrices, les numros de variables ou de
modalits, et dafficher les totaux pour chaque ligne.

Tableaux composs
Le baromtre offre une manire particulirement
intressante de prsenter les tableaux composs.

On dfinit les modalits reprsenter dans la barre de


gauche et dans celle de droite en tapant leur numro dans
les cases prsentes cet effet (cadran Regroupement
des barres). Sparer les numros par des points virgules
si une barre doit reprsenter plusieurs modalits. Dans ce
cas, on reprsentera la somme des effectifs concerns.
On a en outre la possibilit de reprsenter par une colonne
de chiffres les effectifs dune autre modalit. On peut
utiliser cette possibilit pour rappeler leffectif des non
rponses.

Mettre en forme le baromtre


Dans cadran de droite (Prsentation), on affine le contenu
et laspect du graphique :
Nature
des
indications
chiffres
(Citations,
Pourcentages).
Contenu des libells (Libell complet ou Nom de
variable).
Aspects des barres : on peut mettre en vidence les
barres de gauche ou de droite en diffrenciant leur
apparence (Eclaircir les barres gauche ou droite
Prsentation 3D ou Hachurer les barres). Sinon, la
prsentation est identique gauche et droite.
Sphinx 2000

Tableaux et graphiques de synthse

203

Tableau de groupe

Modalits
prsenter

Options de
prsentation

Rpartition pour
une variable

CRITERES
N

Tableau crois

204

Vitesse

Consommation

64 Non- rponse

18.8

32.8

37 Renault

10.8

48.6

35 Peugeot

25.7

20.0

40 Citron

20.0

25.0

11 Talbot

9.1

18.2

21 Ford

23.8

4.8

12 Fiat

0.0

41.7

45 Volkswagen

28.9

0.0

30 Opel

23.3

13.3

31 Japonaise

25.8

3.2

42 Autre

14.3

26.2

9. Les dpouillements gnraliss*


Cette fonction a pour but de dpouiller simultanment
plusieurs variables en vue de dnombrer les frquences
dapparition de leurs modalits ou de leurs valeurs.

La case cocher Mettre les noms des variables permet


dindiquer, avant chaque lment de la liste, le nom de la
variable dont il provient. Cette option est intressante pour
le dpouillement des batteries dchelles car elle fait
ressortir les opinions les plus rpandues sur lensemble
des chelles.

Le cas des questions ouvertes

On peut rechercher les frquences propres chaque


lment de rponse ou aux associations entre lments.
Par exemple dans le cas dune batterie dchelles de
satisfaction, on pourra compter le nombre de fois o
chaque chelon a t cit dans lensemble des chelles.

Cest aussi grce cette fonction que lon peut dpouiller


simultanment plusieurs variables textes. Loption une
ligne = un mot est alors trs utile pour produire le lexique
du corpus des textes slectionns (les mots outils en sont
exclus).

Une autre application consiste rechercher, pour un


ensemble de variables, toutes les associations de rponses
identiques et les prsenter par frquence dapparitions
dcroissantes. On identifie ainsi des profils remarquables
qui seraient bien difficiles reprer par dautres moyens.

Une autre utilisation consiste associer une question


ferme suivie de la question Autre, prcisez qui lui est
associe. On obtient alors lensemble des rponses aux
deux questions dans un seul tableau.

Accder au dpouillement gnralis


On y accde en slectionnant loption Tableaux
gnraliss disponible dans larticle Tableaux multiples
du menu Analyser. On slectionne les variables tudier.
La liste des modalits de toutes les variables slectionnes
apparat dans lenvironnement des tableaux de listes. Le
bouton Ordonner permet de les classer par frquence, par
ordre dapparition ou par ordre alphabtique.

Transfrer, recoder et analyser


On peut slectionner des lignes dans le tableau pour
lditer (Transfrer) ou crer une nouvelle variable
(Recoder). Enfin, Analyser permet dexploiter les tests et
graphiques prsents dans lenvironnement danalyse.

Options disponibles
Le bouton Options permet de choisir entre 3 modes
principaux :
une ligne = une rponse donne la liste des modalits ou
valeurs des variables slectionnes assorties de leur
frquence ;
une ligne = toutes les rponses donne tous les profils
associant les modalits dun mme individu et les classe
par frquence dcroissante ;
une ligne = un mot donne la liste de tous les mots
prsents dans les rponses (texte des rponses textes ou
mots formant les modalits des rponses fermes). Les
mots outils sont ignors de ce dcompte.

Sphinx 2000

Tableaux et graphiques de synthse

205

Slectionner
plusieurs variables
Frquence de toutes
les modalits cites

Sortir le tableau
Crer une variable

Frquence selon les variables

Frquence des associations

206

10. Importance et Performance


Pour mesurer la performance d'un systme, on identifie un
ensemble de critres qui dcrivent ce systme et on
demande aux rpondants de noter chacun de ces critres.
Pour cela, on utilise soit des questions numriques (Noter
de 1 20.), soit des questions chelles (Trs performant,
Assez performant, Peu performant, Pas du tout
performant).
L'tude de ces performances s'largit lorsqu'on les
confronte l'importance (ou l'influence) relative de
chacun des critres.

Mesurer directement l'importance


On peut mesurer directement l'importance de chaque
critre. Pour chaque critre on demande une mesure de la
performance et une mesure de l'importance.
Le mieux est d'utiliser des chelles identiques pour faciliter
la tche du rpondant et pour obtenir des rsultats
homognes.
La restitution des rsultats la plus parlante est le "graphe
deux critres" dans lequel chaque critre est reprsent en
abscisse par la performance et en ordonne par
l'importance.
On identifie ainsi visuellement les critres trs performants
mais peu importants (l'effort peut se relcher) et les critres
trs importants mais peu performants (les lments clefs
pour l'amlioration du systme).
La squence Analyser / Tableaux multiples / Tableaux
de questions numriques permet de slectionner les
questions tudier puis la squence de commandes
Graphique / Graphe deux critres permet d'accder au
rsultat.
Une autre restitution, proche de la prcdente est de voir
ce graphique pour un seul critre mais dans lequel chaque
point reprsente la performance et l'importance pour un
sous-ensemble des observations.
La squence qui mne au graphique est Analyser /
Tableau de moyennes pour slectionner la variable
ferme sparant les observations et les deux variables
chelles ou numriques sur l'importance et la performance
d'un critre.
Sphinx 2000

Mesurer indirectement l'importance


On peut mesurer l'importance des critres en demandant
au rpondant, dans une question ferme ordonne,
d'indiquer quels sont son avis les critres les plus
importants en les ordonnant par importance dcroissante. Il
vaut mieux demander les 5 critres les plus importants
plutt que demander de classer l'ensemble des 20 critres.
L'importance de chaque critre sera le rang auquel le
critre est cit.
Pour obtenir ces rangs, on utilisera la fonction
Transformer une variable / Ferme ordonne n
modalits et p rponses
n variables chelles p
chelons.
Ces chelons pourront tre utiliss tels quels ou bien en
associant des valeurs pour par exemple mettre en exergue
le critre le plus important.

Calculer l'importance
On peut galement demander aux rpondants d'exprimer
une performance globale sur le systme.
On peut alors calculer l'importance d'un critre. Un critre
est ainsi d'autant plus important qu'il participe beaucoup
la performance globale.
Cette "participation" est la corrlation entre le critre et la
performance globale.
Le graphique est dcrit au chapitre sur la corrlation
multiple.

Pondrer par l'importance


La performance globale du systme peut tre calcule
partir des performances par critre.
Pour cela, on calculera une nouvelle variable qui
reprsente la performance moyenne accorde par chaque
rpondant au systme.
Mais comme pour les examens scolaires, il apparat
immdiatement que tous les critres n'ont pas la mme
importance. Il faut leur attribuer un coefficient pour obtenir
une valeur qui reprsente la performance globale. C'est
cette moyenne pondre qui refltera le mieux le systme.

Tableaux et graphiques de synthse

207

208

Sphinx 2000

Tableaux et graphiques de synthse

209

Analyses
multivaries*

210

Analyse factorielle multiple et analyse


en composantes principales

1. Approfondir
Dans ce menu, on trouve les fonctions de statistiques
avances du Sphinx : les analyses multivaries, la
modlisation et le calcul de nouvelles variables (Cf Chap.
Calculer une nouvelle variable et Recalculer une
variable).
Lanalyse multivarie consiste analyser simultanment
plusieurs variables pour exploiter la structuration de
lensemble des donnes en vue de rduire les variables
un plus petit nombre de dimensions (Analyse factorielle)
et / ou de regrouper les observations en catgories
homognes (Typologie). Ces possibilits sont offertes par
les articles Classification automatique, Analyse
factorielle multiple et Analyse en composantes
principales.
Elle permet galement de rechercher les relations entre
une variable et plusieurs autres. On peut ainsi, en utilisant
larticle Corrlations multiples, construire des modles
explicatifs.

Classification automatique
Cet article conduit choisir les variables utiliser pour
dcrire lensemble que lon veut classifier. On a la libert de
choisir le nombre de classes recherches ou de le
dterminer en rfrence une classification dfinie par une
variable de ltude (celle-ci servira de classification initiale).
Lalgorithme utilis est celui des nues dynamiques : on
procde par essais successifs partir dune classification
initiale (dtermine de manire alatoire ou par le choix
dune rfrence). Il nexiste pas de mthode de
classification stable. Il faut donc essayer plusieurs
classifications et choisir celle qui convient le mieux en
sappuyant sur lanalyse de la variance lance aprs que
lon ait cr la variable (Crer une variable).

Sphinx 2000

Ces 2 mthodes sappliquent respectivement aux variables


nominales (Analyse Factorielle Multiple) et numriques
ou chelles (Analyse en Composantes Principales). Bien
que les mtriques utilises diffrent, les algorithmes se
droulent de la mme manire. Dans la forme, on obtient le
mme type de rsultats (% de variance explique, cartes,
tableaux des contributions) et les mmes possibilits sont
offertes (cration de nouvelles variables correspondant aux
scores factoriels, dfinition interactive dune typologie, et
cration dune variable enregistrant cette typologie).
Aprs avoir slectionn les variables en jeu, on peut lire les
rsultats sous la forme de la matrice des corrlations, dune
carte ou du tableau des contributions. On peut choisir avec
le bouton Composantes les axes selon lesquels
reprsenter la carte. Les pastilles que lon fait apparatre
avec le bouton Typologie et que lon peut dplacer sur la
carte permettent de construire la typologie.

Corrlations multiples
Grce cet article, on peut rechercher lquation qui
permet dexpliquer la valeur dune variable par celle de
plusieurs autres. On utilise la mthode de rgression
multiple pas pas (Rgression).
On peut construire dans cet environnement les graphiques
dits Performance/Importance (Profils). Ces graphiques,
trs utiliss dans les tudes de satisfaction, situent sur
laxe horizontal limportance des critres (value par leur
valeur moyenne) et sur laxe vertical leur performance
value par le coefficient de corrlation avec la satisfaction
globale ou tout autre indicateur de performance.

Analyses multivaries*

211

Matrice Performance / Importance

Tableau des contributions

Matrice de corrlation

Carte factorielle

Choix des axes de la carte

Typologie
Scores factoriels
212

Choisir une classification

2. Classification automatique
On cherche identifier dans la population des groupes
d'individus homognes. Par exemple dans une enqute de
satisfaction, identifier diffrentes catgories de ractions,
dans une tude d'opinion, des classes idologiques... Cet
exercice est d'autant plus difficile que les variables et les
individus sont nombreux.
Il existe de nombreuses mthodes de classifications. Dans
le Sphinx, on peut procder intuitivement en agrgeant des
individus sur une carte (Voir Construire une typologie
interactive) ou d'une manire automatique. Dans ce cas, il
suffit l'utilisateur de dfinir les variables par rapport
auxquelles il souhaite regrouper les individus. Le logiciel
proposera une ou plusieurs classifications selon la
mthode des nues dynamiques, qui consiste amliorer
par itrations une partition initiale. Le rsultat dpend de
cette donne de dpart. Elle peut tre fixe d'une manire
alatoire ou correspondre aux modalits d'une variable
existante.
La qualit du rsultat fait intervenir diffrents points de vue:
le nombre de classes (taille), la rpartition des effectifs
dans les classes, l'homognit des classes et leur
dispersion.

Lancer une classification automatique


L'article
Classification
automatique
du
menu
Approfondir donne le choix entre 3 possibilits :
Dtermination automatique : le logiciel calcule les
meilleures classifications pour des classes de taille 2
15. Pour chaque taille, l'algorithme est appliqu 10 fois
sur une partition alatoire. La meilleure classification est
retenue.
Recherche d'une classification de taille fixe : le logiciel
part d'une partition alatoire et applique l'algorithme une
seule fois.
Recherche partir d'une variable : l'algorithme s'excute
sur la base de la partition dfinie par la variable choisie.

Sphinx 2000

Le logiciel affiche le libell des classes, leurs effectifs et


pourcentages, ainsi que la distance moyenne entre les
individus qui la composent. Vient ensuite la valeur des
variables intervenant dans la classification. Lorsqu'on a
choisi d'explorer plusieurs classifications, une liste
droulante donne les indicateurs par rapport auxquels les
comparer :
La taille (Nb) : une classification est d'autant plus simple
exposer qu'elle comporte peu de classes.
L'homognit : plus les individus d'une classe sont
proches les uns des autres, meilleure est leur
identification la classe. Entre 2 classifications, on
prfrera celle dont l'indicateur d'homognit a la plus
faible valeur.
La rpartition : on prfre une classification dont les
classes ont des tailles voisines. L'cart type de leurs
effectifs donne une indication sur ce point et conduit
privilgier les faibles valeurs.
La dispersion : une bonne classification distingue bien les
individus appartenant des classes diffrentes ; ce
qu'indique la distance moyenne entre classes. Elle doit
tre plus grande que la distance l'intrieur des classes
(homognit).

Exploiter une classification


On peut s'aider du bouton Dtailler pour choisir une
classification. On peut crer une variable pour l'enregistrer
(Variable) ou l'analyser plus finement (Analyser).

Analyses multivaries*

213

Fixer les objectifs

Slectionner les variables

Liste des meilleures


classifications

Analyser

Crer

Caractriser

Description de la classification
slectionne

214

Nommer

3. Analyser une classification


Le pouvoir d'une classification tient beaucoup la capacit
d'interprter ses classes en les nommant. On peut alors
dire qu'on est parvenu une typologie. Ceci ncessite une
analyse : comparer les classes du point de vue des
variables qui ont permis de les dfinir. On peut ainsi
constater selon quelles variables les diffrences d'une
classe l'autre sont les plus significatives (au sens de
l'analyse de la variance pour les variables numriques ou
du Chi pour les nominales). C'est en procdant ainsi qu'on
pourra identifier les particularits des classes et les
nommer d'une manire vocatrice.
On peut galement procder de manire plus visuelle en
coloriant dans un nuage de points les individus de chaque
classe. On peut alors se faire une ide de la qualit de la
classification.
Enfin et c'est le plus intressant, on peut utiliser la typologie
rsumant un ensemble de variables pour la confronter
d'autres variables.

Il faut pour cela lancer par exemple une ACP sur les
variables utilises pour construire votre classification
(Approfondir, Analyses en Composantes Principales),
puis avec le bouton Prsentation, slectionner Colorier
avec les modalits de la variable. La classification se
dessinera sur le nuage de points et on peut ainsi apprcier
sa qualit et interprter ses classes.
Attention : le bouton-radio Observations doit tre coch
pour voir le nuage de points. Dans le cas o la
classification ne fait intervenir que 2 variables numriques,
aller loption Corrlations du menu Analyser.

Confronter d'autres variables


Dans l'exemple ci-contre, on utilise la classification pour
dfinir 4 classes de touristes selon leurs rponses 10
questions chelles Pour vous, les vacances idales
c'est... . On rsume ainsi dans une seule typologie, une
batterie de 10 variables exprimant l'image des vacances
idales. En la croisant avec le mode d'hbergement des
touristes, on vrifie qu' chaque hbergement correspond
un type de vacances.

Analyser et interprter les classes


Le bouton Analyser ouvre le dialogue de cration de
variable. Donnez un nom la nouvelle variable. Lorsque
cela est fait, on obtient le tableau de moyennes croisant la
classification avec les variables utilises pour la calculer.
On vrifie en gnral que, par construction, les variables
discriminent bien les classes. La visualisation de ce tableau
par une carte ACP facilitera l'interprtation des classes.
Si vous hsitez entre plusieurs classifications, il vaut mieux
crer les variables correspondantes (Variables) avant de
lancer l'analyse. Ainsi, vous n'aurez pas recalculer une
nouvelle fois les classifications. Vous irez directement
larticle Tableau de moyennes dans le menu Analyser
pour interprter vos classes.

Visualiser les classes dans un nuage


de points
Les variables cres pour enregistrer vos classifications
vous permettront de reprsenter vos classifications sur des
cartes en coloriant les individus en fonction de la classe
laquelle ils appartiennent.

Sphinx 2000

Analyses multivaries*

215

Interprter une classification

Interprter en analysant
Interprter en visualisant

Interprter en confrontant
216

Lancer une analyse

4. Analyse de la variance 2
facteurs (MANOVA)

A partir du menu Approfondir, Analyse de la variance, on


choisit Evaluer linteraction de deux variables (Manova).
On slectionne les variables nominales puis la numrique.

Lanalyse de la variance consiste comparer, pour les


modalits dune variable ferme, la valeur dune variable
numrique. On est ainsi conduit comparer des valeurs
moyennes entre diffrentes catgories dindividus en tenant
compte de la dispersion entre les catgories et lintrieur
des catgories. Le test de Fisher permet dtablir si les
diffrences sont significatives.

Tableau de moyennes 2 facteurs


Lanalyse de la variance 2 facteurs consiste rechercher
linfluence conjointe de 2 variables nominales sur les
valeurs dune variable numrique. On calcule, pour chacun
des cas dfinis par les modalits des variables nominales,
la valeur de la 3me variable.

On obtient le tableau crois des valeurs moyennes. Le


bouton Valeurs permet de choisir quel indicateur afficher,
le bouton Tests lance les analyses de la variance dont la
lgende saffiche au bas du tableau. En cochant Encadrer
les critres discriminants, on facilite la lecture du tableau.
Les autres boutons permettent de modifier le tableau
(Supprimer, Regrouper, Ordonner les lignes ou les
colonnes marques). Le bouton Graphique affiche le
graphique choisi. Ces options sont analogues celles des
tableaux de moyennes (Analyser, Tableau de
moyennes).

Ceci revient construire un tableau crois entre les 2


variables nominales et calculer, pour les catgories
dfinies par les cellules du tableau, la valeur moyenne de
la variable numrique.
Par exemple dans une tude sur le tourisme, on calculera
leffet respectif du Sexe et du Mode dhbergement sur la
dpense totale des touristes.
Dans les cellules du tableau, on peut lire les
caractristiques de la dpense de chaque catgorie
(moyenne, somme, part).

Tests danalyse de la variance dans un


tableau 2 facteurs
On peut tester un effet global (comme sil sagissait dune
analyse un seul facteur). Le rsultat du test est figur
dans les marges du tableau par un encadrement de la
cellule Total si leffet est significatif.
On peut galement tester les effets principaux rsultant des
deux facteurs : par exemple, leffet du Sexe Hbergement
constant ou leffet de lhbergement Sexe constant et
leffet de linteraction stricte enfin.
Dans lexemple ci-contre, on lit que la dpense est
significativement diffrente selon le sexe pour les touristes
en camping. Quel que soit le sexe, la dpense totale est
significativement
diffrente
selon
les
modes
dhbergement.
Sphinx 2000

Analyses multivaries*

217

Analyse un facteur (Anova)

Analyse 2 facteurs (Manova)

Analyse effets significatifs


Valeurs significativement
diffrentes de la moyenne
gnrale

Lgende Anova
Lgende Manova

218

La prsentation Diagramme donne une image de ce


tableau en reliant les variables par des traits dont
lpaisseur est proportionnelle limportance de la
corrlation.

5. Corrlation et rgression
multiple
Les possibilits offertes dans la fonction Rgression
multiple du menu Approfondir gnralisent plusieurs
variables les fonctionnalits proposes dans la fonction
Corrlations du menu Analyser.
Le coefficient de corrlation (r) tablit la qualit de
2
lajustement entre deux variables. Sa valeur absolue (ou r )
est comprise entre 0 et 1, son signe indique le sens de la
relation (croissante ou dcroissante).
Dans le cas dune rgression multiple, on cherche tablir
une relation du type V1=axV2+bxV3+cxV4+. Le coefficient
de corrlation multiple indique la qualit de lajustement
effectu par le modle et sinterprte comme un coefficient
de corrlation simple.

Choisir les variables


Il convient tout dabord de dfinir la variable expliquer et
les variables explicatives. Ceci est indispensable si on veut
tablir un modle.

Coefficients de corrlation et quation


de rgression
Aprs avoir valid le choix des variables analyser, on
obtient 2 types de rsultats :
La valeur des coefficients de corrlation prsente sous
forme de tableau, diagramme ou profil. Les boutons
Corrlations, Profils et Rgression permettent de passer
de lune lautre de ces vues.
L'quation de rgression multiple qui donne une
estimation de la variable expliquer en fonction des
variables explicatives. Cette quation peut tre calcule
pas pas ou non (cocher la case Pas pas).

Prsentations de la matrice des


coefficients de corrlation

Equation de rgression et paramtres


dajustement
Les rsultats des calculs de rgressions multiples sont
activs par le bouton Rgression. Le Sphinx calcule
lquation linaire ajustant le mieux la variable explique
aux variables explicatives. Les rsultats sont communiqus
sous la forme d'une quation. Par exemple ci-contre, la
satisfaction des touristes est explique par les critres
dfinissant des vacances idales. Les paramtres
permettant d'apprcier la qualit de l'ajustement sont
indiqus la suite de l'quation (coefficient de corrlation,
F...).

Simulations sur l'quation de


rgression
La case cocher Pas pas lance un algorithme qui
slectionne les variables explicatives dans lordre de leurs
corrlations respectives avec la variable expliquer.
Lalgorithme sarrte quand la qualit de lajustement
naugmente plus de manire significative.
On peut en outre tester la sensibilit de la rgression en
supprimant ou en rajoutant des variables. On peut alors
suivre lvolution des paramtres de la rgression multiple
et choisir le modle le mieux adapt.
Pour ajouter ou supprimer de lquation une variable, on la
slectionne et on se sert des boutons Mettre et Oter pour
rendre la variable active ou non. Les variables actives sont
marques dun #.

Enregistrement des valeurs calcules


et des rsidus

Dans la prsentation Matrice, on lit la valeur du coefficient


de corrlation entre les variables concernes. La variable
expliquer se trouve par convention en tte du tableau.

Sphinx 2000

Les prsentations en Profils donnent des possibilits plus


fines d'analyse (Voir chapitres concernant Corrlations
multiples et Graphes de positionnement).

Le bouton Variables permet denregistrer, sous la forme


dune nouvelle variable, les valeurs calcules de la variable
expliquer ainsi que les valeurs du rsidu (cart entre la
valeur observe et la valeur calcule).

Analyses multivaries*

219

Choisir les
variables

Coefficients de corrlation

Moyennes et cart type

Equation de rgression

Simuler

Crer une nouvelle variable


220

6. Corrlation multiple et graphe


de positionnement
Il est intressant de complter les donnes de la rgression
multiple par des analyses graphiques permettant de
visualiser les relations entre les variables explicatives et la
variable explique.

Profils d'influence
Ces profils permettent de visualiser l'influence de chaque
variable sur la variable explique. On les lance en
slectionnant le bouton Profils puis x=Corr. C'est un
graphique une seule dimension (x) reprsentant la valeur
du coefficient de corrlation (Corr.).
Le bouton Classer permet de choisir l'ordre de
prsentation des variables. Si on veut mettre en vidence
le sens de la relation, on choisira Corrlation (Valeur
signe). Sinon, loption Corrlation (Valeur absolue)
privilgie la qualit de l'ajustement.

Graphe Influence / Performance

Options de prsentation des


graphiques Influence/Performance
De nombreuses options sont disponibles pour prsenter le
graphique. On y accde avec le bouton Options. Le
bouton Dimensions agit globalement sur la taille du
graphique.
On peut ainsi jouer sur la prsentation des symboles
figurant les variables et sur les chelles du graphique.
Reprsentation des variables
Taille des repres proportionnelle l'cart type. Les
variables disperses apparaissent en plus gros.
Relier les critres fortement corrls. Un trait apparat si
le coefficient de corrlation entre les variables est
suprieur 0.8.
Ignorer le signe des coefficients de corrlation. Cette
prsentation l'avantage de mieux distinguer les
variables ayant un influence (en haut) de celles qui n'en
ont pas (en bas).
Indiquer les coordonnes des point pour afficher la
moyenne et la corrlation de chaque variable.
Echelles du graphique

On obtient ce type de graphique en slectionnant Profils


puis x=Moy/y=Corr. Il permet de tenir compte de 2 points
de vue :

On peut jouer sur les bornes du graphique et l'origine des


axes. Ces paramtres affectent beaucoup la lisibilit
graphique mais peuvent aussi introduire des effets
trompeurs.

L'influence de la variable explicative apprcie par la


valeur relative de son coefficient de corrlation avec la
variable expliquer. Cette valeur est porte en ordonne
(y=Corr.).
La performance de chaque variable explicative value
par sa valeur moyenne. Cette valeur est porte en
abscisse.
Dans l'interprtation de ce type de graphique, on tient
compte des 2 points de vue. Dans les tudes de
satisfaction par exemple, on trouvera des critres trs mal
valus (faible performance) et contribuant peu la
satisfaction globale (faible influence), situs gauche du
graphique, et d'autres qui sont mieux valus (forte
performance) et contribuant fortement la satisfaction
globale, situs en haut droite. Il est alors peut-tre plus
intressant de rechercher des amliorations sur le
deuxime groupe de critres que sur le premier... En tout
cas, le graphique permet de bien poser le problme.

Sphinx 2000

Analyses multivaries*

221

Profils
dinfluence

Graphe
dinfluence
performance

Options de
prsentation

222

Construction d'une typologie

7. Analyse en composantes
principales
L'article Analyse en Composantes principales du menu
Approfondir permet de choisir les variables analyser.
Avec cette mthode, on travaille sur des variables
numriques ou chelles qui sont alors traites comme des
numriques.

Slection des variables


Dans la liste des variables disponibles, slectionnez celles
que vous souhaitez analyser. Les rsultats obtenus
peuvent tres prsents sous trois formes : la matrice des
coefficients de corrlation, le tableau des contributions ou
une projection dans le plan factoriel choisi. On slectionne
la vue dsire en cliquant l'un des boutons Corrlations,
Contributions ou Cartes.

A partir de l'examen de la carte, on peut construire une


typologie en agrgeant les individus selon leur position et
crer un nouvelle variable pour l'enregistrer (Voir chapitre
Construire interactivement une typologie).

Enregistrement des coordonnes


factorielles
Le bouton Variables permet d'enregistrer les coordonnes
factorielles sur chacun des axes de la carte ou pour toutes
les composantes calcules.

Matrice de corrlation
On peut la voir sous forme de tableau ou sous forme de
diagramme (bouton Matrice ou Diagramme). Le
diagramme visualise les relations sous forme de traits
d'paisseur variable selon la valeur de la corrlation. Le
bouton Options permet de fixer les seuils (Voir le
paragraphe Prsentation des cartes factorielles).

Tableau des contributions


Il indique les pourcentages de variance explique par
chaque composante et donne pour chacune d'elle sa
contribution la composante considre.

Projection dans le plan factoriel


Sont reprsents sur cette carte :
des points reprsentant les individus par leur
coordonnes par rapport aux composantes ;
les variables reprsentes par un axe ou un triangle
selon qu'on a coch ou non Cercle de corrlation dans le
dialogue Options (Voir le paragraphe Prsentation des
cartes factorielles).
le choix des composantes dfinissant le plan de
projection est effectu en cliquant sur Composantes (Voir
le paragraphe Prsentation des cartes factorielles).
Si ncessaire, la lisibilit de la carte peut tre amliore en
dplaant avec le curseur les tiquettes correspondant au
libell de chaque variable.
Sphinx 2000

Analyses multivaries*

223

Variables
numriques

Carte : projection sur


les plans factoriels

individus
variables

Contributions

Coefficients de corrlation

224

8. Analyse factorielle multiple


L'article Analyse factorielle multiple du menu
Approfondir permet de choisir les variables analyser.
Avec cette mthode, on travaille sur des variables
nominales ou chelles. Les chelles sont alors traites
comme des nominales.

Slection des variables


Dans la liste des variables disponibles, slectionnez celles
que vous souhaitez analyser. Les rsultats obtenus
peuvent tres prsents sous trois formes : le tableau des
effectifs dit tableau de Burt, le tableau des contributions ou
une projection dans le plan factoriel choisi. On slectionne
la vue dsire en cliquant l'un des boutons Effectifs,
Contributions ou Cartes.

Construction d'une typologie


A partir de l'examen de la carte, on peut construire une
typologie en agrgeant les individus selon leur position et
crer ensuite un nouvelle variable pour l'enregistrer (Voir
chapitre Construire interactivement une typologie).

Enregistrement des coordonnes


factorielles
Le bouton Variables permet d'enregistrer les coordonnes
factorielles sur chacun des axes de la carte ou pour tous
les facteurs calculs.

Tableau des effectifs


Ce tableau est un tableau de contingence entre toutes les
variables contribuant l'analyse. Les lignes et les colonnes
correspondent aux modalits des variables. Les cellules du
tableau contiennent l'effectif des individus ayant les
caractres lignes et colonnes correspondant.

Tableau des contributions


Il indique les pourcentages de variance explique par
chaque axe et donne pour chacun d'eux sa contribution la
composante considre. On trouve en gnral des
pourcentages de variance explique d'autant plus faibles
que le nombre d'individus est lev.

Projection dans le plan factoriel


Sont reprsents sur cette carte :
des points reprsentant les individus par leurs
coordonnes par rapport aux axes factoriels ;
les modalits reprsentes par un pav de taille
proportionnelle aux effectifs (Voir le paragraphe
Prsentation des cartes factorielles).
Le choix des axes dfinissant le plan de projection est
effectu en cliquant sur Facteurs (Voir le paragraphe
Prsentation des cartes factorielles).
Si ncessaire, la lisibilit de la carte peut tre amliore en
dplaant avec le curseur les tiquettes correspondant aux
modalits.
Sphinx 2000

Analyses multivaries*

225

Variables
nominales

modalits
Carte : projection sur
les plans factoriels

individus

Effectifs
Contributions

226

Affichage sur les axes du pourcentage


de variance

9. Prsentation des cartes


factorielles
La prsentation des cartes factorielles (Analyse en
Composantes Principales ou Analyse Factorielle
Multiple) prsente de nombreux points communs.

Choix des axes dfinissant le plan


factoriel
Ce choix est guid par le pourcentage de variance
explique par les composantes ou les facteurs. Par dfaut,
les 2 premiers axes sont prsents. Ils correspondent, par
construction, la meilleure restitution d'information.

Mise en forme des lments de la carte


Le libell des variables ou des modalits peut tre dplac
avec le curseur. Il suffit de les cliquer et de les faire glisser.
On peut n'afficher que les individus ou que les variables
(modalits). Utiliser pour cela les options Observations,
Critres. Quand les deux sont coches, tout est visible.

Le bouton Options permet d'opter pour l'affichage du nom


de l'Axe indiquant le N du facteur ou de la composante et
le pourcentage de variance restitue. Cocher la case % sur
les axes.

Particularit des cartes ACP


On peut faire afficher ou non le cercle de corrlation (case
cocher Cercle de corrlation dans le dialogue Options).
Dans ce cas, les points variables sont relis l'origine par
un trait matrialisant l'angle qu'ils font avec les
composantes. Dans le cas inverse, les variables sont
reprsentes par des triangles de taille proportionnelle
leur valeur moyenne.

Particularit des cartes AFC


On peut, dans le bouton Options, donner aux points
modalits, une taille proportionnelle l'effectif.

Options de prsentation des individus


Le bouton Prsentation offre plusieurs possibilits :
Jouer sur la taille des points : les boutons + et -
laugmentent ou la diminuent. On obtient le mme effet
avec F7 ou Maj + F7.
Illustrer les observations : on peut les colorier selon les
modalits d'une variable choisir : case cocher Colorier
selon la variable ou / et afficher le contenu d'une autre
variable en regard de chaque point : case cocher
Libeller par la valeur de. Le nombre de caractres du
libell est contrlable.
Regrouper les points par zone de la carte. On dfinit pour
cela une grille dont on peut faire varier la maille. On
affiche alors l'effectif de la zone (Nombre d'observations
par maille) ou on trace des points de taille proportionnelle
cet effectif.
Jouer sur le seuil de projection : la case cocher Seuil de
projection permet de dfinir un seuil maximal pour l'angle
que fait le point dans l'espace d'origine par rapport au
plan factoriel. Au-del de ce seuil, les points ne sont plus
projets.

Sphinx 2000

Analyses multivaries*

227

Taille des points : F7


Illustrer

Regrouper
Seuil de projection

Cercle de corrlation

Pourcentage de variance
explique

228

10. Calcul des facteurs et choix du


plan factoriel
L'Analyse en Composantes Principales ou l'Analyse
Factorielle Multiple permettent de rduire le nombre de
dimensions initiales en calculant les composantes ou les
facteurs. Par dfaut, le logiciel calcule les deux premiers et
propose ainsi la meilleure projection. On peut cependant
aller plus loin dans les calculs pour examiner le tableau des
contributions ou produire d'autres projections et ainsi
interprter la structure des donnes sur plus de
dimensions.

Calcul des composantes ou des


facteurs
Les boutons Facteurs (AFC Multiple) et Composantes
(ACP) ouvrent un dialogue affichant la valeur des 5
premires dimensions. Par dfaut, seules les 2 premires
sont calcules.
Pour aller plus loin, cliquez sur le bouton-radio
correspondant au rang souhait. Avec Calculer, les calculs
sont lancs et les valeurs de pourcentages de variance
restitue sur chaque dimension s'affichent. En gnral, on
ne s'intresse qu'aux premires, celles dont le pourcentage
est suprieur au pourcentage moyen attendu (gal 100/n
o n est le nombre de dimensions du tableau initial).

Afficher le tableau des contributions


Ce tableau donne, pour chaque dimension, les variables ou
les modalits qui y contribuent le plus, classes par valeur
de contribution dcroissante. Les signes renvoient la
position des points sur la carte. Le tableau affiche les
dimensions jusqu' la dimension la plus leve marque
dans le dialogue de choix des composantes ou des
facteurs.

Choisir un plan de projection


Le plan de projection est dfini dans le mme dialogue :
Cocher les 2 dimensions qui le dfinissent. En choisissant
de cocher le N de chaque dimension dans la ligne Axe
vertical ou Axe Horizontal, on dtermine la prsentation
de la carte. La case cocher pour afficher le nom des axes
se trouve dans le dialogue Options.

Sphinx 2000

Analyses multivaries*

229

Calculer les composantes ou facteurs

Nombre de dimensions
calculer

Choisir le plan de projection

Projection sur le premier plan (1,2)

230

Projection sur le plan 3, 4

11. Construire interactivement une


typologie
L'examen d'une carte factorielle permet d'identifier, selon la
position des points, des zones plus ou moins homognes
et significatives. On peut, partir de cette perception,
construire une typologie intuitive en agrgeant les points se
trouvant dans une mme zone. La mthode utilise dans
ce cas consiste placer dans le plan factoriel des pastilles
colores figurant des centres de classes. Le logiciel affecte
chaque point la pastille la plus proche. Cette affectation
est visualise en coloriant chaque point de la couleur de la
pastille dont il est le plus proche. Apparaissent ainsi des
zones colores dont on peut modifier les contours et la
composition en dplaant les pastilles.
Lorsqu'on est parvenu une solution satisfaisante, on peut
l'enregistrer dans une nouvelle variable dont les modalits
sont les classes de la typologie qu'on vient de construire.

Enregistrer la typologie dans une


variable
En cliquant Ferme sur la typologie dans le dialogue
ouvert par le bouton Variable, on cre une nouvelle
variable affectant les individus aux classes de la typologie.

Typologie interactive et classification


automatique
On peut contrler la classification dfinie d'une manire
intuitive en la confrontant celle que donne une
classification automatique. Il suffit pour cela de croiser les
variables correspondantes.
On peut galement affiner la classification interactive en la
prenant comme point de dpart pour l'algorithme des nues
dynamiques. Dans le dialogue de classification
automatique, slectionnez Classification initiale cre
par la variable et entrez la variable que vous avez cre
interactivement.

Dfinir les centres de classes


Le bouton Typologie ouvre un dialogue o on peut dfinir
les classes construire. Avec Ajouter, on fait apparatre
une nouvelle ligne dont on peut modifier l'appellation au
clavier. Il est intressant de trouver des noms significatifs
proposant une interprtation. Supprimer fait disparatre les
lignes.
Les cases cocher Afficher les classes et Colorier les
classes doivent tre coches pour voir ce que l'on fait. On
a le choix de la taille de la pastille figurant les centres de
classes (Dessiner avec des grandes formes).

Positionner les centres de classes


Les pastilles sont places au centre de la carte. On les
dplace en les faisant glisser avec le curseur jusqu'
trouver un dcoupage en zones satisfaisantes. Il peut tre
intressant de ne pas tenir compte des points mal projets,
situs en gnral au centre de la carte (jouer pour cela sur
le seuil de projection). On peut galement crer une zone
centrale de points peu typs...
Attention : Le calcul de distance entre les points et les
pastilles se fait dans l'espace de dpart et non pas dans
celui du plan de projection ; ce qui explique certains carts
avec les distances perues dans le plan.

Sphinx 2000

Analyses multivaries*

231

Dfinir les classes

Positionner les centres de


classes

Crer une variable ferme sur la typologie

232

Sphinx 2000

Analyses multivaries*

233

Traitement
simple des
questions textes

234

Analyse de contenu

1. Etudier les textes


Le Sphinx permet danalyser les textes des questions
ouvertes. Lexica ajoute cette possibilit celle douvrir
nimporte quel autre texte en offrant un stade
supplmentaire Etudier des Textes (menu Stade).
Intressons-nous ici au traitement des questions ouvertes.
Il peut faire lobjet de 4 approches diffrentes :
Le verbatim : extraire un sous-ensemble de rponses en
fonction de leur contenu ou de leur contexte.
La prsentation en tableau : dresser un tableau de
frquence des rponses identiques et/ou des mots
contenus dans les rponses en les croisant
ventuellement avec une autre variable ferme.
Lanalyse de contenu : lire et interprter les rponses
pour les codifier dans une nouvelle variable.
Lanalyse lexicale : mettre en uvre les techniques
danalyse lexicale dans lenvironnement spcifique de
latelier lexical (Plus et Lexica uniquement) ou en lanant
les procdures standards de Lexica.

Dans cet environnement, on lit les rponses et on code leur


contenu dans une nouvelle variable dcrivant les
principaux thmes voqus dans les rponses.
Cette thmatique peut tre enrichie en cours de lecture par
lajout de nouvelles modalits. Ce travail est facilit par la
possibilit de voir les rponses selon les mots quelles
contiennent.

Procdure et atelier lexical


Plus et Lexica donnent accs un environnement
spcifique aux fonctions avances danalyse lexicale.

Ces possibilits sont offertes partir de larticle Etudier les


textes du menu Recoder ou en cliquant sur le bouton
Etudier les textes apparaissant au bas de la fentre de
dpouillement
des
questions
textes
(Dpouiller/
Dpouillement automatique).

Verbatim
Cette fonction permet de slectionner des extraits en
fonction de leur contexte (selon les rponses une autre
variable) ou de leur contenu (vocabulaire de la rponse).
Ces extraits peuvent tre prsents sous forme de liste
organise par catgories de rponses.
Linclusion de ces extraits dans un rapport permet de
rendre compte de lenqute par une illustration raisonne.

Tableaux de rponses
On peut prsenter les rponses dans des tableaux. Cette
prsentation est bien adapte dans le cas de rponses trs
rptitives quon pourra croiser avec dautres variables
caractrisant les rpondants.
On peut galement dresser le tableau des mots prsents
dans les rponses et ainsi oprer une recodification
automatique en fonction du vocabulaire.

Sphinx 2000

Traitement simple des questions textes

235

Analyse de contenu :
lire et interprter

Tableau de
rponses et de
mots :
dnombrer,
recoder, croiser

236

Verbatim : citer,
extraire, illustrer

Contrler les rsultats et les diter

2. Faire du verbatim
La manire la plus simple de traiter les questions ouvertes
consiste restituer les rponses dans leur intgralit ou
d'une manire raisonne en oprant des slections par
rapport au contexte ou au contenu.
On pourra produire des listes de rponses :
classes selon l'identit des rpondants ;
restreintes tel ou tel profil (les satisfaits, les
mcontents...) ;
contenant tel ou tel mot.
Les tapes consistent choisir la variable, dfinir les
conditions de l'extraction, et transfrer les citations ainsi
obtenues.

Les rsultats de la recherche s'affichent dans une fentre.


Le bouton Options permet si ncessaire de changer les
conditions.
Avec le bouton Transfrer, on peut Imprimer ou Inclure
dans le rapport...

Produire des listes


L'article Produire des listes du menu Dpouiller offre une
autre manire de faire du verbatim, mais dans cet
environnement, on peut mettre dans les extraits le contenu
de plusieurs variables en les prsentant sous des formats
listes ou fiches (Voir Produire des listes).

Slectionner une variable texte


Allez pour cela dans la fonction Etudier les textes du
menu Recoder. Choisissez votre variable. En slectionnant
ensuite Extraits (Verbatim), vous obtenez un dialogue
dans lequel vous pouvez fixer les conditions de recherche
et de prsentation des extraits.

Prsenter les extraits en les classant


La case cocher Trier selon permet de choisir la variable
par rapport laquelle on veut classer les citations. Dans
lexemple propos ci-contre, on a choisi le Sexe. Les
rponses des hommes seront dabord prsentes, puis ce
sont celles des femmes.

Dfinir un profil de recherche


En cochant la case Rduire un profil, on peut fixer les
conditions auxquelles doivent rpondre les extraits.
En dfinissant une slection selon une ou plusieurs autres
variables, on limite les extraits des conditions de contexte
(identit, comportement, opinion...).
On peut galement filtrer selon le contenu. On dfinit dans
le profil la condition que la variable analyse contienne tel
ou tel mot. On peut en numrer plusieurs. Ci-contre, on
cherche les rponses contenant le mot amis (Plaisir de
manger = amis).

Sphinx 2000

Traitement simple des questions textes

237

Faire du Verbatim

Prsenter les rponses en les


classant
Slectionner les rponses en
les limitant un profil

Slectionner selon le contexte


Slectionner selon le contenu

Imprimer ou inclure
dans le rapport

238

3. Tableau de rponses ouvertes


La manire la plus simple et la plus rapide dtudier une
question ouverte est den dresser la liste en regroupant les
rponses identiques ou en dnombrant les mots quelle
contient. On obtient des tableaux de ce type partir de
Recoder / Etudier les textes ou en slectionnant une
question ouverte dans le menu Analyser / Tableau plat.
Dans le panneau lexical (Lexica uniquement), on accde
aussi ce type de tableau par le bouton Tableau de
fragments.

Tableau des rponses et tableau des


mots
Le tableau dresse la liste des rponses en affichant les
effectifs et les pourcentages de chaque lment. Les
boutons Mots et Rponses permettent de passer de la
liste des mots celle des rponses. Dans la liste des
rponses, seules les rponses identiques sont
dnombres. Dans la liste des mots, on dcompte le
nombre de fois o chaque mot apparat. Les mots outils1
sont systmatiquement ignors.
Ces tableaux peuvent tre imprims, copis ou inclus dans
un rapport (bouton Transfrer) de faon intgrale ou
seulement pour les lignes slectionnes (clic).

Recoder une variable texte


On peut crer une nouvelle variable dfinie partir des
lments slectionns dans la liste des mots. Le bouton
Recoder propose les choix suivants pour la nouvelle
variable :
Ferme : les modalits de la nouvelle variable indiquent
la prsence ou labsence des mots slectionns dans la
rponse.
Ouverte numrique : la nouvelle variable enregistre le
nombre de mots slectionns dans la rponse. Elle les
dnombre tous si aucun nest slectionn. On obtient
alors la longueur de la rponse (sans les mots outils).
Cest un indicateur trs utile.
Ouverte texte : la nouvelle variable est une variable texte
dont les lments sont rduits aux mots slectionns
dans la liste. On fabrique ainsi des textes expurgs ou
rduits des squences remarquables.

Analyser un tableau de textes


Le bouton Analyser renvoie lenvironnement danalyse
des tableaux plat ou croiss. On accde ainsi aux
fonctions graphiques et statistiques classiques. On revient
avec le bouton Liste.

Le bouton Ordonner permet de changer la prsentation


des lignes du tableau. Caractriser donne le dtail des
effectifs composant chaque ligne. Il est particulirement
intressant dans le cas des listes de mots.

Analyser selon le contexte


Le bouton Croiser permet dtudier les rponses aux
questions ouvertes selon leur contexte : qui dit quoi ? Il
suffit de choisir la variable selon laquelle on veut ventiler
les rponses ou le vocabulaire. On revient la liste non
ventile en dcochant la case Croiser le tableau avec la
variable accessible dans le bouton Croiser.

1
Ces mots sont dfinis par le dictionnaire des mots outils prsent dans le
rpertoire dictionnaires motoutils.dic .

Sphinx 2000

Traitement simple des questions textes

239

Produire la liste
des rponses

Produire la liste
des mots

Croiser

Slectionner

Analyser

Recoder
240

La codification

4. Analyse de contenu
Lanalyse de contenu est un travail long qui peut tre
fastidieux. Lenvironnement de travail propos permet de le
rendre plus facile et plus rapide. Les thmes peuvent tre
enrichis en cours danalyse par lajout de modalits, par la
possibilit de passer dune rponse lautre en fonction de
son contenu (navigation lexicale), et par laffichage du
contenu dautres questions pour amliorer la qualit de la
lecture.

Reprendre un travail en cours ou crer


une nouvelle variable
Aprs avoir slectionn Analyse de contenu dans larticle
Etudier les textes du menu Recoder, on choisit de
reprendre un travail en cours en slectionnant la variable
dans laquelle on a commenc la codification.
Si vous commencez votre recodage, il faut dfinir la
variable dans laquelle vous souhaitez coder le contenu :
une variable dont vous choisissez le type. Il sagit le plus
souvent dune variable ferme dont les modalits se
rapportent aux thmes les plus frquents, mais elle peut
tre aussi code si on dispose dun thsaurus ou dun
dictionnaire de thmes, ou de type numrique pour donner
une note la rponse.

On code le contenu de la rponse en cours danalyse en


cochant la case correspondante ou en slectionnant une
ou plusieurs modalits dans la liste droulante. Si vous
avez plus de 10 modalits, les boutons Listes et Boutons
vous permettent de choisir le mode daffichage qui vous
convient le mieux.
Le passage la rponse suivante (flches de navigation ou
retour chariot) valide les rponses pralablement recodes.
Le bouton Revenir vous ramne ltat initial de la
variable (avant validation de la dernire rponse).

Lexique et navigation lexicale


Vous pouvez faire apparatre la liste de tous les mots
(lexique) contenus dans la variable analyse en dplaant
la sparation des deux parties de votre cran sur la droite.
En slectionnant un ou plusieurs mots dans cette liste,
vous pourrez, avec les flches de navigation, passer en
revue les rponses contenant ces mots. Si vous cherchez
un mot particulier, tapez-le rapidement au clavier, le
curseur du lexique se positionnera dessus.
Vous pouvez galement limiter la navigation certains
types de rponses en dfinissant leur profil (vous accdez
ce dialogue avec le bouton N situ en bas gauche de
la fentre danalyse de contenu).

Elaborer la grille thmatique et coder


les rponses
Dans le cas de la codification dans une variable ferme, le
bouton Changer les modalits permet de modifier la liste
des thmes en nommant les modalits, en crant de
nouveaux thmes ou en rorganisant leur liste (Ajouter,
Supprimer, Monter, Descendre dans la liste des
modalits), et ceci tout moment.
Si on dispose dune thmatique dj dfinie et trs longue,
on a tout intrt la rentrer dans un dictionnaire de codes
ventuellement structur. En associant cette liste une
variable code, on gagnera beaucoup de temps.

Sphinx 2000

Traitement simple des questions textes

241

Reprendre un travail en
cours
Crer une nouvelle
variable

Tirer pour agrandir ou rduire


la fentre

Illustrer par une autre variable


Tirer pour
cacher ou
montrer le
lexique

Rponses en liste

242

Naviguer entre des rponses

Sphinx 2000

Traitement simple des questions textes

243

L'analyse
lexicale en bref

244

Le panneau de commandes lexicales

1. Les interfaces
Pour aller plus loin dans lanalyse lexicale, Plus et Lexica
donnent accs un environnement spcifique : latelier
lexical (Etudier les textes / Atelier lexical / Panneau de
commandes). Celui-ci permet de :
Calculer diffrentes formes de lexiques (rduits,
regroups par racine, relatifs un dictionnaire.) ;
Slectionner des mots pour retrouver toutes les rponses
qui les contiennent, produire des extraits ou des
associations de termes ;
Reprer les expressions du texte et les segments
rpts ;
Produire des tableaux lexicaux, des listes de mots
spcifiques (relatifs aux modalits dune autre variable),
et des rponses caractristiques ;
Transformer une variable texte en produisant un nouveau
texte expurg, fragment ou lemmatis ;
Coder automatiquement le texte en fonction de son
contenu lexical.

Ltude des textes fait lobjet de procdures mettant en


uvre des commandes complexes qui ont t en partie
automatises et que lon peut ainsi directement excuter
sans passer par latelier lexical :
la production de diffrentes formes de lexiques (rduits,
2
3
lemmatiss , stemmatiss selon la forme grammaticale),
la recherche dassociations lexicales (segments rpts,
lexiques relatifs, co-occurrences).
la mise en vidence des effets de contexte (indicateurs
dnonciation, tableaux lexicaux, listes de mots
spcifiques, rponses caractristiques).
Enfin, ce panneau permet douvrir nimporte quel texte
prsent sous forme de fichier texte.

Toutes ces fonctions dotent le Sphinx Lexica dun trs


puissant outil danalyse. Pour en simplifier lusage,
quelques procdures standards ont t isoles. On peut les
lancer partir du panneau lexical disponible partir du
stade Etudier des Textes ou partir de la fonction Etudier
les textes.
On obtient ainsi directement les rsultats attendus sans
avoir en spcifier la procdure dans latelier lexical.
Nanmoins, celui-ci sera trs utile pour affiner les rsultats
et raliser les oprations plus complexes quil autorise.

Latelier lexical
Cet cran est compos de 4 grandes parties :
A droite : une fentre prsente diffrentes vues du
corpus ;
A gauche : on peut voir le lexique des mots ou des
expressions. En cliquant dans le lexique, on fait dfiler les
contenus correspondants dans la fentre de droite
(navigation lexicale).
Le bandeau du haut contient un ensemble de boutons de
commande contrlant le calcul et la prsentation du
lexique, la mise en forme du corpus, sa prsentation, et
sa codification dans de nouvelles variables.
Les indications du bas de lcran donnent des statistiques
gnrales sur le texte tudi.
2
chaque forme est ramene sa racine grammaticale (infinitif,
singulier)
3
chaque forme est ramene ses x premiers caractres

Sphinx 2000

L'analyse lexicale en bref

245

Panneau lexical

Analyse globale
Lexique et
associations lexicales
Lexique et contextes

Atelier lexical

Commandes

Vue : lexique

Vue : corpus

Navigation

246

2. Du texte aux formes graphiques


- lapproximation lexicale
Lanalyse lexicale ignore la syntaxe de la phrase et donne
la priorit aux mots. Linformatique permet en effet trs
facilement de dresser la liste des formes graphiques
contenues dans un texte et den faire la statistique. Cest ce
quon appelle extraire le lexique du texte.
Une forme graphique est une suite de caractres ne
comportant pas de sparateurs (blanc, apostrophe,
caractres de ponctuation). Dans ce qui suit, on utilisera
lappellation mot, en lappliquant en fait la ralit dune
forme graphique.

En combinant ces diffrentes fonctions, le Sphinx autorise


une approche rapide des textes :
Calcul du lexique pour comprimer le texte ;
Navigation lexicale pour revenir au texte ;
Dictionnaires, segments rpts, et lemmatisation pour
une intelligence du texte.
On peut ainsi rduire leffort de lecture en produisant un
matriau moins volumineux que le texte initial. Mais ce
nest l quune manire dapprocher son contenu. On y
trouvera un gain de temps qui peut tre considrable et
une prise de distance que la lecture naturelle interdit.

En assimilant ainsi les mots aux formes graphiques, on


peut donner une approximation utile du contenu du texte
par le seul examen des formes les plus frquentes. Comme
on le fait en survolant le lexique dun livre pour avoir une
ide de son contenu.
Cette assimilation peut tre trompeuse du fait des
polysmies (la forme avions dans la phrase Nous
avions de beaux avions) et des significations composes
(pas mal = bien).
Lanalyse lexicale repose ainsi sur une approximation,
source derreurs, quon cherche compenser par :
Un retour ais au texte grce la navigation lexicale qui
permet de situer le mot dans son contexte. La phrase est
le contexte le plus naturel et nous verrons plus loin
comment jouer sur ltendue de ce contexte.
La recherche des segments rpts pour restituer les
locutions et les expressions rptes dont chaque
lment pris isolment peut induire un contre sens
comme par exemple le trop de trop cher, le beau de pas
beau...
Une intelligence artificielle du texte consistant, par le
procd de lanalyse syntaxique automatique, soulever
lambigut des formes graphiques. Dans lexemple cidessus, en reprant la fonction de verbe de la premire
forme avions, on distingue les significations avoir et
aroplane. Cest ce quon appelle la lemmatisation. A
linverse, les synonymes (mots diffrents ayant la mme
signification) ou les mots composs, peuvent tre grs
par des dictionnaires de mots quivalents ou
dexpressions.

Sphinx 2000

L'analyse lexicale en bref

247

Corpus texte

Lapproximation lexicale
sommaire :
Rduire le texte au dbut du
lexique : lexamen des mots les
plus frquents donne une ide
du contenu.

Lexique

Calculer le lexique

Corpus texte
Lapproximation lexicale
contrle :
Rduire le texte son lexique et
contrler par la navigation
lexicale le bien fond des
interprtations faites partir du
lexique.

Lapproximation lexicale
slective :
Travailler sur un lexique rduit
aprs avoir limin les mots
outils et solidaris
les
segments.
Concentrer
lattention sur lexamen des
noms,
verbes,
adjectifs
(utilisation de dictionnaires et de
la lemmatisation).

Interpreter

Navigation
lexicale
Lexique

Corpus texte

Lemmatisation

Slectionner

Segments rpts

Corpus texte
lemmatis et solidaris

Dictionnaire
Lexique rduit et
structur

248

Verbatim

Navigation lexicale

Verbatim

Nouvelle vision
du texte

Intgration de l'analyse de donnes

3. Du texte aux structures


linguistiques : la statistique
lexicale
La statistique lexicale et lanalyse des donnes textuelles
permettent daller plus loin que la simple approximation
dduite de lexamen du lexique ou de ses drivs.

Appliquer les mthodes de lanalyse multivarie sur des


variables dorigine lexicale considres entre elles ou en
relation avec dautres variables de contexte. En intgrant
ainsi lanalyse de donnes classiques avec lanalyse des
donnes textuelles, on peut mettre jour les structures
internes des textes tudis (analyse des co-occurrences)
ou leur dpendance par rapport des donnes de contexte
(analyse des spcificits).

En dnombrant les associations de termes entre eux ou


avec dautres variables, on est conduit un autre type de
lecture totalement objective et susceptible de rvler les
structures que la quantification du texte peut mettre
jour. On peut ainsi transformer le texte en le dcrivant par
des variables statistiques classiques (codification
automatique, mesures lexicales...) ou en le recomposant
sous forme de nouveaux textes (textes expurgs, rduits
leurs formes lemmatises...).
Latelier lexical offre cet gard de nombreuses
possibilits pour mettre jour les particularits lexicales
des textes tudis et prolonger leur analyse en utilisant
toutes les techniques danalyse de donnes du Sphinx.

Recherche des spcificits lexicales


Etablir la statistique des mots du texte selon une variable
externe non textuelle. Rechercher les spcificits lexicales
selon ces contextes, et les visualiser sous forme de cartes
cognitives. Produire les phrases les plus caractristiques
de chaque contexte.

Codification et mesures lexicales


Dcrire le texte par une ou plusieurs variables nominales
codant la prsence, dans les rponses, dun ensemble de
mots slectionns dans le lexique. Cette codification peut
tre enrichie de toutes les possibilits offertes par lusage
de dictionnaires thmatiques, la lemmatisation, la
recherche des segments rpts
Caractriser lnonciation (longueurs de rponses, de
phrases, frquence dusage des embrayeurs...) ou les
noncs (intensits lexicales de termes ou champs
smantiques...) en crant de nouvelles variables
numriques pondrant, pour chaque fragment, limportance
de tel ou tel trait linguistique ou smantique...

Sphinx 2000

L'analyse lexicale en bref

249

Corpus texte

Segments rpts

Lemmatisation
Variable
de contexte

Corpus texte
lemmatis et solidaris
Navigation lexicale

Dictionnaire

Lexique rduit et
structur

Mettre jour
les structures
linguistiques

Listes demots
spcifiques

Tableau
lexical

Structures
Stat.
Phrases
caractristiques

Corpus texte

Lemmatisation

Variable
de contexte

Corpus texte
lemmatis et solidaris
Dictionnaire

Intgrer les
mthodes

Segments rpts

Navigation lexicale

Verbatim

Lexique rduit et
structur
Variables
fermes sur
les mots du
lexique

Mesures
lexicales :
intensits
banalits
Structures
Stat.

250

Statistiques lexicales

4. Latelier lexical en bref


On accde latelier lexical partir du panneau lexical ou
par larticle Etudier des textes du menu Recoder. Cet
cran concentre lensemble des outils proposs par le
Sphinx. Il permet deffectuer 4 grands types de tches
appliques au corpus de la variable slectionne : produire
des lexiques, naviguer entre le lexique et le corpus, tablir
des statistiques, transformer le texte et crer de nouvelles
variables.

Production de lexiques
Le lexique des mots ou liste des formes graphiques
saffiche dans la fentre de gauche.
Il dpend des caractres sparateurs retenus (bouton
Apparier). Son contenu et sa prsentation sont affects
par les boutons Supprimer, Rduire, Regrouper,
Compter et Classer. On peut ainsi liminer ou regrouper
des lments et choisir lordre de leur prsentation ainsi
que les indicateurs statistiques les caractrisant (nombre
doccurrences ou nombre de rponses / fragments
concerns).
Le lexique des expressions (Lexica uniquement) prend la
place du lexique des mots. On slectionne pour cela
Expressions dans le menu droulant Lexique. Dans la
fentre qui apparat, on peut chercher les locutions et les
segments rpts.

Navigation lexicale
La navigation lexicale permet de faire apparatre, dans la
fentre du corpus, les fragments de texte contenant les
mots marqus dans le lexique. On passe dun fragment
lautre avec les flches situes sous la fentre droite. Les
rgles de navigation peuvent tre modifies par le menu
droulant Aller .
Un double clic dans la fentre du lexique fait apparatre le
contexte du mot slectionn (concordances ou lexiques
relatifs). Ltendue du contexte est paramtrable avec le
bouton Apparier. On revient par la touche Esc.
Le bouton Marquer permet de slectionner des lments
du lexique selon leurs proprits, et les boutons 0 <> @
servent annuler la slection, linverser ou tout
slectionner. Grce au bouton Illustrer, on fait apparatre
une autre variable illustrative dans la fentre du corpus.
Sphinx 2000

Les caractristiques statistiques du corpus du lexique et de


chaque observation / fragment sont affiches sous les
fentres correspondantes (taille, richesse, longueur
moyenne, banalit, % de lecture).
Avec le bouton Compter, on choisit les indicateurs
statistiques du lexique. Comparer permet de le confronter
un lexique de rfrence.
Dans le menu droulant Vues (Lexica uniquement), les
articles Bilan lexical, Tableau lexical et Mots spcifiques
donnent accs aux statistiques rsultant du croisement
avec une autre variable.

Transformation du texte et cration de


nouvelles variables
Les boutons Modifier et Remplacer permettent deffectuer
directement des transformations dans le texte du corpus.
Avec Lemmatiser, on peut crer une nouvelle variable
dans laquelle chaque mot est remplac par sa forme
racine.
Recoder donne accs aux nombreuses possibilits de
cration de nouvelles variables : nominales, numriques,
textes.

La barre d'outils
Toutes les fonctions qui viennent rapidement d'tre
voques se lancent partir de la barre d'outils. Les
fonctions suivantes ne sont disponibles que dans Lexica :
rechercher des expressions et des segments rpts,
analyser l'environnement d'un mot, construire des bilans,
des tableaux lexicaux ou des listes de mots spcifiques,
lemmatiser.

Revenir l'atelier lexical ou le quitter


La touche Esc permet de revenir l'cran principal de
l'atelier ou d'en sortir.

Le panneau de commandes lexicales**


Les procdures de recherche les plus courantes ont t
automatises et sont accessibles depuis le panneau de
commandes lexicales. On peut ainsi rapidement tablir des
rsultats qui seront ensuite affins dans l'atelier.

L'analyse lexicale en bref

251

Latelier lexical

Lexique

Corpus

Statistiques lexicales

Barre doutils de Plus

252

5. Le panneau lexical : produire


des lexiques
Une manire rapide de prendre connaissance dun corpus
consiste dresser la liste des mots quil contient. La
procdure Lexiques du panneau lexical permet daller plus
loin que les tableaux de rponses ouvertes.

Formes graphiques et mots


La machine peut identifier les formes graphiques
composant votre texte : suite de caractres sans blanc ou
signes de ponctuation. Malheureusement, un mot se
prsente en gnral sous diffrentes formes graphiques
(singulier, pluriel, flexion des verbes), ce qui rduit la
qualit des listes construites sur le seul reprage de ces
formes.

Verbes, Noms, Adjectifs


En dressant la liste des verbes, noms, adjectifs, vous
dsignez les actions, les objets et les valuations du
discours. Vous pouvez y ajouter la liste des noms propres
et des mots grammaticaux Cette liste est construite
partir dune forme du texte o les statuts grammaticaux
sont reprs (Nom_LC).

Poursuivre dans latelier lexical


Vous pouvez sortir les rsultats avec le bouton Transfrer,
mais vous pouvez aussi enrichir vos rsultats dans latelier
lexical en oprant des regroupements manuels ou des
regroupements par dictionnaires (Regrouper) sur le texte
original ou sur ses formes lemmatises (Nom_L et
Nom_LC).

Pour surmonter cet inconvnient, le Sphinx peut faire une


analyse syntaxique et remplacer chaque forme par son
lemme (masculin singulier pour les noms et adjectifs,
infinitif pour les verbes).
Vous avez galement la possibilit de regrouper les mots
construits sur la mme racine (suite des x premires
lettres).
Bien quapproximatif, ce procd permet de regrouper dans
un mme item diffrentes formes exprimant la mme
ide (#famil pour famille, familier, familial).

Slectionner un type de lexique


Cliquez sur Lexiques, un dialogue vous propose de
construire la liste des formes graphiques qui composent
votre texte en appliquant les options suivantes :
Ignorer les mots outils : ces mots sont pauvres pour
qualifier lnonc mais ils peuvent tre rvlateurs de
lnonciation.
Ignorer les nombres.
Regrouper par racine : on indique le nombre de lettres
dfinissant la racine. Les mots commenant ainsi seront
regroups.
Utiliser le lexique lemmatis : le lexique est dress
partir dune forme lemmatise du texte. Lanalyse
syntaxique est lance automatiquement et une nouvelle
variable (Nom_L) est cre. Vous pourrez alors lutiliser
tout moment pour la suite de vos analyses.
Nombre maximum et Frquence minimale permettent de
limiter la longueur de la liste.
Sphinx 2000

L'analyse lexicale en bref

253

Calculer les
lexiques

Lexique rduit
Lexique des racines

Lexique lemmatis

Trouver les formes


grammaticales

254

6. Le panneau lexical : segments


rpts et lexiques relatifs
Trouver les segments rpts
On appelle Segment rpt toute squence de formes
graphiques rptes lidentique dans le texte. Ils rvlent
les expressions, les formules toutes faites, la langue de
bois.

Avec Lexiques relatifs, vous entrez le mot que vous


voulez tudier puis slectionnez :
Lexiques relatifs pour voir la frquence des termes
gauche et droite du mot recherch (mot pivot) ;
Concordance pour obtenir tous les passages contenant le
mot.
Les rsultats de la recherche apparaissent dans une
fentre qui vous donne accs des options permettant
daffiner les rsultats : enlever les mots outils (Rduire),
modifier la dfinition de lenvironnement du mot (rponse,
phrase, groupe) avec le bouton Apparier.

En les recherchant dans le texte lemmatis, on fait ressortir


encore plus fortement les rptitions et les leitmotivs.
En cliquant sur le bouton Segments rpts, vous avez le
choix de lancer la recherche sur le texte original ou sur le
texte lemmatis (Utiliser le texte lemmatis), sur le texte
qui contient ou non les mots outils (Ignorer les mots
outils).
Vous pouvez enfin limiter la recherche aux segments dune
frquence minimale.
La liste des segments apparat dans une fentre que vous
pouvez imprimer ou inclure dans votre rapport (Bouton
Transfrer).
Vous pouvez affiner vos recherches dans latelier lexical
(Vue Expressions, bouton Segments).
Vous pourrez ainsi limiter la recherche aux segments
contenant des mots choisis par vous ou appliquer la
recherche sur des formes modifies du texte.

Les mots dans leur contexte


Le lexique sort le vocabulaire de son contexte. Afin de
prciser le sens des mots, vous pouvez produire la liste
des phrases ou rponses dans lesquelles ils sont
employs.
Ces listes peuvent tre longues, les lexiques relatifs
donnant la frquence des mots avec lesquels le mot tudi
est utilis.
Elles font ressortir bien plus rapidement le contexte en
donnant des indications trs prcises (frquence
dutilisation gauche et droite).

Sphinx 2000

L'analyse lexicale en bref

255

Segments rpts

Lexiques relatifs et
concordances

256

7. Le panneau lexical : du bilan aux


rponses caractristiques
Vous pouvez apprcier linfluence des locuteurs en mettant
en vidence les diffrences qui caractrisent leur texte.
Cest lobjet des bilans lexicaux, des tableaux de
caractristiques, des listes de mots spcifiques et des
rponses caractristiques.

Bilan lexical
Le bilan lexical rassemble les principaux indicateurs
caractristiques de lnonciation : nombre de mots,
longueur des fragments, richesse lexicale, spcialisation
lexicale Ces indicateurs sont calculs pour les modalits
dune variable et permettent ainsi de comparer diffrents
locuteurs. La production du bilan est automatique : vous
navez qu indiquer la variable selon laquelle vous voulez
ltablir.

Tableaux lexicaux
Un tableau lexical ventile lutilisation des mots selon les
modalits dune variable de contexte. Vous avez galement
la possibilit de limiter la liste aux mots exclusifs, aux mots
communs ou aux mots sur-reprsents ou sousreprsents dans chaque catgorie. A cet effet, choisissez
dans le dialogue les mots que vous souhaitez inclure dans
la liste : Inclure les mots exclusifs dune catgorie,
Inclure les mots communs plusieurs catgories

Choisissez dabord une variable de contexte puis le bouton


Restrictions vous permettra de fixer les conditions de
recherche : se limiter aux mots exclusifs ou aux mots
communs (Inclure les mots exclusifs, Inclure les mots
communs toutes les catgories, Inclure les mots
communs certaines catgories).
Pour filtrer les mots selon leur spcificit, on coche la case
Seuil de spcificit en donnant une valeur au seuil. Ne
cocher Positive que pour limiter la liste aux mots surreprsents. Vous pouvez enfin vous limiter aux n mots les
plus spcifiques par catgorie en cochant Limiter .
Le rsultat dresse, par catgorie, la liste des mots
rpondant aux conditions. Ils sont classs par ordre de
spcificit ou de frquence. En regard apparat la
frquence et/ou lindice de spcificit. Ces options sont
modifiables dans latelier : Compter (faire afficher ou non la
frquence et lindice) et Classer (dfinir lordre des listes).

Rponses caractristiques
Cette fonction repose sur la slection de mots spcifiques
mais donne comme rsultat une liste de rponses
slectionnes en fonction du nombre de mots spcifiques
quelles contiennent et de leur indice de spcificit moyen.

Vous pouvez enfin limiter le tableau aux mots ayant des


effectifs minimums (Seuil de frquence).

Mots spcifiques
Un mot est spcifique dune catgorie sil est surreprsent dans cette catgorie. On utilise le rapport des
frquences (observes / thoriques) comme indicateur de
spcificit. Le mot est dautant plus sur-reprsent (resp.
sous-reprsent) que ce rapport est suprieur (resp.
infrieur) 1. Il est infini pour les mots exclusifs quon
repre avec une toile.

Sphinx 2000

L'analyse lexicale en bref

257

Variable de contexte

Bilan lexical

Conditions spcifiques

Tableau lexical

Mots spcifiques

Rponses
caractristiques

258

Sphinx 2000

L'analyse lexicale en bref

259

La construction
des lexiques

260

1. Caractres sparateurs et
environnement
Pour identifier les diffrents lments composant un champ
textuel, on dfinit des caractres sparateurs.
Les sparateurs de fragments ou dobservations sont
dfinis au moment de lintgration dun fichier de donnes
(Voir Ouvrir un fichier de donnes textuelles).
Les sparateurs de formes graphiques permettent
disoler les mots. Le blanc est le sparateur naturel mais on
peut en retenir dautres ( ()..).
Les sparateurs de phrases ou de tout autre groupe
permettant de dfinir un sous-ensemble signifiant
(proposition, unit de signification...).

Apparier
La dfinition de ces sparateurs conditionne la construction
du lexique et la recherche de lenvironnement dun mot
(concordances, lexiques relatifs). On peut modifier ces
paramtres dans un dialogue ouvert par le bouton
Apparier.
Celui-ci permet de modifier les sparateurs de mots
(formes graphiques), groupes ou phrases, de fixer les
rgles suivre pour traiter les accents et majuscules et
grer les expressions formes de mots composs.

Choisir les rgles de construction du


lexique
En cochant les cases Diffrencier les majuscules ou
Diffrencier les lettres accentues, on considre Maison
ou maison et lve ou lev comme des formes
graphiques diffrentes ou non.
En jouant sur les sparateurs de mots, on fait apparatre
grand-pre comme un seul mot ou comme 2 mots
diffrents. Pour supprimer ou rajouter des sparateurs, il
suffit daller crire dans la bote correspondante.
Si la saisie, on a utilis le caractre _ comme liaison pour
les mots composs sans tiret. On crira ainsi
pomme_de_terre. Mais pour que ce procd fonctionne
bien, il faudra vrifier que le caractre '_' nest pas
considr comme un sparateur (ce qui est le cas par
dfaut).

Options pour la recherche des


expressions
Si la case cocher Composes de mots entiers n'est pas
coche, les squences recherches peuvent inclure des
fragments de mots conscutifs.
Si la case cocher Diffrencier les sparateurs est
coche, on ne tient pas compte des sparateurs.

Enfin, il permet de fixer lenvironnement prendre en


considration pour examiner le contexte dun mot.
On change les sparateurs en les frappant au clavier dans
la zone qui leur est rserve.
Les modifications introduites avec Apparier sont
conserves la prochaine ouverture du logiciel, nanmoins
le bouton Restaurer permet de rtablir les solutions par
dfaut les plus courantes.

Sphinx 2000

La construction des lexiques

261

Dfinir les sparateurs

Lexique

Concordances
Lexiques relatifs
Verbatim

262

2. Rechercher et marquer des


lments dans le lexique
Que lon cherche restituer les mots dans leur contexte ou
simplifier le lexique par regroupement dlments, le
travail danalyse lexicale consiste reprer des mots et
les marquer.
On peut procder manuellement en faisant dfiler la liste
du lexique avec les ascenseurs et en cliquant sur les mots
qui nous intressent. Selon le besoin, on classera le
lexique par ordre de frquence, par ordre alphabtique ou
par ordre dapparition (bouton Classer).
On peut aussi procder dune manire automatique grce
au bouton Marquer. Il permet de trouver et marquer les
lments rpondant aux conditions fixes.

Rechercher par le contenu


Activer le bouton Le mot et entrer le mot recherch ou une
partie de mot. Pour trouver plusieurs mots, tapez les la
suite.
La (ou les) chane(s) de caractres que vous venez
dentrer sera(ont) recherche(s) :
Dans son (leur) intgralit : bouton Mot entier.
Comme dbut de mot : bouton Dbut de mot, tous les
mots commenant par cette chane seront marqus. Par
exemple, en tapant voit , on marquera voiture, voitures,
voiturette.
Comme partie de mot : bouton Partie de mot, tous les
mots contenant la chane seront marqus. Cette option
est trs utile pour marquer tous les verbes dun texte
lemmatis. Ils sont marqus par la terminaison -V
(chanter-V).
Selon la conformit un modle : bouton Modle, tapez
par exemple *isme pour trouver tous les mots se
terminant par isme.

En limitant aux plus frquents : cochez la case Les mots


les plus frquents, taper le nombre de mots que vous
souhaitez dans la bote en regard. Vous pourrez ainsi par
exemple vous concentrer sur les 20 mots les plus
frquents.

Rechercher par dictionnaires


En slectionnant le bouton Les mots du dictionnaire, on
peut utiliser un dictionnaire pour marquer dans le lexique
tous les mots qui sy trouvent. Le bouton Dictionnaire
permet de changer le dictionnaire courant pour le
remplacer par le dictionnaire de son choix.

Combiner les effets du marquage


Le menu droulant Slection permet de combiner
plusieurs recherches conscutives :
Complter : les mots dj marqus le restent, les
nouveaux sajoutent lensemble.
Remplacer : les mots dj marqus seffacent, les
nouveaux les remplacent.
Affiner : seuls sont marqus les mots qui taient dj
marqus, les autres sont effacs (intersection de 2
slections).
Enfin, les boutons 0, <>, @ permettent deffacer toutes les
marques, de les inverser ou de marquer tous les mots du
lexique. Pour conserver dans le lexique un ensemble de
mots slectionns, on les marque puis on inverse les
marques pour supprimer ce qui ne nous intresse pas.

Rechercher selon la frquence


En fixant une plage de frquence : activez loption Les
mots de frquence entre et indiquez lintervalle
correspondant au nombre dapparitions des mots
marquer. Par exemple de 1 10 pour marquer les mots
apparaissant moins de 10 fois, de 1 2 pour marquer les
hapax (la borne suprieure de lintervalle nest pas
comprise). Vous pouvez indiquer une seule des deux
bornes.
Sphinx 2000

La construction des lexiques

263

En cliquant dans le lexique

En cliquant dans le
corpus

Rgles de recherche

Au clavier
Selon la frquence

Par dictionnaire

264

3. Rduire les lexiques


Cest une phase essentielle de lanalyse lexicale. Pour
analyser les mots les plus intressants ou regrouper sous
une mme appellation ceux qui ont une signification
commune, on peut procder manuellement ou dune
manire automatique. Lexamen manuel consiste reprer
les lments supprimer ou regrouper. Les procds
automatiques reposent sur lutilisation de dictionnaires de
rfrence
et/ou
d'algorithmes
morphologiques
(stemmatisation) ou syntaxiques (lemmatisation).

Supprimer
On peut passer en revue tout le lexique et marquer les
mots liminer. Le bouton Supprimer permettra de les
faire disparatre.

Ignorer les mots outils


Le bouton Rduire comporte un premier automatisme en
permettant dliminer les mots outils (selon le dictionnaire
motoutil.doc fourni avec le Sphinx ), les nombres ou les
mots courts (moins de x lettres). Attention, le dictionnaire
des mots outils contient des mots trs intressants
analyser comme les pronoms personnels, les ngations...
Pour revenir au lexique complet et les analyser, utiliser le
bouton Reconstruire.

Ce mme dialogue donne la possibilit de revoir les


groupes (Voir Groupement automatique). Les groupes
sont conservs et retrouvs la prochaine consultation de
la variable. Dfaire les groupes permet cependant
dannuler dfinitivement tous les regroupements.

Lemmatiser
La lemmatisation (Lemmatiser) permet doprer des
regroupements intelligents en utilisant les rgles de la
syntaxe (singulier, pluriel, formes verbales ramenes
linfinitif). Elle prsente lavantage de rduire certaines
ambiguts en distinguant par exemple le nom du verbe
(voyage peut correspondre au nom voyage ou au verbe
voyager). Il est donc conseill doprer le travail de
rduction sur la base du texte lemmatis.

Exploiter le lexique rduit


Les regroupements sont conservs, mais vous pouvez
crer une nouvelle variable rduite aux mots du lexique
(Recoder). Le bouton Verbatim permet de sortir les
lments slectionns.

Regrouper
Le bouton Regrouper offre plusieurs choix pour remplacer
plusieurs lments par un seul :
Grouper les mots marqus dans le lexique : slectionnez
et donnez un nom au regroupement.
Rechercher tous les mots rpondant un modle et les
grouper. Entrez le modle : les lments qui y rpondent
seront automatiquement regroups, par exemple, *isme
pour les mots se terminant par isme.
Grouper les mots commenant par les mmes lettres :
groupement par racine ou stemmatisation. Indiquez le
nombre de caractres retenir pour la racine. Vous
pourrez contrler la validit de chaque groupe (Voir
Stemmatisation).
Grouper avec un dictionnaire. Choisissez un dictionnaire.
En utilisant un dictionnaire de groupement ou thsaurus,
vous pourrez oprer en une seule fois plusieurs
groupements (Voir Gestion de dictionnaires).

Sphinx 2000

La construction des lexiques

265

Enlever les mots outils


Lemmatiser

266

Regrouper

4. Groupements automatiques
On gagne beaucoup de temps en procdant ainsi :

Regroupement selon un modle


Slectionner loption Grouper les mots sur le modle puis
rentrez le ou les modles recherchs. Par exemple, alim*
donne tous les mots commenant par alim, *ie ceux qui se
terminent par ie. La syntaxe disponible offre de trs
grandes possibilits.

un dictionnaire de groupements regroupe plusieurs


dictionnaires de mots. Chaque lment numre une liste
de mots quivalents. Les mots sont spars par le signe
=, et en tte de liste se trouve le nom de lquivalent.
Appliquer un dictionnaire de regroupements revient
appliquer successivement plusieurs dictionnaires de
mots. Les mots dune mme ligne sont automatiquement
remplacs par leur quivalent. Ces dictionnaires sont trs
utiles et peuvent tre assimils des thsaurus de
niveau 1.
Ci-dessous, titre d'exemple, voici le dictionnaire
correspondant l'tat du lexique de droite ci-contre :

Stemmatisation
Ce terme indique le regroupement des mots ayant la mme
racine. Slectionner la case Grouper automatiquement,
puis de mme racine et indiquer le nombre de lettres
minimum que doit contenir la racine commune.

Modifier les groupes


Il est important de pouvoir contrler la qualit des
groupements automatiques. A cet effet, le bouton Modifier
interactivement les groupes permet de les revoir tous
(utiliser les flches) pour ventuellement supprimer des
mots dont la signification nest pas conforme (Enlever). On
peut galement ajouter des mots en les entrant au clavier
(Ajouter). Dfaire supprime le groupe. Pour renommer,
entrez au clavier la nouvelle appellation. Par dfaut, les
groupes sont marqus dun #. Leur nom reprend le modle
auquel il rpond.

Dictionnaires

#faire*=faire=faire_la_cuisine=faire_plaisir=
faire_envie=faire_attention
#gote*=goter=goteux
#gastronomi*=gastronomie=gastronomique
#avoir_*=avoir_envie=avoir_faim
#quelque*=quelque_chose=quelquechose
#enfant*=enfant=enfants
#nature*=naturel=nature
#prendre*=prendre_son_temps=prendre
#vouloir*=vouloir=vouloir_dire
#nourri*=nourrir=nourriture
#cuisine*=cuisiner=cuisine
#lger*=lger=LEGERE
#restau*=restaurant=restau

Conservation des groupements

On peut galement utiliser des dictionnaires. Slectionner


pour cela Grouper automatiquement et avec un
dictionnaire.
Utiliser le bouton Dictionnaire pour ouvrir le dictionnaire
dsir, puis faire Regrouper. Le logiciel cherche les mots
du dictionnaire prsents dans le lexique et les regroupe
sous un mme item. On peut galement procder en
marquant partir du dictionnaire (Marquer les mots du
dictionnaire).
Dictionnaire de mots et de groupements :
un dictionnaire de mot est une liste de termes ayant une
mme signification ou proprit. Cette liste se prsente
comme une numration.

Sphinx 2000

' Dictionnaire de regroupements


$ C:\Donnees\barchoc310\barchoc310.que
Plaisir_de_manger_L 1

Les groupements sont automatiquement conservs.


Lorsquon revient sur une question pour laquelle des
regroupements ont t effectus, un dialogue demande si
on souhaite reprendre le lexique enregistr. En
rpondant oui, les regroupements antrieurs seront
rcuprs. Si vous rpondez non, ils seront perdus.
Pour conserver les regroupements, le logiciel cre
automatiquement dans le rpertoire de lenqute un
dictionnaire de regroupement dont le nom est celui de la
variable : nom_variable.lex.

La construction des lexiques

267

Grouper par racine


Grouper par dictionnaire
Grouper par modle

Contrler les groupements

268

5. La gestion des dictionnaires


Le bouton Dictionnaires (qui se trouve dans la barre
doutils et dans le dialogue Marquer) permet de manipuler
les dictionnaires. Le dictionnaire courant est le dernier
dictionnaire ouvert, c'est lui qui servira au marquage.
Dans la fentre Gestion des dictionnaires, on peut
visualiser le contenu du dictionnaire, ouvrir un autre
dictionnaire, crer un nouveau dictionnaire, enrichir le
dictionnaire courant, ajouter les mots du lexique dans le
dictionnaire courant.

Ouvrir un dictionnaire
Les dictionnaires sont enregistrs comme des fichiers
textes. Le bouton Ouvrir donne accs au dialogue
Windows de gestion des fichiers. Lextension propose par
dfaut est .dic Elle nest pas obligatoire mais permet de
retrouver facilement les dictionnaires.

Travailler sur un texte lemmatis et un dictionnaire de


forme racine.
Utiliser un dictionnaire thmatique pour marquer le
lexique. Par exemple en cherchant les mots exprimant la
satisfaction.
Effacer les mots ainsi marqus (bouton Supprimer) et
parcourir le lexique la recherche dautres mots se
rapportant au thme du dictionnaire.
Ajouter ces mots au dictionnaire avec la squence
Dictionnaire / Ajouter. Ces mots viennent sajouter ceux
qui sy trouvaient dj.
Reconstruire le lexique (boutons Rduire, Reconstruire)
pour retrouver tous les mots qui vous intressent partir
du dictionnaire enrichi.
En rptant cette procdure dune tude lautre, vous
accumulerez une expertise conserve dans vos
dictionnaires.
La capacit maximum dun dictionnaire est de 6 000 mots.

Crer un dictionnaire
Utiliser le bouton Nouveau, donner le nom au fichier (en
remplacement du nom donn par dfaut "DICO.DIC").
Cette procdure ouvre un dictionnaire vide. Vous pouvez :
Y ajouter les mots marqus dans le lexique : bouton
Ajouter.
Entrer au clavier les mots que vous dsirez. Placez le
curseur l'endroit o vous voulez insrer un nouveau mot
et entrez-le au clavier.

Marquer partir du dictionnaire


Un dictionnaire sert marquer des mots dans le lexique.
Utiliser le bouton Marquer puis slectionner Les mots du
dictionnaire (Voir le chapitre Construction de lexiques).
Lutilisation
de
dictionnaires
permet
dacclrer
considrablement lanalyse lexicale. Il est conseill de
travailler pour cela sur un texte lemmatis et dutiliser des
dictionnaires de formes racines pour faire des
regroupements automatiques (stemmatisation).

Ajouter des mots dans le dictionnaire


Vous pouvez ajouter au dictionnaire ouvert les mots
marqus dans le lexique (squence Dictionnaire /
Ajouter). Ceci permet denrichir progressivement les
dictionnaires dune tude lautre. La procdure suivante
est conseille :
Sphinx 2000

La construction des lexiques

269

Ouvrir ou crer un
dictionnaire
Mettre dans le
dictionnaire les mots
marqus du lexique
Entrer des lments
nouveaux au clavier
Marquer les mots
correspondants dans le
lexique

Ouvrir ou crer un
dictionnaire

270

Elaborer des dictionnaires

6. Les diffrents types de


dictionnaires
Les dictionnaires permettent de stocker du vocabulaire de
rfrence et peuvent ainsi considrablement acclrer
l'analyse. A chaque utilisateur de crer les dictionnaires
spcifiques son domaine.
On peut les utiliser pour rduire automatiquement le
lexique (dictionnaire des mots outils) ou pour rechercher
dans un corpus des marqueurs lexicaux de l'nonciation ou
des champs smantiques particuliers.

Diffrents types de dictionnaires


Dictionnaire de mots : il comporte la liste des mots
appartenant un champ lexical particulier : les termes de
l'alimentation, les pronoms personnels... Ces mots sont
reprs par une seule forme graphique.

Un dictionnaire est un fichier texte qui comporte des mots


se rapportant des thmes et/ou ayant une signification
commune (champ lexical). La cration de dictionnaires peut
se faire dans un traitement de textes. Il suffit de dresser les
listes correspondantes en respectant la syntaxe du type de
dictionnaire laborer.
Quelques dictionnaires simples sont fournis avec le logiciel
comme l'ensemble des formes du verbe avoir, les pronoms
personnels, les locutions temporelles. Le lemmatiseur met
galement en uvre des dictionnaires pour la
reconnaissance des formes verbales et le reprage des
locutions usuelles.
Il n'y a pas de limitation la varit des dictionnaires
envisageables.

Dictionnaire d'expressions : il comporte une liste


d'expressions. Une expression par ligne comportant une ou
plusieurs formes graphiques.
Dictionnaire de groupements : il comporte une liste de
formes graphiques quivalentes. Sur chaque ligne, on
trouve le nom gnrique (toujours prcd de # ) suivi de la
liste des formes quivalentes spares par le signe =. Un
dictionnaire de groupements peut rsulter du regroupement
de plusieurs dictionnaires de mots. Le contenu d'un
dictionnaire de mots se trouve sur une ligne du dictionnaire
de groupements.
Dictionnaire de mots outils : c'est un dictionnaire de
mots. Il est utilis pour l'opration de rduction du lexique.
Il peut tre modifi comme tout autre dictionnaire.
Dictionnaire de codes : ce type de dictionnaire sert
l'interprtation des codes (Voir Interprter des codes). Sur
chaque ligne, on a la valeur du code et les diffrentes
manires de l'interprter.
Lexique de rfrence : c'est un dictionnaire de mots
indiquant la frquence de chaque mot dans un corpus de
rfrence. Cette frquence peut s'exprimer en valeur
absolue ou en pourcentage. On utilise ce type de
dictionnaire pour comparer le corpus en cours d'analyse
la rfrence (Voir Comparer un lexique de rfrence).

Sphinx 2000

La construction des lexiques

271

Diffrents
dictionnaires
de mots

des mots outils

Lexique de rfrence

272

dexpressions

de groupements

Dictionnaire de codes

7. Lexique des expressions**


Mots composs et expressions
usuelles
La construction du lexique partir des formes graphiques
ignore les mots composs, locutions, ou expressions (
moins quelles naient t explicitement saisies comme
telles en utilisant le sparateur _ ).
La possibilit de dfinir des listes ou dictionnaires
dexpressions permet de les reprer dans le texte et de les
identifier comme tels en introduisant un sparateur
spcifique. On pourra alors gnrer une nouvelle variable
dans laquelle les expressions apparatront comme une
seule forme graphique.
Cette approche convient pour les mots composs ou
expressions usuelles rpertoris a priori dans des
dictionnaires. Les expressions ou formes dlocution
spcifiques certains contextes ne peuvent tre identifies
qua posteriori partir du constat de leur rptition
lidentique. Cest ce que permet la recherche des segments
rpts.

Lexique des expressions


Le lexique des expressions est rentr au clavier, constitu
partir dun dictionnaire dexpressions ou tabli par la
recherche des segments rpts. Il fait lobjet dune fentre
particulire ouverte dans latelier lexical par le menu
Lexique / Liste des expressions. Celui-ci ouvre une
fentre vierge dans laquelle on peut :
entrer au clavier les expressions recherches ;
reporter les lments dun dictionnaire dexpressions ;
lister les segments rpts trouvs dans le texte (bouton
Segments).

Documenter le lexique des


expressions partir dun dictionnaire
Le bouton Dictionnaire permet douvrir un dictionnaire
dexpressions que lon pourra dverser dans la fentre
(bouton -->Liste). Inversement, le bouton Ajouter permet
denvoyer dans le dictionnaire les expressions entres
dans la liste partir du clavier ou du calcul des segments
rpts.

Actions partir de la liste des


expressions
Comme pour le lexique des mots, on peut supprimer des
expressions, les classer, regrouper des expressions
quivalentes (bouton Variantes), et les sortir dans le
rapport ou l'imprimante (Transfrer).

Solidariser dans le corpus les


expressions de la liste
Le bouton Recoder permet de crer une nouvelle variable
texte dans laquelle les expressions de la liste seront
solidarises par le signe _. En ouvrant cette nouvelle
variable, les expressions apparatront comme une forme
graphique. (Vrifier que le caractre _ n'est pas dfini
comme sparateur).
Ce bouton permet galement de dresser dans une variable
nominale la liste des expressions du texte.

En regard de la liste dexpressions ainsi constitue,


saffiche le nombre doccurrences trouves dans le corpus.
On peut alors, comme pour le lexique des mots,
slectionner des lments et les retrouver dans le texte
(navigation lexicale).

Sphinx 2000

La construction des lexiques

273

Lexique des expressions

Ajouter au clavier
Remplir partir
dun dictionnaire

Remplir en cherchant
les segments rpts
Naviguer du lexique au
corpus
Regrouper des expressions

274

8. Rechercher les segments


rpts**
Tout texte comporte ses leitmotivs, sa langue de bois, ses
petites phrases... On peut les reprer en cherchant les
squences de mots rptes exactement l'identique. On
obtient ainsi :
les locutions : trs bien, peu prs... ;
les phrases ou lments de phrases rpts l'identique
: je ne pense pas, selon moi, il faut, il y a ;
les expressions toutes faites, caractristiques du domaine
tudi : bon repas en famille, bien manger...
Cette recherche permet galement de soulever de
nombreuses ambiguts. Cest un des temps forts de
lanalyse lexicale.

Rechercher les segments rpts


Pour viter l'examen de listes trop longues, on peut cibler la
recherche :
en fonction de la frquence de rptition (bouton
Frquence minimale) ;
en fonction de la prsence dans les segments de mots
dtermins, de mots marqus dans le lexique courant ou
de mots numrs par lutilisateur (bouton Contenant).
en ignorant les segments commenant par un mot outil
ou par lun des mots numrs par lutilisateur (bouton
Ne commenant pas par).
Pour lancer la recherche, procdez ainsi :
slectionnez dans le menu Lexique, la rubrique
Expressions, et activez Segments ;
fixez vos paramtres de recherche ;
par dfaut, la frquence minimum propose est gale la
rptition moyenne des mots du lexique ;
ciblez votre recherche en fixant les longueurs minimales
et maximales et en restreignant certains mots ou en
ignorant les segments commenant par un mot outil.

Cette dernire opration permet de faire toutes les


oprations autorises dans la liste dexpressions :
supprimer des segments sans intrt, naviguer dans le
corpus, retrouver le contexte dun segment (Voir
Concordances et lexiques relatifs).
On peut galement crer une nouvelle variable texte
solidarisant les segments, directement partir de la fentre
des segments (Relier) ou depuis la liste d'expressions
(Recoder, Texte modifi, Relier les mots de chaque
expression). En ouvrant cette nouvelle variable, les
segments rpts seront traits comme des mots.

Segments contraints et segments de


frquence 1
Pas trop et pas trop cher sont des segments contraints.
Pas trop apparat 6 fois et pas trop cher 3 fois. Le premier
est contenu dans le second. Mais leur frquence les
distingue. Ce phnomne est trs frquent et ncessite un
examen attentif des segments que lon souhaite retenir
pour lanalyse. Enfin, les mots composs napparaissant
quune fois chappent la recherche. On ne peut les
reprer qu'en utilisant un dictionnaire.

Solidariser les segments rpts


On peut crer une nouvelle variable texte dans laquelle les
segments rpts seront relis par le caractre _ . Ils
apparatront ainsi dans le lexique de la nouvelle variable
comme une seule forme graphique.
Pour effectuer cette opration, faites Recoder et choisissez
Texte modifi / Relier les mots de chaque expression.
L'analyse de cette nouvelle variable permettra de produire
un lexique tenant compte des segments rpts
significatifs.

Slectionner les segments significatifs


Les segments trouvs saffichent dans une fentre dont le
contenu peut tre class par ordre alphabtique ou par
longueur (Trier), imprim ou copi (Transfrer) selon les
procdures habituelles ou vers dans une liste
dexpressions (--> Liste dexpressions).

Sphinx 2000

La construction des lexiques

275

Rechercher les segments rpts

Dfinir les conditions


Editer
Crer une nouvelle variable
Ajouter au lexique des expressions

Exemple : Si vous gagniez au loto

276

Sphinx 2000

La construction des lexiques

277

Navigation
lexicale et
recherche de
contexte

278

1. Du lexique au corpus : la
navigation lexicale
La navigation lexicale sapparente la fonction dun hypertexte dont chaque mot serait lobjet dun renvoi possible.
On peut en effet, partir dun ou plusieurs mots marqus
dans le lexique ou dans le texte lui-mme :
retrouver toutes les rponses ou fragments de texte
contenant ce mot ou ces mots ;
afficher la valeur quelconque de lune des autres
variables pour situer le contexte de la rponse ;
dtailler toutes les donnes relatives la rponse ;
caractriser lemploi dun mot par la rpartition de telle ou
telle variable dans la strate des observations qui le
contiennent.
On a ainsi la possibilit d'oprer des slections pour
restituer des fragments de texte ou contrler l'interprtation
des termes mis en vidence dans le lexique. On peut le
faire en ne voyant qu'une rponse la fois ou en se plaant
dans une fentre dans laquelle tout le corpus s'affiche la
suite.

Vue par observation

Caractriser et dtailler les


observations
En cliquant sur un mot du texte, on fait apparatre un menu
qui permet d'obtenir des informations complmentaires sur
l'usage de ce mot :
voir l'environnement du mot dans l'ensemble des
observations qui le contiennent : concordances ou
lexiques relatifs (Environnement) ;
identifier toutes les observations contenant ce mot en les
caractrisant par rapport une autre variable
(Caractriser) ou en consultant toutes les informations qui
les concernent (Dtailler) ;
dcrire les proprits des observations concernes en les
codant dans une nouvelle variable (Dcrire).

Copier ou imprimer les lments


slectionns
L'article Copier du menu Edition copie le texte de
l'observation courante.
Pour diter toutes les rponses contenant un mot marqu,
utiliser loption Verbatim, dont les possibilits sont dcrites
dans le chapitre Produire des extraits.

L'article Observations du menu Vue ouvre une fentre


montrant le texte d'une seule observation la fois. On peut
complter par les donnes d'autres variables illustratives
(Illustrer). La hauteur de la fentre est modifiable en
dplaant le trait de sparation.
Sous la fentre, on lit les indicateurs statistiques
caractrisant l'observation.
Les flches permettent de passer d'une observation
l'autre. Si des mots sont marqus dans le lexique, la
navigation se fait selon la rgle choisie (Aller : d'un mot
marqu l'autre, d'une observations contenant tous les
mots marqus la prochaine...). On peut galement limiter
la navigation aux seules observations rpondant au profil
dfini par le bouton N (Voir aussi Modification /
Consultation).

Vue du corpus entier


L'article Observations du menu Vue ouvre une fentre
dans laquelle s'affichent la suite toutes les observations
qu'on peut faire dfiler avec l'ascenseur. Pour passer d'un
mot marqu l'autre, cliquez dans la fentre. Un menu
apparat dont l'article Marque suivante permet de passer
au prochain mot marqu.
Sphinx 2000

Navigation lexicale et recherche de contexte

279

Vue par observation

Donnes de contexte
Variable illustrative
Indicateurs statistiques

Navigation
Vue du corpus entier

Rgles de navigation

Editer les textes slectionns

280

2. Situer un mot dans son contexte


textuel
On peut examiner dune manire plus prcise
lenvironnement dun mot en concentrant lanalyse sur son
contexte immdiat : il peut sagir dun groupe de mots, de la
phrase ou de la rponse toute entire.
Dans le cas de rponses longues ou lorsque le texte a t
dcoup en paragraphes, il est prfrable de se limiter la
phrase ou la proposition.
On se place dans ce mode avec loption Environnement
de la liste droulante Vue.
On obtient le mme effet en faisant un double clic sur un
mot du lexique, ou en cliquant sur un mot dans le corpus.
Un menu contextuel s'affiche.

Voir le contexte immdiat


Lorsqu'on choisit Concordance, le contexte du mot pivot
s'affiche. Deux options de prsentation sont disponibles :
centrer les citations sur le mot pivot (case Mise en forme
coche) ou les aligner droite (case Mise en forme non
coche) ;
faire disparatre les mots ignors dans la construction du
lexique en cochant la case Texte rduit. Par exemple
pour ne pas montrer les mots outils.
On peut enfin signer la citation en affichant la valeur dune
autre variable choisie par Le bouton Illustrer.

Extraire des citations


Avec le bouton Transfrer, on peut indiffremment
imprimer le contenu de la fentre ou l'inclure dans le
rapport.

Choisir l'article Environnement pour voir le contexte du


mot choisi.
On tudie ainsi :
la concordance du mot tudi, cest--dire lensemble des
lments du texte contenant le mot. Ce procd
sapparente la production de verbatim ou de liste de
citations centres sur un mot particulier (Voir
Consulter/Modifier et Listes structures) ;
les lexiques relatifs droite et gauche du mot tudi.
Deux boutons permettent de passer dune analyse
lautre. Il convient de fixer ltendue du contexte quon
souhaite analyser en agissant sur le bouton Apparier.

Fixer ltendue du contexte


Cette tendue est dtermine par des sparateurs de
groupes de mots, de phrases et de rponses.
Le dialogue propos par le bouton Apparier permet de :
spcifier des ensembles de sparateurs. Par dfaut, le
Sphinx considre 3 sparateurs de phrase : . ! ? . On
peut modifier ces ensembles au clavier ;
choisir le niveau de contexte dsir : groupe, phrase,
rponse pour fixer ltendue du contexte analyser
autour du mot choisi. Ds quun des sparateurs est
rencontr, on arrte lextraction.

Sphinx 2000

Navigation lexicale et recherche de contexte

281

Fixer ltendue du contexte

Concordance

Double clic dans le lexique

Lexiques relatifs

282

Mot pivot

3. Les lexiques relatifs**


La liste des citations illustrant lemploi dun mot peut tre
trs longue. Les lexiques relatifs permettent un examen
synthtique en faisant ressortir les mots avec lesquels le
mot pivot est le plus frquemment associ.
Le principe consiste construire un ou plusieurs lexiques
prsentant la liste des mots se trouvant telle position par
rapport au mot pivot choisi.
Le bouton-radio Lexiques relatifs ouvre la fentre des
lexiques relatifs. Par dfaut, elle prsente 2 lexiques :
gauche et droite, pour les positions 2 mots avant (-2), 1
mot avant (-1), 1 mot aprs (1), 2 mots aprs (2).

Dfinir le nombre et la position des


lexiques relatifs
Le bouton Compter permet de modifier les lexiques relatifs
en :
fixant le nombre de lexiques (boutons-radios 1, 2, 4) ;
indiquant pour chaque lexique la position par rapport au
mot pivot des mots recenser.
Dans l'exemple ci-contre, 4 lexiques sont dfinis
correspondant aux positions -1, +1, +1, +2 par rapport au
mot pivot.
Par dfaut, les lexiques sont prsents par ordre
doccurrences dcroissantes. On peut complter la
statistique des occurrences relatives une position par :
le nombre total doccurrences du mot dans le corpus
(quelle que soit sa position) : Nombre total
doccurrences ;
le pourcentage dapparition du mot la position
considre par rapport au nombre total d'apparitions dans
le corpus (quelle que soit la position) : Pourcentage dans
le lexique relatif. Cest un indicateur de dpendance
linguistique par rapport au mot pivot.

Interprter les lexiques relatifs


Lexemple ci-dessous donne des lexiques relatifs
lenvironnement du mot France utilis dans les deux livres
de la campagne 1995 de Jacques Chirac. France y
apparat 12 fois sur un corpus total de 35 247 mots.
Environnement -1 3
pivot -1 +3
242 mots - 283 occ
pays 6 ( 6.82% ; 88)
Europe 4 ( 7.14% ; 56)
avenir 3 ( 11.54% ; 26)
chang 3 ( 17.65% ; 17)
doit 3 ( 4.05% ; 74)
Franais 3 ( 2.91% ; 103)
monde 3 ( 6.38% ; 47)
nouvelle 3 ( 15.00% ; 20)
puissance 3 ( 15.79% ; 19)

Le lexique de -1 +3 affiche les 3 indicateurs. Ils montrent


notamment que les mots nouvelle, puissance, chang sont
plus souvent associs France que Europe : Europe est 4
fois dans lenvironnement de France pour un total de 56
apparitions, ce qui indique une faible dpendance
linguistique (7,14 %).

Lexiques relatifs et segments rpts


Le lexique relatif peut donner une ide des segments
rpts, quil ne reprsente pas exactement. Il peut
cependant tre utile de mener une exploration pralable
partir des lexiques relatifs.

Prsenter les lexiques relatifs


Le bouton Classer permet dafficher les lexiques relatifs
par ordre alphabtique ou par ordre dapparition des mots
dans le corpus. Le bouton Rduire permet, dans ce
contexte galement, dignorer ou de rtablir les mots outils.
Le bouton Transfrer donne les possibilits habituelles
dinclusion dans le rapport, de copie dans le presse-papiers
et dimpression.
Sphinx 2000

Navigation lexicale et recherche de contexte

283

Dfinir les lexiques relatifs

Nombre
Positions par rapport au pivot

Indicateurs statistiques

4 lexiques avant et aprs

Lexique de l'environnement -2 +2

284

4. Production d'extraits
Dans Plus et Lexica, la production d'extraits offre de plus
grandes possibilits que dans Primo, notamment car elle
peut tre guide partir d'une slection de mots dans le
lexique. En la lanant depuis l'atelier lexical, on peut
slectionner beaucoup plus finement les extraits selon leur
contenu.

Le dialogue abrg

Fixer l'tendue de l'extrait


Selon l'option slectionne dans Apparier, l'tendue de
l'extrait est fixe la rponse entire, la phrase ou au
groupe de mots. Quand le texte des observations est long,
il est intressant de limiter l'extrait de la phrase contenant
le mot.

Structurer la prsentation des extraits

Aprs avoir slectionn les lments du lexique, dont la


pertinence peut tre vrifie grce la navigation lexicale,
une action sur le bouton Verbatim ouvre un dialogue
abrg dans lequel on fixe les lments diter (Mots ou
Textes). Mots pour les lments du lexique, Textes pour
les rponses ou extraits correspondants. On peut
complter ventuellement les critres de slection en
prcisant les options de prsentation. Les extraits ainsi
slectionns apparaissent dans une fentre dont le
contenu peut tre imprim grce au bouton Transfrer.
Le dialogue abrg permet de trier les textes contenant des
mots marqus selon les modalits d'une variable de
contexte tout en se limitant ventuellement ceux qui
rpondent un profil dfini.
Une version plus complexe du dialogue est accessible avec
le Sphinx Lexica. Cliquer sur licne Options pour le faire
apparatre. Elle offre les possibilits suivantes :

Le dialogue complet
Le dialogue tendu offre de nombreuses possibilits :
restreindre aux observations contenant des mots
marqus dans le lexique : cochez lun des boutons Les
lments concerns ou Tous les lments. La slection
des extraits se fait en fonction de la rgle de navigation
lexicale retenue ;
fixer le contenu des extraits (cadre Contenu) : afficher le
texte de la variable tudie et ou celui d'une autre
variable ;
afficher la valeur des mesures lexicales relatives
lobservation : nombre de mots de lobservation (M),
nombre de mots marqus (MM), banalit de lobservation
(frquence moyenne des mots de la rponse), intensit
des mots marqus (MM/M) ;
mettre les mots marqus en majuscules.

Sphinx 2000

Ci-contre un exemple daffichage. Le mot manger est le


mot slectionn. Les premires indications documentent la
rponse : mesures lexicales, variable illustrative.

Regrouper selon les modalits de la variables illustrative :


ceci permet de prsenter les extraits par catgorie de
locuteurs.
Classer : par dfaut, l'affichage se fait dans lordre
d'apparition. On peut galement choisir de les prsenter
selon les indicateurs suivants : Nombre de mots, Nombre
de mots marqus, Banalit de la rponse (pour afficher
les rponses des plus communes au plus originales),
Intensit des mots marqus (pour faire ressortir lintensit
du thme correspondant aux mots slectionns dans le
lexique).

Rduire le nombre dextraits


Limiter aux phrases contenant un mot marqu : quand
les observations contiennent plusieurs phrases, on gagne
en lisibilit et pouvoir de dmonstration (Voir Apparier pour
jouer sur les sparateurs).
Limiter un nombre dtermin dextraits : enlever les
rponses similaires. Deux rponses sont considres
comme similaires si elles contiennent les mmes mots.
Les rgles dassimilation de 2 rponses sont paramtrables
par le bouton Rgles. On peut ainsi :
limiter la comparaison aux mots marqus ;
tenir ou ne pas tenir compte de lordre et du nombre
doccurrences des mots.
Les groupes sont lists avec l'indication du nombre de
rponses similaires prcd du signe #. A titre d'exemple,
le texte de l'une des rponses est cit.

Navigation lexicale et recherche de contexte

285

Dialogue abrg
Dialogue complet

Nb de rponses similaires

286

5. Rsum des diffrentes


manires de produire des extraits
En rsum, voici les diffrentes manires dans le Sphinx
de slectionner des extraits.

en listant les rponses caractristiques (Mots spcifiques,


Rponses caractristiques).
Il faut enfin noter la possibilit, dans la fentre
Caractriser les observations, de lister les rponses de
chaque cellule d'un tableau ou dans l'atelier lexical celles
caractrisant les effectifs utilisant tel ou tel mot
(Caractriser).

Slection selon la variable


Avec Dpouiller / Produire des listes, on choisit la ou les
variables dont on veut extraire le contenu en le restreignant
ventuellement un profil donn. On peut jouer sur la
prsentation : format liste ou table, fiches personnalises.

Slection en fonction du contenu


Dans latelier lexical, on peut faire de la Navigation
lexicale partir des mots marqus, puis Copier le contenu
de la fentre courante. Trs utile pour noter la vole le
contenu d'une observation la fois.
Extrait de lenvironnement dun mot pivot (Environnement,
Co-occurrences ou lexiques relatifs). Permet de situer
un mot dans son contexte pour en apprcier les variations
smantiques.
Verbatim permet de prsenter l'ensemble des extraits
relatifs aux mots marqus dans le lexique. Idal pour faire
du verbatim, pour restituer des rponses.
Cette fonction offre de nombreuses possibilits :
restreindre l'extrait la phrase. Trs utile dans le cas de
rponses longues ;
complter par des variables illustratives ;
classer selon des indicateurs statistiques (banalit,
longueur...) ;
rsumer en regroupant les rponses similaires.

Slection en fonction du contexte


En se plaant dans une strate (Changer de strate) et en
oprant comme ci-dessus, on limite les productions
d'extraits la strate slectionne.
On peut galement procder de manire plus directe :
en restreignant le contenu des Listes structures la
dfinition dun profil (Uniquement les observations telles
que) ;
en restreignant le Verbatim la dfinition dun profil
(Rduire un profil) ;
Sphinx 2000

Navigation lexicale et recherche de contexte

287

Dpouiller en produisant des listes

Atelier lexical : Verbatim

Atelier lexical : Environnement

Tableaux : Caractriser

288

Sphinx 2000

Navigation lexicale et recherche de contexte

289

Analyse
syntaxique et
lemmatisation
**

290

Rsoudre les ambiguts smantiques

1. La lemmatisation
Principes de la lemmatisation
Lapproximation du contenu d'un texte par ses seules
formes graphiques lmentaires peut conduire des
contresens ou laisser planer une grande ambigut.
Lanalyse syntaxique permet de rsoudre correctement les
ambiguts lies la syntaxe. En appliquant les rgles de
la grammaire, on peut, dans la plupart des cas, distinguer
verbes, substantifs, adjectifs, et leur substituer leur forme
racine (singulier dun substantif, infinitif dun verbe par
exemple), mais aussi identifier les mots composs et les
locutions.
Voici un exemple illustrant ce procd :
Corpus et lexique originaux
Jai aperu les grands avions que
nous avions vus hier avec grand
pre
avions (2), aperu, avec, grand,
grands, hier, j, pre que, les, nous,
vus

Corpus et lexique lemmatiss


Je apercevoir_v le grand_a
avion_n que nous avoir_v,
voir_v hier_n avec grand_pre_n
apercevoir_v, avoir_v, avec,
avion_n grand_a, grand_pre_n,
hier_n, je, que, le, nous, voir_v.

Dans le lexique lemmatis et rduit, on voit le mot avance


cit 54 fois. Il sagit du substantif avance (lavance
technologique) et non du verbe avancer (il avance plus
vite). Lanalyse syntaxique permet ainsi de rsoudre les
ambiguts smantiques. Elle permet aussi de distinguer
les mots composs et les locutions.

Identifier les formes grammaticales et


les locutions
Dans lexemple prcdent, la marque du statut grammatical
napparat pas, car, pour des raisons de lisibilit, le tiret du
suffixe grammatical a t dclar comme sparateur de
mots.
En procdant diffremment, on peut faire apparatre la
suite de chaque mot son suffixe grammatical. Cela permet
trs rapidement de produire un lexique restreint aux Verbes
(_V), aux Adjectifs (_A), aux substaNtifs (_N), aux
adverBes (_B), aux mots Grammaticaux (_G).

Lambigut entre avions (avoir) et avions (aroplanes)


disparat dans le corpus lemmatis. Le statut grammatical
des mots est en outre signal par les suffixes _N, _V...

Rduire la forme graphique au mot


racine
La lemmatisation permet ainsi de substituer au lexique
initial un lexique beaucoup plus efficace dans la phase
dapproximation lexicale. Ci-contre on peut comparer, pour
un corpus de 2 378 slogans publicitaires comportant 15
610 mots, le haut du lexique original au lexique lemmatis.
Chaque forme graphique a t remplace par sa forme
canonique ou racine : le singulier pour un substantif ou un
adjectif, linfinitif pour un verbe. Ainsi, par exemple, toutes
les formes le, la l, les, une partie des du sont regroupes
sous la forme racine le. Les diffrentes flexions du verbe
tre (est, sont, ...) apparaissent linfinitif dans le lexique
lemmatis. Les singuliers et pluriels ont t regroups :
ainsi par exemple, homme et meilleur napparaissent
quune fois dans le lexique lemmatis regroupant les
effectifs des formes originales singulires et plurielles.
Sphinx 2000

Analyse syntaxique et lemmatisation**

291

Corpus lemmatis
Corpus lemmatis avec
indication des catgories
syntaxiques

Lexique brut et lemmatis : exemple des slogans publicitaires.

292

2. Lancer la lemmatisation
Lanalyseur syntaxique
Le lemmatiseur intgr au Sphinx est l'analyseur
syntaxique SYLEX, dvelopp par la socit Ingnia
Langage Naturel. Il est constitu dun analyseur syntaxique
et dun dictionnaire. Le dictionnaire franais contient 61 400
entres, 521 400 formes lexicales et 25 600 locutions. Une
version anglaise de lanalyseur syntaxique et un
dictionnaire danglais sont galement disponibles sur
demande.
La lemmatisation consiste faire lanalyse syntaxique de la
variable. Une nouvelle variable contenant la version
lemmatise du corpus sera ajoute la base de donnes.
Cette variable pourra tre ouverte et analyse comme
nimporte quelle autre variable texte.
On accde au lemmatiseur par le bouton Lemmatiser.

Options de lemmatisation
Lanalyseur syntaxique procde par tape. Il dtermine le
statut du mot, recherche sa forme racine et tablit une
nouvelle phrase compose des formes racines. Ces
nouvelles phrases forment le corpus lemmatis. Les
options disponibles sont les suivantes :
Filtrer des mots grammaticaux : les mots grammaticaux
napparatront pas dans le texte lemmatis. A la
diffrence de la rduction du lexique par les mots outils,
cette option a pour effet de faire disparatre du nouveau
corpus les mots grammaticaux ;
Reprer les locutions usuelles : elles figureront dans le
nouveau corpus relis par un tiret : pomme_de_terre ;
Indiquer la catgorie des mots : chaque mot sera
attach lun des suffixes qui le caractrise : _V pour le
Verbe, _N pour un Nom commun, _P pour un nom
Propre, _A pour un Adjectif, _B pour un adverBe, _G pour
un mot Grammatical.
Des conditions syntaxiques supplmentaires peuvent tre
ajoutes en cliquant sur le bouton Grammaire
complmentaire.

Sphinx 2000

Faire un essai
Lanalyse syntaxique met en uvre des techniques de
lintelligence artificielle, elle peut prendre quelques minutes
pour un texte trs long, surtout si votre machine nest pas
trs rapide. Vous pouvez vous faire une ide en ne
lemmatisant quune partie du texte. Placez-vous sur
lobservation de votre choix et cliquer sur le bouton Aperu
pour lemmatiser le fragment correspondant.

Cration dune nouvelle variable


contenant le texte lemmatis
Le bouton Lemmatiser lance la lemmatisation du corpus
entier.
Le rsultat saffiche dans une fentre o vous pouvez
contrler et ventuellement modifier le rsultat. En effet,
lanalyse syntaxique nest pas un procd fiable 100 %,
certaines ambiguts ne peuvent tre rsolues : les fautes
de frappe ou dorthographe sont un obstacle, le texte peut
contenir des mots inconnus... Si c'est ncessaire, vous
pourrez directement entrer vos corrections au clavier.
Pour analyser le texte que vous avez sous les yeux, cliquer
sur le bouton Etudier le texte lemmatis. Cette action
cre une nouvelle variable et vous met en position pour
l'analyser.

Analyse syntaxique et lemmatisation**

293

Corpus dorigine

Choisir les options de lemmatisation

Contrler, corriger

Crer une nouvelle variable

Corpus lemmatis

294

3. Analyser un texte lemmatis


Il est trs souvent prfrable deffectuer lanalyse dune
variable texte sous sa forme lemmatise. Lapproximation
lexicale partir des mots les plus frquents du corpus sera
de bien meilleure qualit. Cest notamment le cas lorsquil
sagit dun texte comportant une syntaxe : rponses des
questions ouvertes formules sous forme de phrases,
interviews non directives, textes rdigs ou littraires.
Nanmoins, cela peut faire perdre certaines nuances trs
importantes vhicules par des diffrences que la
lemmatisation fait disparatre (parler de la femme ou des
femmes, de finance ou de finances...).

Rechercher les caractristiques de


lnonciation
Le travail sur un texte lemmatis facilite grandement ltude
de lnonciation :
usage des pronoms personnels (je et j se trouvent
regroups) ;
utilisation des adjectifs, adverbes... ;
travail sur les substantifs et les verbes pour dceler la
prsence de telle ou telle caractristique des actes de
langage. Comme en PNL (Programmation Neuro
Linguistique), rechercher les champs lexicaux visuels,
kinesthsiques, auditifs..., les traits positifs, ngatifs...

Afficher le texte dorigine en mme


temps que le texte lemmatis
Pour faciliter la navigation lexicale sur un texte lemmatis, il
est utile de faire apparatre le texte de la variable dorigine
(utiliser la squence N / Illustrer par la variable) dans la
fentre dinformation sur lobservation courante (si
ncessaire, cliquer dans cette zone pour voir la suite du
texte).

Utiliser le type grammatical des mots


Les substantifs dnomment les choses, les objets, la
scne, le monde. Les noms propres voquent les
personnages, acteurs, lieux et objets personnifis. Les
verbes
indiquent
laction,
le
mouvement,
les
transformations, et les adjectifs les apprciations, les
valuations, les jugements...
En travaillant sur un corpus lemmatis dot des marques
grammaticales, il est trs facile par exemple de dnombrer
la prsence de chaque type grammatical ou de dresser des
listes selon le type.
Limportance relative dans un texte de chacune de ces
catgories peut apporter beaucoup dinformations,
notamment pour qualifier dventuelles variations selon
lorigine (qui rpond ?) ou selon la partie ( quel moment
de largumentation ?)...
A partir du panneau lexical, vous pouvez automatiquement
obtenir la liste des mots les plus frquents classs selon
leur statut grammatical. Cette fonction automatise des
oprations que vous pouvez affiner dans l'atelier lexical.

Sphinx 2000

Analyse syntaxique et lemmatisation**

295

Corpus
lemmatis

Corpus
dorigine

Raccourcis du
panneau lexical

296

4. Modifier le corpus
On peut directement apporter des modifications dans le
corpus. Le plus souvent, on le fera pour corriger des fautes
de frappe ou des fautes d'orthographe. A cet gard,
lorsqu'on travaille sur des textes imports, on a tout intrt
les soumettre au pralable au correcteur orthographique.

Corriger ou annoter le texte


Le bouton Modifier permet dcrire dans la fentre du
corpus et de le corriger. Outre la correction des fautes de
frappe, cette possibilit est trs utile pour :
grer les polysmies : par exemple dans un corpus de
slogans publicitaires, le mot aimer peut exprimer le got
ou le sentiment amoureux. On peut distinguer ces 2
formes en ajoutant par exemple une marque spcifique
lune des significations. On ajoutera par exemple un $
lorsquil sagit du sentiment ;
faire des annotations dans le texte. On peut ainsi faire de
lanalyse de contenu la manire classique en lisant les
rponses et en notant dans un langage cod (mots
prcds par un caractre particulier & par exemple) les
thmes rencontrs. On retrouvera trs facilement
lensemble des thmes marqus partir du caractre qui
les distingue, pour enfin crer une nouvelle variable
ferme sur ces thmes (Voir le bouton Recoder).
Aprs chaque modification ou annotation, le texte est
reconstruit et de nouveau enregistr. Pour gagner du
temps, dcocher la case Reconstruire immdiatement le
lexique. Dans ce cas, la fin de vos modifications, activer
le bouton Rtablir pour que le lexique prenne en compte
les modifications apportes.

Remplacer
Cette fonction est analogue celle des logiciels de
traitement de textes. Elle est trs utile pour faire des
substitutions systmatiques. On y accde par le bouton
Remplacer de la barre doutils.

Reconstruire le lexique
Tant que vous n'avez pas revenir sur le lexique des fins
d'interprtation, vous n'avez pas intrt cocher le bouton
Reconstruire immdiatement le lexique car cela peut
ralentir inutilement le travail.

Sphinx 2000

Analyse syntaxique et lemmatisation**

297

Modifier le corpus

Entrer les modifications au clavier

Reconstruire le lexique ou non

298

Sphinx 2000

Analyse syntaxique et lemmatisation**

299

La statistique
lexicale**

300

1. Les indicateurs lexicaux


Avec l'extraction du lexique, le logiciel calcule les
indicateurs statistiques qui guident l'utilisateur dans son
travail d'interprtation.

Statistiques des formes graphiques


(mots)
Avec le bouton Compter, on choisit les indicateurs affichs
dans le lexique en regard de chaque mot :
Nombre doccurrences : cest le nombre de fois o un mot
apparat dans le corpus. On le note mi,. i est l'indice du
mot.
Nombre dobservations : cest le nombre dobservations
ou fragments contenant au moins une fois le mot. Il est
not oi. Comme un mot peut apparatre plusieurs
reprises dans une observation, on a mi >=oi.

Statistiques relatives au lexique


Taille du lexique. : c'est le nombre de mots diffrents
prsents dans le corpus, elle donne une indication sur la
richesse du vocabulaire. Elle est note l. Cette valeur,
affiche en bas droite de la fentre du corpus, est
calcule sans les mots outils si ceux-ci ont t ignors et
sans les mots supprims. Les nombres de mots ignors
et supprims figurent entre parenthses.
Nombre de mots marqus : ces mots sont utiliss pour le
calcul du pourcentage de lecture du corpus et des
intensits lexicales.
Pourcentage de lecture du corpus : c'est le rapport entre
le nombre doccurrences cumules des mots marqus et
la taille du corpus total. PL = 100 * m / c avec c : taille
du corpus, m indice des mots marqus. Il donne une
indication de la fraction du corpus, vue par les termes
slectionns dans le lexique.

Rptition moyenne : c'est le nombre de fois qu'un mot


se trouve en moyenne rpt dans le texte. Rep = c / l.
Selon le cas, le calcul est effectu en ignorant les mots
outils ou les mots supprims. La valeur de la rptitivit
calcule sur la totalit du lexique et du corpus est donne
entre parenthses.

Statistiques relatives l'observation


Pour chaque observation, on lit dans le cadran situ en bas
de la fentre :
La taille de l'observation, en nombre de caractres et de
mots (r) et le nombre de mots marqus (m) qu'elle
contient.
La banalit : c'est le nombre moyen d'occurrences dans
le corpus, des mots prsents dans la rponse : b = (r) /
r avec (r) indice des mots de la rponse et r taille de
l'observation. Elle mesure aussi la rptition moyenne
des mots utiliss. Plus elle est leve, plus la rponse est
banale. La banalit est comprise entre 1 pour une
observation ne contenant que des hapax et le nombre
d'occurrences du mot le plus frquent (pour le cas d'une
observation qui ne contiendrait que ce mot).
L'intensit des mots marqus : c'est le rapport entre le
nombre de mots marqus et le nombre de mots de la
rponse ou du fragment (100* m/r). Cet indicateur permet
d'apprcier l'intensit avec laquelle il fait rfrence au
thme correspondant aux mots marqus dans le lexique.

Statistiques relatives au corpus


Taille du corpus : c'est la longueur du texte, elle donne le
nombre total de formes graphiques qui le composent. c =
i . Le calcul ne tient pas compte des mots ignors (mots
outils) ou supprims. S'il y en a, ils figurent entre
parenthses.

Sphinx 2000

La statistique lexicale**

301

Nb. occurrences

Nb. observations

Stat. des mots


marqus

Stat. globales

Stat. de l observation

pourcentage de
lecture des mots
marqus

302

2. Bilan lexical
Au stade du traitement, le tableau rcapitulatif des
variables textes donne, pour chaque variable, la taille du
corpus (nombre de mots), celle du lexique (nombre de
mots diffrents), et la longueur moyenne d'une observation
(nombre de mots moyens...). Ce tableau est trs utile pour
comparer la manire dont ces variables sont documentes.

Poids relatif du corpus des diffrentes catgories : ces


indicateurs donnent une ide de la manire dont les
zones de langage se recoupent : l'intersection d'une
ligne et d'une colonne, on lit le pourcentage de lecture du
corpus de la catgorie en colonne, par le lexique qu'il a
en commun avec la catgorie en ligne. Dans l'exemple cicontre, on constate que le lexique que les employs
partagent avec les cadres moyens couvre 67% du corpus
des cadres moyens, alors qu'il ne couvre que 53% de
celui des employs.

Dans l'atelier lexical, on peut aller plus loin en comparant


les caractristiques lexicales de la variable tudie selon
les catgories dfinies par une autre variable (variable de
contexte).

Lancer le bilan lexical


Aprs avoir ventuellement rduit et agrg le lexique, on
choisit Bilan par contexte dans le menu Vue, puis on
slectionne la variable de contexte. On peut, dans la liste
des modalits de la variable choisie, dslectionner celles
qui ne nous intressent pas ou slectionner nouveau
celles qui nous intressent (Ctrl + clic).

Indicateurs propres chaque contexte


Les 2 premires sries d'indicateurs donnent des
informations propres chaque contexte :
Indications globales et de tendances : effectifs, nombre
de mots, mot le plus frquent (cette dernire information
est significative quand on a ignor les mots outils).
Moyenne et dispersion : longueur moyenne, nombre de
mots diffrents, rptition, nombre de mots uniques
(hapax).
Les indicateurs suivants mettent l'accent sur les points
communs et diffrences entre contextes :
Nombre de mots communs toutes les catgories et
nombre de mots exclusifs de chaque catgorie : par
diffrence avec le nombre total de mots, on obtient le
nombre de mots partags (mais d'une manire partielle).

Sphinx 2000

La statistique lexicale**

303

1 / Eventuellement rduire le lexique

Bilan lexical

2/ Choisir les contextes

Analyser les zones


de langage

cadres moyens

304

employs
employs

ouvriers

3. Construire un tableau lexical


Pour mettre en vidence les diffrences d'usage du
vocabulaire selon l'identit des locuteurs, selon les parties
d'un document, ou selon toute autre variable de contexte,
on construit un tableau lexical. Ce tableau dispose en ligne
les lments lexicaux et en colonne les catgories dfinies
par les modalits dune variable nominale. On peut ainsi
dnombrer la frquence de chaque terme pour chaque
catgorie.

Dfinition du tableau
Pour dfinir les lignes du tableau, il faut marquer dans le
lexique les mots qui figureront en ligne dans le tableau puis
slectionner Tableau lexical dans le menu Vue.
Le dialogue qui apparat permet de choisir la variable selon
laquelle ventiler le lexique en cours d'analyse. On peut se
limiter certaines catgories en slectionnant celles qui
nous intressent dans la liste des modalits. Le bouton
Croiser permet de slectionner une autre variable.

Choix des indicateurs calculer


Le bouton Compter permet de choisir les indicateurs
afficher :
Les effectifs : cest laffichage par dfaut. Il donne l'effectif
de chaque catgorie. La dernire colonne fait la somme
des effectifs en ligne. Si toutes les modalits n'ont pas t
slectionnes, elle est diffrente de l'effectif sur
l'ensemble du corpus.
Les % en ligne : ils donnent une indication sur la
rpartition entre modalits. Cette rpartition dpend
videmment de leffectif des modalits. L'indice de
spcificit permet de prendre la mesure de cet effet.
Les indices de spcificit : lindicateur de spcificit est le
rapport entre le nombre dutilisations observes et le
nombre thorique dutilisations tel quil rsulterait dun
emploi proportionnel au nombre total de mots prononcs
par la catgorie considre. Les termes spcifiques d'une
catgorie (sur utiliss par cette catgorie) ont un indice
suprieur 1. Les termes exclusifs sont suivis de *. Les
mots sous reprsents ont un indice infrieur 1.

Sphinx 2000

Modification des lignes ou colonnes


du tableau lexical
A moins davoir des ides a priori bien arrtes pour ne
sintresser qu un petit sous-ensemble du lexique,
lanalyse dun tableau lexical conduit examiner de grands
tableaux. Il est intressant de rduire la dimension de ces
tableaux en slectionnant les mots intressants ou en se
limitant au termes les plus significatifs par leur effectif
(frquence absolue, spcificit...).
On modifie les lignes du tableau en jouant sur les termes
slectionns dans le lexique (utiliser la touche Esc pour
revenir au lexique) ou en utilisant le bouton Slect (Voir
Slections dans un tableau lexical). On peut changer les
colonnes en revenant sur la slection des modalits avec le
bouton Croiser. On dite avec Transfrer.

Poursuivre l'analyse du tableau lexical


Le bouton Analyser transfre le tableau dans
l'environnement d'analyse des tableaux croiss. On pourra
approfondir l'analyse (Chi, AFC) et illustrer les rsultats
par des graphiques ou des cartes situant les locuteurs par
rapport au vocabulaire employ.
Retour l'atelier lexical par le bouton Lexique.

La statistique lexicale**

305

1/ Marquer les mots dans le lexique


2/ Choisir la variable de contexte

3/ Slectionner les mots significatifs

4/ Analyser

306

Tableau lexical

4. Listes des mots spcifiques


Un tableau lexical peut tre prsent de manire plus
directe en dressant, pour chaque colonne du tableau, la
liste des mots utiliss par la catgorie correspondante. On
peut ainsi chercher quels sont les mots qui distinguent
chaque catgorie et analyser la variation des noncs
selon les parties du texte, selon les locuteurs, ou selon les
catgories de rpondants, cest--dire selon le contexte.

Produire des listes de mots


spcifiques
Pour obtenir la liste des mots spcifiques un contexte,
allez dans la liste Vue et choisir Mots spcifiques.
Comme pour un tableau lexical, choisissez la variable de
contexte et / ou les modalits retenir. Si cette variable est
numrique, l'ge par exemple, commencez par dfinir des
classes (Recoder, Mettre les numriques en classes). Le
bouton Croiser permet de changer la variable slectionne
pour le croisement.

Prsenter les listes

En bas de la fentre des mots spcifiques, on peut lire le


nombre total de mots retenus. On peut ainsi contrler la
svrit des slections.
Les boutons Analyser, Marquer, Rduire fonctionnent
exactement comme dans la fentre du tableau lexical :
Analyser pour poursuivre l'analyse en produisant des
cartes d'AFC dans l'environnement d'analyse des tableaux
croiss, Rduire pour liminer les mots outils du lexique.
Marquer permet daller marquer dans le lexique les mots
slectionns. Ceci est ncessaire si on veut examiner leur
environnement textuel, les ajouter dans un dictionnaire ou
faire toute autre opration sur ce lexique particulier.

Les rponses caractristiques


Les rponses caractristiques d'une catgorie sont celles
qui contiennent le plus de mots spcifiques cette
catgorie. Grce un calcul effectu sur les indices de
spcificit, on peut ainsi sortir, pour chaque catgorie, la
liste des rponses qui la caractrisent le mieux.
Pour lancer la recherche des rponses caractristiques,
activez le bouton Rponses caractristiques qui se
trouve en bas gauche de lcran.

Le Sphinx calcule le tableau lexical et affiche directement la


liste des mots propres chaque contexte en appliquant les
paramtres courants de slection (Voir Slections dans
un tableau lexical). On peut faire afficher les frquences
ou l'indice de spcificit en utilisant le bouton Compter qui
permet galement de paramtrer le calcul de lindice de
spcificit (Voir Indices de spcificit).
Le bouton Classer permet dafficher la liste des mots selon
l'ordre du lexique courant ou par ordre dcroissant des
valeurs de l'indice de spcificit.

Slectionner les termes


Outre la slection pralable effectue dans le lexique, le
bouton Select permet d'affiner les conditions de slection :
les mots exclusifs de chaque catgorie ;
les mots communs toutes les catgories ;
les mots communs certaines catgories seulement.
Ces choix peuvent tre complts par des conditions sur
les effectifs et/ou sur la spcificit (Voir Slection dans un
tableau lexical).

Sphinx 2000

La statistique lexicale**

307

1/ Marquer les mots dans le lexique


2/ Choisir la variable de contexte

3/ Affiner les conditions de slection


4/ Sortir les rponses caractristiques

308

Liste de mots spcifiques


Nb. Occurrences

Indice de spcificit

5. Slections dans un tableau


lexical ou dans des listes de mots
spcifiques
La recherche des caractristiques lexicales d'un tableau
lexical ou de listes de mots spcifiques permet de mettre
en vidence les zones de langage, le jargon, ou le langage
commun. C'est un temps fort de l'analyse lexicale. On peut
procder de manire systmatique et aveugle avec
l'inconvnient de produire des tableaux et listes trs longs
examiner et dont les lments ne sont pas forcment
significatifs.

Procder d'une manire slective


Le logiciel permet, par les actions sur le lexique et par un
dialogue de slection (Slect), de cibler la recherche :
Slectionner les lments lexicaux en fonction de leur
contenu smantique : on travaillera de prfrence sur le
texte lemmatis, ou mieux encore sur une seule catgorie
syntaxique (nom, verbe...). On a tout intrt liminer les
mots outils ou termes vides, effectuer des
regroupements, ou slectionner les termes les plus
significatifs. Ce travail s'effectue dans le lexique par les
boutons Supprimer, Regrouper, Marquer.
Filtrer par la statistique en tenant compte de 3 critres : la
prsence dans une seule catgorie, toutes les catgories
ou certaines seulement, la frquence et la spcificit.

Limiter par la frquence


La case cocher Seuil de frquence permet de
n'examiner que les termes suffisamment frquents dans le
corpus (on peut par exemple ne retenir que les termes de
frquence suprieure la moyenne). Cette condition peut
tre nuance en l'imposant chaque catgorie ou une au
moins.

Tenir compte de la spcificit


La spcificit indique dans quelle mesure un terme est surreprsent ou sous-reprsent dans une catgorie.
L'indicateur est gal 1 si la proportion dans laquelle il est
utilis est la mme que sur l'ensemble du corpus. Si le
terme est sur-employ, lindicateur est suprieur 1. Il est
infrieur 1 dans le cas inverse.
On peut fixer un seuil et choisir de ne tenir compte que des
termes de spcificit positive (case Positive coche). En
cochant galement Ngative, on retient tous les termes
sur-reprsents (marqus +) ou sous-reprsents
(marqus -). Les exclusifs sont marqus dun *.

Combiner les critres de slection


On joue sur l'ensemble de ces critres en les combinant.
On rduit indiffremment la slection en jouant sur le seuil
de spcificit ou sur la frquence. Le nombre de mots
slectionns peut orienter la recherche. Cette indication
figure au bas de la fentre.

Slectionner selon le sens


La case cocher Uniquement les mots marqus permet
de faire la slection dans le lexique. Seuls les mots
marqus figureront dans le tableau ou les listes. Si aucun
mot n'est marqu, le lexique entier est analys. Le bouton
Marquer ralise l'opration inverse en marquant dans le
lexique les mots slectionns grce la statistique.

Choisir les zones de langage


Les 3 cases cocher Inclure les mots exclusifs d'une
catgorie, Inclure les mots communs toutes les
catgories, Inclure les mots communs certaines
catgories permettent de concentrer l'analyse sur des
zones de langage particulires ; ce qui est essentiel du
point de vue de la communication.

Sphinx 2000

La statistique lexicale**

309

Slection dans le tableau lexical


et la liste de mots spcifiques
Identifier les zones de langage

Limiter par la spcificit

Limiter par la frquence

Limiter selon le sens des mots


Limiter par longueur de la liste
Effectifs

Mot sur-reprsent

Mot sous-reprsent

Mots exclusifs

Nb. de mots retenus

310

Indice de spcificit

Choisir un seuil de slection

6. L'indice de spcificit
Dans le Sphinx, les calculs de spcificit sont utiliss en
diffrentes circonstances : rechercher des caractristiques
(Caractriser, Tableau de caractristiques), tablir des
listes de modalits spcifiques (Tableau de modalits
spcifiques). Ils obissent toujours au mme principe.

Comparer la distribution observe


une distribution de rfrence
Ces calculs s'apparentent aux calculs effectus pour le test
2
du Chi . Il s'agit de mettre en vidence des carts une
rpartition de rfrence. On procde en calculant un effectif
thorique rpondant une hypothse de rpartition
proportionnelle des lments tudis. L'cart la rfrence
est mis en vidence par le rapport entre l'effectif thorique
et celui qu'on observe :
si les 2 effectifs sont identiques, le rapport est gal 1, la
rpartition est proportionnelle ;
si l'effectif rel est suprieur l'effectif thorique,
l'lment considr est sur-reprsent et le rapport est
suprieur 1 ;
si l'effectif rel est infrieur l'effectif thorique, l'lment
considr est sous-reprsent et le rapport est infrieur
1.

A la diffrence du test du Chi2, on n'utilise pas ici de


modle probabiliste pour formuler un jugement sur la
significativit de l'indicateur. Il s'agit plutt de l'utiliser d'une
manire relative pour slectionner les carts les plus forts.
Le problme est en effet ici de trouver des moyens
efficaces et pertinents pour rduire la varit lexicale et ne
retenir que les lments sur lesquels les diffrences sont
les plus fortes.
S'il s'agit maintenant d'apprcier la significativit de ces
carts, on pourra se reporter au test du Chi2 aprs avoir
recod les lments lexicaux tudis dans une variable
nominale (Voir Recoder les textes).

La mthode de calcul
Si on note N le nombre total de mots dans le corpus, m le
mot utilis, c la catgorie considre, Nm le nombre de fois
o le mot m est utilis par toutes les catgories
confondues, Nc le nombre total de mots dans la catgorie c
et Ncm le nombre de fois o le mot m est utilis dans la
catgorie c, lindicateur de spcificit est gal :
Ncm / (Nc * Nm / N)
Par dfaut, cet indicateur est calcul par rapport l'effectif
total des seuls mots figurant dans le tableau. Pour que N et
Nc soient calculs pour tous les mots prsents dans le
lexique courant il faut cocher loption Calcul sur
lensemble du lexique (bouton Compter).
En gnral, le calcul par rapport l'ensemble des mots du
lexique a plus de pertinence. Il renvoie la globalit du
discours. En se limitant l'ensemble des mots
slectionns, on risque de se rfrer un ensemble dnu
de fondement en terme d'nonciation.

Sphinx 2000

La statistique lexicale**

311

Indicateur de spcificit

Tableau lexical

Effectif thorique
(hypothse de rpartition
proportionnelle)

Indicateur de
spcificit

Nb. total de tous les mots


dans la catgorie (Nc)

Effectif rel (Ncm)

Nb d occurrence du mot
toutes catgories (Nm)

Nb. total d occurrence de tous


les mots dans toutes les
catgories (N)

1,09 = 9 / (33 * 27 / 108) )

Effectif
thorique

Liste de mots spcifiques

312

7. Comparer un lexique de
rfrence
La fonction Comparer, accessible par un des boutons de
commande de latelier lexical, permet deffectuer une
comparaison du lexique avec un dictionnaire de rfrence.
Le dictionnaire de rfrence est un ensemble de mots
assortis dune frquence.
Comparer le lexique du corpus tudi avec un dictionnaire
de rfrence, cest retrouver les mots qui sont surreprsents ou sous-reprsents dans le texte par rapport
cette rfrence.

Quelle rfrence ?

Un dictionnaire de rfrence peut tre thmatique, par


exemple les verbes modaux dans lensemble des discours
dune personnalit politique. On comparera lutilisation de
ces verbes entre sa dernire prestation et lensemble de
ses discours.

Crer / enrichir un dictionnaire de


rfrence
La syntaxe dun dictionnaire de rfrence est :

Chacun des mots pourra tre :


dans le corpus mais pas dans la rfrence ;
dans la rfrence mais pas dans le corpus ;
sous-reprsent dans le corpus ;
sur-reprsent dans le corpus.
On cochera les lments souhaits dans le dialogue des
options.

Le calcul qui permet de fonder la sur-reprsentation ou la


sous-reprsentation est le Rapport des frquences ou la
Comparaison de frquences.
Les frquences servant de base au calcul peuvent aussi
tre calcules de deux manires :
le pourcentage dapparition du mot par rapport
lensemble des mots concerns (corpus ou rfrence) ;
le pourcentage dapparition du mot par rapport
lensemble des mots communs au corpus et la
rfrence.
Ces diffrents modes de calcul ont dj t dcrits dans le
cadre des listes de mots spcifiques.

Limiter la comparaison

24
31
23
94
45

Comme dans les listes de mots spcifiques, le rsultat de


cette comparaison est trop volumineux et il faut limiter cette
comparaison pour nen restituer que lessentiel.

Chaque mot est suivi sur la mme ligne de sa frquence.


Un tel dictionnaire peut tre construit dans un traitement de
textes partir de valeurs obtenues par ailleurs.
Le dictionnaire peut aussi tre enrichi en lui ajoutant le
lexique du corpus en cours dtude.

Sphinx 2000

Rsultats de la comparaison

Options de calcul

Un dictionnaire de rfrence peut tre gnral, par


exemple le lexique de tous les mots utiliss dans tous les
articles du journal Les Echos . On comparera une
coupure de presse cette rfrence pour mesurer si elle
est dans le ton.

jaune
rouge
vert
bleu
noir

Ainsi, si on tudie chaque semaine le corpus dune


mission tlvise, on pourra, semaine aprs semaine,
construire le dictionnaire de rfrence de cette mission et
comparer le vocabulaire de lmission en cours
lensemble des missions prcdentes, et ceci, sans traiter
le trop volumineux corpus de lensemble des missions.

On limitera ainsi la comparaison aux seuls mots ayant une


frquence minimale n dans le corpus tudi.
On appliquera un seuil la comparaison pour ne restituer
que les lments vraiment sur-reprsents ou sousreprsents. On ne restituera que les n mots les plus
caractristiques.

La statistique lexicale**

313

5 des couleurs rfrences napparaissent pas


dans le texte

Les couleurs dans le texte


ne sont quau nombre de
trois et ne reprsentent que
1,32% du corpus

Le mot rouge est


nettement surreprsent dans le
texte. En effet, il
reprsente 77,8 %
des occurrences des
couleurs dans le
corpus et 20,8 % des
occurrences des
couleurs dans le
dictionnaire de
rfrence.

314

Sphinx 2000

315

Codification
automatique
des textes

316

1. Crer de nouvelles variables


dorigine lexicale
Une variable texte peut tre transforme par la
lemmatisation et enregistre sous la forme dune nouvelle
variable contenant le texte lemmatis.
Le Sphinx offre dautres opportunits pour crer de
nouvelles variables partir du texte analys :
Variables nominales pour reprer dans le texte la
prsence dun ou plusieurs mots dfinis a priori comme
les modalits de la nouvelle variable : le texte est codifi
automatiquement en fonction des mots marqus dans le
lexique.
Variables numriques pour enregistrer une mesure de
nature lexicale effectue sur chaque observation : le texte
est quantifi.
Variable texte pour enregistrer un texte modifi par
rapport loriginal : le texte est transform.
Toutes ces oprations donnent lieu la cration dune
nouvelle variable qui vient sajouter la suite de la liste des
variables et des questions.

Slectionner les lments lexicaux


prendre en considration
Dans le lexique des mots ou des expressions, on opre les
rductions, suppressions ou regroupements utiles. Puis on
slectionne les lments partir desquels seront cres
les nouvelles variables.

Slection d'une procdure de


recodification
Le bouton Recoder ouvre le dialogue dans lequel on dfinit
le type de la nouvelle variable et les oprations mettre en
uvre pour la crer.

Dnomination et enregistrement de la
nouvelle variable
Le dialogue habituel de cration d'une nouvelle variable
s'affiche. La premire tape consiste donner un nom
cette variable. Pour la suite des analyses, il est utile de
noter toutes les indications ncessaires afin de retrouver
lorigine des nouvelles variables ainsi cres. A cet effet,
utiliser le cadre prvu pour la description de la variable en
notant les principales tapes qui la dfinissent.

Ces nouvelles variables seront disponibles pour toutes les


analyses statistiques que le Sphinx propose par ailleurs. La
possibilit de crer ainsi de nouvelles variables nominales
ou numriques permet de ramener lanalyse dun corpus
textuel des procdures statistiques classiques.
D'autre part, en transformant le texte, on peut conserver
dfinitivement les rductions opres partir du lexique
(liminations, regroupements thmatiques, solidarisation
des expressions et segments...).
La squence des oprations est la suivante :

Slectionner une variable texte


L'article Etudier les textes du menu Stade et du menu
Recoder permet de choisir la variable texte et vous place
dans l'atelier lexical. Dans l'atelier, vous pouvez aussi
directement choisir une autre variable en utilisant le bouton
Autre.

Sphinx 2000

Codification automatique des textes

317

1/ Slectionner une variable texte


2/ Prparer le lexique et / ou marquer les lments prendre en considration

3/ Slectionner le type de la nouvelle variable

Recoder selon la prsence des


mots marqus

Mesurer les proprits lexicales

Transformer le texte

4/ Nommer la nouvelle variable


et la crer

318

Cration dune variable ferme sur les


mots du lexique

2. Codification lexicale
Il s'agit de codifier le texte en reprant automatiquement la
prsence, dans les rponses, des mots marqus dans le
lexique. Cette mthode est trs efficace si le lexique a t
au pralable correctement mis en forme : lemmatisation ou
regroupement des diffrentes formes dun mme mot,
regroupement des synonymes ou quivalents, usage de
dictionnaires thmatiques pour regrouper entre eux tous les
termes porteurs dune mme signification.
Sous ces conditions, on peut faire lconomie de la
mthode classique danalyse de contenu (Voir Coder des
textes) dont les inconvnients sont largement compenss
par le caractre automatique et objectif de la procdure qui
suit.
La dmarche gnrale est la suivante :
prparer le lexique : analyser de prfrence un corpus
lemmatis et effectuer les groupements ncessaires ;
marquer dans le lexique les lments que lon souhaite
reprer dans la rponse. Sil sagit de termes regroups
(lments commenant par un #), la prsence dun au
moins des lments du groupe suffit pour identifier la
prsence du thme correspondant ;
agir sur le bouton Recoder et choisir Variable ferme
pour dfinir le type de variable crer.

Si vous optez pour Ferme sur les mots marqus du


lexique, la nouvelle variable a autant de modalits que de
mots marqus dans le lexique. Au maximum 50 ; ce qui
correspond la limite des rponses aux questions fermes.
Une mme rponse peut contenir plusieurs mots marqus.
Ainsi la nouvelle variable est rponses fermes multiples.
Le nombre maximum de rponses possibles est a priori
gal au nombre de mots slectionns. Il est finalement
ajust par le logiciel en fonction du nombre maximum de
mots effectivement prsents dans une rponse.
Le rsultat du dpouillement plat de la nouvelle variable
ne correspond pas ncessairement au nombre
doccurrences affiches dans le lexique. En effet, les
variables fermes sur les mots du lexique dnombrent des
rponses et non des mots. Si un mot est prsent plusieurs
fois dans une mme rponse, leffectif des rponses nest
incrment que de 1.
L'effectif obtenu indique le nombre d'observations
contenant au moins une fois le mot considr.

Cration de variables oui/non


Si vous slectionnez loption Variable oui/non : la nouvelle
variable aura deux modalits de rponses : Oui et
Non . La modalit Oui correspond au cas o lun des
mots slectionns dans le lexique est prsent au moins
une fois dans la rponse.
Attention : le balayage des rponses se fait en suivant les
rgles de la navigation lexicale. Si la liste droulante
Navigation est sur loption Obs. avec le mot actif, seules
les observations contenant ce mot activeront la modalit
Oui . Pour reprer la prsence de l'un des mots, il
convient donc de slectionner loption Obs. ayant un des
mots marqus.
Par dfaut, la liste des mots marqus est reprise dans le
libell de la nouvelle variable sauf si vous entrez votre
propre description. Lnumration est tronque si la liste
est trop longue.

Sphinx 2000

Codification automatique des textes

319

Coder les mots


marqus dans le
lexique

Elments lexicaux
pris en compte

Variable Oui / Non

Plaisir de manger 12
Oui
Non
TOTAL OBS.

Plaisir de manger_R2

Variable ferme sur les


mots du lexique

320

Non- rponse
manger
bon
repas
ami
got
plaisir
plat
faim
aliment
#famille
restaurant
table
TOTAL OBS.

Nb. cit.

Frq.

236
74
310

76,1%
23,9%
100%

Nb. cit.
74
107
95
50
38
24
23
19
15
14
26
13
10
310

Frq.
23,9%
34,5%
30,6%
16,1%
12,3%
7,7%
7,4%
6,1%
4,8%
4,5%
8,4%
4,2%
3,2%

En slectionnant Pour l'ensemble des mots, une seule


variable est cre : elle donne le nombre fois o l'un des
mots marqus est prsent.

3. Mesures lexicales
On cherche caractriser les noncs par le poids de
certains mots ou l'nonciation par les caractristiques de
chaque observation. Ceci peut donner lieu aux mesures
suivantes :

Indications relatives la prsence de


certains mots
On cherche mesurer l'importance dans le corpus des
mots slectionns dans le lexique :
Nombre doccurrences des mots marqus : calculer le
nombre de fois o ces mots apparaissent ;
Intensit lexicale des mots marqus : calculer leur poids
relatif par rapport au nombre total de mots de la rponse
(100*Nb. mots marqus / Nb. total de mots).
Ces calculs peuvent sappliquer lensemble des mots
marqus ou chacun deux. Dans ce dernier cas, on cre
autant de variables que de mots marqus.

Caractristiques des observations

Intensit lexicale des mots marqus


Cet indicateur permet de mesurer limportance relative dun
mot ou dun groupe de mots. Il exprime, en pourcentages,
la place accorde aux thmes ou significations que ces
mots reprsentent. On a les mmes options que pour le
nombre d'occurrences : calculer une variable pour chaque
mot (note mot_I) ou une seule variable pour l'ensemble
des mots.

Banalit de l'observation
Cet indicateur est gal au nombre de fois o les mots de
l'observation apparaissent en moyenne dans tout le corpus.
Cette variable permet ensuite de slectionner les rponses
les plus banales, les moins banales et de les lister... Il est
prfrable de calculer la banalit en ignorant les mots
outils.

Nombre total de mots (longueur de


l'observation)

On prend en compte le lexique courant sans tenir compte


des mots marqus :
Longueur de l'observation : compter le nombre de mots
utiliss ;
Banalit de l'observation : calculer le nombre moyen de
fois o les mots de la rponse sont rpts dans tout le
corpus ;
Richesse de l'observation : calculer le nombre de mots
diffrents.

En calculant le nombre de mots de l'observation - la


longueur - (sur la base du lexique courant et sans tenir
compte des mots marqus), on obtient un indicateur trs
utile dans l'analyse des questions ouvertes. Il est identique
celui obtenu en choisissant Nombre doccurrences des
mots marqus avec l'option Pour l'ensemble des mots et
sans mots marqus dans le lexique.

Pour construire ces indicateurs, on slectionne l'une des


mesure lexicales proposes.

Elle est gale au nombre de mots diffrents. Ce calcul ne


tient pas compte des mots marqus et se fait sur la base
des lments du lexique courant.

Nombre doccurrences des mots


marqus

Richesse de l'observation

S'il n'y a pas de mots marqus, le calcul tient compte de la


totalit des mots du lexique courant (sans les mots ignors
ou supprims).
Loption Pour chaque mot permet de crer autant de
variables que de mots slectionns. Leur nom contient
celui du mot suivi de l'extension _O. Elles enregistrent le
nombre de fois o le mot est prsent dans l'observation.

Sphinx 2000

Codification automatique des textes

321

Mesures lexicales

Groupe
des variables de
chaque mot

Valeur
moyenne

Somme

0,37
0,34
0,17
0,09
0,08
0,08
0,08
0,06
0,05
0,05
0,04
0,03
0,12

115
105
53
29
26
24
24
20
15
14
13
10
448

manger_O
bon_O
repas_O
chose_O
#en_famille_O
got_O
plaisir_O
plat_O
faim_O
aliment_O
restaurant_O
table_O
Ensemble

Une variable pour lensemble


des mots

Plaisir de manger__R

=100*Nb. Occurrence marques/ Nb. total de mots


Longueur

Banalit

Richesse
322

Frq.

1
0,3%
Non- rponse
73 23,5%
Moins de 1,00
104 33,5%
De 1,00 2,00
71 22,9%
De 2,00 3,00
38 12,3%
De 3,00 4,00
18
5,8%
De 4,00 5,00
5
1,6%
Plus de 5,00
310 100%
TOTAL OBS.
Minimum = 0, Maximum = 6
Somme = 458
Moyenne = 1,48 Ecart-type = 1,24

Nombre doccurrences des mots marqus

Intensit

Nb. cit.

4. Modification du contenu d'une


variable texte
Comme on le fait quand on lemmatise un texte, il sagit l
de crer une nouvelle variable texte contenant un texte
modifi. Cette possibilit permet :
denregistrer un nouveau texte en tenant compte des
rductions, suppressions et regroupements oprs dans
le lexique des mots ou des expressions. Ceci est utile
pour travailler ensuite sur des textes rectifis ou
expurgs ;
de changer le niveau danalyse dun texte en fractionnant
chaque observation en fragment de texte plus fin.

Lexique des expressions : lorsque le lexique des


expressions est ouvert, le dialogue du bouton Recoder
offre 2 possibilits : Texte rduit aux expressions (la
nouvelle variable texte ne contiendra que ces
expressions) ou Relier les mots de chaque expression.
Dans ce dernier cas, la nouvelle variable conserve
l'intgralit du texte original mais les expressions
apparatront comme une seule forme graphique (les
lments formant l'expression sont relis par _ :
mot_compos).

Texte rduit aux mots du lexique


Aprs avoir fait dans le lexique les modifications dsires :
ignorer des mots (Rduire), en supprimer (Supprimer), en
regrouper (Regrouper), on excute la squence Recoder /
Texte modifi / Texte rduit aux mots du lexique.
Dans le contenu de la nouvelle variable texte, les mots
ignors ou supprims n'apparatront plus, et les lments
d'un groupement dfini dans le lexique seront remplacs
par le nom de ce groupement.
Si des mots sont marqus dans le lexique, eux seuls seront
utiliss pour construire la nouvelle variable.

Relier les mots conscutifs


Il faut distinguer 2 cas :
Lexique des mots : si c'est le lexique des mots qui est
ouvert (menu Lexique / Mots), marquez dans le lexique
les lments appartenant aux mots composs que vous
souhaitez reconstituer, puis excutez : la squence
Recoder / Texte modifi / Relier les mots marqus
conscutifs. On cre ainsi un nouveau texte o les suites
conscutives seront solidarises par un tiret ( _ ) pour ne
former qu'une seule forme graphique. C'est une manire
de solidariser les mots composs. Mais il est beaucoup
plus intressant de procder partir du lexique des
expressions.

Sphinx 2000

Codification automatique des textes

323

Modifier le texte

Transformer en fonction des


mots

Transformer les expressions


Rduire aux mots du lexique

Relier les expressions

324

5. Fractionner une variable texte


Cette option est utile quand on analyse des textes dont le
dcoupage initial se rvle inadquat ou quand les
rponses sont longues et comportent plusieurs phrases.
Il est en effet gnant, pour certaines oprations (lecture de
la fentre corpus, navigation lexicale, cration de variables
fermes sur les mots du lexique), davoir, au niveau de
lobservation, un texte trop long ou comportant de trop
nombreuses units de significations ou de trop nombreuses
phrases.
Le principe consiste alors fractionner chaque observation
en fonction des sparateurs spcifis : retour chariot pour
dcouper en paragraphes, point pour les phrases, autres
signes de ponctuation pour les propositions, ou tout autre
caractre introduit dans le texte cette fin.
On opre ainsi un changement d'unit statistique (d'une
population de paragraphes une population de phrases...).
Une nouvelle enqute est alors cre : elle comporte un
nombre dobservations suprieur la premire et rpond
aux caractristiques suivantes :
la nouvelle variable texte contient les fragments rsultant
du dcoupage ;
la valeur de toutes les autres variables est reprise
lidentique pour chaque nouvelle observation cre par
clatement de loriginale ;
le texte des autres variables textes nest repris quune
seule fois dans lobservation correspondant au premier
fragment du texte clat. Pour les autres fragments, elle
est vide ;
une variable CLEF, de type numrique, est cre
automatiquement la fin de la liste des variables. Elle
contient, pour chaque nouvelle observation, la
provenance de la partie fractionne.

le logiciel procde au dcoupage et la cration de la


nouvelle enqute dans laquelle vous vous retrouvez.
Cest la nouvelle variable qui se trouve maintenant active.
Vous pouvez vrifier que le nombre dobservations a
chang.
Pour revenir lenqute dorigine, il faut louvrir nouveau.

Changement d'unit statistique


En procdant ainsi, on passe par exemple d'une population
de paragraphes une population de phrases. On change
d'unit statistique.
Un cas particulier de cette opration consiste fractionner
la rponse en autant de mots qu'elle contient. Ceci est
particulirement intressant si la rponse contient par
exemple des noms de marque. Ce fractionnement
s'effectue au stade de la Saisie des rponses, dans le
menu Grer et dans la fonction Changer d'unit
statistique : option Autant d'units que de fragments
d'une question texte (Voir le paragraphe Changer d'unit
statistique).

Pour fractionner une variable texte, procdez ainsi :


dans le dialogue ouvert par le bouton Recoder,
slectionnez Texte modifi / Fractionner les rponses ;
choisissez le ou les sparateurs dsirs en les tapant
dans la bote Fractionner les rponses pour les
sparateurs ;
un dialogue vous avertit quune nouvelle enqute va tre
gnre ;
dans le dialogue standard de gestion de fichiers, donner
un nom de rpertoire pour la nouvelle enqute ;

Sphinx 2000

Codification automatique des textes

325

326

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

327

Ouvrir un fichier
de donnes
textuelles**

328

1. Du corpus textuel la base de


donnes
On peut, avec le Sphinx, analyser nimporte quel corpus
disponible sous la forme dun fichier texte (ASCII) :
interviews non structures, tables rondes, comptes
rendus de runions, ... saisis dans un traitement de
textes ;
documents de toute nature : articles de presse, textes
littraires, pages Html, rcuprs dans un fichier
texte ;
bases de donnes : fichiers dadresses, bases
bibliographiques, exports sous forme de fichier texte.
Pour analyser ce type de donnes, il faut tout dabord les
intgrer dans Sphinx en crant, partir du ou des fichiers
d'origine, une base de donnes adquate. Cest ce quon
peut faire partir du menu Fichier et de la rubrique Ouvrir
un fichier de donnes. Mais au pralable, il faut rflchir
la structuration du corpus.
Est-il form naturellement d'units lmentaires qui se
rptent comme les enregistrements d'une base
bibliographique ou les couples questions/rponses d'une
interview ?
Peut on identifier diffrents sous-ensembles de textes
comme les titres et les rsums d'une base
bibliographique, ou les questions et les rponses dans une
interview ?
Est-il structur en catgories homognes comme l'entretien
auquel attribuer un couple de question / rponse dans un
corpus regroupant plusieurs interviews o une anne
situant le titre et le rsum d'un ouvrage ?
La rponse ces questions dpend de la structuration
"naturelle" du corpus, mais galement de la stratgie
d'analyse envisage.
Elle conduit :
Dfinir les observations : selon quelles units
lmentaires dcouper le corpus ?

Sphinx 2000

Phrases, paragraphes, pages, parties, documents,


rpliques, ensembles de rpliques, interviews, fiches...
constitueront la population analyser. En analyse de
donnes textuelles, on utilise souvent le mot fragment pour
qualifier ces units lmentaires, qui correspondent aux
individus ou observations formant la population tudie.
Dfinir les variables : selon quels points de vue
structurer le corpus ?
On peut considrer le texte relatif une unit lmentaire
comme un tout ou distinguer plusieurs sous-ensembles
(la question et la rponse, le titre et le rsum...) et dfinir
ainsi une ou plusieurs variables textes.
On peut aussi identifier des catgories auxquelles
appartiennent les units lmentaires : le document ou la
partie qui situe la phrase, le nom de la personne
interviewe qui situe la question et la rponse, l'anne
pour le titre et le rsum. On cre pour cela des variables
nominales dites variables de contexte qui situent les
variables textes.
La base de donnes cre partir du corpus sera
organise en fonction des indications de dcoupage et de
structuration. Elle sera compose dautant de fragments
(lignes / observations...) que le texte contient dunits
lmentaires. Chaque fragment sera compos dune ou
plusieurs variables : textes et contextes dfinissant le statut
des textes.
A titre d'exemple, le schma ci-contre illustre les diffrentes
manires de structurer le texte de 3 interviews non
directives :
dcouper selon l'entretien : la base comporte 3
observations (les interviews), une variable texte (texte
des questions ou des rponses), une variable de contexte
(l'entretien). On ne peut pas faire la diffrence entre
question et rponse ;
dcouper selon la prise de parole : la base comporte 24
observations (tour de parole ou rplique), une variable
texte (texte des questions ou des rponses), 2 variables
de contexte : l'interview, et le statut de la variable texte
(Question ou Rponse). On ne peut pas croiser question
et rponse ;
dcouper selon l'change : la base comporte 12
observations (changes question / rponse), deux
variables textes (le texte de la question et le texte de la
rponse), une variable de contexte (l'interview). Cette
solution permet de distinguer question et rponse et de
croiser leur vocabulaire.

Ouvrir un fichier de donnes textuelles**

329

... aux bases de


donnes

Du texte

Variables de
contexte

Variables
textes

Questions

Rponses

Questions

Rponses

Identit de linterview
Statut du texte (question/rponse)

3 entretiens
330

Texte des questions ou des rponses

24 rpliques

12 changes question/rponse

2. Ouvrir un texte analyser


C'est un cas particulier de l'ouverture de donnes externes.
Vous devrez d'abord confirmer qu'il s'agit d'un texte
analyser, ouvrir ensuite le fichier, et choisir enfin quel
type de structuration il correspond.

Lancer la squence d'ouverture


Si vous venez de dmarrer le Sphinx, utilisez le bouton
Fichier de donnes. Si vous tes dj en train de
travailler, utilisez dans le menu Fichier, l'article Ouvrir un
fichier de donnes. Vous pouvez galement utiliser le
bouton Ouvrir un texte du panneau lexical.
Dans le dialogue Ouvrir un fichier de donnes,
choisissez l'option Un texte analyser. Ne choisissez Des
donnes formates que si vos donnes sont prsentes
sous forme de tables (en provenance d'Excel ou Access
par exemple).

Dans le premier cas, choisir loption Les textes sont


annots : les indications naturelles de structurations sont
inexistantes ou peu nombreuses, hormis les annotations et
marques introduites dans une phase prparatoire pour
guider le logiciel.
Dans le deuxime cas, choisir loption Les textes sont
baliss : on trouve les traces de l'organisation des
donnes (les balises), elles rsultent de leur origine
informatique (bases de donnes, fichiers) ou de leur mode
d'laboration (fiches de lectures, compte rendu
d'entretiens...).
Le choix renvoie aussi au caractre rptitif ou non du
matriau analyser. L'option Les textes sont baliss
correspond bien aux cas o la nature des donnes impose
un dcoupage en units lmentaires (la note
documentaire, la fiche, la coupure de presse, le couple
question / rponse). Au contraire, loption Les textes sont
annots correspond au cas o aucun choix ne s'impose a
priori.

Ouvrir le fichier
Avec le dialogue habituel de Windows, cherchez votre
fichier et ouvrez le. Une nouvelle fentre apparat et vous
montre le contenu du fichier. Si vous ne reconnaissez pas
vos donnes, vous vous tes tromp de fichier ou ce n'est
pas un fichier au format texte.
L'ouverture ne se passera correctement que si le fichier
n'est pas utilis en mme temps dans un autre logiciel.

Choisir le format correspondant la


structuration des donnes
Avant de passer l'tape suivante, vous devez indiquer au
logiciel comment il devra interprter les indications de
structuration prsentes dans vos donnes. Deux
possibilits vous sont offertes :
la premire correspond au cas o vous analysez un ou
quelques textes, peu ou irrgulirement structurs :
discours, livre, rapport, pice de thtre, compte rendu de
runion, de table ronde, focus groups... ;
la deuxime, au contraire, concerne des ensembles de
textes rgulirement structurs : bases de donnes
bibliographiques, sites Internet, collection de documents
(coupures
de
presses,
changes
dans
une
messagerie...), entretiens non directifs...

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

331

Ouvrir un fichier texte


1/ Choisissez un texte
analyser

2/ Ouvrir le fichier
3/ Choisir le format correspondant la
structuration de vos donnes

Annot :
rapports,
textes littraires,
comptes rendus
Balis :
bases de donnes,
collection de documents,
entretiens non structurs

332

3. Texte balis
On obtient par exemple un texte balis en extrayant des
lments d'une base de donnes ou en compilant un
ensemble de messages lectroniques. Ces donnes sont
en effet structures par les balises qui indiquent les
diffrentes rubriques. Toutes ne sont pas forcment
prsentes, mais chaque information est rattache l'une
d'elles.
A partir des balises, le logiciel peut organiser la nouvelle
base de donnes : il repre les balises dans le texte et les
soumet pour validation l'utilisateur. Puis il cre une
variable par balise, et parcourt le texte en affectant ce qui
suit chaque balise la variable correspondante. Lorsqu'il
rencontre nouveau une balise, il cre une nouvelle
observation.

Dfinir les caractres dlimitant les


balises
Aprs avoir slectionn loption Les textes sont baliss,
un cran vous propose de valider les caractres permettant
de reprer les balises : remplir pour cela les cases Les
balises commencent par, et Les balises finissent par.
Le retour chariot (^p, saut la ligne) et les deux points ( : )
sont proposs par dfaut. Les blancs sont ignors.
Le logiciel explore les donnes et dresse la liste de tout ce
qui se trouve entre 2 caractres dlimiteurs. Les ":" qui
peuvent par ailleurs tre prsents dans le texte sont des
sources d'erreur qu'il conviendra d'ignorer.

Une autre case cocher permet d'indiquer si, lorsqu'une


balise est absente, le contenu de la variable doit tre
admise non rponse ou si on doit plutt Conserver la
valeur prcdente.

Identification des variables et des


observations
La validation des balises dfinit la structure de la table de
donnes.
A chaque balise correspond une variable de la table
(colonnes). Il y a autant de variables que de balises et
autant d'observations que le nombre de fois o la balise la
plus frquente apparat dans le texte (lignes). Une
observation est dfinie par l'ensemble des balises
(variables).
Le logiciel parcourt le texte en affectant ce qui suit une
balise la variable correspondante. La rptition d'une
balise marque le passage l'observation suivante. Pour les
balises manquantes, la variable est mise non rponse ou
reprend la valeur prcdente.
En fin de lecture, le logiciel affiche la liste des variables et
leur donne un type par dfaut. On peut le modifier en
indiquant le plus appropri dans la liste.

Cration de la base Sphinx


Aprs avoir contrl les variables, validez et donnez un
nom votre base. Une nouvelle enqute est cre, vous
pourrez la reprendre et lanalyser comme toutes les autres.

Contrler la validit des balises


trouves
Le logiciel parcourt le texte et dresse la liste de tout ce qu'il
trouve entre les caractres dlimiteurs en indiquant les
frquences d'apparition.
L'cran suivant affiche cette liste ; ce qui permet de
prciser les lments considrer comme balises et ceux
qui doivent tre ignors. Utilisez la case cocher Ne pas
considrer la chane comme une balise pour marquer
d'un x les lments ignorer. Dans l'exemple ci-contre,
c'est le cas de mdecine, conomie politique ...

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

333

334

4. Prparer et ouvrir un fichiers


d'entretiens semi-directifs
Les entretiens semi directifs sont insuffisamment structurs
pour tre saisis dans le cadre fix a priori pour les
questionnaires Sphinx, mais ils prsentent un niveau de
structuration qui conduit les analyser comme des textes
baliss. C'est dans cette optique qu'il convient d'organiser
leur saisie.
Dans l'exemple ci-contre, on utilise des balises en dbut de
ligne (dlimiteurs ^p et : ) pour :
dfinir la signaltique de l'entretien (Entretien, Sexe, Age,
CSP) ;
indiquer les grandes parties de l'entretien (Partie) ;
distinguer les questions et les rponses (Q, R).

Traitement des variables signaltiques


A la lecture du fichier, le logiciel repre que les balises
Entretien, Sexe, Age, Csp sont en nombre infrieur aux
autres. Il propose de les liminer en les marquant comme
lments ne pas considrer comme balise (case cocher
Ne pas considrer la chane comme une balise).

Les questions / rponses


Ces balises ne sont pas marques, elles dfinissent
l'observation lmentaire, c'est--dire que leur rptition fait
passer l'observation suivante.
Si 2 "Q" se suivent, ils appartiennent ncessairement des
observations diffrentes, et dans ce cas, on aura un "R"
non rponse.

Prcautions prendre au moment de


la saisie
Le logiciel applique aveuglment les "rgles de
reconnaissance" du texte. Il faut par consquent s'assurer
qu'elles ont bien t respectes la saisie :
les dlimiteurs de balises ne doivent pas tre prsents
ailleurs dans le texte. Attention au " : " ou utilisez d'autres
caractres( <, >, ]...) ;
toutes les balises de contexte doivent tre documentes
(mme si elles sont ventuellement vides).

Il faut changer cela en indiquant que lorsque la balise est


absente, la valeur prcdente doit tre conserve. En effet,
on souhaite ici que le couple question/observation dfinisse
l'observation lmentaire, les autres balises renvoyant
des variables de contexte. Pour que ces variables soient
bien documentes, il faut cocher la case Si la balise est
absente, conserver la valeur prcdente.

Traitement des parties


On procde de la mme manire pour la balise Partie. Ceci
implique que tout couple de question/rponse est rattach
une partie.
On peut ainsi indiquer la structuration gnrale de
l'entretien sans devoir ncessairement trouver toutes les
parties dans tous les entretiens ni tous les couples de
questions/rponses d'une mme partie les uns la suite
des autres. Seuls les changements de partie doivent tre
signals ; c'est ce que permet l'option Si la balise est
absente, conserver la valeur prcdente.

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

335

Signaltique
Variables de
contexte
Parties de
linterview

Questions
Rponses

336

Variables
textes

5. Texte annot
On utilise cette approche lorsque le ou les textes
analyser sont faiblement structurs ou pas du tout. Se pose
alors la question du dcoupage en fragments lmentaires.
La dmarche la plus simple consiste s'appuyer sur la
structuration naturelle du texte. Enfin, la possibilit
d'interprter des annotations apportes dans le texte
permet d'en reprer les lments et/ou de les commenter.

Dcouper le texte en fragments


lmentaires
Indiquez si vous souhaitez dcouper le texte en phrases ou
en paragraphes en cochant les boutons appropris. Le
Sphinx cre un nouveau fragment chaque caractre de
ponctuation
forte
(Phrases)
ou
retour
chariot
(Paragraphes). Vous pouvez galement spcifier le
caractre sparateur de votre choix pour dcouper selon
vos propres indications (Caractres sparateurs).
Une opration un peu plus complexe vous permet de
dfinir plusieurs caractres sparateurs dont certains
serviront structurer votre texte.

les annotations globales de type JALON : tous les


fragments, jusqu' la prochaine annotation globale, sont
dsormais affects par cette annotation ;
la syntaxe respecter est la suivante : le contenu est
dfini entre crochets et prcd d'une mention prcisant
son type : [MT= contenu ]
M= pour MARQUE (variable ferme)
MT= pour MARQUE TEXTE (variable ouverte)
J= pour JALON (variable ferme)
JT= pour JALON TEXTE (variable ouverte)

Le bouton Dtail disponible dans loption Annotations


permet :
dindiquer les annotations qu'on souhaite utiliser (cocher
la case correspondante) ;
de donner un nom la variable ;
de prciser si on souhaite conserver les annotations dans
le texte ;
dorganiser la propagation de la dernire annotation
(Marque absente = Marque prcdente).

Numroter les fragments et les parties


Le bouton Numrotation permet de numroter les
fragments et / ou de les rpartir en un nombre de parties
dterminer (Indicateur de parties).

Par exemple, pour distinguer des chapitres et des sections,


portez, dans votre texte, chaque dbut de chapitre le
caractre $, chaque dbut de section, le caractre .
Pour indiquer que vous souhaitez dcouper votre texte en
phrases et que les chapitres sont contenus dans des
sections, cochez Niveaux et entrez vos caractres
sparateurs sur le modle ci contre. Les sparateurs de
fragments figurent gauche, ceux qui indiquent les
chapitres et sections figurent en deuxime et troisime
position (selon l'ordre d'inclusion).

Interprter les annotations


Les annotations sont des repres ou commentaires
rajouts dans le texte. Elles sont reconnues par le logiciel
et permettent de crer des variables de contexte
caractrisant les fragments auxquels elles s'appliquent.
Le contenu de l'annotation peut donner lieu une variable
ferme ou ouverte texte. On peut, d'autre part, les
distinguer selon leur porte :
les annotations locales de type MARQUE : un seul
fragment sera affect par l'annotation (le fragment qui la
contient) ;
Sphinx 2000

Ouvrir un fichier de donnes textuelles**

337

1/ Dcouper
2/ Structurer

Structurer par niveaux

Structurer par dcompte des


fragments
Structurer par annotations
Jalon
Marque

Sparateur

Slectionner les annotations et dfinir


les variables

338

6. Exemples de textes annots


Selon la nature du corpus analys et des annotations qui
ont t mises, on utilisera diffremment les possibilits
offertes par le dialogue d'ouverture d'un Texte annot.

Analyse de discours
On peut ramener ce cas celui de tout texte mono bloc
dans lequel aucune structuration particulire n'est mise en
vidence hors mis celle de la syntaxe.
La solution la mieux approprie consiste :
fragmenter le texte en phrases et dnombrer les
paragraphes. Chaque phrase se trouve ainsi affecte
un paragraphe repr par son numro. Pour cela,
slectionner Niveaux et entrer les caractres de
ponctuation forte dans la case de gauche et le retour
chariot dans la case de droite ;
dcouper le texte en 5 parties conscutives et de
longueur gale (en nombre de fragments). On peut ainsi
identifier des parties de dbut, de milieu et de fin du texte.
Pour cela, dans le dialogue Numrotation cocher
Numrotation des parties et Indicateur de partie : 5.
La base de donnes obtenue comporte la variable texte et
3 variables de contexte contenant le numro de fragment le
numro de paragraphe et de partie.

La nouvelle base contiendra la variable texte et 3 variables


de contexte : le statut du texte (Question, Rponse), la
Partie et le document d'origine (Fichier).
En procdant ainsi, on peut dfinir la strate des questions,
celle des rponses et se concentrer sur l'un ou l'autre des
corpus. Mais on ne pourra pas rapprocher le texte d'une
question de celui de la rponse qu'elle provoque. Cette
stratgie convient aux entretiens non directifs. Mais si
l'entretien est dirig avec des questions qui reviennent
l'identique, il vaut mieux procder comme pour un texte
balis. En assimilant le couple question / rponse une
observation, on pourra croiser les vocabulaires
correspondants.

Pice de thtre
Ce cas peut se ramener au cas prcdent : on fait prcder
chaque
rplique
d'une
marque
Personnage
:
[M=Harpagon], [M=Elise]. En dbut de chaque Scne, on
pose un Jalon [J=Acte I Scne 1]..... Pour identifier les
Actes indpendamment les uns des autres, on peut utiliser
un sparateur de niveau en posant par exemple des $ au
dbut de chaque Acte.
La fragmentation peut se faire par phrases ou par
rpliques. Dans ce dernier cas, faire concider la rplique et
le paragraphe ou introduisez un niveau rplique.

Entretien non directif


Dans ce cas, on souhaite distinguer les questions des
rponses pour pouvoir analyser le texte des rponses
d'une manire isole. Dans le texte, on porte les
annotations [M=Question] et [M=Rponse] au dbut de
chaque Question / Rponse et aprs un retour la ligne.
Pour identifier d'ventuelles parties, on ajoute des
annotations de type jalon : [J=Introduction], [J=Partie 1]...
au dbut de chaque partie.
Pour dcouper le texte, choisissez Phrases et dans le
dialogue Annotations, nommez Statut la variable Marque
et Partie la variable Jalon. Cochez la case Marque
absente = Marque prcdente (ceci permet de ne pas
rpter la marque chaque phrase).
Si vous avez plusieurs entretiens, vous pouvez faire un
fichier pour chacun. Cochez alors la case Plusieurs
fichiers.
Sphinx 2000

Ouvrir un fichier de donnes textuelles**

339

AVARE.DOC : tel quil nous est parvenu


ACTE_V - SCENE_V
ANSELME, HARPAGON, ELISE, MARIANE, FROSINE, VALERE,
MAITRE_JACQUES, LE_COMMISSAIRE, SON_CLERC.
HARPAGON : Oui, ils se sont donn l'un l'autre une promesse de
mariage. Cet affront vous regarde, seigneur Anselme, et c'est vous qui
devez vous rendre partie contre lui et faire toutes les poursuites de la
justice pour vous venger de son insolence.
ANSELME : Ce n'est pas mon dessein de me faire pouser par force et
de rien prtendre un cur qui se serait donn ; mais, pour vos intrts,
je suis prt les embrasser ainsi que les miens propres.
HARPAGON : Voil, monsieur, qui est un honnte commissaire, qui
n'oubliera rien, ce qu'il m'a dit, de la fonction de son office. (Au
commissaire) Chargez-le comme il faut, monsieur, et rendez les choses
bien criminelles.

Annotations
Jalons
acte et scne
liste des
personnages
prsents
Marques
nom du personnage
didascalies

AVARE.TXT : aprs le traitement dans Word


$[J=ACTE_V - SCENE_V][JT=ANSELME, HARPAGON, ELISE, MARIANE, FROSINE, VALERE,
MAITRE_JACQUES, LE_COMMISSAIRE, SON_CLERC]
&[M = HARPAGON] Oui, ils se sont donn l'un l'autre une promesse de mariage. Cet affront vous
regarde, seigneur Anselme, et c'est vous qui devez vous rendre partie contre lui et faire toutes les
poursuites de la justice pour vous venger de son insolence.
&[M = ANSELME] Ce n'est pas mon dessein de me faire pouser par force et de rien prtendre un
coeur qui se serait donn ; mais, pour vos intrts, je suis prt les embrasser ainsi que les miens
propres.
&[M = HARPAGON] Voil, monsieur, qui est un honnte commissaire, qui n'oubliera rien, ce qu'il
m'a dit, de la fonction de son office. [MT=Au commissaire] Chargez-le comme il faut, monsieur, et
rendez les choses bien criminelles.

AVARE.QUE : le dictionnaire des variables cres


1. REPLIQUES
2. DIDASCALIES
3. QUI PARLE
4. ACTE_SCENE
5. NUMERO_DANS_SCENE
6. NUMERO_DANS_PIECE
7. QUI EST SUR SCENE

340

O(texte)
O(texte)
F(unique)
F(unique)
O(numrique)
O(numrique)
F(multiples;11)

H quoi ! Charmante Elise,....


( part)
HARPAGON ; CLEANTE; ...
ACTE1_SCENE1 ; ....
1 2 ..........
1 2 ......
HARPAGON ; CLEANTE; ...

7. Macro commandes pour la


prparation des textes
Prparer un texte, nous l'avons vu, c'est indiquer par des
caractres la structure du texte.
Certains caractres sont des sparateurs de fragments,
d'autres entourent les annotations qui illustrent le texte.
Le texte original ne prsente pas en gnral cette
structuration sous forme de caractres rservs.
Par contre la typographie, les styles, la pagination
contiennent des lments de structure.
Les traitements de textes proposent des fonctions de
Rechercher / Remplacer sophistiques qui sont trs utiles
pour automatiser le processus. Elles sont assez difficiles
mettre en uvre et, pour le traitement de textes Microsoft
Word (version 6 et suivantes), un ensemble de macrocommandes est disponible pour effectuer simplement les
oprations les plus courantes.

Installer les macro-commandes


Pour installer les macro-commandes, lancer Word, ouvrir le
fichier Lexica.dot qui se trouve dans le rpertoire
Sphinx2000 puis rpondre affirmativement la demande
de confirmation.
Les macro-commandes sont dsormais disponibles et une
barre d'outils spcifique a t cre.
Dans cette barre d'outils, le bouton-outil lance un
dialogue permettant d'oprer des transformations sur
l'ensemble du texte.
Ces transformations consistent insrer des sparateurs
ou transformer des portions du texte en annotations.

Placer des sparateurs

tous les
n mots : on obtiendra des fragments de
longueur identique ;
avant le style "unstyle" : en rptant cette opration pour
les styles Titre1, Titre2, Titre3, on aura un fragment pour
chaque sous-partie du texte.

Reprer les annotations


Les annotations sont les portions de textes qui illustrent les
fragments. Elles donneront lieu des variables fermes et
n'apparatront pas dans le corpus proprement dit.
Or dans le texte brut, ces annotations sont identifiables par
le style (au sens de Word), par la typographie (gras,
italique).
Dans le dialogue, on trouve des options pour transformer
en annotation :
texte ayant le style "unstyle"
texte en "gras"
texte entre ( et ) : tous les textes entre parenthses
seront transforms en annotations.

Recherche / remplacement avec


attributs
Word permet d'effectuer des remplacements sophistiqus :
en se fondant sur les attributs (police, taille, style, ) ;
en utilisant des caractres gnriques ( * @ ?).
L'utilisation de ces fonctions, bien documentes dans l'aide
de Word, permet de rsoudre automatiquement la plupart
des cas de figures non traits directement par les macrocommandes installes par le Sphinx.

Ouvrir le fichier modifi


Avant de quitter Word et de lancer l'analyse du fichier, il
faut encore l'enregistrer au format texte, qui est le seul
format reconnu par le Sphinx.

Pour tre certain de ddier un caractre (DOLLAR '$' par


exemple) la sparation de fragments, il est prudent de
supprimer pralablement les occurrences ventuelles dans
le texte (Enlever les sparateurs $ & ).
L'insertion des sparateurs peut se faire :
avant chaque page : on pourra construire un index des
mots dans le texte ;

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

341

Puis dsigner le fichier


Lexica.dot
Choisir le bon type de fichier

Mthodologie

La barre doutils pour transformer le


texte slectionn en annotation ou bien
pour lancer le dialogue ci-dessous

Microsoft Word
propose des options de
recherche gnriques
ou par attributs

342

Sphinx 2000

Ouvrir un fichier de donnes textuelles**

343

Travailler avec
le Sphinx

344

1. Enregistrements et fichiers
Le Sphinx gre automatiquement vos donnes. Chaque
fois que vous quittez le logiciel aprs avoir apport des
modifications, il vous propose de les enregistrer. La
premire fois, vous choisirez le nom de votre enqute en
modifiant, de prfrence, le nom propos par dfaut.

Les fichiers d'une tude


Une tude Sphinx est enregistre sous la forme de 3
fichiers dnomms de manire identique au nom de
l'enqute et distingus par leur terminaison :
* nom.que : contient le questionnaire
* nom.rep : contient les rponses
* nom.ouv : contient les rponses aux questions
ouvertes.
Vous donnez un nom votre enqute, le Sphinx s'occupe
de distinguer les fichiers.
Attention : pour faciliter votre travail, nous vous conseillons
d'enregistrer vos tudes dans un rpertoire. Pour cela,
choisissez le type rpertoire dans le dialogue
d'enregistrement.

Enregistrer et enregistrer sous


Comme dans tous les logiciels Windows, Enregistrer
provoque la mise jour de vos fichiers par enregistrement
de toutes les modifications intervenues depuis la dernire
mise jour. Utilisez cette fonction si vous craignez une
interruption intempestive de votre travail.
Enregistrer sous permet de modifier le statut
d'enregistrement soit par changement du nom ou de
l'emplacement des fichiers, soit par changement de format.

crer une nouvelle enqute partir d'une tude existante.


Vous n'avez plus besoin des donnes ;
transformer votre questionnaire de rfrence en
bibliothque pour pouvoir ainsi facilement rcuprer ses
questions lors dune prochaine tude ;
pour en faire un modle de questionnaire que vous
utiliserez prochainement ;
pour exporter le contenu de votre questionnaire au format
texte ou pour en faire une version Html publiable sur
l'Internet. Il vous faudra pour cela le module spcialis le
Sphinx et l'Internet.

Exporter et convertir
Les 2 boutons Exporter les donnes et Exporter les
rsultats permettent de rcuprer les donnes brutes ou
les dpouillements plat dans des fichiers textes (*.txt) ; ce
qui permet de les reprendre avec d'autres logiciels,
notamment Excel.
Avec loption Convertir lenqute pour, vous pourrez
crer, partir de votre tude Sphinx, un fichier de donnes
(.sav) que Spss sait relire. Avec cet article, vous pourrez
aussi revenir au format de la version 2 du Sphinx.

Sauvegarde automatique
Au fur et mesure de la saisie, une sauvegarde
automatique est mise jour dans le rpertoire
C:\Sphinx2000\Sauvegarde.
Le nom de ce rpertoire peut tre chang dans le dialogue
des prfrences.
Si au cours des traitements, vous supprimez
malencontreusement des variables ou des donnes, vous
pourrez toujours revenir cette sauvegarde qui nvolue
pas aprs la fin de la saisie.

Faire une sauvegarde de l'enqute


Utilisez cet article pour enregistrer votre enqute sous un
autre nom ou pour en faire une copie. Tous les fichiers
seront automatiquement sauvegards. Nous vous
conseillons de faire des copies d'archives de votre tude
aprs les phases de dfinition du questionnaire et au fur et
mesure de la saisie des donnes.

Faire une copie du questionnaire


En utilisant cet article, vous agirez uniquement sur le fichier
du questionnaire (.que), et vous pourrez :
Sphinx 2000

Travailler avec le Sphinx

345

Enregistrer ltude :
le questionnaire
et les donnes
3 fichiers : .que, .rep, .ouv

Enregistrer le questionnaire
uniquement

Rechercher une enqute et


louvrir

Convertir dans
un autre format

Exporter
Le fichier des donnes
Les rsultats

346

2. Imprimer, publier, prparer les


rapports
De l'imprimante au site Web, le Sphinx offre de
nombreuses possibilits : sortir directement l'imprimante
les documents mis en forme ou les rcuprer dans un
traitement de textes (Inclure dans le rapport), ou un
navigateur (Le Sphinx pour Internet) et mettre ainsi une
dernire main l'laboration du rapport ou la
prsentation finale.

Sortir des rsultats l'imprimante


C'est la solution la moins souple mais la plus directe :
Imprimer le questionnaire : menu Fichier, fonction
Imprimer dans le stade de lElaboration du questionnaire.
Imprimer tous les rsultats : dans le stade des
Traitements et Analyses, menu Dpouiller, fonction
Dpouillement automatique / Imprimer.
Imprimer un tableau, un graphique, une analyse :
prparer la mise en forme l'cran puis passer par le
menu Fichier, et la fonction Imprimer. Larticle Mettre en
page permet de composer la page avant son dition.

Le choix du mode peut tre modifi chaque premire


utilisation de loption. Dans tous les cas, cette fonction
affecte des niveaux de plan et styles diffrents aux titres,
graphiques, tableaux et commentaires.
Avec Inclure dans le rapport, on transfre indiffremment
le questionnaire, un plan de dpouillement ou une analyse
isole.
Le principal avantage de cette fonction est d'autoriser le
transfert d'un grand nombre de rsultats, notamment grce
au plan de dpouillement et sans avoir passer d'un
logiciel l'autre comme les fonctions Copier / Coller y
obligent.

Exporter
Cette fonction enregistre dans un fichier texte sans autre
mise en forme que la tabulation.

Transfrer
Ce bouton, notamment prsent dans l'environnement
d'analyse lexicale, permet de choisir entre les 4 principaux
modes : Impression, Copier, Inclure dans le rapport,
Exporter dans un fichier.

Copier / Coller
L'article Copier, du menu Edition met dans le pressepapiers le contenu de la fentre active ou la zone de texte
slectionne (raccourci Ctrl+C). En faisant Coller (Ctrl+V)
dans l'application cible, on y transfre le contenu du
presse-papiers.
Larticle Copier copie comme une image le contenu
graphique de la fentre ( l'exclusion des titres et
lgendes). Le menu Copier en texte permet de transfrer
titres, tableaux et lgendes en mode texte (sans les
encadrs et autres signes graphiques).

Inclure dans le rapport


C'est la solution la plus souple pour transfrer les rsultats
dans un traitement de textes et y poursuivre la mise en
forme. Inclure dans le rapport, accessible par le menu
Fichier, offre 2 choix :
Images : les tableaux sont reproduits en mode graphique.
Tableaux Word : les tableaux sont rcuprs avec
tabulations et bordures dans les applications Microsoft
(Word, Works, Wordpad).
Sphinx 2000

Travailler avec le Sphinx

347

Copier / Coller, Inclure


Dpouillement automatique
Imprimer

Exporter
Plan de
dpouillement

Inclure dans le rapport

Dpouillement automatique

348

Plan de dpouillement

Dpannage

3. Inclure dans le rapport


La fonction Inclure dans le rapport permet de transfrer
depuis le Sphinx vers un traitement de textes les tableaux
et les graphiques de rsultats.

Principe de fonctionnement
Le Sphinx place dans le presse-papiers successivement
tous les lments (le titre, le sous-titre, le tableau, le
graphique, le commentaire). Aprs chaque tape, le Sphinx
envoie un message au traitement de textes en lui indiquant
quil est ncessaire de coller le contenu du presse-papiers.
Le succs de l'opration demande donc une coopration
de la part du traitement de textes.
Windows propose en standard un traitement de textes
simple (WordPad). Vous pouvez dans tous les cas
construire votre rapport dans ce traitement de textes,
l'enregistrer puis fermer le document avant de le rouvrir
partir de votre traitement de textes habituel.

Installation des macro-commandes de


mise en forme
A la premire utilisation
automatiquement des
forme. En effet, le
fonctionnement avec
suivantes).

de cette fonction, le logiciel installe


macro-commandes de mise en
Sphinx est optimis pour un
Microsoft Word (version 6 et

Lautomatisme de cette installation nest pas garanti car il


se peut que certains paramtrages de Word ne soient pas
compatibles ou que la configuration de votre systme pose
des problmes. Il pourra tre alors ncessaire de contacter
l'administrateur de votre rseau.
Vrifier que le fichier Normal.dot n'est pas protg en
criture, que vous avez indiqu la bonne version de Word
et que Microsoft Office est correctement install.

Si la fonction choue, cest la plupart du temps parce que


les macro-commandes ne sont pas correctement installes
dans le traitement de textes.
Pour les rinstaller manuellement, procder de la manire
suivante :
quitter le Sphinx ;
lancer Word ;
avec Word2000, choisir larticle Scurit du menu Outils /
Macros et choisir le niveau moyen ;
dans toutes les versions de Word, ouvrir le fichier
Sphinx.dot qui se trouve dans le rpertoire Sphinx2000 (il
peut tre ncessaire de choisir loption Modles de
document dans la liste Type de fichiers) ;
rpondre Activer les macros la demande de
confirmation ;
accepter, dans le dialogue suivant, linstallation des
macros Sphinx ;
redmarrer Word (qui sest ferm la fin de linstallation)
et drouler le menu Outils / Macros / Macros et vrifier
la prsence des macros Questionnaire Sphinx et Rapport
Sphinx.
Un autre motif de panne est un dpassement des capacits
de Word pour la mise en forme des tableaux. Il faudra alors
inclure les tableaux comme des images et non comme des
tableaux Word.
Enfin, les plans de dpouillement trop importants devront
tre scinds pour ne pas dpasser la mmoire alloue
Word.

Alternative
A cette fonction Inclure dans le rapport, on peut toujours
substituer le Copier / Coller, qui nopre qulment par
lment et qui transfre les tableaux sous forme dimages
mais qui a lavantage de ne pas tre soumis aux incidents
cits ci-dessus.

En outre, la protection anti-virus incorpor dans Word peut


empcher linstallation de ces macros.
Avec les versions 95 et 98 de Word, la question Voulezvous activer les macro-commandes ? est pose et il faut
rpondre "Activer les macros".
Attention, avec Word 2000, la question nest pose que si
le niveau de scurit nest pas le niveau le plus lev.
Sphinx 2000

Travailler avec le Sphinx

349

Choisir son traitement de


textes dans la liste

ATTENTION : la premire
installation, il faut dsactiver la
protection antivirus de Microsoft

Le transfert est termin.


Continuez la rdaction du
rapport dans Word.

350

4. Aperu rapide
La fonction permet de prendre connaissance, sous une
forme rsume, de la structure du questionnaire et de l'tat
de l'enqute.
Le bouton Transfrer permet de transfrer le texte contenu
dans la fentre.

Aperu sur les Questions / Variables


Afficher la liste des questions et la structuration du
questionnaire.
Cette fonction (active par la touche F3 tout moment) est
particulirement utile pour choisir une variable dans une
liste lorsque l'enqute comporte de nombreuses variables
et qu'il est difficile de se rappeler quel nom de variable
correspond telle ou telle question.

Aperu sur les Rponses / Donnes


Afficher les rponses individuellement sous forme d'une
fiche ou des rponses aux diffrents textes.
Cette fonction (active par la touche MAJ + F3 tout
moment) a le mme environnement que Dtailler des
observations : c'est l'ensemble des observations qui sera
examin. Il n'y aura pas de restriction dans la navigation
entre les observations.

Aperu sur les Dpouillements /


Statistiques
Afficher les rpartitions de chacune des variables.
Cette fonction (active par la touche CTRL + F3 tout
moment) a le mme environnement que Caractriser des
observations : c'est l'ensemble des observations qui sera
examin. Et seules les fonctionnalits de confrontation d'un
groupe d'observations l'ensemble de l'chantillon seront
dsactives.

Sphinx 2000

Travailler avec le Sphinx

351

F3
Maj + F3

Ctrl + F3

352

5. Prfrences
Polices de caractres
Les polices
globalement.

de

caractres

peuvent

tre

modifies

On choisit ainsi :
une police pour les crans de saisie directe ;
une police pour laffichage de la liste des questions ;
une police pour les nombres des tableaux (grande
police) ;
une police pour les tiquettes et les commentaires (petite
police) ;
une taille de police pour les textes dans latelier lexical (la
police elle-mme doit tre de largeur constante comme la
police courrier).
Larticle Caractres du menu Edition permet de changer
ces polices.
Les polices de caractres pour limpression sont choisies
dans le dialogue de mise en page.

Couleurs
Les couleurs des lments de graphiques sont galement
modifiables.
A chacune des modalits correspond une couleur que lon
peut changer. Les valeurs par dfaut (que lon peut tout
moment Restaurer) sont les plus adaptes limpression
en noir et blanc.

Options gnrales
Ce dialogue, appel par larticle Options du menu Edition,
permet divers paramtrages.
Notamment, effectuer des copies de sauvegarde au cours
de la saisie (Voir le chapitre Enregistrements et fichiers).
Les autres options sexpliquent delles-mmes sur le
dialogue reproduit ci-contre.

Sphinx 2000

Travailler avec le Sphinx

353

Rpertoire
des
sauvegardes
automatiques
Ouvrir le fichier des
initialisations
manipuler avec
prcaution

354

6. Acclrateurs et raccourcis
De nombreuses fonctions ont des raccourcis qui permettent
d'viter le passage par un dialogue.
Des combinaisons de touches (Touche Ctrl + lettre)
existent aussi pour les principales fonctions (voir en face
des articles de menus).

Acclrateurs Windows
ALT + TABULATION pour basculer dune application vers
une autre (par exemple pour passer de Sphinx vers Word
aprs avoir transfr un rsultat).
ALT + le caractre soulign dans un nom de contrle
pour l'activer.
ALT + IMPR ECRAN pour copier l'image de la fentre
active dans le presse-papiers.

Gnral
CTRL + K ouvre le dialogue de slection d'un tableau
plat.
CTRL + R ouvre la fentre des rsultats.
CTRL + C pour copier dans le presse-papiers.
ECHAPPEMENT pour revenir l'cran principal.
RETOUR CHARIOT enfonc au dmarrage pour ouvrir la
dernire enqute utilise.
CTRL + ESPACE pour mettre la fentre de l'analyse
courante en plein cran.
F3, MAJ + F3, CTRL + F3 pour avoir un aperu des
variables, des donnes, du dpouillement.
F1 pour avoir de l'aide sur la fonction en cours.
F2 pour consulter ou rdiger un mmo d'aide
complmentaire sur la fonction en cours.

Manipulations des tableaux


La touche F5 (resp. MAJ + F5) augmente (resp. diminue)
la largeur des colonnes d'un tableau.
La touche F5 (resp. MAJ + F5) augmente (resp. diminue)
la dimension horizontale d'un graphique.
La touche F6 (resp. MAJ + F6) augmente (resp. diminue)
la dimension verticale d'un graphique.
La touche F7 (resp. MAJ + F7) augmente (resp. diminue)
la taille des repres dans un graphique.
La touche F4 (resp. MAJ + F4) fait passer l'analyse du
tableau suivant (resp. prcdent) de mme type.
La touche F11 (resp. MAJ + F11) change l'axe horizontal
(resp. vertical) dans une analyse factorielle.
La touche F12 bascule entre les principaux types de
prsentation d'un graphique.
Sphinx 2000

La touche F12 bascule entre les divers types de valeurs


affiches dans un tableau.
CTRL + MAJ + M (ou CTRL + Pave Num '-') diminue la
taille des caractres de deux points.
CTRL + MAJ + P (ou CTRL + Pave Num '+') augmente la
taille des caractres de deux points.

Analyse lexicale
La touche F5 (resp. MAJ + F5) augmente (resp. diminue)
la position des tabulations pour les listes.
La touche F11 bascule entre 1, 2 et 4 lexiques relatifs
(vue Environnement de l'analyse lexicale).
La touche F12 change l'ordre de prsentation du lexique
ou des lexiques relatifs.

Saisie et consultation des rponses


La touche PAGE SUIVANTE (PRECEDENTE) pour
passer l'observation suivante (prcdente).
La touche ENTREE (MAJ + ENTREE) pour passer la
variable suivante (prcdente).
La touche TAB (MAJ + TAB) pour passer la boite
d'dition suivante (prcdente).
La touche F11 : en mode rapide, bascule entre affichage
des modalits en clair ou codes dans la liste.
La touche F11 : en mode direct, bascule entre affichage
des modalits sur une colonne et sur plusieurs colonnes.
La touche F11 : en mode tableur, bascule entre affichage
d'une variable ou de toutes les variables.

Divers
Double-clic sur un point dans une analyse factorielle pour
voir la fiche de l'individu correspondant.
Double-clic sur une case de tableau pour caractriser les
observations correspondantes.
Enfoncer la touche RETOUR CHARIOT au dmarrage
pour activer la dernire enqute ouverte.
Pour les acclrateurs cits plus haut qui modifient des
tailles, le pas est modifi par la touche CTRL si elle est
enfonce simultanment.

Travailler avec le Sphinx

355

Pensez aux raccourcis :

F5, F6 pour les dimensions


F1 pour laide
Ctrl + C pour copier
...

Aide en ligne

Pour
vous
guider

Site Internet

Mmos
personnels

356

7. Travailler avec des donnes


externes
En plus des enqutes qu'il vous permet de raliser, le
Sphinx peut tre utilis sur tout type de donnes provenant
d'autres applications : tableurs, gestionnaires de bases de
donnes, traitements de textes...
Vous avez cette possibilit au lancement du logiciel en
choisissant dans le panneau central le bouton Fichier de
donnes ou en passant par l'article Ouvrir un fichier de
donnes du menu Fichier.

Des donnes formates


Les donnes sont organises dans le fichier selon une
structure rgulire de table ou de fiches (Voir Ouvrir un
fichier de donnes formates). Le fichier est enregistr
au format texte. Pour ouvrir directement un autre format,
utilisez le bouton Une base de donnes.

Un texte analyser

Pour entrer des donnes au clavier, ouvrez une enqute


quelconque et allez dans le stade des Traitements
l'article Tableaux multiples du menu Analyser. Choisissez
alors Tableau d'effectifs quelconques. Vous pourrez
alors entrer vos donnes au clavier.

Une tude statistique


Afin de faciliter le travail, des ponts sont prvus avec
d'autres logiciels d'analyse statistique, notamment SPSS.
Nous consulter pour bnficier d'un pont avec d'autres
outils.
On peut ainsi en standard ouvrir les fichiers .SAV de SPSS.
Inversement l'article Enregistrer sous du menu Fichier
permet de crer, partir d'une base Sphinx, les fichiers
SAV que vous pourrez analyser avec SPSS.

Une base de donnes


Cette option permet de mettre en uvre le protocole
ODBC. Elle autorise ainsi l'ouverture directe de toute base
qui le respecte.

On utilise cette option lorsque le fichier contient du texte


sans structure rgulire (entretien non directif, discours,
document...). Voir pour cela : Ouvrir un texte quelconque
pour l'analyser.

Une base d'images


Cette fonction permet d'intgrer une base d'images dans le
Sphinx. Les images doivent tre au format bitmap (.bmp).
Chaque image fait l'objet d'un fichier; plac dans le mme
rpertoire. Slectionnez le premier pour crer une nouvelle
base contenant ces images.
En utilisant l'article Dcrire des images du menu Recoder,
on peut alors visionner les images pour analyser leur
contenu.

Un tableau d'effectifs
Vous pouvez analyser des rsultats provenant d'autres
applications en les lisant avec le Sphinx. Ouvrez le fichier
contenant le tableau que vous voulez analyser, vous
retrouverez l'environnement d'analyse des tableaux
d'effectifs avec toutes les possibilits graphiques et
statistiques qu'il offre. Vous pourrez ainsi reprsenter votre
tableau avec une carte d'AFC.

Sphinx 2000

Travailler avec le Sphinx

357

Tables de
donnes

Fiches de
donnes

Textes
Fichier Spss : *.sav
Tableau dun fichier ou entre au clavier

Toute base de donnes

358

Base dimages

8. Ouvrir un fichier de donnes


Cette procdure peut faire gagner beaucoup de temps pour
rcuprer des donnes externes dj structures. Le
Sphinx peut intgrer 2 types de structures : les donnes
tabules et balises. Dans tous les cas, il faut :
ouvrir le fichier contenant les donnes. Ce doit tre un
fichier au format texte (.txt) ;
indiquer quel type de donnes on intgre ;
dfinir les marqueurs de structure ;
contrler la manire dont le logiciel reconnat et interprte
les variables ;
enregistrer la nouvelle base.

Donnes tabules
Elles correspondent aux structures de table comportant des
individus (ou observations) dcrits par un certain nombre
de champs (ou variables) qui se rptent l'identique et
dans le mme ordre d'un individu l'autre. Les marqueurs
de structure sont dans ce cas des caractres spciaux
indiquant le passage d'un champ ou d'une variable l'autre
(sparateurs de variables) et d'un individu ou d'une
observation l'autre (sparateurs d'observations).
Dans le cas d'une table Individus x Variables, la tabulation
(^t) est le sparateur de variables, et le retour chariot le
sparateur d'observations.

Donnes balises
Cette situation correspond aux structures de fiches dont les
fichiers bibliographiques sont un bon exemple. Chaque
fiche contient un certain nombre d'articles ou rubriques
dont le nombre et l'ordre peuvent varier mais dont le
contenu est signal par un titre dispos d'une manire
constante et reprable : une balise.
Les marqueurs de structure sont les caractres qui
encadrent les balises. Par exemple, le retour chariot en
ouverture et le caractre 2 points en fin.

Spcifier les marqueurs de structure


Aprs avoir choisi le type de structure auquel correspond
vos donnes (l'aperu du fichier doit vous y aider),
l'assistant vous conduit prciser les marqueurs de
structure : sparateurs ou dbut et fin de balise selon le
cas. Par dfaut, on vous propose les cas les plus courants,
mais vous pouvez les modifier et les adapter vos
donnes (attention les caractres marqueurs ne doivent
pas tre utiliss autrement dans vos donnes).

Vrifier les interprtations du logiciel


Le logiciel signale les balises trouves et affecte un type
par dfaut chaque variable. Vous avez la possibilit de
vrifier et de modifier ces affectations.

Dans le cas d'une interview, on placera avant chaque


question un $ utilis comme sparateur d'observations et
avant chaque rponse, un servant de sparateur de
variables.
On dfinit ainsi une table comportant autant de lignes qu'il y
a de couples Question / Rponse et comportant 2
colonnes : la premire pour la question, la deuxime pour
la rponse.
Pour s'assurer que la structure est correctement dfinie, on
vrifiera que le nombre de sparateurs de variables est un
multiple exact du nombre de sparateurs d'observations.
Le coefficient multiplicateur est le nombre de variables.

Sphinx 2000

Travailler avec le Sphinx

359

Donnes formates

Donnes balises

1/ Reconnatre la structure

Donnes tabules
1/ Reconnatre la structure

2/ Dfinir les marques de balises

2/ Dfinir les sparateurs


3/ Valider les balises

3/ Valider les variables


4/ Valider les variables

4/ 5
Enregistrer la
nouvelle base
Sphinx
360

Sphinx 2000

Travailler avec le Sphinx

361

Eurka ! le
compagnon du
Sphinx

362

1. Amliorer la communication
grce aux modules
complmentaires
Eurka! est un logiciel compagnon du Sphinx. Ses
fonctions de prsentation apportent une plus grande
souplesse pour l'laboration des documents, des
questionnaires ou des tableaux de bord, et ceci quel que
soit le mdia utilis : impression papier, publication sur le
Web, cran et autres supports multimdia.
Ce module complmentaire s'intgre totalement au Sphinx
2000 et peut tre appel directement depuis les panneaux
de commandes du Sphinx.
Selon le stade de votre travail dans le Sphinx, vous pourrez
ainsi :
enrichir la prsentation et la mise en page de vos
questionnaires en utilisant la fonction Dfinir des
formulaires ;
adapter l'interface de saisie en fonction des circonstances
: saisie scanner, saisie par oprateur de saisie (CATI),
saisie effectue par le rpondant lui-mme via Internet ou
sur un poste dispos dans un espace public CASI.

Communiquer le Questionnaire
La fonction Dfinir les formulaires permet de prparer
des formulaires avec toutes les fonctions graphiques des
logiciels de PAO.
Chaque question est compose du libell, d'une zone de
saisie (cases cocher pour les questions fermes, zone
vierge pour les questions ouvertes) et d'une consigne
ditable.
Des logos peuvent tre imports sur le formulaire, les
modalits peuvent tre associes des pictogrammes
(content-pas content par exemple).
Les couleurs, polices, tailles, formes de chaque question
peuvent tre modifies individuellement.

Si le questionnaire doit tre lu automatiquement par un


scanner, un cadre entourant la zone des questions sera
ajout ainsi que les informations ncessaires comme le
numro de page.

Faciliter la saisie
La saisie automatique des questionnaires par scanner
permet d'envisager des enqutes volumineuses avec des
ressources humaines constantes.
La saisie par oprateur se fait dans des crans similaires
au questionnaire papier ; ce qui simplifie beaucoup la tche
d'interprtation.
Pour la saisie l'cran par les rpondants eux-mmes
(dans le cadre d'une enqute Internet par exemple), ou
pour la saisie par oprateur, Eurka! offre des possibilits
plus tendues que celles disponibles d'une manire
standard dans le Sphinx :
Utilisation de la structuration du questionnaire : parties,
renvois, contrles de saisie (mme sur Internet) ;
Regroupement de questions sur un mme cran ;
Paramtrages du fonctionnement : passage automatique
la question suivante, retour interdit,

Communiquer les Rsultats


La fonction Explorer les donnes permet de prparer des
tableaux de bord avec les principaux rsultats de l'enqute
sous forme de tableaux et de graphiques.
Ces tableaux plat, tableaux croiss, tableaux de groupes
sont disposs sur le tableau de bord et modifiables
individuellement :
Le contenu : tableau, graphique, libell de la question,
valeurs remarquables,
La prsentation graphique : couleur, police, taille,
Les tests statistiques : intervalles de confiance, Chi,
moyenne, mdiane,
Les valeurs du tableau : effectifs et/ou pourcentages
et/ou carts
Les conditions de calcul : non-rponses, mise en classes
des nombres,
Les observations concernes : chantillon total, strate,
profil particulier.

Le placement des questions peut tre fait manuellement


pour amliorer la disposition automatique.
Le questionnaire ainsi prpar pourra tre imprim pour
tre ensuite reproduit par photocopie ou par offset.
Sphinx 2000

Eurka ! le compagnon du Sphinx

363

Mise en forme et enrichissement


du formulaire

Hpital de Charmont - Questionnaire de satisfaction


Merci de rpondre ce questionnaire et de le dposer au bureau d'accueil.
Les statistiques 1998 de ce questionnaire y sont galement votre disposition.
Vous pouvez galement rpondre ce questionnaire sur le site Internet de l'tablissement :
http://www.hopital-charmont.fr
1. Dans quel service avez-vous sjourn ?
Chirurgie Gnrale

Ranimation

Soins Intensifs

Maternit

Cardiologie

O.R.L.

Pneumologie

Griatrie

Urologie

Gastrologie

2. Quelle a t la dure de votre


hospitalisation ?

Psychiatrie

ttt

Trs
Plutt
Plutt
mcontent mcontent satisfait

Trs
satisfait

3. L'accueil lors de votre entre


4. La qualit des soins
5. La dure des soins
6. La comptence du personnel
7. La disponibilit du personnel soignant
8. Les informations fournies sur votre sant
9. Le rconfort apport par le personnel
10. Le confort d'installation dans la chambre
11. L'hygine et la propret
12. La qualit de la restauration
13. Les services annexes (tl, bibliothque...)

14. Lors d'une hospitalisation, qu'est ce qui vous importe le


plus, outre la qualit des soins ?
l'accueil

la dure

l'information

le rconfort

la disponibilit du personnel

le confort

les services annexes

autres

15. Si 'autres', prcisez :

16. Quelle est votre impression gnrale sur votre sjour


dans notre tablissement ?

Service chirurgie gnrale


Des indicateurs de qualit ...
Trs mcontent

Trs mcontent

6,50%

Plutt mcontent

Critres et valuation globale :

Services

Accueil

Plutt mcontent

12,25%

Plutt satisfait

46,00%

Trs mcontent

22,00%

Plutt satisfait

35,25%

Trs satisfait

Comptence

13,25%

29,00%

Trs satisfait

Lors d'une hospitalisation, qu'est ce qui vous importe le


plus, outre la qualit des soins ?

22,50%

Plutt satisfait

35,75%

Critres

16,75%

Plutt mcontent

28,00%

Trs satisfait

l'accueil

32,75%

13,49%

la dure

10,99%

l'information
Soins_qualit
Trs mcontent

Tableau de bord
prsentant les
rsultats

Soins_rapidit

9,25%

Plutt mcontent

Trs mcontent
23,00%

Plutt mcontent

Plutt satisfait

33,50%

Plutt satisfait

Trs satisfait

34,25%

Trs satisfait

Disponibilit

8,50%

Trs mcontent

15,75%

Plutt mcontent

28,75%

5,79%

la disponibilit du personnel

16,00%

Plutt satisfait

47,00%

26,97%

le rconfort

8,00%

le confort

34,00%

Trs satisfait

5,39%
30,97%

les services annexes

3,30%

autres

3,10%

42,00%

note_globale

... peu disperss ...

...et interdpendants
Informations

La satisfaction moyenne par critre :


Moyenne Ecart-type
Soins_rapidit

2,28

1,63

Soins_qualit

2,12

1,55

Informations

2,30

1,58

Disponibilit

2,25

1,60

Comptence

2,01

1,54

Accueil

2,32

1,62

Total

2,21

1,59

Moyenne =13,81
Mdiane =14,00
6,00

Disponibilit

Soins_rapidit

Soins_qualit

Accueil
PROFESSION
Agriculteur

AGE

Retrait

SEXE

Moyenne =35,02

L'identit des patients :

20,00
14,00

Comptence

Ouvrier

Fminin (41,00%)
2,00

82,00
32,00

Masculin (59,00%)

Patron Industrie Commerce

4,58%
7,82%
9,43%

Prof. Librale Cadre

16,17%

Cadre Moyen

16,71%

Employ
Autre

364

2,16%

20,49%
22,64%

2. Mettre en forme les


questionnaires Papier
Les questionnaires auto-administrs ncessitent une
prsentation irrprochable. Grce aux fonctions graphiques
du module communication d'Eurka!, vous pourrez
optimiser la mise en page, jouer sur les couleurs et
optimiser votre communication avec une souplesse bien
plus grande que celle qui vous est propose par le Sphinx.
Mais comme tout se paie, vous y passerez un peu plus de
temps, tout en continuant d'en gagner beaucoup compte
tenu des rsultats obtenus.
Vous pourrez galement vous adapter chaque situation
particulire.
Lorsque les individus interroger proviennent d'un panel, il
est possible de prparer des questionnaires pr-imprims
(nominatifs) c'est--dire reprenant certaines des variables
dj connues de chaque individu. Vos correspondants
pourront ainsi vrifier les informations les concernant et
ventuellement indiquer les modifications apporter.
Lorsque les questionnaires sont destins la lecture
automatique par un scanner, un cadre spcial est rajout
pour permettre la reconnaissance automatique de la page.
C'est la solution idale. Vos questionnaires seront ainsi
automatiquement reconnus.

Sphinx 2000

Eurka ! le compagnon du Sphinx

365

Rdaction du questionnaire

Enqute PAPIER

Mise en forme et
enrichissement du formulaire
Impression et
reproduction
Collecte des
rponses
Saisie
manuelle

Saisie par
scanner

Traitements et analyses
laboration de tableau de bord
Impression et reproduction
du rapport crit

Saisie par scanner


Cases reconnues

Rature

Cases non
reconnues
Tches

366

La machine n'est pas


assez intelligente!

3. Enqutes "Internet et Email"


Internet offre de nouvelles opportunits pour consulter et
interroger les populations qui vous intressent. Que vous
placiez un questionnaire sur votre site ou que vous le
diffusiez par e-mail, vous n'aurez pas supporter le cot de
la saisie. Vous rduirez aussi les dlais d'obtention des
rsutats.
Certes, le taux de connexion l'Internet limite encore
l'intrt de cette mthode pour les enqutes grand public.
Mais elle est dj trs pertinente pour l'interrogation de
panlistes et/ou pour la consultation d'une population relie
par un Intranet (communication interne). Le formulaire est
prpar avec toutes les possibilits de mise en forme
(images, commentaires, couleurs, ).
La fonction Enregistrer pour Internet lance un assistant
qui va construire les fichiers ncessaires et les installer sur
le serveur de l'entreprise.
Si vous ne possdez pas de serveur, vous pourrez faire
hberger vos questionnaires sur le serveur de notre
oprateur Alma.
Le questionnaire sera diffus soit en mettant un lien vers
le questionnaire sur le site de l'entreprise, soit en
envoyant un email avec l'adresse du questionnaire une
liste de destinataires (prospects, clients, collaborateurs,
).
Aprs l'enqute ou tout moment, vous pouvez tlcharger
les rponses dj enregistres pour les analyser avec le
Sphinx.
Les tableaux de bord que vous constituez partir des
rsultats de l'enqute pourront tre restitus sous forme de
pages html et installs sur le site. La fonction Enregistrer
pour Internet vous guide dans cette dernire phase de
publication des rsultats.
Si vous disposez d'un Intranet Lotus, vous pouvez
bnficier d'une solution Interview qui intgre la
conception, la diffusion des formulaires via Lotus et
l'analyse des rsultats au standard Eurka!.

Sphinx 2000

Eurka ! le compagnon du Sphinx

367

Rdaction du questionnaire
Mise en forme et
enrichissement du formulaire

Enqute INTERNET
Enqute E-MAIL

Publication sur le
serveur
Diffusion (email ou lien
vers le questionnaire)
Tlchargement
des rponses
Traitements et analyses
laboration de tableau de bord
Publication automatique du
tableau de bord sur Internet

Java ou HTML

368

4. Enqutes "Disquette ou Rseau"


Avec le module de communication, vous pourrez
galement crer des supports de saisie autonomes et
diffusables.
Le charg d'tudes rdige le questionnaire dans le Sphinx.
Avec le module Eurka!, il a non seulement la possibilit
d'adapter au mieux l'cran de saisie mais il peut galement
prparer un support qui pourra tre diffus sous forme de
disquette ou au travers un rseau. Ce support proposera
l'environnement de saisie que vous avez conu,
enregistrera automatiquement les rponses et pourra
galement donner la possibilit de consulter les rsultats.
Les fonctions de ce module (le charg d'tudes pourra en
dsactiver certaines) sont :
Saisie de nouvelles observations ;
Modification des observaions existantes ;
Visualisation / impression des rsultats.
Parmi les nombreuses utilisations de ce module de saisie,
citons :
Dploiement d'une enqute auprs dtablissements
secondaires, de succursales, dagences qui pourront
immdiatement imprimer leurs propres rsultats.
Rpartition de la saisie entre plusieurs oprateurs de
saisie.
Installation sur un rseau pour une saisie simultane
depuis plusieurs postes.
Saisie CATI dans le cadre des enqutes par tlphone.
Module install sur l'ordinateur portable (bientt sur le
PDA) des enquteurs.
Disquette auto-excutable envoye directement aux
personnes interroger.
Installation du questionnaire sur une borne interactive
dans une exposition, un salon.
Questionnaire d'valuation en libre-service dans un
organisme de formation.

Sphinx 2000

Eurka ! le compagnon du Sphinx

369

Rdaction du questionnaire
Mise en forme et
enrichissement du formulaire

Enqute DISQUETTE
Enqute RESEAU

laboration du modle de
tableau de bord
Paramtrage du module de
saisie et/ou de consultation
des rsultats
Reproduction et
diffusion d une
disquette autonome

Installation sur un
rseau local

Rassemblement
de toutes les
disquettes
Traitements en analyses sur
lensemble des rponses

Saisir et voir ses rsultats

370

5. Communiquer les rsultats


Eurka! apporte la mme souplesse dans l'laboration des
rapports et la communication des rsultats que dans la
mise en forme des questionnaires.
Il permet de prsenter les rsultats sous forme de tableaux
de bord, de graphes de relations ou d'abres de dcision et
de les diffuser sur un support papier, Internet ou par
l'intermdiaire d'un rseau local ou d'un support disquettes
ou CD.

Une nouvelle mise en forme des


rsultats
Eurka! permet de mettre en scne les rsultats en les
prsentant classiquement sous la forme de tableaux ou de
graphiques. D'une manire plus originale, il permet de
construire les schmas pour visualiser les relations entre
variables sous forme de graphes ou reprsenter les arbres
selon lesquels votre population peut se segmenter...
Il met ainsi votre disposition une approche originale de
l'exploration et de l'analyse de donnes. Mais en outre ce
module permet de s'affranchir de la prsentation linaire
des rapports produits avec le Sphinx pour concevoir de
vritables tableaux de bord. En suivant la logique des outils
de prsentation, vous pourrez disposer librement les
lments de votre argumentation (tableaux, graphiques,
schmas...) en les manipulant comme des objets.
Enfin avec ce module, vous pourrez concevoir des modles
de prsentation qui s'actualiseront automatiquement en
fonction des donnes auxquelles vous les associerez. Ceci
est trs utile pour les tudes rptitives.

Choisir le mdia le plus adquat


Les prsentations et les tableaux de bord conus dans
Eurka! peuvent indiffremment tre diffuss en les
imprimant sur support papier, en les produisant sous forme
de documents html destins tre publis sur le Web, ou
en les transfrant sur un support numrique destin tre
lu l'cran via un CD, une disquette ou un rseau.

Sphinx 2000

Eurka ! le compagnon du Sphinx

371

372

Sphinx 2000

Eurka ! le compagnon du Sphinx

373

Mthodologie

374

Les diffrentes formes denqutes

Rappel des principes de lenqute


par questionnaire
Dans la plupart des cas, lenqute par sondage est une
voie de recherche trs efficace pour obtenir des
informations. Cest loutil le plus utilis dans les tudes
qualitatives et quantitatives, dans les enqutes et les
sondages.
Mais pour tre fiable et efficace, cet instrument doit tre
men avec prcaution. Il est donc ncessaire de
dterminer les objectifs de ltude avant de dfinir sa mise
en uvre. A cet gard, plusieurs tapes sont alors
envisager.

Dfinition des objectifs


La premire phase dune tude consiste dfinir
prcisment le problme qui doit tre trait. Afin de tirer le
meilleur profit des rsultats de ltude, il est indispensable
de savoir ce que lon recherche et davoir une ide de
lintrt de ltude.
Connatre les donnes dont on a besoin permet de
concevoir un instrument capable de les produire. Cest
donc grce la dtermination pralable des objectifs de
lenqute que des moyens appropris pourront tre dfinis.

La dtermination des chantillons


La ralisation dun sondage seffectue sur une partie de la
population appele chantillon. Mais la dtermination de
lchantillon doit tre calcule afin de fournir des
informations et des rsultats cohrents avec ceux qui
seraient obtenus si toute la population tait interroge. Il
faut donc dabord dfinir la population mre pour tre en
mesure dinterroger un chantillon fiable et reprsentatif.
Cest tout le problme de lchantillonnage qui consiste
se poser plusieurs questions : Qui interroger ? Combien de
personnes ? Quel chantillon retenir et comment le
slectionner (chantillon reprsentatif ou non, tirage
alatoire ou respect de quotas) ? Dans quelle mesure les
rsultats de cet chantillon sont-ils fiables ? Etc. Mme si
les contraintes budgtaires et les techniques employes
fournissent des lments de rponses, la thorie des
sondages nous apporte des enseignements prcis fonds
sur des hypothses contraignantes concernant la slection
des chantillons. Nanmoins, le savoir-faire et lexprience
guident souvent fortement la dtermination de lchantillon
interroger et les logiciels Sphinx proposent une aide
lchantillonnage.
Sphinx 2000

Lorsque les objectifs de ltude, la population mre et


lchantillon sont fixs, il sagit de dfinir les moyens mis en
uvre pour ltude. Si on envisage que lenqute sera la
mthode dobservation et de recueil des informations, on
doit alors opter pour une technique denqute.
Or celles-ci sont trs diversifies. Parmi les plus
rpandues, nous retiendrons lenqute par voie postale,
lentretien tlphonique, le questionnaire sur Minitel,
lenqute sur Internet et lentretien en face--face. Ces
derniers peuvent se drouler domicile, sur le lieu de
travail, dans la rue, proximit des points de vente...
Le questionnaire est le seul lien, dans les enqutes par
courrier ou par Internet, entre lenquteur et la population
interroge. Dans le cas des entretiens tlphoniques ou en
face--face, la communication entre linterview et
linterviewer passe par le dialogue et le questionnaire
devient alors un guide dentretien ou une grille
dobservation o il est possible denregistrer les rponses.

Le questionnaire
Le questionnaire est donc destin capter, dans la
population interroge, les lments de rponses aux
questions que lon se pose. Il a alors deux objectifs :
provoquer une raction chez les interviews et servir de
support linterviewer qui pourra y enregistrer ses
informations de faon complte et prcise. La rdaction du
questionnaire est soigner dans ce sens.
Le questionnaire incorpore non seulement les questions
poser mais galement les plages de rponses. Il est
souvent bon dindiquer un titre ainsi quun commentaire
vocateur pour la population interroge.
Cest un instrument trs flexible du fait de la grande varit
des questions qui peuvent tre poses. Llaboration dun
bon questionnaire requiert une trs grande comptence et
peut tre intgre dans des logiciels spcialiss en analyse
statistique. Cest le cas du Sphinx qui propose une gamme
varie de fonctions destines la conception du
questionnaire.

Le pr-test
La phase de conception dune enqute sachve en
gnral par le test dune enqute pilote qui permet de
valider, sur un nombre restreint de personnes, les choix
effectus dans le cadre de ltude.
Ce test permet de dcouvrir si le protocole dtude est
raliste, si le contenu et la forme des questions sont
adapts aux objectifs de ltude.

Mthodologie

375

Cest aussi souvent loccasion de dcouvrir des erreurs


grossires et des oublis, ou encore de vrifier la ncessit
de chaque question pose et dcarter ventuellement
celles qui ne rpondent pas directement aux objectifs de
ltude.
Le test dune enqute prsente donc lintrt de rechercher
la meilleure adaptation entre les objectifs de ltude, les
moyens allous et les mthodes choisies.

Le recueil des donnes


Quoique fastidieuse, cette phase ne prsente aucune
difficult particulire, mme si selon les techniques
denqutes utilises, les enquteurs doivent possder des
comptences plus ou moins importantes.
Cette tape ncessite nanmoins une bonne organisation
du travail et peut tre effectue dans des logiciels de
gestion de donnes, de traitement denqutes ou danalyse
statistique.
Actuellement, lamlioration des communications entre ces
logiciels permet dchanger les bases de donnes trs
facilement et de reprendre des donnes existantes comme
sil sagissait dinformations obtenues par questionnaires.
Dans ce domaine, le Sphinx prsente une fonction
dimportation des donnes depuis des traitements de
textes, des tableurs ou toute base de donnes externes.

Le dpouillement et lanalyse de
donnes
Une fois les rponses saisies, on sintresse aux rsultats
qui vont ressortir de cette tude. On peut alors distinguer
plusieurs niveaux danalyse : on commencera par le
constat des rponses donnes par les interviews, cest-dire le dpouillement. Cette phase sera complte par des
calculs ou des tests statistiques et par un
approfondissement des analyses pour parvenir aux
rsultats significatifs de lenqute, ce qui permettra
dadapter les dcisions et les actions aux conclusions de
ltude.
Le dpouillement des rsultats donne rapidement un
aperu de lensemble des rsultats de lenqute en
produisant des tableaux ou graphiques de rsultats et des
listes de rponses donnes. Il est dabord conseill de
prendre connaissance des rsultats des variables
considres indpendamment les unes des autres et de
procder ensuite la mise en relation de plusieurs
variables.
La phase danalyse permet deffectuer des tests et des
calculs sur les rsultats extraits du dpouillement. Elle a
pour objectif danalyser les rsultats de faon prcise et
daider linterprtation et la dcision.
376

Il est souvent ncessaire, aprs analyse, de revenir sur la


dfinition initiale dune ou plusieurs variables pour modifier
et enrichir la base initiale de donnes. A ce niveau, on peut
transformer le contenu dune variable en procdant des
regroupements ou la suppression de modalits de
rponses, mais on peut galement crer ou calculer de
nouvelles variables.

La prsentation des rsultats


La prsentation des rsultats significatifs de lenqute est
parfois une tche complexe : elle ncessite de prendre
connaissance des analyses de donnes pour ne
slectionner que les plus caractristiques et les plus
synthtiques.
Les rsultats retenus pour le rapport dtude sont
galement ceux qui sont susceptibles de conduire aux
prises de dcisions et aux actions. Il sagit ensuite de les
prsenter dans un rapport dtude qui, par sa mise en
page, ses commentaires, ses graphiques..., mettra en
valeur les rsultats significatifs.
Dans cet objectif, le Sphinx propose des fonctions
adaptes qui permettent de prsenter un rapport organis
selon un plan de dpouillement, de synthtiser et rsumer
les rsultats dans des tableaux construits cet effet et
complts
par
des
commentaires
gnrs
automatiquement par le Sphinx.
Des fonctions de mise en forme des tableaux et graphiques
de rsultats permettent galement de distinguer les
rsultats les plus significatifs dans lensemble des
informations ressortant de ltude ralise dans le logiciel.
Enfin, les nombreuses possibilits dchange avec les
autres logiciels offrent une grande souplesse lors de la
ralisation du rapport dtude.

La communication
Le travail d'enqute et d'tude s'apparente un travail de
communication :
communication amont pour la transmission du
questionnaire, l'expos des questions, le recueil des
rponses ;
communication avale pour la diffusion des rsultats, le
travail d'argumentation et d'aide la dcision.
Les nouvelles technologies offrent de nouvelles
opportunits de mise en page, de prsentation, d'illustration
par des couleurs ou des images, d'interactivit dans les
changes avec les rpondants ou le destinataire du
rapport. Avec l'volution des logiciels, le charg d'tudes
peut ainsi de mieux en mieux matriser cet aspect important
de son travail.

Les diffrentes formes d'enqutes


L'observation directe
L'observation directe consiste mener une observation
sans solliciter la participation consciente des personnes
observes. Ceci pose bien sr des questions d'ordre moral
: a-t-on le droit de procder l'insu de ceux qu'on observe
? Tout dpend de l'usage qui sera fait des informations
recueillies.
Il existe aussi des obstacles d'ordre pratique. En effet,
beaucoup d'informations sont inaccessibles par cette
mthode. D'autre part, les dispositifs concrets permettant
d'assurer ce type d'observation (camouflage, glace sans
tain, camra vido) sont coteux et difficiles mettre en
uvre. Notons cependant les nombreuses possibilits
offertes par Internet. L'analyse des traces (origine, pages
visites, temps pass, clic...) laisses par l'internaute est
une modalit de l'observation directe.

Entretien en face--face
Les protagonistes de l'entretien se font face et peuvent
ainsi dialoguer en utilisant toutes les ressources de la
communication interpersonnelle. Les circonstances de ce
type d'entretien - communication de sujet sujet prsentent des avantages certains. L'enquteur sollicite
activement le rpondant tout en interagissant avec lui pour
rguler l'entretien dans sa dure. Des questions peuvent
tre prcises ou expliques, l'interprtation des rponses
peut tre vrifie, au risque cependant d'influencer ou de
biaiser l'observation.
Cette mthode n'est pas exclusive de l'observation directe.
L'enquteur peut, en cours ou l'issue de l'entretien, noter
les caractristiques du comportement de son interlocuteur.
Dure de l'entretien, perception de l'assurance, de la
sincrit de l'interlocuteur, prsence ou absence de
certains indices sur les lieux de l'interview, de
comportement a priori dfinis.

Entretien tlphonique

Enqute par voie postale


Le questionnaire est, dans ce cas, l'unique lien entre
l'observateur et la population. Le rpondant est seul, libre
de rpondre ou non, dans l'ordre qui lui convient, sans
subir d'autre influence que celle des indications et
questions que le questionnaire expose. Il a tout le temps
qu'il souhaite pour rflchir ses rponses.
L'observateur s'est exprim une fois pour toutes en
laborant des questions qu'il ne peut plus ni modifier ni
expliquer. De mme n'a-t-il aucun recours auprs du
rpondant pour vrifier le sens de ses rponses.

Enqute via Internet


Ce type d'enqute se dveloppe avec l'usage de l'Internet.
Le questionnaire est accessible sur un site, le rpondant lit
les rponses sur son cran et entre directement les
rponses. L'avantage de ce procd est de supprimer en
aval la saisie informatique. D'autre part, ce moyen permet
de grer la squence des questions. Une nouvelle question
n'apparat l'cran que lorsque la question prcdente a
reu une rponse. C'est un avantage par rapport aux
enqutes par courrier dans lesquelles il est impossible de
dvoiler progressivement les questions. Cette approche est
de plus en plus frquente pour la consultation des panels.
Elle reste encore limite pour le grand public par le faible
taux de connexion des mnages.

Enqute en laboratoire et panel


La situation exprimentale consiste mettre l'individu dans
un contexte contrl par l'exprimentateur. Il est possible
ainsi, en construisant des plans d'exprience, d'isoler les
effets de chacune des actions envisages.
Avec les panels, on professionnalise l'chantillon en
recrutant dans une population considre, des individus qui
acceptent de rpondre aux consultations dont ils seront
l'objet. Ils sont en gnral rmunrs et forms au rle qui
est le leur : rpondre le plus objectivement possible aux
questions qui leur sont priodiquement poses par l'institut
qui gre le panel.

C'est une autre forme d'entretien. La communication y


dispose de moins de ressources. Les protagonistes ne se
voient pas, l'enquteur ignore le cadre dans lequel se
trouve le rpondant. L'interaction reste possible, mais la
bonne comprhension de l'interlocuteur est prive des
informations gestuelles. La pression du temps s'exerce
diffremment.
Sphinx 2000

Mthodologie

377

AVANTAGES

Enqute par
observation
directe

Enqute en
face face

Enqute
tlphonique

Enqute par
courrier postal
ou lectronique

378

- Objectivit dans lobservation des


faits ou comportements.
- Perturbation minimum du fait de
lenquteur.

- Permet lobservation des attitudes et


comportements.
- Bon contrle de lchantillon sond :
les personnes contactes sont
contraintes de rpondre.
Possibilit
de
dvoiler
progressivement les objectifs de
lenqute.
- Souplesse lie lenquteur :
adaptation
du
vocabulaire,
interprtation
des
rponses,
prcisions apportes.
- Possibilit dentretiens plus longs.

- Moins coteux que face--face.


- Moins dinfluence lie lenquteur.

- Cot moindre surtout avec Internet.


- Le rpondant ne subit pas
linfluence de lenquteur.
- Le rpondant a le temps de la
rflexion, ce qui permet une meilleure
approche des questions dopinion.

INCONVENIENTS
- Impossibilit dobserver des
opinions ou attitudes.
- Difficult de mise en uvre
pratique (condition de lobservation,
formation de lenquteur).
- Problme dontologique. On
observe des gens leur insu.

- Coteux.
- Lenquteur
rpondant.

influence

le

- Tout dpend de la qualit des


enquteurs, de leur formation
lenqute, et de leur srieux sur
le terrain.

- Difficult poser correctement


des
questions

rponses
assistes.
- Impossibilit de passer des
questionnaires trop longs.

- Faible taux de rponse.


- Absence de contrle a priori de
lchantillon.
- Forte influence lie au
questionnaire et sa logique.

Un modle pour concevoir un bon


questionnaire
Celui qui rdige un questionnaire peut toujours ramener les
questions qu'il envisage l'un des 4 grands thmes
suivants. Ceux-ci peuvent tre tudis indpendamment
les uns des autres, mais la richesse de l'enqute natra de
la manire dont on est capable de les relier dans un
systme.

Les grands thmes d'une enqute

Utiliser le modle identit,


comportement, motifs, opinion et
valeurs
Quel que soit votre domaine d'tude, il vous sera utile de
revenir sur votre questionnaire en l'analysant du point de
vue de ce modle. Tous les thmes sont-ils abords, les
manques correspondent-ils un choix dlibr ou un
oubli ?
Quelles sont les relations envisageables entre questions ?
A quel type de thorie renvoient-elles ? ....

Les quatre grands thmes suivants peuvent s'appliquer


l'tude de tout type de population. Le 4me thme ne
concerne que les populations humaines.
Identit : qui interroge-t-on? Quels objets observe-t-on?
Comportement : Que font ceux qu'on interroge, comment
agissent - ils? Quelles sont les proprits des objets
observs ?
Motifs contraintes: quelles sont les raisons qui guident les
comportement, expliquent les actions ? A quelles
contraintes, mcanismes sont soumis les objets tudis ?
Opinions et valeurs : quelle signification les sujets
accordent-ils leur comportements, sur quelles valeurs
se fondent leurs motifs d'action ?

Concevoir le questionnaire comme un


systme
Les thmes qui structurent le questionnaire peuvent tre
envisags comme un systme situant les questions les
unes par rapport aux autres. Ainsi, l'explication d'un
comportement peut tre recherche dans des facteurs
d'identit suivant les modles du dterminisme social ou
dans la prise en considration des motifs en rfrence au
modle de dcision rationnelle. Toutes les relations
envisageables entre les diffrents thmes peuvent faire
sens en renvoyant aux grandes thories du domaine
tudi.
Raisonner ainsi sur les relations entre les questions permet
d'affiner le questionnaire en anticipant sur les analyses qui
se rvleront utiles au moment de l'analyse des rsultats.

Sphinx 2000

Mthodologie

379

Le questionnaire comme liste


Identit

Les actions
envisages

Les questions
quon se pose

Les questions
quon pose

Qui ?

Comportement

Fait quoi ?

Motifs

Pourquoi ?

Opinions valeurs

Quel sens
cela a ?

Le questionnaire comme systme

Opinions valeurs
Qui fait quoi ?
Quels motifs expliquent les
comportements ?
Quel sens accorder
au comportement ?

Identit

Comportement

Qui pense quoi ?


Motifs

380

Des questions qu'on se pose aux


questions qu'on pose
Pice matresse de toute enqute, le questionnaire est
l'articulation du modle conceptuel, expression des
hypothses
et du mode opratoire, instrument
d'observation et de recueil de l'information. De la thorie
l'observation, du concept la variable, le questionnaire
organise, par l'intermdiaire des questions poses et des
rponses obtenues, la confrontation des ides aux
phnomnes du terrain.
Quelle que soit la sophistication des traitements effectus
et le srieux des chiffres, c'est sur le sens des mots que
reposent finalement les contributions de l'tude.

La question qu'on se pose


Toute question pose dans un questionnaire renvoie une
ou plusieurs questions que s'est pose celui qui fait l'tude.
Ainsi, derrire toute question qu'on pose, il y a une
question qu'on se pose : une hypothse. Celle-ci renvoie
une ou plusieurs thories, connaissances pralables
dgages dans une phase prliminaire d'tude
documentaire et de rflexion. La qualit du questionnaire
repose sur la clart de ce travail initial.

La question qu'on pose


Sa fonction est de susciter une rponse, donc de
provoquer une raction. Mais pas n'importe quelle raction.
On recherche en fait la rponse la question qu'on se pose
et on veut la connatre avec une objectivit maximale. Il
faut donc perturber le moins possible l'authenticit de ce
qu'est celui qu'on interroge, ce quil fait, sait, ressent, pense
et tout prix, viter de provoquer une rponse qui
serait influence par les circonstances de l'interrogation.
Neutralit, objectivit, mais aussi clart. Que le sens de la
question soit le mme pour celui qui la pose que pour celui
qui l'entend. La qualit des rponses dpend de celle de la
comprhension entre questionneur et rpondant.

Sphinx 2000

La rponse qu'on enregistre


La finesse de l'observation dpend du procd
d'enregistrement de la rponse. Rpondre en choisissant
parmi une liste de modalits prdfinie fait perdre la varit
et les nuances que permet l'enregistrement d'une rponse
librement formule. Il en va diffremment lorsqu'il s'agit
d'une grandeur ou d'un nombre. Il suffit alors d'enregistrer
tel quel le chiffre annonc pour saisir dans l'unit
considre toutes les nuances de la rponse. Dans tous
les autres cas, la mesure dpend de l'talonnage de
l'instrument. Choix de l'unit, dfinition a priori d'un
systme de codification : ds la conception du
questionnaire, il faut imaginer les rponses. Ce travail
suppose une connaissance a priori sur les phnomnes
abords. Sans hypothses, pas d'observation.

Rdiger un bon questionnaire


Raliser un bon questionnaire ncessite de la mthode et
beaucoup de mtier.
La mthode : respecter les tapes de la dmarche :
Formuler des hypothses claires, les questions qu'on se
pose.
Traduire ces hypothses sous forme de questions
poser en tenant compte des caractristiques des
populations interroges, de leur langage et des
circonstances de l'interrogation.
Tester le questionnaire en l'administrant en situation.
Cette phase fait ressortir les problmes de langage, les
difficults de comprhension, elle permet d'valuer la
dure de l'entretien...
Dpouiller et analyser les rponses obtenues au cours du
test. On pourra ainsi constater que telle question n'est
pas vraiment utile, que telle autre manque, que la
manire d'enregistrer les rponses n'est pas la plus
pratique. On est ainsi conduit tenir compte, ds la
conception du questionnaire, des traitements que l'on
souhaite faire.
Le mtier : il s'acquiert avec l'exprience. Formuler un bon
questionnaire est une tche difficile qui exige de trouver le
meilleur compromis entre les impratifs de la
conceptualisation, du terrain et des mthodes statistiques.
A cet gard, si vous tes nophyte, vous gagnerez
beaucoup de temps et obtiendrez de bien meilleurs
rsultats en faisant appel aux conseils d'experts. C'est ce
que nous vous proposons au travers du service Le Sphinx
en direct. Consultez-nous pour bnficier de notre
exprience.

Mthodologie

381

Le questionnaire est au centre


du dispositif denqute

L'HYPOTHESE
La question qu'on se pose
Quelle radio vient en tte , ou :
Combien de personnes coutent journellement telle radio ?

LA
METHODE
D'OBSERVATION
Les questions
qu'on
pose

Avez vous cout la radio hier ou aujourd'hui ?


0Non rponse 1Oui
2Non
Si oui, laquelle ?
0Non rponse 1FR.INTER 2Europe 3RMC 4RTL
5Ville
6Horizon 7Antenne 8Sud 9Musica
Quelle est la radio locale que vous coutez le plus
souvent ?
0Non rponse 1Ville
2Horizon 3Antenne 4Sud
5Musica

Les rponses
qu'on
enregistre
De ce que le rpondant dit
ce que l'enquteur
enregistre

De ce que l'enquteur
prononce ce que le
rpondant comprend

Guide d'entretien
LA VARIABLE
Les rsultats qu'on obtient

Formulaire
d'enregistrement

Taux d'coute: Nombre de personnes ayant cit telle radio la question 2


sur Nombre de personnes interroges

382

L'INDICATEUR

La manire de poser les questions


Entretien libre : Question ouverte,
rponse spontane
Une question est rponse spontane lorsque aucune
indication n'est apporte au rpondant sur la manire de
formuler sa rponse. Mme s'il s'agit d'une question
rponse ferme - dont la rponse sera code par rapport
des modalits prtablies - la nomenclature prconue ne
lui est pas communique. Par exemple, la profession est
demande sans que la classification en CSP ne soit
fournie. Le rpondant est donc entirement libre de sa
rponse.

Entretien semi ouvert : Question


ouverte, rponse ferme
La rponse librement obtenue n'est pas ncessairement
enregistre telle quelle. L'enquteur peut interprter la
rponse pendant l'entretien, ou rception des
questionnaires expdis par courrier. Il applique pour ce
faire la codification drive des modalits de rponses
dfinies avec la question.
Procder ainsi suppose :
En face--face, que l'enquteur prenne garde de ne pas
dvoiler la liste des modalits qu'il a sous les yeux ;
Par courrier ou Internet, que les modalits de rponses
aux questions qui doivent rester ouvertes, ne figurent pas
sur le questionnaire expdi, bien qu'elles aient t
prconues et doivent servir ultrieurement la
codification.
Comme le montre le tableau ci-contre, l'entretien est dit
ouvert si la rponse est libre et enregistre telle qu'elle est
donne. Il est semi-ouvert si la rponse est libre, mais la
rponse enregistre suivant la codification prtablie.

Entretien ferm : Question assiste


La question est ferme ou rponse assiste si la liste des
modalits de rponses est communique au rpondant. On
l'aide rpondre en lui proposant de choisir parmi une liste.

Sphinx 2000

Dans les enqutes par courrier ou Internet, les questions


sont gnralement assistes. Trs couramment utilis, ce
procd simplifie considrablement le traitement. On
vite ainsi tout le travail d'interprtation engendr par le
systme semi-ouvert.
Dans les enqutes en face--face, l'enquteur peut
numrer la liste, la faire lire sur son document ou utiliser
des panneaux crits en grosses lettres cet effet. Cette
dernire mthode est de loin la meilleure.
Au tlphone, l'numration est le seul moyen d'assister la
question. Cela ne va pas sans poser quelques difficults si
la liste est trop longue.
Procder ainsi a l'avantage de la facilit pour ceux qui font
l'enqute. Mais cette mthode comporte galement des
risques.
Le rpondant est fortement pouss rpondre. Il faut
donc bien prciser que la rponse n'est pas obligatoire et
prvoir une rubrique la rubrique "autre prcisez"
L'ordre dans lequel sont numres les questions et les
modalits de rponses a une influence sur le choix.
Lorsque la liste est longue, les dernires modalits sont
survoles ou trop rapidement nonces par l'enquteur.
L'attention se fixe alors sur les premires citations. Si de
plus, celles-ci sont des rponses videntes, le
phnomne est amplifi : il faut donc viter de placer ces
modalits en tte de liste.
Pour viter les autres effets d'ancrage sur le dbut de la
liste, il peut tre intressant de soumettre l'chantillon
des numrations diffrentes obtenues par permutation.
On neutralise ainsi les ventuelles influences en faisant
varier la position des termes.

La manire de poser une question peut


en affecter le sens
Suivant que la question est assiste ou non, l'information
recueillie n'a pas la mme signification. Nous reviendrons
ultrieurement sur ce point. Notons pour l'instant que cette
dcision affecte le fond de l'enqute et ne doit pas tre
prise la lgre. Son application correcte par les
enquteurs doit donc tre soigneusement contrle.

Mthodologie

383

Poser les questions et enregistrer les rponses

Manire d'enregistrer la rponse.


Ouverte:
Ferme
Rponse
Rponses selon Modalits
telle qu'elle.
prdtermines.

Manire de poser la question.


Question Ouverte:
Question Ferme
rponse spontane.
rponse assiste.

ENTRETIEN SEMI-OUVERT

FERME

Question: Possdez vous une automobile,Question: Parmi les qualits`suivantes : con


scurit, puissance, robustesse,
vitess
si oui quelle en est la marque ?
faible consommation, faible cot achat quel
Rponse du rpondant Citron
les 3 plus importantes vos yeux?
Enregistrement rponse2
0 Non rponse 1Non
2Franaise
3Allemande
4Italienne 5Japon
6Amric.
7Autre

IIIENTRETIEN

OUVERT

Question: Combien de kilomtres


parcourez vous dans l'anne avec
votre automobile
Rponse du rpondant 25400
Enregistrement rponse
25400

ou:
Question: Possdez vous une automobile,
si oui quelle en est la marque ?
Rponse du rpondant Citron
Enregistrement rponse

384

IIENTRETIEN

Citron

Rponse du rpondant: Confort, Vitesse


Enregistrement rponse
0 Non rponse 1Confort
3Puissance
4Robustes.
6Consomm.
7Prix

1 5
2Scurit
5Vitesse
8Autre

IV
Le rpondant ne peut
se satisfaire des
rponses proposes.
Prciser la catgorie "Autre

L'art du questionnaire : la logique


de l'entretien
Quelques
principes
fondamentaux
scrupuleusement respects.

doivent

tre

Introduire le questionnaire

Un entretien a sa logique propre. Comme une


conversation, il volue de propos gnraux vers des
questions plus prcises. En face--face ou au tlphone, il
faut en tenir compte.
Les questions gnantes ou difficiles doivent tre reportes
en fin d'interview.

Courrier ou media lectronique


Un texte bref situe l'organisme qui ralise l'enqute et
donne quelques indications sur les buts poursuivis ainsi
que sur la manire de remplir le questionnaire.
Il est important de prvoir une incitation rpondre :
explication des buts de l'enqute, proposition de
transmettre les rsultats, ou cadeau. Tout dpend du
budget mais la force de l'incitation peut affecter beaucoup
le taux de rponse.
Plus le questionnaire est long, plus faible est l'incitation
rpondre. Il doit tre clairement rdig, ar et occuper un
nombre de pages le plus rduit possible.
Les possibilits graphiques et d'animation des mdias
lectroniques peuvent tre utiliss comme des incitations
rpondre. Mais attention ne pas surcharger les pages et
allonger ainsi le temps de rponse.
Face--face
Tout le processus repose sur la qualit des relations que
l'enquteur parvient tablir. Sa mise, son expression, ses
attitudes doivent tre adaptes au public qu'il interroge.
Ces paramtres doivent tre adapts aux circonstances de
lenqute (dans la rue, domicile...).
Tlphone
Il n'y a pas de diffrence fondamentale entre la prise de
contact en face--face et au tlphone mais le tlphone
exige une concision et une clart d'expression encore plus
grande. Si le rpondant se dclare indisponible, il est plus
ais d'obtenir un rendez-vous tlphonique. Le simple fait
de le solliciter permet parfois de faire tomber l'objection.

Sphinx 2000

Respecter les usages de la


conversation

Il faut viter de faire dbuter un questionnaire en face-face par des questions d'identit. Ce qui se justifie du point
de vue de l'analyse risquerait de transformer l'entretien en
interrogatoire de police. Il faut prvoir des questions
d'introduction ou de transition. Peut tre inutiles pour
l'analyse, elles ont pour but de rendre l'entretien plus facile.
Enfin, l'ordre des questions doit tenir compte des effets
perturbateurs de l'entretien. Les questions rponse
spontane doivent prcder les questions assistes. Dans
le mme esprit, il faut rvler le plus tard possible le but
prcis du questionnaire. En effet, certaines rponses
risquent d'tre influences par celui-ci. Mme par courrier,
il faut respecter cette rgle. On veillera galement ce que
les questions dont les rponses peuvent tre lies figurent
sur des pages diffrentes.

Longueur du questionnaire
Plus un questionnaire est long, plus il est difficile
administrer. Cette contrainte joue en particulier pour les
enqutes par courrier et tlphoniques.

Eviter les questionnaires


organigrammes
Il faut viter de multiplier les questions-renvois. Elles
compliquent beaucoup l'entretien et ne se justifient pas
toujours. On risque en effet d'imposer au rpondant une
logique qui n'est pas la sienne et de biaiser ainsi
l'observation. Il faut donc se garder de construire un
questionnaire comme on conoit un organigramme et
limiter les questions-renvois aux impossibilits strictes de
rpondre.

Mthodologie

385

L'art du questionnaire : la logique


de l'analyse
La difficult consiste rdiger un questionnaire qui passe
bien et qui permette par la suite les analyses les plus riches
possibles.

Ne poser que des questions utiles


C'est une vidence qu'il faut rappeler car la rdaction fait
souvent oublier les objectifs initiaux. En confrontant la liste
des questions que se pose le demandeur celle des
questions rdiges dans le questionnaire, il faut vrifier que
rien n'a t oubli et que tout est ncessaire.
Deux cas peuvent alors se prsenter :
Une question du demandeur de l'tude reste sans
rponse. Il faut complter le questionnaire ou constater
qu'il est impossible de rpondre srieusement l'objectif
fix.
Une question du questionnaire ne peut tre rattache
aucune des questions du demandeur. Il faut la supprimer
ou ajouter aux objectifs telle contribution initialement non
prvue. Mais assurons-nous alors que c'est une
connaissance
susceptible d'affecter l'action du
demandeur.

Adapter le questionnaire aux


traitements et aux analyses projets
Nomenclatures et analyse par strate
La qualit des rsultats est fonction de la taille de
l'chantillon. Ainsi, dcouper un petit chantillon en strates
trop nombreuses conduit des rsultats sans signification.
Il faut par consquent adapter la taille de l'chantillon, les
modalits des questions dfinissant les strates. Si N est
l'effectif total et si le nombre de modalits dpasse N/30
ces modalits dfiniront au moins une strate non
exploitable. Ainsi, utiliser une nomenclature de C.S.P. en
12 postes en n'interrogeant que 200 personnes nous
obligera regrouper des catgories entre elles pour obtenir
des strates significatives.

Type de variables
Suivant le type de questions, les rponses obtenues
qualifient des tats possibles (variables qualitatives), ou
mesurent des grandeurs (variables quantitatives).
Les variables quantitatives sont plus riches et autorisent
des traitements plus complexes : calculs de moyennes,
d'carts types, corrlations, rgressions, analyse en
composantes principales. Ces indicateurs ou mthodes
permettent des analyses plus fines et plus puissantes que
celles autorises par l'usage des variables qualitatives.
Il faut donc tre capable, ds la conception du
questionnaire, de dfinir les traitements envisags, pour
recueillir les informations ncessaires selon le bon format.
Ce choix consiste dterminer le format de la rponse
(texte, code, ferme, chelle, numrique) en fonction des
analyses envisages.

Ds la conception du questionnaire,
tenir compte de l'analyse des donnes
Certains choix effectus au moment de la rdaction du
questionnaire conditionnent fortement les possibilits
ultrieures d'analyse. Ainsi, s'il est toujours possible de
transformer une rponse numrique en variable qualitative,
l'inverse n'est pas toujours possible. Si d'autre part, aucune
question ouverte n'a t prvue, le questionnaire ne
permettra aucune vritable dcouverte, et sans numrique,
aucune mesure n'est facilement ralisable.
Les traitements
Expliquer
Relier

Question rponse numrique


Variable
quantitative
Question rponse chelle

Mesurer

Toujours
possible

Classifier
Mettre en
correspondance

Que si
les modalits sont
dans le bon ordre

Question rponse ferme unique


Variable

Evaluer

qualitative Question rponse ferme multiple

Dcrire

Question rponse texte

Explorer

386

Le questionnaire

Thorie des sondages et estimation


statistique
Raliser un sondage, c'est substituer l'tude d'une
population entire (la population mre), l'observation d'une
partie de cette population, l'chantillon. La thorie des
sondages permet de :
dfinir les conditions selon lesquelles on peut estimer les
proprits de la population totale partir des
observations faites dans l'chantillon.
qualifier l'estimation en indiquant le degr d'erreur ou de
risque qu'elle comporte.

Le sondage alatoire
L'estimation statistique ne peut tre effectue que sous les
conditions d'un sondage alatoire. Celles-ci impliquent que
la population soit de trs grande taille par rapport celle
de l'chantillon et que chaque individu de la population ait
exactement la mme chance de faire partie de l'chantillon.
Sous ces conditions, le calcul de probabilit montre qu'on
obtient un chantillon dont la composition est voisine de
celle de la population mre.

L'estimation statistique
Dans l'hypothse du sondage alatoire, on peut calculer,
partir d'un rsultat observ dans l'chantillon, l'intervalle
dans lequel doit normalement se situer la valeur
correspondante dans la population totale. Cette fourchette
appele intervalle de confiance indique ainsi la marge
d'imprcision que comporte toute estimation. On a
l'habitude de la distinguer du risque d'erreur pris en
acceptant cette fourchette comme valide. Plus on souhaite
rduire le risque, plus la fourchette sera large et les
rsultats imprcis, au contraire, on peut dsirer afficher des
rsultats plus prcis mais avec un risque d'erreur plus
grand. La seule manire d'amliorer la prcision sans
augmenter le risque d'erreur est d'augmenter la taille de
l'chantillon.
Attention: la qualit de l'estimation ne dpend que de la
taille de l'chantillon, sous rserve que le tirage est bien
alatoire. Si l'interrogation porte sur une population entire,
les rsultats sont exacts et il n'y a plus lieu de parler
d'estimation.

Sphinx 2000

Si l'exhaustivit n'est pas atteinte, quelle que soit


l'importance du taux de rponse, l'estimation n'est possible
que si les rponses obtenues sont le fait du hasard. Sa
qualit ne dpend que du nombre de rpondants.

Les paramtres influenant la qualit


d'une estimation
L'intervalle de confiance dpend essentiellement de la taille
n de l'chantillon. Par exemple, pour l'estimation d'une
proportion p, on le calcule en application de la formule cicontre. Il est important de constater que l'intervalle de
confiance dcrot avec la racine carre de la taille de
l'chantillon, ce qui signifie que plus l'chantillon est grand,
plus le gain en prcision sera faible.
D'autre part, le produit p*(1-p) est de valeur maximum
quand p est gal 0,5 ; ce qui signifie qu'il sera beaucoup
plus difficile d'estimer la victoire d'un candidat de deuxime
tour au soir des lections (il faudra examiner prs de 3000
bulletins) que l'limination d'un petit candidat au premier
tour. Une centaine de bulletins suffisent pour prvoir
l'chec d'un candidat rassemblant 10% des suffrages.

La pratique des sondages


Les conditions thoriques du sondage alatoire sont trs
difficiles raliser pratiquement. Aucun protocole concret
ne permet d'assurer la stricte quivalence des chances
d'tre interrog. Mme si les numros de tlphone sont
tirs au hasard, la prsence ou l'absence au moment de
l'appel introduit un biais li au mode de vie...
Pour cette raison, il est toujours utile de vrifier la qualit
d'un chantillon en contrlant, sur des caractres connus
dans la population totale, que les rsultats sur l'chantillon
sont conformes. Sinon, on dit que l'chantillon est biais.
Plutt que d'avoir le redresser a posteriori, on peut fixer
un plan de sondage par quota pour assurer a priori la
proportionnalit de l'chantillon. Les limites de cette
mthode tiennent la connaissance de la population
interroger et aux possibilits pratiques de recueillir des
rponses partir de plans de sondage multi-critres trs
fins. Interroger tant d'hommes, ouvriers, de plus de 50
ans...
Dans la pratique, on combine souvent la mthode des
quotas avec une procdure libre pour trouver les individus
correspondant aux quotas prdfinis.

Mthodologie

387

Tirage alatoire et estimation statistique


t=1,96. p.(1-p)/n
Estimation
Sondage
Population mre

p
Proportion
dans lchantillon

Echantillon

[p-t, p+t]
Intervalle de confiance
dans la population

Effet taille de lchantillon


Erreur
n=100
n=300
n=1000
n=3000
Les grands chantillons
sont plus prcis
Taille

Effet de lordre de grandeur du phnomne


p

100%
50%
[p-t, p+t]
0%

388

Les phnomnes grossierssont


plus faciles dcrire
prcisment

Dfinir le bon chantillon


La thorie des sondages nous apprend que l'estimation
statistique n'est possible que si l'chantillon est alatoire et
s'il est suffisamment important. L'estimation est interdite si
l'chantillon est trop petit : n<30.
Outre les difficults pratiques du tirage alatoire, la
dtermination de la taille de l'chantillon ncessite le choix
d'un bon compromis entre la prcision attendue et le cot
de collecte des donnes.

Echantillons homognes
On est dans cette situation lorsque les analyses ne portent
que sur l'chantillon total. On cherchera dans ce cas
slectionner l'chantillon le plus grand possible compte
tenu des moyens disponibles. Plus l'chantillon est grand,
plus il faudra interroger de personnes supplmentaires
pour gagner en prcision. A partir d'un certain seuil, les
gains en prcision ne justifient plus le cot supplmentaire
que cela implique.

Une solution de compromis consiste dfinir un chantillon


stratifi dans lequel on alloue le budget disponible
chacune des strates. Si on dispose d'un budget de 500
personnes et si la population se compose de 5 strates, on
interrogera
alatoirement 100 personnes de chaque
catgorie. On est ainsi assur d'avoir une prcision
convenable pour l'analyse de chaque strate. Mais on ne
pourra rien tirer de l'analyse de l'chantillon total dans
lequel certaines strates seront sur-reprsentes et d'autres
sous-reprsentes.

Redressement d'chantillon
Dans le cas prcdent, on redressera l'chantillon total
pour composer un nouvel chantillon dans lequel chaque
catgorie sera reprsente proportion de son poids dans
la population totale.
Procder ainsi conduit, au niveau de l'analyse, travailler
sur les chantillons propres chaque strate et sur un
chantillon redress pour analyser la population totale.

Tout dpend en fait du type de dcision prendre et de la


marge d'incertitude tolrable. Ainsi, on sera beaucoup plus
exigeant pour valuer l'audience d'un mdia en vue de fixer
des tarifs publicitaires que pour une tude de satisfaction.
Dans le premier cas, on s'orientera vers de grands
chantillons (1000 2000 sonds), dans le second, on
pourra se contenter d'chantillons plus modestes (200
300).

Echantillons htrognes
Cette situation correspond au cas o lon souhaite tablir
des rsultats sur des sous-ensembles de l'chantillon. Si
l'chantillon est alatoire, on obtiendra des effectifs trs
faibles pour les catgories peu reprsentes ; ce qui risque
d'interdire toute estimation sur les strates correspondantes.
Ainsi, pour analyser la strate d'une catgorie reprsentant
2% de la population totale, il faut un chantillon contenant
au moins 30 personnes dans cette catgorie ; ce qui
ncessite l'interrogation de 1500 personnes. Mais cet
effectif ne se justifie pas pour tudier la population dans
son ensemble. Il faudra donc trancher entre renoncer
analyser toutes les strates ou supporter le cot
d'interrogation de 1500 personnes.

Sphinx 2000

Mthodologie

389

Choisir la taille de lchantillon

Taille de
lchantillon

Taux
derreur

Intervalle de confiance
pour p=50%

200
300

6,93%
5,65%

[43,07% , 56,93%]
[44,34% , 55,65%]

2000
3000

2,19%
1,79%

[47,81% , 52,19%]
[48,21% , 51,79%]

Sondage alatoire
B

A
C

Il est trs coteux de bien


reprsenter les strates de faibles effectifs

E
D
B

C
E
D
Redresser
une solution conomique
Sondage par quota
B

E
D
390

Les formes de l'analyse de


donnes
Les mthodes de l'analyse de donnes sont multiples et
rpondent des objectifs varis :
dpouillement visant restituer les rponses de manire
individuelle ou synthtique ;
transformation des donnes originales par recodification
ou calcul ;
analyses statistiques visant dcrire, expliquer ou
classifier.
Elles peuvent concerner une ou plusieurs variables, un seul
individu, tous les individus de l'chantillon ou un sousensemble appel strate.

Le niveau d'analyse
Les dpouillements peuvent se faire diffrents niveaux :
Au niveau de l'individu. On s'intresse aux donnes de
dtail en vue d'entreprendre des actions individuelles. Les
traitements se ramnent alors restituer tout ou une
partie de l'information propre chaque observation. Les
rsultats sont produits sous forme de listes plus ou moins
tendues et structures selon le nombre d'individus
dcrits. Ces extractions peuvent tre effectues au stade
de la saisie (Consulter un profil d'individus), ou au stade
du dpouillement en produisant des listes.
Au niveau de la population entire. On cherche
synthtiser les informations dcrivant chaque individu
pour traiter la population comme un tout. Ceci revient
gommer les variations individuelles pour dcrire chaque
variable par un ou plusieurs indicateurs synthtiques :
valeur moyenne pour les variables numriques,
frquence relative des modalits d'une variable nominale.
Au niveau d'un sous-ensemble de la population. On
analyse des catgories particulires d'individus pour tenir
compte de l'htrognit de la population. En dfinissant
les conditions auxquelles doit rpondre le sous ensemble
tudi, on construit la strate qui se substitue alors
l'examen de l'chantillon total. La fonction Changer de
strate permet ainsi d'analyser comme un tout n'importe
quel sous-ensemble d'individus.

L'analyse univarie : on dcrit la population en examinant


une seule variable la fois. C'est la manire la plus
simple de restituer l'information et de faire de lestimation
statistique.
L'analyse bivarie : on s'intresse aux relations existant
entre 2 variables des fins d'explication et/ou de
prdiction. Cette approche ncessite la formulation d'une
hypothse que la statistique permettra d'infirmer ou de
confirmer.
L'analyse multivarie : on aborde la complexit rsultant
de la multiplicit des variables.
Dans une approche descriptive, on cherche rduire le
nombre de variables (analyses factorielles) ou agrger
les individus en catgories homognes (typologies).
Dans une approche explicative, on cherche intgrer la
pluralit des causes et des effets d'interaction (rgression
multiple et analyse de la variance multiple manova -).

La recodification
Les donnes disponibles ne se trouvent pas toujours dans
un format adquat. La recodification permet de gnrer de
nouvelles variables mieux appropries l'analyse. On peut
distinguer :
La recodification d'une seule variable : mettre en classes
une variable numrique, agrger les modalits d'une
variable nominale, recoder une variable texte en fonction
de son contenu.
La recodification de plusieurs variables : calculer un score
partir des donnes de plusieurs variables nominales,
calculer une nouvelle variable en application d'une
formule en faisant intervenir plusieurs variables, crer de
nouvelles variables calcules en application d'une
analyse multivarie (scores factoriels, classifications...).

De l'univari au multivari
On peut distinguer 3 grandes problmatiques auxquelles
rpondent 3 manires d'aborder l'analyse :

Sphinx 2000

Mthodologie

391

Les niveaux danalyses


Variables j
Analyser la population comme un tout: synthtiser
On sintresse aux variables

Individus i
Analyser les donnes individuelles: dtailler

On sintresse aux individus


Analyser les sous ensembles de la population: segmenter
On sintresse aux strates

Les problmatiques

Analyse univarie
Dcrire une variable la fois

Analyse bivarie
Mettre en relations 2 variables, expliquer

Analyse multivarie
Analyser simultanment
plusieurs variables, synthtiser

392

L'analyse univarie
L'analyse univarie consiste donner une description
synthtique de l'ensemble des individus observs ou d'un
de ses sous-ensembles. La manire d'effectuer ces
descriptions dpend de la nature statistique des variables
en jeu. Dans le cas d'tude par sondage, on peut
galement se livrer l'estimation des proprits de la
population mre.

Dcrire

Dans le tableau ci-contre, on passe d'une information trs


bien structure (variables numriques) une information
floue et ambigu (variables textes), les oprations
auxquelles elles se prtent vont du calcul algbrique
(variables numriques) la qute du sens (variables
textes). En consquence, la qualit des indicateurs
rsultant et le "rendement" des mthodes mises en uvre
va dcroissant. Ces proprits dterminent des techniques
de calcul ou de traitement de l'information, elles devraient
galement guider, ds la conception du questionnaire, le
choix des questions.

Extrapoler la population totale

On analyse chaque variable pour parvenir un nonc


synthtique du type :
" Il y a ......." : Il y a tant d'hommes, tant de femmes qui
connaissent notre produit, il y a chez les acheteurs tant
d'ouvriers...
" ........... est (sont).... " : Le revenu moyen des mnages
acheteurs est de.., la qualit est le premier critre de
choix...
"...........fait (font)....." X% de l'chantillon fait confiance
......

Si l'chantillon rpond aux conditions du sondage alatoire


(tous les individus de la population ont exactement la
mme chance d'tre slectionns) et s'il comporte au
moins 30 individus, on peut estimer partir des indicateurs
calculs sur l'chantillon, les proprits de la population
totale. La valeur de l'cart-type (numrique) et celle de
l'intervalle de confiance (nominale) donnent les fourchettes
de l'estimation.
Attention, dans le cas d'une strate, c'est l'effectif de la
strate qu'il faut considrer et non pas celui de l'chantillon.

Ces noncs spcifient l'tat d'une variable par un effectif


(tant d'hommes), un pourcentage (X% de la population fait)
une grandeur moyenne (le revenu moyen des mnages
acheteurs est...) ou un rang (le premier critre de choix est
la qualit). L'importance du phnomne considr se
trouve ainsi chiffre. L'analyste peut, sur cette base,
exercer son jugement pour dcider. Si la prcision le
permet, il pourra effectuer des calculs et des prvisions.
Dans le cas d'une variable texte, la description consiste
restituer le texte sous forme de liste ou lexique indiquant la
frquence des termes utiliss. Dans tous les cas, il faudra
lire et interprter ces lments dont le sens n'est pas,
comme pour les autres variables, fix a priori.

Les indicateurs selon le type de


variable
Selon le type de variable, la nature de l'information
recueillie n'est pas de mme nature et n'autorise pas les
mmes traitements. A chaque cas correspondent des
indicateurs de rsultats diffrents.

Sphinx 2000

Mthodologie

393

Le type de variable dtermine les possibilits danalyse

394

L'analyse bivarie
L'analyse bivarie commence par la formulation d'une
hypothse oriente par la signification des variables et se
poursuit par la mise en uvre d'une mthode rsultant de
la nature des variables.

La statistique conduira rejeter lhypothse si on ne peut


pas montrer que la relation recherche existe. Dans le cas
inverse, la qualit de linterprtation du fait statistique ne
dpendra que de celle de la thorie utilise.

La statistique : mettre en uvre la


mthode adapte
La mthode mettre en uvre pour tester l'existence d'une
relation dpend de la nature des variables en prsence.

La smantique : explication et
relations causales
Lanalyse bivarie conduit formuler un nonc de type
Si..V1.. Alors V2 postulant l'hypothse d'une relation
causale entre 2 variables. A ce stade, c'est la smantique
qui guide l'analyse : la signification des variables conduit
formuler une thorie justifiant la relation et son sens. La
statistique peut confirmer ou invalider son existence mais
seule la thorie en donne le sens. Ainsi, on peut tablir
statistiquement un lien entre le niveau d'ducation et le
revenu. Mais c'est en fonction d'une thorie qu'on
interprtera cette relation pour dire que le revenu
conditionne l'ducation (thorie du cot) ou que l'ducation
dtermine le revenu (thorie du rendement).
L'anlayse bivarie commence donc par la formulation des
hypothses que la statistique permettra de tester. Le
modle ci-contre peut orienter la rflexion : parmi toutes les
relations envisageables, 3 renvoient des thories trs
gnrales du comportement humain :
1 - Le dterminisme sociologique : laction obit aux
habitudes et aux contraintes.
2 - La dcision et la rationalit : laction rsulte des choix
et des calculs.
3 - Les psychologismes : laction est modalit
dexpression.

Le tableau ci-contre identifie les 3 cas possibles selon la


nature des variables (nominales ou numriques).
Pour les variables chelles, on se ramne l'un des cas
prcdents selon qu'on les considre comme des variables
numriques ou comme des variables nominales.
Le cas des variables textuelles peut galement tre
ramen lun des 3 cas prcdents :
En faisant une analyse de contenu par recodification de
la variable, on est ramen au cas du croisement avec une
variable nominale.
En utilisant les mthodes de lanalyse lexicale :
construction dun tableau lexical qui dcompte le nombre
doccurrences des mots de la variable texte
analyse, pour les modalits dune variable
nominale. On est ramen au traitement dun tableau
de contingence analogue ceux des tris croiss,
cration de nouvelles variables dorigine lexicale :
nominales (fermes sur les mots du lexique) ou
numriques
(longueur,
banalit,
intensit...)
susceptibles dtre mises en relation entre elles ou
avec les variables de contexte) ; ce qui ramne
lun des cas prcdents.

On peut bien sr faire l'conomie de la rflexion pralable


et essayer toutes les relations envisageables. Elles
peuvent tre trs nombreuses et perdre l'analyste dans une
qute aveugle. D'autre part, le fait de constater une relation
statistique ne suffit pas tablir une connaissance
argumentante. Les exemples sont nombreux dans les
tudes, de concidences inexpliques ou fortuites...
Avant de commencer toute analyse bivarie, il convient
donc dtablir une stratgie de recherche, en mobilisant les
expriences, intuitions, croyances, thories, toutes
connaissances pralables que lon confrontera aux
informations contenues dans la base de donnes. On
dterminera ainsi quelles variables mettre en relation.
Sphinx 2000

Mthodologie

395

La smantique : la signification des variables guide la formulation des hypothses

Opinions Valeurs

Identit

3
Comportements
2

Motifs
La statistique : la nature des variables dtermine la mthode

1 Tris croiss

3 Analyse de la variance

396

3 Analyse de la variance

2 Corrlation

Construction et lecture dune carte


dAFC

Lanalyse bivarie : Chi2 et AFC


Afin de dterminer sil existe un lien entre 2 variables
nominales, on compare les effectifs du tableau ceux
qu'on aurait obtenus si les effectifs taient rpartis
proportionnellement. Si tel est le cas, quelle que soit la
modalit considre dune des variables, la rpartition des
modalits de lautre reste la mme. Il y a alors
indpendance entre les 2 variables.

Le calcul du Chi2
Le test du Chi consiste dterminer si le tableau tudi
correspond cette hypothse. Sil sen carte beaucoup,
on prsume lexistence dun lien dautant plus significatif
que lcart est grand. Le Chi est la mesure de cet cart.
A partir d'un tableau de contingence L lignes Li et C
colonnes Cj, on dtermine dabord, pour chaque
case, leffectif thorique. C'est le produit du total de sa ligne
(Li,.) par le total de sa colonne (C.,j) divis par le total
gnral (n) soit (Li,.*C.,j/n). On calcule ensuite la somme
des carrs des carts entre effectif rel et effectif thorique.
Plus lcart est grand, plus le Chi est lev, et plus on a de
chances dtre en prsence dun lien significatif.
Cette apprciation dpend bien sr de la dimension du
tableau, cest--dire du nombre de degrs de libert : ddl =
(L-1)* (C-1). Plus il y a de cases, plus la somme risque
dtre leve. Si la valeur du Chi permet dindiquer
lexistence dun lien, il faut, pour le qualifier, examiner
comment celui-ci est compos.

Contribution au Chi et interprtation


des correspondances
Sur quelles cases observe-t-on les carts les plus
importants ? Sur quelles autres les effectifs sont sans
surprise ?

On peut donner une reprsentation plus visuelle des carts


lindpendance par la technique de lanalyse factorielle
des correspondances. Elle conduit tracer une carte qui
dispose les modalits des 2 variables en fonction des
carts la situation dindpendance.
Par dfaut, chaque modalit est reprsente par un pav
de surface proportionnelle son effectif. Leurs positions les
unes par rapport aux autres sinterprtent ainsi :
2 modalits lignes et colonnes seront dautant plus
proches que les effectifs du tableau sont en excs par
rapport lindpendance : attraction.
Les modalits lignes et colonnes seront dautant plus
loignes que les effectifs du tableau sont en dficit par
rapport lindpendance : rpulsion.
Les modalits lignes ou colonnes situes la priphrie
de la carte signalent des profils originaux. Au contraire,
une position centrale interdit tout commentaire (profils
sans originalit ou point mal reprsent dans le systme
daxes de la carte).
Le bien fond de ces interprtations dpend de :
Lintensit du lien entre les 2 variables, mesur par le
Chi.
La quantit dinformations restitue par la carte, indique
par le pourcentage de variance explique (ou dcart
lindpendance) par les axes. La qualit de la
reprsentation est dautant meilleure que ces
pourcentages sont levs.
Linterprtation des axes partir des oppositions quils
mettent en vidence doit tenir compte du pourcentage de
variance restitue. Sil est faible, il faut se garder
dinsister sur des phnomnes qui ne reprsentent
quune petite partie des caractristiques du tableau.

On examine pour cela les contributions de chaque case


la somme du Chi, elles mettent en vidence l'importance
de l'excs ou du dficit observable dans chaque cellule.
Les cases contribuant le plus fortement sont encadres de
bleu ou de rouge selon que l'effectif rel excde ou est
infrieur l'effectif thorique.
Ainsi, cest lexamen des contributions au Chi et des
correspondances
quelles
rvlent
qui
permet
vritablement de qualifier la relation.
Sphinx 2000

Mthodologie

397

398

L'analyse bivarie : corrlation


Lorsque les variables sont numriques, on dispose d'une
information trs riche autorisant la recherche d'une formule
mathmatique pour qualifier la relation.

Le coefficient de corrlation est galement affect dun


signe. Il indique le sens de la relation. Elle est croissante si
le signe est positif, dcroissante sinon. Ce signe est aussi
celui de a, le coefficient de rgression dans lquation
V1=axV2+b.

Nuage de points et droite de


rgression

V1

V1

La recherche dune relation entre 2 variables numriques x


et y peut se faire de 2 manires diffrentes :
Dune manire graphique, en reprsentant chaque
observation par ses coordonnes x et y selon 2 axes. On
obtient alors un nuage de points plus ou moins bien
aligns.
Dune manire algbrique, en recherchant lexistence
dune relation linaire entre ces 2 variables y = ax + b. On
obtient des valeurs calcules y plus ou moins proches
des valeurs observes.
Selon que la forme du nuage est plus ou moins proche
dune droite (la droite de rgression), ou que les valeurs
calcules partir de lquation (de rgression) sont plus ou
moins proches des observations relles, on dira que la
corrlation entre les 2 variables est bonne ou mauvaise. Le
coefficient de corrlation mesure la qualit de lajustement
entre les valeurs y et x relles et le modle de la relation
reprsent par lquation y = ax + b ou par la droite
correspondante. En rfrence une interprtation causale
du modle, y est appele variable expliquer et x variable
explicative.

Coefficient de corrlation
Le coefficient de corrlation (r) tablit la qualit de
lajustement entre deux variables V1 et V2. Sa valeur
absolue (ou r2) est comprise entre 0 et 1.
Elle est gale 1 si lajustement est parfait : il existe une
fonction V1=axV2+b dont le rsultat donne toujours
exactement la valeur observe de V1 : on peut alors dire
que V1 dpend exactement de V2.

V2

V2

Relation dcroissante, a<0, 2r>0.8

Relation croissante, a>0, r>0.8


V1

V2

Pas de relation r2 <0.1

Dans le cas dune rgression multiple, on cherche tablir


une relation du type V1=axV2+bxV3+cxV4. On calcule
alors un coefficient de rgression multiple. Il indique
galement la qualit de lajustement effectu par le modle
et sinterprte comme un coefficient de corrlation simple.

Modle linaire et non linaire


Le calcul du coefficient de corrlation se fait par rapport au
modle linaire de l'quation du premier degr laquelle
correspond la droite de rgression. On peut tester la
relation par rfrence un modle non linaire. Il faudra
pour cela transformer la valeur de la variable explique en
la recalculant par rapport au modle tester. Par exemple,
pour tester un modle logarithmique, on calculera une
nouvelle variable gale au log de la variable explicative :
log(x) pour ensuite tester l'equation y=a.logx+b.

Elle est gale 0 si quelle que soit la fonction considre,


la valeur calcule de V1 est galement loigne de sa
valeur observe. V1 est indpendante de V2.
Lusage est de considrer qu partir dun coefficient de
corrlation de valeur absolue suprieure 0.8, il existe une
bonne relation entre les 2 variables.
Sphinx 2000

Mthodologie

399

400

L'analyse bivarie : analyse de la


variance
L'analyse de la variance s'applique au cas o les variables
sont de natures diffrentes : l'une est nominale et dfinit
des catgories d'individus, l'autre, numrique, permet de
mesurer une proprit de ces individus. On pourra ainsi par
exemple savoir si, selon le sexe, le revenu varie
significativement.

Tableau de valeurs moyennes


La construction dun tableau de valeurs moyennes, tablit,
pour les modalits d'une variable nominale, les valeurs
moyennes d'une ou plusieurs variables numriques. On
peut ainsi comparer ces valeurs entre elles et conclure
lexistence dune relation si les variations de la moyenne
mettent en vidence des diffrences significatives sur
lensemble des modalits.
On utilise pour cela le test de lanalyse de la variance.

Critres discriminants et valeurs


significatives
Les tests danalyse de la variance et de comparaison de
moyennes apportent une information trs utile permettant
d'identifier les variables pour lesquelles les catgories de la
variable nominale font apparatre des diffrences
discriminantes :
Les variables dont le nom est encadr de bleu
discriminent les modalits de la variable nominale. Pour
ces variables, le test de Fisher est significatif (par dfaut
au risque de 5 %).
Les cellules encadres dans le tableau signalent une
moyenne significativement diffrente de la moyenne sur
lensemble de lchantillon. Le test de comparaison de
moyennes est significatif (par dfaut au risque de 5 %).

Reprsentation graphique de la
dispersion

Analyse de la variance
Son but est dtablir si, au regard des valeurs de la variable
numrique, les groupes dindividus correspondant aux
modalits de la variable nominale sont significativement
diffrents les uns des autres. Elle met en uvre les
principes suivants :
Pour chaque modalit de la variable nominale, la
moyenne de la variable numrique dissimule une
dispersion autour de cette moyenne. La variance (le carr
de lcart-type) mesure cette dispersion appele variance
interne.
Dune modalit lautre, la moyenne varie et rvle une
htrognit, plus ou moins grande, mesure par un
autre calcul de variance : la variance entre modalits.
Le test danalyse de variance porte sur le rapport entre la
variance entre modalits et la moyenne des variances
internes. Il a pour but de vrifier si lhtrognit entre
modalits est plus grande que lhtrognit lintrieur
des modalits. Si ce rapport not F est suffisamment lev,
on dit que la variable numrique discrimine les modalits
de la variable nominale.

Sphinx 2000

Ce jugement global sapplique la rpartition de la


population totale en catgories dfinies par chacune des
modalits. On peut le complter en comparant les valeurs
moyennes de chaque modalit la moyenne tablie sur
lensemble de la population.

L'analyse d'un tableau de moyennes est facilite par la


reprsentation graphique de la dispersion des variables
numriques selon les modalits de la nominale.

Analyse de la variance plusieurs


facteurs
On peut mener une analyse de la variance en considrant
2 variables nominales et une numrique. On cherche alors,
par la comparaison de tous les cas dfinis par les
nominales les influences directes et croises qu'elles
peuvent avoir sur la valeur de la numrique. Cette mthode
dite analyse de la variance multiple (Manova) fait partie des
mthodes multivaries. Elle n'est disponible que dans
Plus2.

Mthodologie

401

402

marquer des individus selon leur appartenance telle


strate ou selon quils rpondent tel profil et constituer
ainsi des groupes a priori.

Analyse multivarie : objectifs et


mthodes
Lanalyse multidimensionnelle des donnes consiste
analyser simultanment plus de deux variables la fois
dans un but de synthse ou danalyse.

Synthtiser
Il s'agit de rsumer la masse des informations concernant
un grand nombre dindividus dcrits par de nombreuses
variables.
On cherche dcrire les donnes par une expression plus
conomique afin den rendre compte plus simplement.
Deux voies sont envisageables :
La classification ou la typologie : elle consiste regrouper
les individus de la base de donnes en classes (ou types)
dindividus selon les similarits qui permettent de les
rassembler. Par exemple : dcrire une population en
identifiant diffrentes classes de styles de vie.
La rduction des dimensions danalyse : elle consiste
rduire un grand nombre de variables quelques
dimensions communes. Par exemple, ramener la varit
des opinions exprimes par les rponses vingt
questions diffrentes, 2 dimensions opposant dune
part, le sentiment la raison, et dautre part, la tradition
au changement.

Analyser
On cherche les influences de plusieurs variables entre elles
pour mettre en vidence comment celles-ci se dterminent
les unes et les autres.
On cherche expliquer en construisant des modles
permettant dexpliquer une variable par les variations de
plusieurs autres, en cherchant ainsi des liens de causalit
plus complexes que la simple relation entre deux variables.

Les mthodes
Les mthodes disponibles sont nombreuses :
Certaines sont directes. Elles peuvent consister :
combiner entre elles plusieurs variables pour calculer une
nouvelle variable qui les rsume (une somme, une
moyenne, un score...).

Sphinx 2000

Dautres sont indirectes. Elles reposent sur une analyse


pralable de la structure des donnes orientant la synthse
en fonction des proprits rvles. On peut distinguer ces
mthodes selon le type de variables auxquelles elles
s'appliquent :
- Pour les variables quantitatives, il sagit de :
La corrlation multiple : elle permet de construire la
matrice de corrlation qui met en vidence lensemble
des relations existant entre plusieurs variables.
Lanalyse en composantes principales : partir des
proprits de la matrice de corrlation, elle permet de
substituer aux variables de dpart un plus petit nombre
de dimensions qui les rsument au mieux. Dans cet
espace rduit, on peut alors dfinir une typologie en
regroupant les individus en classes homognes.
La rgression multiple : partir des proprits de la
matrice de corrlation, elle permet de btir un modle
explicatif donnant la meilleure expression de lune des
variables - variable expliquer - en fonction des autres variables explicatives -.
La classification automatique : cette mthode consiste
rpartir les individus dune population en un nombre de
classes dtermin a priori. En fonction de la structure des
donnes, la mthode consiste amliorer une partition
initiale des individus.
- Pour les variables qualitatives, il sagit de :
Lanalyse factorielle des correspondances multiples :
partir dune analyse des distances entre individus, dfinie
par rapport leur description sur un grand nombre de
variables qualitatives, on dtermine un sous-ensemble de
dimensions, des facteurs conservant au mieux les
distances de dpart. Dans cet espace rduit, on peut
alors dfinir une typologie en regroupant les individus en
classes homognes.
La classification automatique applique des variables
qualitatives.
Toutes ces mthodes sont accessibles par le menu
Approfondir. On peut pour mmoire y rajouter des
mthodes de mme nature, ne portant pas sur les individus
mais sur des tableaux deffectifs ou des tableaux de
moyennes. Le tableau ci-dessous rsume les mthodes
disponibles.

Mthodologie

403

Expliquer

V1

Etablir un modle des relations entre


variables. Il exprime ces relations sous forme
de fonction mathmatique.

V2

V3

V3

Rgression multiple : n variables numriques


Manova
: 2 variables nominales et 1 numrique

Synthtiser
Rduire le nombre des
dimensions
danalyse
:
cartes factorielles, scores
factoriels.
Analyse factorielle multiple (AFCM)
: n variables nominales
Analyse en composantes principales (ACP)
: n variables numriques
Analyse factorielle des correspondances (AFC) : 2 nominales
Analyse en composantes principales
dun tableau de moyennes (ACP)
: 1 nominale n numriques
Classifier
Regrouper les individus en
classes
homognes.
Classification automatique,
typologie vue.
Classification automatique
Typologie AFCM
Typologie ACP

404

: n numriques
: n nominales
: n numriques

L'analyse factorielle : les principes


Les mthodes d'analyse factorielle peuvent porter sur des
donnes de dimensions modestes, tableaux croiss,
tableaux de moyennes ou sur des ensembles de grande
dimension lorsqu'en ligne, on trouve tous les individus de la
population. Dans ce dernier cas, la recherche des facteurs
peut se prolonger par la construction d'une typologie.

AFCM et ACP

Lidal est de le rduire aux deux dimensions dun plan.


Cette configuration permet en effet de visualiser les
individus et de mettre en vidence ce qui les distingue. Ces
deux dimensions, appeles facteurs, rsument lensemble
des variables de dpart et peuvent conduire une
interprtation plus synthtique de la structure des donnes.
A partir de ces mmes informations, on peut regrouper les
individus en classes de proximit pour dfinir ainsi une
typologie.
Cette dmarche est illustre par le schma ci-contre.

Les deux mthodes dont on prsente ici les principes


portent sur ce type de donnes comportant autant de
lignes que l'chantillon ou la strate compte d'individus.
Quant aux colonnes, ce sont :
soit des variables numriques ou critres (questions
ouvertes numriques ou chelles), auquel cas, il s'agit
d'un tableau de valeurs (chaque case est la valeur
donne par l'individu en rponse la question pose) et
l'analyse est une Analyse en Composantes principales ou
ACP sur individus.
soit des variables qualitatives (questions fermes uniques
ou multiples), auquel cas, elles reprsentent les
modalits. Le tableau est alors un tableau binaire ne
comportant que des 1 ou des 0, selon que l'individu a cit
ou non la modalit en question. Un tel tableau binaire
peut tre assimil un tableau d'effectifs et peut tre
soumis comme tel l'Analyse factorielle des
correspondances multiples ou AFC sur individus.
Bien quelles concernent des variables de natures
diffrentes, ces deux mthodes mettent en uvre les
mmes principes et la mme dmarche. Nous les
dcrivons dune manire commune dans ce qui suit, pour
illustrer plus en dtail ensuite lAnalyse en composantes
principales et situer enfin, par diffrence, les spcificits
de lAnalyse factorielle multiple.

Les donnes individus / variables

Trouver les facteurs pour rduire le


nombre des variables danalyse
La rduction de lespace de dpart se fait par la recherche
des facteurs rsumant lensemble des donnes.
Pour lAnalyse en composantes principales - cas des
donnes quantitatives -, on cherche les combinaisons
linaires des variables qui conservent le mieux la structure
des donnes. On sappuie pour cela sur lanalyse de la
matrice de corrlation.
Pour lAnalyse factorielle des correspondances cas
des donnes qualitatives -, on procde par une analyse de
la distance du Chi en vue de dterminer les facteurs qui
restituent au mieux les carts entre individus. On sappuie
pour cela sur le tableau des effectifs ou tableau de Burt.

Agrger les individus : construire une


typologie
La dtermination des facteurs rsumant l'information de
dpart permet, par projection, de reprsenter les individus
dans un plan. Les individus apparaissent ainsi sous la
forme d'un nuage de points mettant en vidence diffrentes
zones. On peut regrouper les individus en catgories selon
leur disposition sur la carte et dfinir ainsi une typologie.

Scores factoriels et typologie

Le tableau de i lignes, reprsentant les individus, et de c


colonnes, reprsentant les dimensions, correspond
lunivers analyser. Il forme un hyper-espace de c
dimensions dans lequel se situent les i individus.

L'enregistrement des coordonnes des individus par


rapport aux axes factoriels (score factoriels) et leur
appartenance l'une des catgories de la typologie permet
de rsumer l'information de dpart.

Les techniques qui nous intressent ont pour but de


ramener cet espace de plus modestes dimensions.

Sphinx 2000

Mthodologie

405

Rduire les
dimensions
Donnes initiales

Synthse

Regrouper
les individus

Variables numriques :
Variables nominales

Analyse en composantes principales

: Analyse factorielle multiple

On enrichit la base de dpart en crant


de nouvelles variables correspondant aux :
Scores factoriels
Classes typologiques

406

Trouver une typologie pour grouper


les individus en classes homognes

L'analyse factorielle : interprter


les rsultats
Qualit de la rduction par lanalyse
factorielle
Les algorithmes utiliss consistent rechercher les n
premiers facteurs. Chacun deux restitue une partie de
linformation du tableau de dpart. Le premier facteur en
restitue le plus et ainsi de suite, selon lordre dcroissant
de la quantit dinformations.
La qualit de lanalyse dpend ainsi de linformation
restitue par les deux premiers facteurs. Plus celle-ci est
leve, meilleure sera lanalyse effectue dans le plan
quils dfinissent. Lorsque celle-ci est trop faible, il peut tre
ncessaire de la complter par lanalyse des plans
suivants.
La quantit dinformations restitue par un facteur (ou axe
factoriel) est indique par le pourcentage de variance
explique par le facteur (AFC) ou la composante (ACP).

Interprter les facteurs


Linterprtation des facteurs peut se faire par lexamen du
plan factoriel ou partir du tableau des contributions. Les
contributions indiquent dans quelle mesure les axes
restituent l'information contenue dans les variables de
dpart.

Par projection, on peut reprsenter les individus dans le


plan factoriel, mais selon leur position dans lespace
dorigine, ils seront plus ou moins bien reprsents. Sils
sont loigns du plan de projection, ils se projetteront au
centre du plan et leur position fera illusion.
Dans le cas de l'ACP, les coordonnes des variables sont
gales au coefficient de corrlation de la variable avec
chacun des axes. Pour l'AFCM, elles sont un indicateur de
la contribution des modalits chacun des axes.
Ainsi dans la figure suivante, les individus C et A semblent
proches alors quils sont en fait loigns. A est mal
reprsent car trs loign du plan factoriel avec lequel il
forme un angle presque droit.
La projection est dformante, il convient donc de procder
avec prudence, par exemple en ignorant les points mal
projets (ceux qui font un angle lev avec le plan) et en
concentrant lanalyse sur les groupes de points loigns du
centre.
Ces prcautions tant prises, il est alors possible de
regrouper les individus, selon leur proximit dans le plan
factoriel, en construisant ainsi une typologie vue. Cette
possibilit est une des originalits du Sphinx. Elle est
accessible partir du bouton Typologie figurant en regard
des cartes danalyses factorielles.

Visuellement, on peut raisonner comme si, par leur position


loigne du centre, les variables (ACP) ou les modalits
(AFCM) tiraient les axes factoriels en leur donnant leurs
proprits . Au contraire, lorsquelles se trouvent prs du
centre, elles nont pas ou peu dinfluence.
Dans le cas de l'ACP, les coordonnes des variables sont
gales au coefficient de corrlation de la variable avec
chacun des axes. Pour l'AFCM, elles sont un indicateur de
la contribution des modalits chacun des axes.

Sphinx 2000

Mthodologie

407

Interprter les axes

F2

Le schma ci-contre conduit interprter le


facteur F1 comme la dimension sur laquelle
sopposent les critres C1 et C4, alors que sur
le facteur F2, C3 et C5 sopposent C2.
Les variations du critre C6 sont mal
reprsentes par ce plan factoriel.
Lexamen du tableau des contributions
associ cet exemple confirmerait ces
interprtations. Par exemple, on pourrait y
vrifier que C6 ne contribue que pour un trs
faible pourcentage chacun des axes.

C3

C5

C1
F1

C6

C4

C2

Projection des individus dans le plan factoriel

A
B

B
F

F
A

C
E

E
D

Vue dans lespace

408

Vue dans le plan factoriel

Corrlation et rgression multiple


L'objectif de la rgression multiple est de mettre en relation
une variable, la variable explique avec plusieurs autres les
variables explicatives, dans le but de dfinir l'quation qui
les relie. On pourra ainsi, connaissant les variables
expliques, dterminer les valeurs de la variable explicative
: V1=axV2+bxV3+cxV4. On calcule alors un coefficient de
rgression multiple. Il indique la qualit de lajustement
effectu par le modle et sinterprte comme un coefficient
de corrlation simple.
L'exemple ci-contre, tir d'une tude de satisfaction, montre
comment on peut expliquer la satisfaction globale en la
rapportant l'valuation des diffrents attributs du service
considr. Les coefficients de rgression partielle (ai)
donnent une indication sur la manire dont la perception de
chaque attribut intervient dans la formation de la
satisfaction globale.

Equation de rgression linaire


multiple et paramtres dajustement
On calcule lquation linaire qui ajuste le mieux la variable
explique par rapport aux variables explicatives. Les
rsultats sont communiqus sous la forme de lquation de
rgression multiple.

Les variations de F peuvent conduire reconsidrer les


variables intervenant dans le modle. En effet, la
suppression ou l'ajout de variables supplmentaires peut
affecter la qualit de l'ajustement (coefficient de corrlation)
mais dgrader celle de l'estimation. On observe alors une
dcroissance de F.

Procdure de rgression pas pas


Les variables explicatives interviennent dans le calcul, dans
lordre de leurs corrlations respectives avec la variable
expliquer. Lalgorithme sarrte quand la qualit de
lajustement naugmente plus de manire significative.

Indpendance des variables


explicatives
L'examen de la matrice des coefficients de corrlation
permet de vrifier que les variables explicatives intervenant
dans l'quation sont indpendantes. On peut, en outre,
tester la sensibilit de la rgression en supprimant ou
rajoutant des variables. On peut alors suivre lvolution du
coefficient de corrlation multiple.

Rgression non linaire


Il est tout fait possible de tester des modles non
linaires. Il faut pour cela au pralable transformer les
variables intervenant dans le modle en utilisant la
fonction.

La qualit de l'ajustement s'apprcie principalement la


valeur du coefficient de corrlation. Plus sa valeur absolue
est leve, plus faible est l'cart entre les valeurs calcules
et observes (cet cart est aussi appel rsidu).
L'effet de chaque variable explicative dpend des
coefficients de rgression figurant dans lquation. Plus
celui-ci est grand, plus la variable explicative considre
influence la variable explique. Mais il faut galement tenir
compte de lcart-type de chacun de ces coefficients. Plus
il est lev, moins nette est linfluence de la variable
considre.
Enfin, lindicateur F est un autre moyen d'apprcier la
qualit de l'estimation. Si sa valeur est suprieure au seuil
d'une table de Fisher, l'estimation est considre comme
trs significative ( 95%) ou peu significative (entre 80 et
95%), sinon, elle ne l'est pas du tout.

Sphinx 2000

Mthodologie

409

V1
V2
V3

V0

Variable explique

Vn
Variables explicatives

Vo = a1xV1 + a2xV2 + a3xV3 + anxVn


Note

Evaluations
Coefficients dimportance relative
Equation de rgression multiple
note_globale = +0.970 * Restauration +0.891 * Confort -0.652 * Soins_qualit
+0.639 * Informations -0.510 * Rconfort +0.390 * Hygine -0.219 * Services
+9.709
Matrice de corrlation

note
_glo
1,00
note globale
0,42
Restauration
0,35
Confort
0,26
Hygine
0,23
Informations
Soins rapidit 0,15
0,15
Comptence
0,14
Disponibilit
-0,00
Rconfort
-0,06
Accueil
-0,06
Services
Soins qualit -0,14

410

Rest
aura

Conf
ort

Hygi
ne

Infor
mati

Soin
s_ra

Com
pte

Disp
onib

1,00
0,17
0,33
0,12
0,22
0,22
0,26
0,15
-0,04
0,04
0,15

1,00
0,09
0,05
0,16
0,25
0,17
0,18
-0,02
-0,03
0,10

1,00
0,12
0,19
0,08
0,22
0,29
-0,03
0,18
-0,04

1,00
0,17
0,08
0,22
0,12
0,02
-0,00
0,07

1,00
0,17
0,31
0,18
-0,09
0,03
0,09

1,00
0,15
0,14
-0,00
-0,02
0,08

1,00
0,20
-0,06
0,04
0,08

Rc
onfo

1,00
0,03
0,00
0,01

Acc
ueil

1,00
0,02
-0,04

Serv
ices

Soin
s_q

1,00
0,04

1,00

Classification automatique
La classification automatique rpond lobjectif suivant :
regrouper les individus dune population en classes formant
une partition. Cest--dire que tout individu appartient une
classe et une seule. La partition est lensemble des
classes.

Diffrentes approches de classification


Il existe plusieurs manires doprer une classification :
effectuer le tri plat ou crois dune ou plusieurs
variables fermes uniques. Chaque classe est forme
des individus ayant en commun une modalit (tri plat)
ou un couple de modalits (tri crois). Toute variable
ferme unique (ou toute combinaison de variables
fermes uniques) dfinit ainsi une classification ;
construire une typologie vue partir de lexamen dun
plan factoriel : on dfinit la variable ferme sur la
typologie qui, comme toute variable ferme, dfinit une
classification.

Dfinir la population : tous les individus de la base ou une


strate seulement ;
Slectionner les variables par rapport auxquelles on
souhaite dfinir une partition de la population ;
Fixer le nombre de classes dsires ou une partition de
dpart dfinie par la variable ferme unique de son
choix ;
Il est tout fait possible de choisir pour variable de dpart
une typologie dfinie partir dune analyse en
composantes principales ou une analyse factorielle
multiple. On pourra ainsi affiner les agrgations effectues
dans le plan factoriel.

La mthode des centres mobiles


Cet algorithme met en oeuvre le principe suivant : on
amliore progressivement la partition de dpart en
calculant, pour chaque classe, un individu fictif moyen. On
dfinit alors une nouvelle classification, par agrgation aux
individus fictifs moyens rsultant de la classification
prcdente. On rpte lopration tant que la nouvelle
classification diffre de la prcdente.

Dans le premier cas, la classification est la traduction


exacte des donnes. Mais si on veut la construire partir
de plusieurs variables, on risque dobtenir un nombre
beaucoup trop grand de classes, ce qui fait perdre tout
intrt la classification.

Lindividu fictif moyen est calcul comme le barycentre de


la classe, lagrgation se fait en fonction de la moindre
distance.

Dans le deuxime cas, on peut fixer un nombre rduit de


classes ou types, pour capter les individus apparaissant
dans un plan factoriel mais le procd daffectation peut
paratre trop subjectif et approximatif.

La classification rsultant de lalgorithme dpend de la


partition de dpart. Elle est fixe dune manire alatoire si
on se borne indiquer le nombre de classes dsires,
sinon, elle dpend de la variable choisie.

La procdure de classification automatique propose est


un compromis pour viter les inconvnients qui viennent
dtre signals. Elle repose sur la mise en oeuvre de la
mthode dite des centres mobiles ou des nues
dynamiques.

Il peut alors tre intressant de rechercher plusieurs


classifications pour les comparer entre elles. On peut pour
cela considrer :
la rpartition des effectifs conduisant des classes plus
ou moins quilibres ;
le pouvoir discriminant de la classification. On cherchera
pour cela comparer les classes du point de vue des
variables partir desquelles on les a dtermines :
analyse de la variance ou test du Chi selon quil sagit de
variables quantitatives ou qualitatives.

Il existe bien dautres mthodes (classifications


hirarchiques ascendantes ou descendantes) mais celle
que nous proposons peut sappliquer de trs grands
effectifs et permet de contrler a priori le nombre de
classes.

Analyser la classification obtenue

Dfinir une classification


Les tapes de la mthode sont les suivantes :
Fixer les objectifs de la classification ;

Sphinx 2000

Mthodologie

411

412

Sphinx 2000

Mthodologie

413

Table des
matires
dtaille

414

Avant de commencer.............................8
1. L'organisation du Sphinx et les
diffrents logiciels ......................................9
Les quatre stades d'une tude...................... 9
Les trois niveaux de logiciels........................ 9
Le Sphinx Primo ............................................. 9
2
Le Sphinx Plus .............................................. 9
Le Sphinx Lexica ............................................ 9
Version 2000 et versions antrieures ........... 9
Eurka ! ........................................................... 9

2. A l'intention des utilisateurs d'une


version antrieure du Sphinx...................11
Les nouveauts ............................................ 11
Compatibilit avec les anciennes
versions ........................................................ 11

Le Sphinx en quelques pages.............14


1. Bref parcours initiatique...........................15
Crer une nouvelle enqute ........................ 15
Dfinir le questionnaire ............................... 15
Saisir des rponses ..................................... 16
Dpouiller et analyser les rsultats ............ 16
Prparer le rapport ....................................... 17

2. Llaboration du questionnaire ................19


1.1 Dfinition des questions ..................... 19
Organisation du questionnaire ................... 20
Edition du questionnaire ............................. 20

3. La saisie des rponses............................22


Saisie directe ou saisie rapide .................... 22
Les nouvelles technologies de saisie ........ 22
Consultation et correction........................... 22
Organisation de la saisie ............................. 23

4. Les traitements ........................................24


Dpouiller les rsultats................................ 24
Analyser les rsultats .................................. 25
Recoder les donnes ................................... 28
Approfondir les analyses* ........................... 29

5. Analyser des donnes textuelles.............31


Le verbatim ................................................... 31
Prsentation en tableau............................... 31
Lanalyse de contenu................................... 32
Lanalyse lexicale*........................................ 33

6. Utiliser toutes les possibilits du


Sphinx......................................................34
Rdiger un rapport dtude ......................... 34
Ouvrir une base de donnes ....................... 34
Sphinx 2000

Caractriser .................................................. 35
Dcouvrir les statistiques............................ 35
Le Sphinx en direct ...................................... 36

Elaborer le questionnaire ....................38


1. Pour commencer votre travail ................. 39
Crer une nouvelle enqute ........................ 39
Reprendre une enqute existante............... 39
Rechercher une enqute ............................. 39
Ouvrir un fichier de donnes externes....... 39

2. Les modles de questionnaire ................ 41


Utiliser un modle de questionnaire .......... 41
Choisir un questionnaire-type .................... 41
Crer la nouvelle enqute............................ 41
Enrichir la liste des modles....................... 41

3. Cration dune nouvelle enqute ............ 43


Dfinir un titre denqute............................. 43
Rdiger des commentaires ......................... 43
Inscrire lorganisme et la priode ............... 43
Rdiger par questions ou par parties ?...... 43

4. Rdaction des questions......................... 45


Partir dun modle........................................ 45
Crer une nouvelle question ....................... 45
Insrer et dupliquer...................................... 45

5. Bibliothque de questions....................... 47
Utiliser la bibliothque................................. 47
Enrichir la bibliothque ............................... 47
Crer une bibliothque ................................ 47

6. Questions rponses fermes ............... 49


Rponses fermes uniques......................... 49
Rponses fermes multiples....................... 49
Rponses fermes ordonnes .................... 49
Questions chelles ...................................... 49
Indiquer les modalits ................................. 49

7. Questions ouvertes ................................. 51


Ouvertes numriques .................................. 51
Ouvertes textes ............................................ 51
Questions "Autre, prcisez"........................ 51
Questions images ........................................ 51

8. Codes, dates et QCM.............................. 53


Questions codes .......................................... 53
Questions dates ........................................... 53
Associer des valeurs aux questions
fermes ......................................................... 53

9. Organiser le questionnaire...................... 55
Titres, consignes et parties......................... 55
Dplacer des questions ou des parties...... 55
Modifier des questions ................................ 55
Grouper des questions ................................ 55

Table des matires dtaille

415

Renvois et restrictions la saisie............... 55

10.Groupes de questions .............................57


11.Renvois Restrictions .............................59
Renvoi ........................................................... 59
Restrictions de saisie .................................. 59
Autre, prcisez.......................................... 59
Lgende de la liste des questions .............. 59

12.Modifier le questionnaire pendant et


aprs la saisie..........................................61
Changer le type dune question.................. 61
Modifier les modalits ................................. 61
Supprimer des variables.............................. 61
Modifier les contrles de saisie .................. 61

13.Mettre en page le questionnaire


papier.......................................................63
Traitement de textes ou Sphinx ?............... 63
Une prsentation sur mesure...................... 63
Aperu du questionnaire avant
impression .................................................... 63
Amlioration du questionnaire dans un
traitement de textes ..................................... 63

14.Options de mise en page.........................65


Choisir une disposition ............................... 65
Dfinir len-tte ............................................. 65
Numroter les questions et les
modalits ...................................................... 65
Crer les zones de rponses....................... 65
Adapter les polices de caractres .............. 65
Indiquer les rponses .................................. 65

15.Impression du questionnaire ...................67


Prparer la mise en page du
questionnaire................................................ 67
Choisir une disposition ............................... 67
Affiner la prsentation ................................. 67
Imprimer le questionnaire ........................... 67
Faire figurer les rponses ........................... 67

16.Exporter le questionnaire.........................69
Inclure dans le rapport................................. 69
Enregistrement du questionnaire au
format Texte.................................................. 69
Modifications dans le traitement de
textes............................................................. 69

Saisir les rponses ..............................72


1. Les diffrentes sources de donnes........73
Enqutes simples peu volumineuses......... 73
Enqutes utilisant des donnes prexistantes...................................................... 73

Enqutes traitant un gros volume de


rponses ....................................................... 73
Enqutes ncessitant un
environnement de saisie particulier ........... 73
Enqutes en rseau ..................................... 73

2. Saisie des rponses ................................ 75


Saisie directe ................................................ 75
Saisie rapide................................................. 75
Les options communes aux deux
modes de saisie ........................................... 75

3. Consultation et modification .................... 77


Le mode direct ............................................. 77
Le mode rapide ............................................ 77
Le mode tableur ........................................... 77
Consulter un profil dindividus ................... 77

4. Options et contrles de saisie ................. 79


Options de saisie ......................................... 79
Contrles automatiques de saisie .............. 79

5. Rassembler / Fusionner .......................... 81


Rassemblement d'enqutes
strictement identiques................................. 81
Consolidation d'enqutes ayant une
partie commune* .......................................... 81
Fusion d'enqutes* ...................................... 81

6. Importer des rponses*........................... 83


Importer des rponses ................................ 83
Importer des complments de
rponses ....................................................... 83
Ouvrir un fichier de donnes ...................... 83
Exporter les rponses ................................. 83

7. Gestion de panels* .................................. 85


Choisir un panel ........................................... 85
Slectionner des panlistes........................ 85

8. Documenter depuis le panel ................... 87


Saisir les donnes de campagne................ 87
Complter avec le panel .............................. 87
Mettre jour le panel ................................... 87
Fusionner deux enqutes............................ 87

9. Scanner et Internet.................................. 89
La saisie par scanner................................... 89
Le Sphinx et lInternet.................................. 89
Publier les rsultats ..................................... 89

10.Redresser un chantillon ........................ 91


Appliquer des quotas .................................. 91
Choisir les variables de redressement....... 91
Extraction alatoire...................................... 91
Aide lchantillonnage .............................. 91

11.Changer dunit statistique Eclater


des observations*.................................... 93
Questionnaires en grappes......................... 93

416

Eclater selon des parties ............................. 93


Eclater selon des questions ........................ 93
Eclater selon le contenu dune
question texte ............................................... 93
Eclater selon la valeur dune question
numrique..................................................... 93
Gnration de la nouvelle enqute ............. 93

12.Changer lunit statistique


Regrouper des observations*..................95
13.Outils complmentaires sur les
rponses* ................................................97
Supprimer les doublons .............................. 97
Trier les observations .................................. 97
Comparer des fichiers de rponses ........... 97

Produire des rsultats .......................100


1. Dpouiller ..............................................101
Dpouillement automatique ...................... 101
Strates ......................................................... 101
Options de dpouillement ......................... 101
Plan de dpouillement ............................... 101
Produire des listes ..................................... 101
Appliquer un barme ................................. 101
Tableaux de bord........................................ 101

2. Environnements de dpouillement et
danalyse ...............................................103
Dpouiller les rsultats.............................. 103
Analyser les rsultats ................................ 103
Produire des tableaux de questions
ouvertes ...................................................... 103

3. Naviguer dans les tableaux de


rsultats .................................................105

Dpouiller plusieurs strates ...................... 109


Eliminer des individus aberrants.............. 109
Contrler la saisie sur une strate ............. 109

6. Filtres de slection ................................ 111


Conditions de slection............................. 111
Enchanements des filtres......................... 111
Quelques filtres complexes....................... 111

7. Produire automatiquement un rapport


complexe (Plan de dpouillement)........ 113
Dfinir un plan de dpouillement.............. 113
Excuter un plan ........................................ 113
Utiliser plusieurs plans de
dpouillement............................................. 113

8. Produire des listes................................. 115


Slectionner les variables prendre en
compte ........................................................ 115
Prsenter la liste ........................................ 115
Structurer la liste........................................ 115
Modifier la liste ........................................... 115
Utiliser la liste............................................. 115

9. Caractriser les cellules d'un tableau ... 117


Double clic sur la cellule d'un tableau ..... 117
Dtailler, corriger, transfrer..................... 117
Rpartition et spcificits.......................... 117

Modifier les donnes en les


recodant..............................................120
1. Questions et variables .......................... 121
Diffrents vocabulaires.............................. 121
Lignes et colonnes..................................... 121
Nouvelles variables.................................... 121
Supprimer les variables............................. 121

La fentre de consultation des


rsultats ...................................................... 105
La fentre d'analyse ................................... 105
La fentre de caractrisation des
observations ............................................... 105
Produire des tableaux de questions
ouvertes ...................................................... 105

2. Recoder................................................. 123

4. Tableaux rcapitulatifs...........................107

Fonctions communes aux codes et


aux dates..................................................... 125
Interprter des codes................................. 125
Convertir des dates.................................... 125
Heures et minutes ...................................... 125

Tableaux rcapitulatifs des questions


fermes ....................................................... 107
Tableaux rcapitulatifs des questions
ouvertes ...................................................... 107
Tableaux rcapitulatifs des questions
textes........................................................... 107

5. Utiliser les strates ..................................109


Dfinir une strate........................................ 109
Changer de strate....................................... 109
Sphinx 2000

Etudier des textes ...................................... 123


Mettre des numriques en classes........... 123
Interprter des codes et convertir des
dates............................................................ 123
Transformer et combiner* ......................... 123

3. Tableaux de listes : codes et dates....... 125

4. Calculer un barme............................... 127


Etablir un barme....................................... 127
Calculer le barme ..................................... 127
Exploiter la liste du barme....................... 127
Crer une variable score ........................... 127

Table des matires dtaille

417

5. Transformer une variable ......................129


Transformer une variable ferme ............. 129
Extraire de l'information sur les
fermes multiples....................................... 129
Transformer une variable en variable
ouverte ........................................................ 129
Transformer une variable en variable
ferme ......................................................... 129
La cration de nouvelles variables........... 129

6. Calculer une nouvelle variable* .............131


Choisir un mode de calcul......................... 131
Dfinir un mode de calcul ou crire un
programme ................................................. 131
Crer une nouvelle variable ...................... 131

7. Recalculer une variable et utiliser les


modles*................................................133

2. Tableaux plat des questions


nominales .............................................. 145
Questions rponse unique..................... 145
Questions rponses multiples ............... 145
Questions rponses ordonnes ............ 145
Traitement des non-rponses ................... 145
Options de dpouillement ......................... 145

3. Mettre en forme les tableaux plat....... 147


Calcul des pourcentages........................... 147
Visualiser les pourcentages...................... 147
Regrouper, Supprimer, Permuter des
lignes........................................................... 147
Revenir au tableau initial........................... 147
Modifier les dimensions ............................ 147
Choisir les polices ..................................... 147
Options de dpouillement ......................... 147

Recalculer les valeurs dune variable ...... 133


Mettre jour les calculs de variables ....... 133
Utiliser les modles ................................... 133
Crer vos propres modles....................... 133

4. Les graphiques plat............................ 149

8. Combiner des variables* .......................135

5. Tris plat : tests sur les variables


nominales .............................................. 151

Calculer un score en pondrant les


rponses ..................................................... 135
Dfinir une variable ferme dont les
modalits sont des profils......................... 135
Dfinir une variable combinant les
modalits de 2 variables............................ 135
Multi Oui/Non.............................................. 135
Verbose ....................................................... 135
Reprer les observations .......................... 135
Variable Strates .................................... 135

9. Modifier des variables* ..........................137


Modifier la dfinition d'une variable ......... 137
Cacher des variables ................................. 137
Numroter les observations...................... 137

10.Dcrire des observations en cours


danalyse................................................139
Dcrire les individus dans un tableau ...... 139
Dcrire partir de latelier lexical ............. 139

Analyse univarie, les tableaux


plat ......................................................142
1. Les diffrents niveaux danalyse ...........143
Mettre en forme les tableaux..................... 143
Choisir les graphiques............................... 143
Effectuer des tests statistiques ................ 143
Changer de strate....................................... 143
Reprendre une analyse.............................. 143
418

Choisir une reprsentation graphique ..... 149


Paramtrage des graphiques .................... 149
Dimensions du graphique ......................... 149

Pourcentage par rapport aux


observations ou citations.......................... 151
Calcul de l'intervalle de confiance............ 151
Comparer 2 pourcentages......................... 151
Comparer 2 distributions : test du Chi.... 151

6. Tableaux plat des questions


numriques et chelles ......................... 153
Mise en classes automatique des
numriques................................................. 153
Dfinir une autre mise en classes ............ 153
Dpouillement des chelles ...................... 153
Dfinir des valeurs associes aux
chelons ..................................................... 153

7. Tableaux plat : tests sur les


variables numriques ............................ 155
Mettre en classes une variable
numrique................................................... 155
Choisir les indicateurs et valeurs
remarquables ............................................. 155
Intervalle de confiance .............................. 155
Comparaison de moyennes ...................... 155

8. Dpouiller les questions "Autre,


prcisez"................................................ 157
Slectionner la question de dpart........... 157
Choisir les modalits retenir.................. 157
Crer une nouvelle variable ...................... 157

Analyses bivaries, les tableaux


croiss ................................................160
1. Croiser 2 variables.................................161
Programmer des tris croiss..................... 161
Lancer un tri crois .................................... 161
Options de calcul ....................................... 161

2. Mettre en forme un tableau crois.........163


Pourcentage en ligne ou en colonne ?..... 163
Pourcentage selon le nombre
d'observations ou de citations.................. 163
Les options de calcul................................. 163
La mise en forme du tableau ..................... 163

3. Tableaux croiss : les graphiques.........165


Choisir une reprsentation........................ 165
Contenu du graphique ............................... 165
Paramtrer les graphiques ........................ 165
Le baromtre............................................... 165

4. Tableaux croiss : tests statistiques


et AFC ...................................................167
Un exemple ................................................. 167
Test du Chi sur le tableau ........................ 167
Comparaison de 2 lignes ou colonnes..... 167
Analyse factorielle des
correspondances ....................................... 167

5. Tableaux de moyennes .........................169


Lancer un tableau de moyennes............... 169
Mettre en forme un tableau de
moyennes ................................................... 169
Test de comparaison de moyennes.......... 169
Test d'analyse de la variance .................... 169

6. Graphes de dispersion ..........................171


Prsentation des graphiques .................... 171
Dispersion "Critre" Dispersion
"Modalit" ................................................... 171

7. Graphiques "2 critres"..........................173


Comparer deux valuations ...................... 173
Nommer les valuations ............................ 173
Ordre des critres ...................................... 173
Options d'affichage .................................... 173
Dplacer les tiquettes .............................. 173
Lecture du graphique................................. 173

8. Rduction des dimensions d'un


tableau de moyennes (carte ACP) ........175
La carte d'analyse en composantes
principales .................................................. 175
Modifier les cartes...................................... 175
ACP sur tableaux de moyennes et sur
les individus ............................................... 175

9. Prsentation des cartes factorielles ......177


Dplacer les vignettes sur les cartes ....... 177
Sphinx 2000

Prsenter les cartes AFC........................... 177


Prsenter les cartes ACP........................... 177
Raccourcis pour redimensionner la
carte 177

10.Corrlation et nuage de points.............. 179


Slectionner les variables analyser....... 179
Test de corrlation et droite de
rgression................................................... 179
Visualisation des donnes
individuelles ............................................... 179
Dimensions de la carte .............................. 179

11.Typologies et scores par rapport 2


dimensions ............................................ 181
Construction d'une typologie
interactive ................................................... 181
Calculer un score ....................................... 181
Crer une variable typologie ou score ..... 181

12.Reprendre des analyses ....................... 183


Retrouver un rsultat dj effectu .......... 183
Relancer simultanment plusieurs
traitements.................................................. 183

13.Dterminer une analyse........................ 185


Choisir les variables analyser................ 185
Paramtrer le choix des variables ............ 185
Les principes de lexpertise ...................... 185

Tableaux et graphiques de
synthse .............................................188
1. Les analyses synthtiques.................... 189
Tableaux multiples..................................... 189
Tableaux de caractristiques .................... 189
Dpouillement gnralis* ........................ 189
Les tableaux composs* ........................... 189

2. Les tableaux de groupes et tableaux


accols .................................................. 191
Tableaux de groupes ................................. 191
Tableaux plat accols ............................. 191
Tableaux de questions numriques ......... 191

3. Les tableaux croiss multiples .............. 193


Tableaux croiss juxtaposs .................... 193
Tableaux ventils ....................................... 193
Tableaux croiss n dimensions ............. 193
Tableaux de caractristiques et listes
de modalits spcifiques........................... 193

4. Les tableaux de caractristiques .......... 195


Choisir les variables prendre en
compte ........................................................ 195
Calculer les modalits les plus
frquentes................................................... 195

Table des matires dtaille

419

Calculer les modalits spcifiques........... 195


Caractriser ................................................ 195

5. Elaborer un tableau de
caractristiques......................................197
Afficher les traits dominants..................... 197
Mettre en vidences toutes les
spcificits.................................................. 197
Focaliser sur les originalits..................... 197
Tests et jugement....................................... 197

6. Les tableaux de modalits


spcifiques* ...........................................199
Lancer une recherche de modalits
spcifiques ................................................. 199
La slection des rponses spcifiques.... 199
Prsentation des listes .............................. 199

7. Les tableaux composs* .......................201


Le dialogue Tableau compos .................. 201
Composer les lignes du tableau ............... 201
Enregistrer et reprendre un tableau ......... 201

8. Les baromtres......................................203
Slectionner les modalits
reprsenter ................................................. 203
Mettre en forme le baromtre.................... 203
Cas des tableaux plat accols ............... 203
Tableaux composs ................................... 203

9. Les dpouillements gnraliss*...........205


Accder au dpouillement gnralis ...... 205
Options disponibles................................... 205
Le cas des questions ouvertes ................. 205
Transfrer, recoder et analyser................. 205

10.Importance et Performance ...................207


Mesurer directement l'importance............ 207
Mesurer indirectement l'importance......... 207
Calculer l'importance................................. 207
Pondrer par l'importance......................... 207

Analyses multivaries* .....................210


1. Approfondir ............................................211
Classification automatique........................ 211
Analyse factorielle multiple et analyse
en composantes principales ..................... 211
Corrlations multiples ............................... 211

2. Classification automatique.....................213
Lancer une classification automatique .... 213
Choisir une classification.......................... 213
Exploiter une classification....................... 213

3. Analyser une classification ....................215


Analyser et interprter les classes ........... 215
420

Visualiser les classes dans un nuage


de points ..................................................... 215
Confronter d'autres variables ................ 215

4. Analyse de la variance 2 facteurs


(MANOVA) ............................................ 217
Tableau de moyennes 2 facteurs........... 217
Tests danalyse de la variance dans un
tableau 2 facteurs.................................... 217
Lancer une analyse.................................... 217

5. Corrlation et rgression multiple ......... 219


Choisir les variables .................................. 219
Coefficients de corrlation et quation
de rgression ............................................. 219
Prsentations de la matrice des
coefficients de corrlation ........................ 219
Equation de rgression et paramtres
dajustement............................................... 219
Simulations sur l'quation de
rgression................................................... 219
Enregistrement des valeurs calcules
et des rsidus............................................. 219

6. Corrlation multiple et graphe de


positionnement ...................................... 221
Profils d'influence ...................................... 221
Graphe Influence / Performance ............... 221
Options de prsentation des
graphiques Influence/Performance .......... 221

7. Analyse en composantes principales.... 223


Slection des variables ............................. 223
Matrice de corrlation................................ 223
Tableau des contributions ........................ 223
Projection dans le plan factoriel ............... 223
Construction d'une typologie ................... 223
Enregistrement des coordonnes
factorielles .................................................. 223

8. Analyse factorielle multiple.................... 225


Slection des variables ............................. 225
Tableau des effectifs.................................. 225
Tableau des contributions ........................ 225
Projection dans le plan factoriel ............... 225
Construction d'une typologie ................... 225
Enregistrement des coordonnes
factorielles .................................................. 225

9. Prsentation des cartes factorielles ...... 227


Choix des axes dfinissant le plan
factoriel ....................................................... 227
Mise en forme des lments de la carte... 227
Options de prsentation des individus .... 227
Affichage sur les axes du pourcentage
de variance ................................................. 227
Particularit des cartes ACP ..................... 227

Particularit des cartes AFC...................... 227

10.Calcul des facteurs et choix du plan


factoriel ..................................................229
Calcul des composantes ou des
facteurs ....................................................... 229
Afficher le tableau des contributions ....... 229
Choisir un plan de projection.................... 229

11.Construire interactivement une


typologie ................................................231
Dfinir les centres de classes ................... 231
Positionner les centres de classes........... 231
Enregistrer la typologie dans une
variable........................................................ 231
Typologie interactive et classification
automatique................................................ 231

Traitement simple des questions


textes...................................................234
1. Etudier les textes ...................................235
Verbatim...................................................... 235
Tableaux de rponses................................ 235
Analyse de contenu ................................... 235
Procdure et atelier lexical ........................ 235

2. Faire du verbatim...................................237
Slectionner une variable texte................. 237
Prsenter les extraits en les classant....... 237
Dfinir un profil de recherche ................... 237
Contrler les rsultats et les diter .......... 237
Produire des listes ..................................... 237

3. Tableau de rponses ouvertes..............239


Tableau des rponses et tableau des
mots 239
Analyser selon le contexte ........................ 239
Recoder une variable texte........................ 239
Analyser un tableau de textes................... 239

4. Analyse de contenu ...............................241


Reprendre un travail en cours ou crer
une nouvelle variable................................. 241
Elaborer la grille thmatique et coder
les rponses ............................................... 241
La codification ............................................ 241
Lexique et navigation lexicale................... 241

L'analyse lexicale en bref ..................244


1. Les interfaces ........................................245
Latelier lexical............................................ 245
Le panneau de commandes lexicales ...... 245

2. Du texte aux formes graphiques lapproximation lexicale......................... 247


3. Du texte aux structures linguistiques :
la statistique lexicale ............................. 249
Recherche des spcificits lexicales ....... 249
Codification et mesures lexicales............. 249
Intgration de l'analyse de donnes......... 249

4. Latelier lexical en bref .......................... 251


Production de lexiques.............................. 251
Navigation lexicale..................................... 251
Statistiques lexicales ................................. 251
Transformation du texte et cration de
nouvelles variables .................................... 251
La barre d'outils ......................................... 251
Revenir l'atelier lexical ou le quitter ...... 251
Le panneau de commandes lexicales**.... 251

5. Le panneau lexical : produire des


lexiques ................................................. 253
Formes graphiques et mots ...................... 253
Slectionner un type de lexique ............... 253
Verbes, Noms, Adjectifs ............................ 253
Poursuivre dans latelier lexical................ 253

6. Le panneau lexical : segments


rpts et lexiques relatifs .................... 255
Trouver les segments rpts .................. 255
Les mots dans leur contexte..................... 255

7. Le panneau lexical : du bilan aux


rponses caractristiques ..................... 257
Bilan lexical ................................................ 257
Tableaux lexicaux ...................................... 257
Mots spcifiques ........................................ 257
Rponses caractristiques........................ 257

La construction des lexiques............260


1. Caractres sparateurs et
environnement ...................................... 261
Apparier ...................................................... 261
Choisir les rgles de construction du
lexique......................................................... 261
Options pour la recherche des
expressions ................................................ 261

2. Rechercher et marquer des lments


dans le lexique ...................................... 263
Rechercher par le contenu ........................ 263
Rechercher selon la frquence ................. 263
Rechercher par dictionnaires.................... 263
Combiner les effets du marquage ............ 263

3. Rduire les lexiques.............................. 265


Supprimer ................................................... 265

Sphinx 2000

Table des matires dtaille

421

Ignorer les mots outils............................... 265


Regrouper ................................................... 265
Lemmatiser ................................................. 265
Exploiter le lexique rduit.......................... 265

4. Groupements automatiques ..................267


Regroupement selon un modle............... 267
Stemmatisation .......................................... 267
Modifier les groupes .................................. 267
Dictionnaires .............................................. 267
Conservation des groupements ............... 267

5. La gestion des dictionnaires ..................269


Ouvrir un dictionnaire................................ 269
Crer un dictionnaire ................................. 269
Marquer partir du dictionnaire ............... 269
Ajouter des mots dans le dictionnaire ..... 269

6. Les diffrents types de dictionnaires .....271


Diffrents types de dictionnaires.............. 271
Elaborer des dictionnaires ........................ 271

7. Lexique des expressions** ....................273


Mots composs et expressions
usuelles....................................................... 273
Lexique des expressions........................... 273
Documenter le lexique des
expressions partir dun dictionnaire ..... 273
Actions partir de la liste des
expressions ................................................ 273
Solidariser dans le corpus les
expressions de la liste............................... 273

8. Rechercher les segments rpts** ......275


Rechercher les segments rpts ............ 275
Slectionner les segments significatifs ... 275
Segments contraints et segments de
frquence 1 ................................................. 275
Solidariser les segments rpts ............. 275

Navigation lexicale et recherche


de contexte .........................................278
1. Du lexique au corpus : la navigation
lexicale...................................................279
Vue par observation................................... 279
Vue du corpus entier ................................. 279
Caractriser et dtailler les
observations............................................... 279
Copier ou imprimer les lments
slectionns ............................................... 279

2. Situer un mot dans son contexte


textuel ....................................................281
Fixer ltendue du contexte....................... 281
Voir le contexte immdiat.......................... 281
422

Extraire des citations................................. 281

3. Les lexiques relatifs**............................ 283


Dfinir le nombre et la position des
lexiques relatifs .......................................... 283
Prsenter les lexiques relatifs .................. 283
Interprter les lexiques relatifs ................. 283
Lexiques relatifs et segments rpts ..... 283

4. Production d'extraits.............................. 285


Le dialogue abrg .................................... 285
Le dialogue complet .................................. 285
Fixer l'tendue de l'extrait ......................... 285
Structurer la prsentation des extraits .... 285
Rduire le nombre dextraits..................... 285

5. Rsum des diffrentes manires de


produire des extraits.............................. 287

Analyse syntaxique et
lemmatisation** ..................................290
1. La lemmatisation ................................... 291
Principes de la lemmatisation................... 291
Rduire la forme graphique au mot
racine .......................................................... 291
Rsoudre les ambiguts smantiques.... 291
Identifier les formes grammaticales et
les locutions ............................................... 291

2. Lancer la lemmatisation ........................ 293


Lanalyseur syntaxique ............................. 293
Options de lemmatisation ......................... 293
Faire un essai ............................................. 293
Cration dune nouvelle variable
contenant le texte lemmatis .................... 293

3. Analyser un texte lemmatis ................. 295


Afficher le texte dorigine en mme
temps que le texte lemmatis ................... 295
Utiliser le type grammatical des mots...... 295
Rechercher les caractristiques de
lnonciation............................................... 295

4. Modifier le corpus .................................. 297


Reconstruire le lexique.............................. 297

La statistique lexicale** .....................300


1. Les indicateurs lexicaux ........................ 301
Statistiques des formes graphiques
(mots) .......................................................... 301
Statistiques relatives au lexique............... 301
Statistiques relatives au corpus ............... 301
Statistiques relatives l'observation ....... 301

2. Bilan lexical ........................................... 303

Lancer le bilan lexical ................................ 303


Indicateurs propres chaque contexte.... 303

Cration dune variable ferme sur les


mots du lexique.......................................... 319

3. Construire un tableau lexical .................305

3. Mesures lexicales.................................. 321

Dfinition du tableau.................................. 305


Choix des indicateurs calculer............... 305
Modification des lignes ou colonnes
du tableau lexical ....................................... 305
Poursuivre l'analyse du tableau lexical.... 305

Indications relatives la prsence de


certains mots.............................................. 321
Caractristiques des observations........... 321
Nombre doccurrences des mots
marqus ...................................................... 321
Intensit lexicale des mots marqus ........ 321
Banalit de l'observation ........................... 321
Nombre total de mots (longueur de
l'observation).............................................. 321
Richesse de l'observation ......................... 321

4. Listes des mots spcifiques ..................307


Produire des listes de mots
spcifiques ................................................. 307
Prsenter les listes..................................... 307
Slectionner les termes ............................. 307
Les rponses caractristiques.................. 307

5. Slections dans un tableau lexical ou


dans des listes de mots spcifiques......309
Procder d'une manire slective............. 309
Slectionner selon le sens ........................ 309
Choisir les zones de langage .................... 309
Limiter par la frquence............................. 309
Tenir compte de la spcificit ................... 309
Combiner les critres de slection ........... 309

6. L'indice de spcificit.............................311
Comparer la distribution observe
une distribution de rfrence .................... 311
La mthode de calcul................................. 311
Choisir un seuil de slection..................... 311

7. Comparer un lexique de rfrence.....313


Quelle rfrence ? ...................................... 313
Crer / enrichir un dictionnaire de
rfrence ..................................................... 313
Rsultats de la comparaison..................... 313
Options de calcul ....................................... 313
Limiter la comparaison .............................. 313

Codification automatique des


textes...................................................316
1. Crer de nouvelles variables
dorigine lexicale ....................................317
Slectionner une variable texte................. 317
Slectionner les lments lexicaux
prendre en considration .......................... 317
Slection d'une procdure de
recodification.............................................. 317
Dnomination et enregistrement de la
nouvelle variable ........................................ 317

2. Codification lexicale...............................319
Cration de variables oui/non ................... 319
Sphinx 2000

4. Modification du contenu d'une


variable texte......................................... 323
Texte rduit aux mots du lexique ............. 323
Relier les mots conscutifs....................... 323

5. Fractionner une variable texte .............. 325


Changement d'unit statistique ................ 325

Ouvrir un fichier de donnes


textuelles**..........................................328
1. Du corpus textuel la base de
donnes ................................................ 329
2. Ouvrir un texte analyser..................... 331
Lancer la squence d'ouverture ............... 331
Ouvrir le fichier........................................... 331
Choisir le format correspondant la
structuration des donnes ........................ 331

3. Texte balis........................................... 333


Dfinir les caractres dlimitant les
balises ......................................................... 333
Contrler la validit des balises
trouves ...................................................... 333
Identification des variables et des
observations............................................... 333
Cration de la base Sphinx ....................... 333

4. Prparer et ouvrir un fichiers


d'entretiens semi-directifs ..................... 335
Traitement des variables signaltiques ... 335
Traitement des parties ............................... 335
Les questions / rponses .......................... 335
Prcautions prendre au moment de
la saisie ....................................................... 335

5. Texte annot ......................................... 337


Dcouper le texte en fragments
lmentaires ............................................... 337
Interprter les annotations ........................ 337
Numroter les fragments et les parties .... 337

Table des matires dtaille

423

6. Exemples de textes annots .................339


Analyse de discours .................................. 339
Entretien non directif ................................. 339
Pice de thtre.......................................... 339

7. Macro commandes pour la


prparation des textes ...........................341
Installer les macro-commandes................ 341
Placer des sparateurs .............................. 341
Reprer les annotations ............................ 341
Recherche / remplacement avec
attributs....................................................... 341
Ouvrir le fichier modifi ............................. 341

Travailler avec le Sphinx ...................344


1. Enregistrements et fichiers ....................345
Les fichiers d'une tude ............................ 345
Enregistrer et enregistrer sous................. 345
Faire une sauvegarde de l'enqute........... 345
Faire une copie du questionnaire ............. 345
Exporter et convertir .................................. 345
Sauvegarde automatique........................... 345

2. Imprimer, publier, prparer les


rapports..................................................347
Sortir des rsultats l'imprimante ........... 347
Copier / Coller............................................. 347
Inclure dans le rapport............................... 347
Exporter ...................................................... 347
Transfrer ................................................... 347

3. Inclure dans le rapport...........................349


Principe de fonctionnement ...................... 349
Installation des macro-commandes de
mise en forme............................................. 349
Dpannage.................................................. 349
Alternative................................................... 349

4. Aperu rapide ........................................351


Aperu sur les Questions / Variables ....... 351
Aperu sur les Rponses / Donnes ........ 351
Aperu sur les Dpouillements /
Statistiques................................................. 351

5. Prfrences ...........................................353
Polices de caractres ................................ 353
Couleurs...................................................... 353
Options gnrales...................................... 353

6. Acclrateurs et raccourcis ...................355


Acclrateurs Windows............................. 355
Gnral........................................................ 355
Manipulations des tableaux ...................... 355
Analyse lexicale ......................................... 355
Saisie et consultation des rponses ........ 355
424

Divers .......................................................... 355

7. Travailler avec des donnes externes .. 357


Des donnes formates............................. 357
Un texte analyser .................................... 357
Une base d'images..................................... 357
Un tableau d'effectifs ................................. 357
Une tude statistique................................. 357
Une base de donnes ................................ 357

8. Ouvrir un fichier de donnes ................. 359


Donnes tabules ...................................... 359
Donnes balises....................................... 359
Spcifier les marqueurs de structure....... 359
Vrifier les interprtations du logiciel ...... 359

Eurka ! le compagnon du Sphinx ...362


1. Amliorer la communication grce
aux modules complmentaires ............. 363
Communiquer le Questionnaire................ 363
Faciliter la saisie ........................................ 363
Communiquer les Rsultats...................... 363

2. Mettre en forme les questionnaires


Papier .............................................. 365
3. Enqutes "Internet et Email" ................. 367
4. Enqutes "Disquette ou Rseau".......... 369
5. Communiquer les rsultats ................... 371
Une nouvelle mise en forme des
rsultats ...................................................... 371
Choisir le mdia le plus adquat .............. 371

Mthodologie......................................374
Rappel des principes de lenqute par
questionnaire......................................... 375
Dfinition des objectifs.............................. 375
La dtermination des chantillons ........... 375
Les diffrentes formes denqutes........... 375
Le questionnaire ........................................ 375
Le pr-test................................................... 375
Le recueil des donnes ............................. 376
Le dpouillement et lanalyse de
donnes ...................................................... 376
La prsentation des rsultats ................... 376
La communication ..................................... 376

Les diffrentes formes d'enqutes ............. 377


L'observation directe ................................. 377
Entretien en face--face............................. 377
Entretien tlphonique .............................. 377
Enqute par voie postale........................... 377
Enqute via Internet................................... 377

Enqute en laboratoire et panel ................ 377

Un modle pour concevoir un bon


questionnaire .........................................379

Le niveau d'analyse ................................... 391


De l'univari au multivari ......................... 391
La recodification ........................................ 391

Les grands thmes d'une enqute............ 379


Concevoir le questionnaire comme un
systme....................................................... 379
Utiliser le modle identit,
comportement, motifs, opinion et
valeurs......................................................... 379

L'analyse univarie..................................... 393

Des questions qu'on se pose aux


questions qu'on pose.............................381

La smantique : explication et
relations causales ...................................... 395
La statistique : mettre en uvre la
mthode adapte........................................ 395

La question qu'on se pose ........................ 381


La question qu'on pose ............................. 381
La rponse qu'on enregistre ..................... 381
Rdiger un bon questionnaire................... 381

La manire de poser les questions.............383


Entretien libre : Question ouverte,
rponse spontane .................................... 383
Entretien semi ouvert : Question
ouverte, rponse ferme............................ 383
Entretien ferm : Question assiste ......... 383
La manire de poser une question
peut en affecter le sens ............................. 383

L'art du questionnaire : la logique de


l'entretien ...............................................385
Introduire le questionnaire ........................ 385
Respecter les usages de la
conversation ............................................... 385
Longueur du questionnaire ....................... 385
Eviter les questionnaires
organigrammes .......................................... 385

L'art du questionnaire : la logique de


l'analyse.................................................386
Ne poser que des questions utiles ........... 386
Adapter le questionnaire aux
traitements et aux analyses projets........ 386
Ds la conception du questionnaire,
tenir compte de l'analyse des donnes.... 386

Thorie des sondages et estimation


statistique ..............................................387
Le sondage alatoire.................................. 387
L'estimation statistique ............................. 387
Les paramtres influenant la qualit
d'une estimation ......................................... 387
La pratique des sondages ......................... 387

Dfinir le bon chantillon ............................389


Echantillons homognes........................... 389
Echantillons htrognes.......................... 389
Redressement d'chantillon...................... 389

Dcrire......................................................... 393
Les indicateurs selon le type de
variable ....................................................... 393
Extrapoler la population totale............... 393

L'analyse bivarie....................................... 395

Lanalyse bivarie : Chi2 et AFC................ 397


2

Le calcul du Chi ........................................ 397


Contribution au Chi et interprtation
des correspondances ................................ 397
Construction et lecture dune carte
dAFC .......................................................... 397

L'analyse bivarie : corrlation................... 399


Nuage de points et droite de
rgression................................................... 399
Coefficient de corrlation .......................... 399
Modle linaire et non linaire .................. 399

L'analyse bivarie : analyse de la


variance................................................. 401
Tableau de valeurs moyennes .................. 401
Analyse de la variance............................... 401
Critres discriminants et valeurs
significatives .............................................. 401
Reprsentation graphique de la
dispersion ................................................... 401
Analyse de la variance plusieurs
facteurs ....................................................... 401

Analyse multivarie : objectifs et


mthodes .............................................. 403
Synthtiser.................................................. 403
Analyser ...................................................... 403
Les mthodes ............................................. 403

L'analyse factorielle : les principes............. 405


AFCM et ACP .............................................. 405
Les donnes individus / variables ............ 405
Trouver les facteurs pour rduire le
nombre des variables danalyse ............... 405
Agrger les individus : construire une
typologie ..................................................... 405
Scores factoriels et typologie ................... 405

L'analyse factorielle : interprter les


rsultats................................................. 407

Les formes de l'analyse de donnes ..........391


Sphinx 2000

Table des matires dtaille

425

Qualit de la rduction par lanalyse


factorielle .................................................... 407
Interprter les facteurs .............................. 407
Trouver une typologie pour grouper
les individus en classes homognes ....... 407

Corrlation et rgression multiple ...............409


Equation de rgression linaire
multiple et paramtres dajustement ........ 409
Procdure de rgression pas pas.......... 409
Indpendance des variables
explicatives................................................. 409
Rgression non linaire............................. 409

Classification automatique..........................411
Diffrentes approches de
classification .............................................. 411
Dfinir une classification........................... 411
La mthode des centres mobiles.............. 411
Analyser la classification obtenue ........... 411

Table des matires dtaille .............414


Bibliographie ......................................428

426

Sphinx 2000

Table des matires dtaille

427

Bibliographie

428

BENZECRI J.P : Pratique de lanalyse des donnes


(DUNOD 1980)
BLANCHET A. & Al : Lentretien dans les sciences
sociales (DUNOD 1985)
BROSSIER G. & DUSSAIX A.M. : Enqutes et
sondages : Mthodes, modles, applications, nouvelles
approches (DUNOD 1999)
COURTES J. : Analyse
( HACHETTE SUP.1991)

smiotique

du

discours

DUGAST D. : La statistique lexicale (SLATKINE 1980)


FLOCH J.M. : Smiotique marketing et communication
(PUF 1980)
GHIGLIONE R. & Al : Manuel danalyse de contenu
(ARMAND COLIN 1985)
GRANGE D. & LEBART L. : Traitement statistique des
enqutes (DUNOD 1993)
JAMBU M. : Exploration informatique statistique des
donnes (DUNOD 1989)
LAFON P. : Dpouillement et statistique en lexicomtrie
(SLATKINE 1984)
LAGARDE (DE) J. : Initiation lanalyse de donnes
(DUNOD 1993)
LEBART L. & SALEM A. : Analyse statistique des
donnes textuelles (DUNOD 1988)
MAINGUENEAU D. : Lanalyse de discours (HACHETTE
1991)
MALARET G. : Statistiques appliques aux sciences
humaines (PUF 1991)
MOSCAROLA J. : Enqutes et analyse de donnes
(VUIBERT 1990)
VIARD V. : Statistiques
(ECONOMICA 1985)

appliques

WEBER R.P. : Basic content


UNIVERSITY PRESS 1990)

Sphinx 2000

la

gestion

analysis

(SAGE

Bibliographie

429

430

S-ar putea să vă placă și