Documente Academic
Documente Profesional
Documente Cultură
Le Sphinx Dveloppement
7, rue Blaise Pascal
74600 Seynod
Tlphone : 04 50 69 82 98
Fax : 04 50 69 82 78
e-mail : contact@lesphinx-developpement.fr
Internet : http://lesphinx-developpement.fr
Avant propos
Ce manuel accompagne la nouvelle version du Sphinx que
vous venez d'acqurir. Nous vous en flicitons.
Ce logiciel sappuie trs fortement sur les interfaces et les
protocoles de Windows. Vous retrouverez ainsi les
habitudes que vous avez dj acquises par lexprience de
ce systme (gestion des fichiers, menus, dialogues, listes
droulantes, raccourcis). Nous nous sommes efforcs de
toujours respecter ces conventions bien tablies. Cest
pour cela que vous parviendrez trs facilement lutiliser.
Vous serez galement guid par votre connaissance du
travail des enqutes, des tudes et de la statistique. Nous
utilisons le langage de ces mtiers et avons structur le
logiciel par rapport aux grandes tapes dune tude :
questionnaire, saisie, dpouillement, analyse Notre souci
constant est de faciliter votre comprhension devant
lcran. A cette fin, de nombreux commentaires sont
affichs pour vous aider vous situer et comprendre les
menus, boutons de commande, options Pour les
oprations les plus complexes, vous tes pris en charge
par un assistant. Enfin, lorsque le sens dun article ou dun
bouton vous chappe, il vous suffira dessayer pour
comprendre trs vite son utilit.
Pour toutes ces raisons, vous naurez aucune difficult
vous servir de votre logiciel et peut-tre pourrez-vous
mme vous passer du manuel. Mais vous risquez alors de
le sous-utiliser ou de vous compliquer inutilement la vie. En
effet, toutes les possibilits qu'il offre ne sont pas
galement visibles ni toujours trs comprhensibles au
premier abord et vous risquez de passer ct de
fonctions trs utiles.
Le premier objectif de ce manuel est de vous faire
dcouvrir tout ce que vous pourrez faire avec le logiciel. A
cette fin, il est organis en doubles pages dveloppant une
tche, une fonction, un rsultat que vous pourrez
entreprendre ou raliser.
La partie de droite vous montre le logiciel, ses crans, ses
menus, ses dialogues et les tats (tableaux, graphiques)
quil permet de produire.
Sommaire
Avant de commencer.............................8
1. L'organisation du Sphinx et les
diffrents logiciels ......................................9
2. A l'intention des utilisateurs d'une
version antrieure du Sphinx...................11
3. Consultation et modification.................... 77
4. Options et contrles de saisie................. 79
5. Rassembler / Fusionner.......................... 81
6. Importer des rponses*........................... 83
7. Gestion de panels*.................................. 85
8. Documenter depuis le panel ................... 87
9. Scanner et Internet.................................. 89
10.Redresser un chantillon ........................ 91
11.Changer dunit statistique Eclater
des observations*.................................... 93
12.Changer lunit statistique
Regrouper des observations* ................. 95
13.Outils complmentaires sur les
rponses* ................................................ 97
Avant de commencer
Croiser 2 variables.................................161
Mettre en forme un tableau crois.........163
Tableaux croiss : les graphiques .........165
Tableaux croiss : tests statistiques
et AFC....................................................167
5. Tableaux de moyennes .........................169
6. Graphes de dispersion ..........................171
7. Graphiques "2 critres"..........................173
8. Rduction des dimensions d'un
tableau de moyennes (carte ACP) ........175
9. Prsentation des cartes factorielles.......177
10.Corrlation et nuage de points ..............179
11.Typologies et scores par rapport 2
dimensions.............................................181
12.Reprendre des analyses........................183
13.Dterminer une analyse ........................185
Tableaux et graphiques de
synthse .............................................188
1. Les analyses synthtiques ....................189
2. Les tableaux de groupes et tableaux
accols...................................................191
3. Les tableaux croiss multiples...............193
4. Les tableaux de caractristiques ...........195
5. Elaborer un tableau de
caractristiques......................................197
4
Approfondir............................................ 211
Classification automatique .................... 213
Analyser une classification.................... 215
Analyse de la variance 2 facteurs
(MANOVA) ............................................ 217
5. Corrlation et rgression multiple ......... 219
6. Corrlation multiple et graphe de
positionnement ...................................... 221
7. Analyse en composantes principales.... 223
8. Analyse factorielle multiple.................... 225
9. Prsentation des cartes factorielles ...... 227
10.Calcul des facteurs et choix du plan
factoriel.................................................. 229
11.Construire interactivement une
typologie ................................................ 231
Analyse syntaxique et
lemmatisation** ..................................290
1.
2.
3.
4.
La lemmatisation ...................................291
Lancer la lemmatisation ........................293
Analyser un texte lemmatis .................295
Modifier le corpus ..................................297
Sphinx 2000
Avant de commencer
Mthodologie......................................374
Rappel des principes de lenqute par
questionnaire .........................................375
Les diffrentes formes d'enqutes..............377
Un modle pour concevoir un bon
questionnaire .........................................379
Des questions qu'on se pose aux
questions qu'on pose.............................381
La manire de poser les questions.............383
L'art du questionnaire : la logique de
l'entretien ...............................................385
L'art du questionnaire : la logique de
l'analyse .................................................386
Thorie des sondages et estimation
statistique...............................................387
Dfinir le bon chantillon ............................389
Les formes de l'analyse de donnes ..........391
L'analyse univarie .....................................393
L'analyse bivarie .......................................395
Lanalyse bivarie : Chi2 et AFC ................397
L'analyse bivarie : corrlation ...................399
L'analyse bivarie : analyse de la
variance .................................................401
Analyse multivarie : objectifs et
mthodes ...............................................403
L'analyse factorielle : les principes .............405
L'analyse factorielle : interprter les
rsultats .................................................407
Corrlation et rgression multiple ...............409
Classification automatique..........................411
Sphinx 2000
Avant de commencer
Avant de
commencer
Le Sphinx Lexica
Le Sphinx Primo
Avec le Sphinx Primo, vous pouvez :
concevoir votre questionnaire, saisir vos rponses et
dpouiller vos propres enqutes. Du questionnaire au
rapport, vous disposez dun outil pratique et puissant ;
dtailler vos donnes denqutes. Quil sagisse de
vrifier les rsultats et corriger les donnes, de prparer
et diter des listes, de rechercher les particularits de
certains individus, vous pourrez trs facilement naviguer
dans vos donnes. Le Sphinx est aussi un puissant
explorateur de donnes.
Le Sphinx Plus2
Eurka !
Le Sphinx est totalement compatible avec Eurka ! le
logiciel compagnon du Sphinx qui vous permettra par
exemple :
La publication d'une enqute sur Internet
La mise en forme de formulaires de haute qualit
La programmation de tableaux de bord automatiss.
Avant de commencer
Rdiger le
questionnaire
Traitements
quantitatifs
10
Saisir les
rponses
Les questions
Aide en ligne
Les rponses
Aperu
Les rsultats
Eurka!
Les nouveauts
Les principes et lesprit restent les mmes : vous
retrouverez les fonctions que vous connaissez dj.
Avec Windows 95, Windows 98, Windows NT et les
nouveaux systmes, la capacit dadressage 32 bits
autorise le traitement de donnes trs volumineuses sans
sacrifier la rapidit. Le Sphinx 2000 y gagne une capacit
de traitement illimite et encore plus de vivacit. Termines
les limitations 32000 observations, 1000 variables..., les
mgabases soffrent vous comme les enqutes les plus
monstrueuses comptes en millions dobservations. Mais
comme tout se paie, vous ne pourrez pas les faire
fonctionner sous Windows 3.1 !
Cette nouvelle puissance a aussi permis de donner au
logiciel son nouveau look, la matire est plus riche,
linterface plus sduisante mais toujours aussi efficace.
Les nouvelles capacits enrichissent les trois stades : la
dfinition des questionnaires, la saisie des rponses, le
traitement des donnes ainsi que lanalyse lexicale qui,
dans Lexica, fait lobjet dun nouveau stade.
Vous dcouvrirez galement un nouvel environnement
pour la prsentation des rsultats des questions ouvertes,
des codes et des variables dates, ainsi quune intgration
forte avec 2 autres produits du Sphinx : le module de saisie
par scanner et le logiciel Eurka!
Sphinx 2000
Avant de commencer
11
Elaboration du questionnaire
Options de saisie
Restriction la saisie
La gestion de panel
Fusionner 2 enqutes
Changement dunit statistique
Scanner et autres modes de saisie
Redressements dchantillons multicritres
Strates pour les redressements
Comparer des fichiers
Importer une base de donnes (ODBC)
Supprimer les doublons
12
Ouvrir un texte
Panneau lexical
Segments rpts
Noms, verbes, adjectifs
Phrases caractristiques
Mots spcifiques
Traits grammaticaux (temps verbaux)
Conservation des groupements
Groupements automatiques par racine
Comparer un lexique de rfrence
Sphinx 2000
Avant de commencer
13
Le Sphinx en
quelques pages
14
Dfinir le questionnaire
Il sagit alors de dcrire la premire question dans le
dialogue qui apparat. Cliquez dans la zone Libell et
tapez le texte de la question : Pouvez-vous me dire pour
qui vous venez de voter ?. Cliquez dans la zone Variable
et tapez VOTE. Ce nom abrg servira pour reprer la
question lors des dpouillements.
La question attend une seule rponse et il y a 5 candidats.
La question est dite ferme unique (slectionnez ce type
dans la liste propose) et les noms des candidats sont les
modalits de rponses. Cliquez dans la zone Modalits et
tapez Lenoir ; Leblanc ; Lebleu ; Lerouge ; Levert.
Sphinx 2000
15
Droulez ces menus, ici aussi dans le seul but de voir les
diffrentes fonctions (Rassembler/Fusionner par exemple
qui vous permettra de runir plusieurs enqutes partielles
pour les dpouiller ensemble).
16
Les boutons
et
ainsi que la liste droulante des
variables en bas droite de lcran permettent daccder
aux autres tableaux. Vous prenez connaissance des
rsultats, question par question. Droulez les menus
Dpouiller, Recoder et Analyser. Ces menus proposent
laccs aux fonctions danalyse de donnes qui vous
permettront de produire des statistiques sur une ou
plusieurs questions simultanment.
Par exemple, vous pouvez tudier lhypothse que les
individus sont optimistes et que le candidat pour qui ils ont
vot a des chances dtre lu. Vous allez donc construire le
tableau crois de la variable VOTE par la variable
PROBABLE, en choisissant larticle Tableaux croiss
dans le menu Analyser.
Le dialogue qui apparat vous permet de dfinir un ou
plusieurs tris croiss. Droulez la liste Variable 1 et
choisissez la ligne VOTE. Droulez la liste Variable 2 et
choisissez la ligne PROBABLE. Cliquez maintenant sur le
bouton Croiser V1 et V2 puis sur le bouton Analyser.
Sphinx 2000
Prparer le rapport
Vous allez, pour finir, conserver une trace de ce premier
rsultat : dans le menu Fichier, choisissez larticle
Imprimer, puis cliquez sur OK dans le dialogue propos. Si
une imprimante est connecte, une page contenant le
tableau et le graphique sera produite. Enfin, vous allez
pouvoir commencer un rapport sur cette brillante tude :
dans le menu Fichier, choisissez larticle Inclure dans le
rapport. Dans le dialogue suivant, slectionnez le
traitement de textes que vous utilisez et cliquez sur OK. Le
Sphinx recopie les lments de votre analyse dans votre
traitement de textes, l o le curseur est plac. Un
message vous signale la fin de lopration.
Utilisez la combinaison de touches ALT+TAB (cest un des
secrets du travail efficace avec Windows) pour visualiser le
rsultat dans le traitement de textes. Utilisez nouveau
ALT+TAB pour revenir dans Sphinx.
17
18
2. Llaboration du questionnaire
Le questionnaire est la liste des questions poses
lchantillon (lensemble des personnes interroges). Dans
le cas de la construction dune grille dobservation, chaque
lment composant la grille est assimil une question.
19
Organisation du questionnaire
Pour amliorer la prsentation de votre questionnaire, de
nombreuses options permettent dorganiser et de structurer
votre liste de questions. Et pour le rendre plus souple, de
nombreuses possibilits de modification sont disponibles.
Utilisez pour cela le menu Organiser.
Edition du questionnaire
20
Sphinx 2000
21
Consultation et correction
Les vrifications et les corrections de donnes sont
considrablement facilites par lusage de larticle
Chercher qui permet de ne revoir et corriger que les
observations rpondant aux conditions que vous fixez.
Vous pourrez galement complter aprs coup une saisie
en vous plaant sur la strate de votre choix pour organiser
ainsi une saisie slective.
Enfin, en mode tableur, vous visualiserez dun seul coup
dil toute votre base de donnes, avec affichage des
individus en ligne et des variables en colonne.
22
Organisation de la saisie
Outre la saisie classique, le Sphinx propose des fonctions
de gestion de donnes dans le menu Grer :
Sphinx 2000
23
4. Les traitements
Une fois les rponses saisies, le Sphinx offre un trs grand
nombre dinvestigations propres satisfaire toutes les
curiosits, des plus simples aux plus complexes.
A ce stade, on sintresse au contenu des rponses. On
parle alors de variables (nominales, numriques ou textes)
car il sagit dexaminer la diversit des rponses apportes,
leur variation, leur rptition dun individu lautre, et les
relations que ces variations permettent de mettre en
vidence.
Les dnombrements et calculs que la statistique autorisent
sont alors utiliss pour rechercher les proprits et
structures remarquables des donnes.
Les quatre menus du stade Traitements et Analyses
organisent ces possibilits selon une graduation de
complexit croissante.
MARQUE
10%
15%
Non- rponse
Renault
11%
Peugeot
Citron
11%
Talbot
Ford
Fiat
7%
Volkswagen
Opel
Japonaise
Autre
9%
14%
4%
6%
11%
2%
16%
16%
13%
13%
13%
12%
10%
8%
7%
4%
3%
3%
Ren
ault
Peug
eot
Citro
n
Talbot
Ford
Fiat
Volksw
agen
Opel
Japon
aise
Autre
MARQUE
Renault
Peugeot
Citron
Talbot
Ford
Fiat
Volkswagen
Opel
Japonaise
Autre
13%
10%
13%
3%
7%
4%
16%
8%
13%
12%
MARQUE
Opel
Japonaise
13%
Volkswagen
16%
Autre
8%
12%
Analyse univarie
Fiat
13% Renault
4%
3%
7%
10%
Ford
Peugeot
13%
Talbot
Citron
25
Les cellules encadres signalent les carts significatifs selon le test du Chi.
Axe 2 (20.6%)
20 25000
Fiat
Japonaise
Volkswagen
Talbot
5 7000
Citron
Axe 1 (39.8%)
-5000 Autre
16 20000
Peugeot
Ford
7 10000
Opel
Renault
13 16000
10 13000
26
25 30000
Synthtiser et rsumer
La rdaction dun rapport dtude doit viter laccumulation
de chiffres et de rsultats statistiques ; cest ce que
permettent les tableaux synthtiques.
Ils rsument plusieurs rsultats, et mettent en vidence les
traits les plus caractristiques.
A cet effet, la fonction Tableaux multiples du menu
Analyser permet de construire des tableaux accols ou
des tableaux de questions groupes qui synthtisent les
rsultats de plusieurs variables de mmes modalits :
PUISSANCE
Sphinx 2000
SEXE
REVENU
Renault
- de 4CV
Consommation
S.A.V. Entretien
13 16000
Peugeot
9CV et plus
Confort
16 20000
Citron
- de 4CV
Prix
6 7CV S.A.V. Entretien
5 7000
7 10000
Talbot
- de 4CV
Etrangres
CRITERES
ENSEMBLE
Distributeur
Prix
Homme
Confort
Scurit
4 5CV (39) Consomm. (80)
8 9CV (37)
Vitesse (74)
20 25000
5 7000
25 35000
20 25000
Femme (89)
Homme (74)
5 7000 (39)
10 13000 (25)
27
Synthtiser et discriminer
Les tableaux de moyennes croises permettent dvaluer
les modalits dune variable ferme selon plusieurs critres
quantitatifs. Grce lAnalyse de la variance un ou 2
facteurs, les critres discriminants sont automatiquement
mis en vidence. Par exemple : positionner des groupes
dindividus selon leur opinion exprime sur plusieurs
chelles.
On exploite le tableau contenant en ligne les individus et en
colonne leurs valuations. A partir de ces donnes, on
pourra construire des typologies et chercher les dimensions
sous-jacentes de lopinion.
Sphinx 2000
29
Expliquer et modliser
Lanalyse des relations entre deux variables numriques
peut tre gnralise en vue de mettre en vidence des
modles plus complexes. Avec larticle Corrlations
multiples, on peut analyser les relations entre une variable
expliquer et plusieurs variables explicatives, et estimer un
modle explicatif par le procd de la rgression multiple.
30
Le verbatim
Cette fonction consiste produire des extraits de textes en
fonction de leur contexte (autre variable) ou de leur
contenu (vocabulaire de la rponse), et restituer la liste
des rponses obtenues et des mots du texte.
Cette liste peut concerner tous les individus interrogs ou
une partie de la population interroge (rpondant
certaines caractristiques). Elle peut tre organise par
catgories de rponses, elle peut tre illustre par le
numro des individus, ou par leurs rponses dautres
variables
Prsentation en tableau
On peut prsenter les rponses aux questions ouvertes
textes dans un tableau qui indique la frquence des
rponses identiques ou celle des mots contenus dans le
texte. Cette possibilit dtude est accessible par loption
Tableau des rponses de la fonction Etudier des textes
dans le menu Recoder ou en construisant le tableau plat
de la question ouverte texte.
Par dfaut, le logiciel propose la liste des rponses
identiques en affichant leurs effectifs et leurs frquences
(Cf tableau 1 qui suit). Mais vous pouvez aussi construire la
liste des mots contenus dans les rponses en cliquant sur
le bouton Mots (Cf tableau 2 qui suit).
Les effectifs de ces listes peuvent tre ventils selon une
autre variable caractrisant les rpondants (bouton
Croiser). En cliquant sur le bouton Analyser lorsque vous
avez la liste lcran, vous retrouvez lenvironnement
danalyse des tris plat et des tris croiss avec toutes les
possibilits graphiques et les tests statistiques classiques.
Vous pouvez ainsi associer chaque catgorie dindividus
les mots quils utilisent.
Ces fonctions sont particulirement adaptes dans le cas
de rponses trs rptitives.
Sphinx 2000
31
Lanalyse de contenu
Lanalyse de contenu consiste lire le texte en vue de
caractriser son contenu et dfinir les principaux thmes
quil voque.
Cette mthode est accessible dans le bouton Analyse de
contenu de la fonction Etudier des textes. Au fur et
mesure de la lecture, on dfinit les modalits quon retient
et on coche les rponses en fonction du contenu des textes
cits.
Cette fonction vous place devant lcran suivant de
recodage : en haut de lcran, dans la partie droite, sont
affiches les rponses donnes par les diffrents individus
la question analyse et en bas de lcran, sont
prsentes les modalits que vous tes en train de
redfinir et de saisir.
Ainsi, vous passez en revue lensemble des rponses
donnes la variable texte et, au fur et mesure que vous
prenez connaissance de leur contenu, vous crez de
nouvelles modalits de rponses et vous cochez les
modalits qui correspondent au texte de la rponse.
32
Lanalyse lexicale*
Lanalyse lexicale donne un aperu du contenu du texte en
dressant le lexique (liste des mots quil contient, classe
par frquence dapparition).
Diverses mthodes sont utilises pour permettre
dapprocher le texte tout en rduisant au mieux les
ambiguts de la langue :
le calcul de diffrents lexiques : lexiques sans les motsoutils, regroups par racines, lemmatiss avec affichage
du statut grammatical [Rduire, Lemmatiser] ;
Sphinx 2000
33
34
Caractriser
Le Sphinx est galement un puissant gestionnaire de
donnes : retour aux donnes brutes, recherche et
navigation dans la base, dition des donnes relatives
nimporte quel sous-ensemble.
Que vous lappliquiez vos donnes denqutes ou
dautres sources, il offre une trs grande souplesse pour
exploiter les bases de donnes composites en utilisant
toutes les ressources de la statistique et de la gestion de
fichiers.
Face un tableau ou un graphique, on prouve trs
souvent le dsir den savoir plus sur le dtail des lments
qui le composent. Pour rpondre ce besoin, le Sphinx est
dot de puissants moyens de retour aux donnes brutes. A
partir des cellules dun tableau, des points individus dans
une reprsentation graphique, ou mme des mots dun
corpus texte, le logiciel permet de connatre
instantanment la nature et les caractristiques des
observations concernes.
Cette facult permet instantanment de vrifier lorigine de
tel rsultat et de tenter de lexpliquer. Pour consulter les
donnes brutes, il suffit deffectuer un double clic sur la
cellule concerne dun tableau, sur le point dune carte ou
sur un mot en analyse lexicale.
Sphinx 2000
35
Le Sphinx en direct
Votre visite guide se termine.
Lambition de cette visite guide est doffrir un aperu
rapide des nombreuses fonctions disponibles dans votre
logiciel. Par consquent, nous avons abord succinctement
certains thmes, tels que lanalyse lexicale, la gestion de
donnes et lanalyse statistique. Vous trouverez une
description exhaustive de toutes les fonctions du logiciel
dans les pages qui suivent ainsi que leur raison d'tre et
leur mode d'emploi.
Vous pouvez enfin bnficier des services prioritaires du
Sphinx en Direct pour toute assistance mthodologique ou
logiciel. Si vous n'tes pas inscrits ce service payant,
contactez Le Sphinx Dveloppement :
Tl. : 04 50 69 82 98
Fax
: 04 50 69 82 78
Mel
: contact@lesphinx-developpement.fr
Internet : http://www.lesphinx-developpement.fr
36
Sphinx 2000
37
Elaborer le
questionnaire
38
Elaborer le questionnaire
39
Accder toutes
les enqutes
du rpertoire de travail
40
Choisir un questionnaire-type
Les modles de questionnaires sont disponibles dans un
rpertoire cr cet effet au sein du dossier Sphinx 2000.
Par dfaut, quelques modles vous sont proposs : ils sont
dcrits par un rsum de lobjectif du questionnaire, et ils
correspondent des enqutes de satisfaction (Clinique et
Transport) ou des observatoires touristiques (Touristes).
Sphinx 2000
Elaborer le questionnaire
41
Slectionner
le modle utiliser
Indiquer ou crer
le rpertoire o
lenqute est sauvegarde
42
Indiquer le nom
de lenqute
Elaborer le questionnaire
43
Titre de
lenqute
44
Insrer et dupliquer
Pour insrer une question, slectionnez dans la liste, la
question avant laquelle vous souhaitez faire votre insertion,
puis choisissez Insrer une question du menu Rdiger.
Attention pour insrer une question aprs un titre,
slectionnez la question qui suit le titre (on insre toujours
avant!).
Si votre questionnaire comporte des questions similaires,
vous pouvez utiliser des procdures de duplication des
questions. Dans la liste, slectionnez la question ou les
questions qui vous intressent puis choisissez l'article
Dupliquer les questions. Vous pouvez aussi, aprs avoir
slectionn les lignes correspondantes dans la liste, utiliser
les touches Ctrl+C pour copier les questions, puis Ctrl+V
pour les coller la fin de la liste. Si vous voulez simplement
recopier le libell des modalits, il faut slectionner les
modalits qui vous intressent dans le dialogue de
dfinition de la question approprie, puis utiliser Ctrl+C
pour les copier, et dans le cadre des modalits de lcran
de dfinition de la nouvelle question, vous activez Ctrl+V.
.
Sphinx 2000
Elaborer le questionnaire
45
Texte de la
question
Nom de la
variable
Type de la
variable
Contrles et
paramtres
Dplacement
dans la liste
Utiliser la bibliothque
Choisir une question...
Copier dans le questionnaire
Recopier du
questionnaire vers la
bibliothque
46
5. Bibliothque de questions
Le Sphinx permet de grer une ou plusieurs bibliothques
de questions dans lesquelles le charg d'tudes ira puiser
la fois pour le guider dans le choix des questions mais
aussi pour acclrer les tches rptitives de la dfinition
de questions.
Une bibliothque est fournie avec le logiciel. Les
utilisateurs avertis enrichiront cette bibliothque ou mieux,
creront leur propre bibliothque de questions.
Utiliser la bibliothque
Il y a deux manires d'invoquer la bibliothque : depuis la
liste des questions ou depuis lcran de dfinition d'une
question.
Depuis la liste des questions, on choisit l'article Utiliser la
bibliothque du menu Rdiger. La liste des questions de
la bibliothque s'affiche. On slectionne une question puis
on clique sur le bouton Insrer. On peut ritrer l'opration
plusieurs fois sans quitter la bibliothque.
Depuis le dialogue de dfinition d'une question, on choisit
le bouton Bibliothque. Aprs avoir choisi la question, on
clique sur le bouton Remplir et la question en cours de
dfinition prend les caractristiques de la question
slectionne dans la bibliothque.
Les questions sont classes par thme et sous-thme. On
peut rduire la liste un thme donn pour visualiser les
questions proposes dans une liste plus courte et ainsi
choisir plus rapidement celle qui nous intresse.
Enrichir la bibliothque
Le bouton Enrichir permet d'ajouter une question la
bibliothque. On indique alors les thmes et sous-thmes
qui la caractrisent.
Sphinx 2000
Elaborer le questionnaire
47
Chercher dans la
bibliothque par thme
Thme
48
Questions chelles
On utilise ce type de question pour mesurer une opinion,
une prfrence, une satisfaction ou toute numration
ordonne. Ce type de question est quivalent une ferme
unique dont chaque modalit est affecte d'une note
correspondant au rang de l'chelon. Par dfaut, la note est
fixe suivant l'ordre dentre des chelons. Mais elle peut
tre change en slectionnant dans la fentre de dfinition
des chelons, le menu Valeurs associes et en
dfinissant pour chaque chelon la valeur de son choix. Au
moment du dpouillement, ces valeurs seront traites
comme celles d'une variable numrique.
Si vous utilisez une batterie dchelles qui ont des
modalits similaires, vous pouvez viter de saisir chaque
fois les modalits de rponses. A cet effet, le bouton
Echelles, disponible dans lcran de dfinition des
questions chelles, vous donne la liste des modalits de
toutes les chelles que vous avez dj dfinies sur ce
poste. Slectionnez dans la liste celle qui vous intresse :
elle sera automatiquement recopie dans le cadre des
chelons.
Sphinx 2000
Elaborer le questionnaire
49
Ferme unique
Ferme multiple
Ferme chelle
Modalits
Valeurs associes
traites comme
numriques
50
7. Questions ouvertes
Les rponses aux questions ouvertes ne sont pas connues
a priori. Il peut s'agir d'un nombre (ouverte numrique),
d'un mot ou d'une suite de mots (ouverte texte), d'une
image, dun code ou dune date.
Ouvertes numriques
Les rponses attendues sont des grandeurs dfinies par
rapport une unit donne. Elles gnrent une variable
numrique qui sera traite comme telle ou comme une
question rponses fermes dont les modalits sont des
classes d'intervalles. Il est trs intressant de recueillir au
dpart des informations numriques dont la prcision
permettra des analyses plus fines (corrlation, ACP...),
quitte revenir ensuite sur des classes dintervalles.
En dfinissant une question numrique, on peut prciser s'il
s'agit de valeurs entires ou dcimales dans le bouton
Contrles disponible dans lcran de dfinition de
question. Ce bouton donne galement la possibilit de fixer
des bornes minimales et maximales, qui auront pour effet
dinterdire la saisie des valeurs qui ne respectent pas ces
conditions.
Ouvertes textes
Questions images
Sphinx 2000
Elaborer le questionnaire
51
Ouverte numrique
Ouverte texte
Autre, prcisez
EXTRAITS VERBATIM
ANALYSE DE CONTENU
TEXTE
RECODIFICATION
52
ANALYSE LEXICALE
Questions dates
Questions codes
Un code est une squence de caractres alpha
numriques, souvent de taille fixe, dont les lments ont
une signification particulire dfinie par leur position dans
le code. Par exemples : les deux premiers caractres du
code postal renvoient au dpartement ; dans le numro
Insee, le premier caractre indique le sexe, les deux
suivants lanne de naissance.
On associe au code le dictionnaire qui donne en clair la
signification de chaque lment qui le compose. Un mme
lment peut sinterprter de diffrentes manires : par
exemple, 73 est le code dpartemental de la Savoie et
indique une appartenance la rgion Rhne Alpes.
Le dictionnaire ncessaire linterprtation des codes
postaux contient ainsi une ligne par code. Chaque ligne est
constitue selon le modle suivant :
73=Savoie=Rhne Alpes
74=Haute Savoie=Rhne Alpes
75=Paris=Ile de France
Sphinx 2000
Elaborer le questionnaire
53
54
9. Organiser le questionnaire
La qualit d'un questionnaire tient beaucoup la clart de
ses questions mais aussi sa structuration. Cest pourquoi
il est souvent utile de revenir globalement sur lorganisation
du questionnaire, aprs avoir rdig l'ensemble des
questions. C'est alors que l'on peut revoir la suite logique
des questions, affiner les thmes voqus dans le
questionnaire, regrouper des questions, dfinir des renvois,
ajouter des consignes...
Elaborer le questionnaire
55
Libell
Modalits de rponses
Zone de
dplacement
Renvois
56
Restrictions
Variable
Libell
SERVICES98
PRODUITS98
FINANCES98
:
:
:
:
:
Elaborer le questionnaire
57
Tableau de groupe
Nonrponse
58
Peu important
Assez
Sans
important
importance
Trs
important
TOTAL
VITESSE
144
162
CONFORT
62
39
20
39
162
SECURITE
157
162
CONSOMMATION
155
162
PRIX
146
162
Ensemble
79
45
315
363
810
Renvoi
Un renvoi est un aiguillage que l'on place sur une question
et qui renverra le rpondant (et l'oprateur de saisie) sur
une autre partie du questionnaire ds lors que la rponse
la question de dpart remplit une condition.
Un dialogue permet d'exprimer tous les renvois en
dsignant pour chacun l'origine, la condition et la
destination de l'aiguillage.
L'origine du renvoi est une des questions que l'on choisit
dans la liste droulante.
Le renvoi peut tre conditionnel et on exprime la condition
sous la forme d'un filtre de slection (Voir le paragraphe
correspondant pour plus de dtails).
Le renvoi peut tre inconditionnel, si par exemple on a fini
une partie spcifique et que l'on veut revenir au tronc
commun.
La destination est une autre question du questionnaire que
l'on choisit galement dans une liste. Cette destination peut
tre aussi la fin du questionnaire lorsque toutes les
questions restantes ne sont pas pertinentes.
Restrictions de saisie
Les renvois sont des aiguillages qui ne peuvent pas
rpondre toutes les situations.
Autre, prcisez
Une condition de prsentation classique concerne les
questions semi-fermes. On souhaite laisser l'interview
la possibilit de rpondre autre chose que les modalits
proposes.
Dans le dialogue dclench par le bouton Contrles de la
question ferme, on coche l'option Associer une question
texte, "Autre, prcisez".
Une question texte est automatiquement cre aprs la
question ferme mais celle-ci ne sera propose la saisie
que si la dernire modalit de la question ferme est
coche.
Attention, la question est associe la dernire modalit,
pas la modalit Autre. Ainsi si les modalits sont "Xxxx ;
Yyyyy ; Zzzzz ; Autre ; Ne sait pas" la question texte sera
associe la modalit "Ne sait pas".
Elaborer le questionnaire
59
Renvoi
inconditionnel
tablir un
renvoi
Cliquer pour
ajouter un second
renvoi
60
Renvoi la fin
des
Elaborer le questionnaire
61
62
Elaborer le questionnaire
63
64
Utiliser le zoom
Dfinir len-tte
Le bouton En-tte est utilis pour insrer du texte ou des
images en en-tte, au-dessus du titre de lenqute qui
figure automatiquement en haut au centre de la premire
page. On peut ainsi prvoir un espace pour un numro de
questionnaire ou pour une date.
On peut insrer un logo en indiquant le nom du fichier
image et son chemin daccs entre crochets :
[c:\ sphinx2000 \ SphPrSc \ Automobi \ tortue.bmp] par
exemple.
Il est galement possible de faire figurer en en-tte la
valeur dune variable (nom de lindividu ou de lentreprise
par exemple) pour des questionnaires nominatifs prremplis. La variable doit tre aussi inscrite entre crochets.
Sphinx 2000
Elaborer le questionnaire
65
66
lancent un
la meilleure
obtenez un
les options
Affiner la prsentation
Avec les onglets Polices et En-tte, vous personnalisez
vos questionnaires en variant les polices selon les
lments du questionnaire. Rdigez vos en-ttes en
distinguant la premire page des pages suivantes ou en y
insrant votre logo.
Imprimer le questionnaire
Le bouton Imprimer lance limpression conformment
vos choix de mise en page. Vous pouvez galement utiliser
Inclure dans le rapport pour reprendre votre
questionnaire dans un document Word.
Sphinx 2000
Elaborer le questionnaire
67
Mettre en page
le questionnaire
Faire dfiler
les questionnaires
et visualiser
les rponses
68
Enregistrement du questionnaire au
format Texte
Dans le stade Elaboration du questionnaire, le menu
Fichier permet daccder la fonction Enregistrer sous.
Dans cette fentre, choisissez loption Faire une copie du
questionnaire puis Dans un fichier texte dans le menu
droulant.
Votre questionnaire est alors enregistr dans un format
texte (xxx.txt) dans le rpertoire que vous avez choisi.
Lancez le traitement de textes que vous utilisez
couramment puis ouvrez le fichier texte contenant votre
questionnaire.
Pour accder votre questionnaire, demandez votre
traitement de textes dafficher tous les types de fichiers.
Parfois, il ne vous propose que les fichiers qui sont dans
son format (xxx.doc par exemple pour Microsoft Word).
Votre questionnaire est maintenant dans un traitement de
textes. Le Sphinx a export les textes des questions, les
consignes, les modalits proposes ainsi quune case pour
accueillir chaque rponse.
La manire dont le Sphinx exporte le questionnaire nest
pas paramtrable. En fait, il envoie le questionnaire dans le
traitement de textes dans une prsentation la plus simple
possible, afin que tout nouvel amnagement soit possible.
Sphinx 2000
Elaborer le questionnaire
69
Copier le questionnaire
en format texte
Eventuelles modifications
dans lenvironnement
du traitement de textes
70
Sphinx 2000
Elaborer le questionnaire
71
Saisir les
rponses
72
Enqutes ncessitant un
environnement de saisie particulier
Enqutes en rseau
Si lensemble des rpondants a accs un rseau interne
ou externe, le module Le Sphinx et lInternet vous permet
de concevoir un questionnaire au format adquat, pour
linstaller en rseau et organiser la collecte des rponses
dans un fichier dtermin. Voir le paragraphe Scanner et
Internet ce sujet.
Sphinx 2000
73
74
Saisie directe
Ce mode organise la saisie question par question. Dans le
cas des questions groupes, la fentre de saisie directe
prsente un tableau de questions (si les groupes de
questions sont activs).
Lorsque la rponse est ferme, on coche l'cran la
modalit retenue ou on tape le numro correspondant. On
passe la question suivante avec la touche entre ou en
cliquant sur la flche de droite correspondant au dfilement
des questions. On dcoche une case dj slectionne en
cliquant nouveau sur celle-ci. Lorsque la question est
ouverte, on entre au clavier le texte ou le numro souhait.
Vous noterez que les cases sont rondes lorsque la rponse
est unique, et carres quand plusieurs rponses sont
autorises. La saisie est contrle : on ne peut pas entrer
de code inexistant ou de valeur hors bornes, ni cocher plus
de rponses que le nombre maximum autoris.
Ce mode de saisie est particulirement appropri pour les
enqutes tlphoniques, puisquil permet de visualiser le
libell complet des questions et des modalits de rponses
proposer dans un cran qui offre donc tout ce qui est
ncessaire tant pour administrer les questionnaires que
pour recueillir les donnes.
Sphinx 2000
Saisie rapide
Ce mode de saisie fait apparatre toutes les questions dun
rpondant dans la mme fentre. On peut faire de la saisie
au kilomtre en rentrant les donnes au clavier.
Dans ce cas, on entre le numro des modalits retenues
sans avoir valider aprs chaque question ou chaque
observation. En ce qui concerne les questions ouvertes, on
saisit les textes ou les nombres au clavier. La saisie des
questions multiples se fait en entrant successivement les
rponses dans les cases et le passage la case suivante
seffectue avec la touche Tabulation ou la touche Espace.
Si la question est rponses ordonnes, on entre dans la
premire case la rponse donne au rang 1, dans la
seconde case, la rponse donne au rang 2 Enfin, dans
ce mode de saisie, les questions groupes napparaissent
pas sous forme de tableaux.
Le passage la question suivante est automatique ds que
le nombre de caractres attendu est atteint. Un cas
particulier se prsente donc pour les questions ayant plus
de 10 modalits puisque le logiciel attendra deux
caractres : vous pouvez donc saisir 01 au lieu de 1 pour
forcer le passage la question suivante (Voir Options de
saisie). Le passage lobservation suivante est
automatique ds que la dernire question du questionnaire
est renseigne.
75
Saisie rapide :
toutes les questions sur
le mme cran
2 exemples d crans
de saisie directe
12
43
3. Consultation et modification
Si aprs avoir saisi vos rponses, vous souhaitez aller
consulter lensemble des donnes, vous pouvez le faire en
utilisant le mode de consultation/modification disponible
dans le stade de la saisie des rponses.
Cet environnement peut tre prsent en mode direct (une
question par cran ou un tableau de questions dans le cas
des questions groupes) ou en mode rapide (toutes les
questions dun rpondant sur une mme fentre). Il existe
aussi un mode tableur qui permet de visualiser et de
modifier les donnes dans un tableau qui indique tous les
individus en ligne et toutes les questions en colonne.
On accde la consultation et modification des donnes
par le panneau central de la saisie des rponses, en
cliquant sur le bouton Consulter/Modifier ou par le menu
Saisir en choisissant loption Consulter/Modifier. Dans
lcran de consultation des donnes, on passe dun mode
lautre grce licne situ en bas gauche de lcran.
La possibilit daccder uniquement aux donnes dune
sous-population rpondant un profil est galement
propose par le Sphinx, ce qui acclre encore la
navigation dans les donnes.
Le mode direct
Le mode direct de consultation / modification est
particulirement adapt lorsquon souhaite vrifier la
rponse une question dun individu donn. Des flches
de navigation ainsi que des listes droulantes permettent
de passer rapidement dune question une autre et dun
individu un autre.
Le mode tableur
Ce mode est propos pour la vrification des donnes. Il
permet de parcourir la base d'un seul coup d'il en se
concentrant ventuellement sur une seule variable (bouton
une variable / toutes les variables). On passe dune
observation lautre avec le retour chariot ; ce qui permet
de modifier rapidement un ensemble de valeurs en entrant
les nouvelles donnes au clavier et en cliquant sur la
touche Retour Chariot.
Attention : vous ne pouvez pas modifier les rponses aux
questions textes en mode tableur. Revenez dans un des
autres modes.
Pour aller encore plus vite dans les modifications
d'ensemble sur la base, vous pouvez utiliser le bouton
Remplacer qui permet de changer des valeurs sur une ou
plusieurs variables, et ceci, pour toutes les observations ou
pour un sous-ensemble d'observations dfinies par un
profil.
Le mode rapide
Vous pouvez consulter toutes les rponses dun individu
dans un mme cran si vous choisissez le mode rapide.
Sur un mme questionnaire, vous passez dune question
lautre avec le Retour Chariot. Le bouton Annuler ferme la
fentre consultation/modification sans enregistrer les
modifications apportes.
Sphinx 2000
77
Naviguer
Atteindre
Supprimer
Imprimer
Illustrer
Changer de mode
Modification rapide en
mode tableur
Slectionner un sousensemble
d observations
Modifier partout
78
Options de saisie
On les fixe partir de larticle Options de saisie du menu
Saisir. Elles dpendent du mode de saisie choisi.
En mode rapide, la solution par dfaut conduit passer
automatiquement litem suivant aprs documentation
complte (variables fermes, numriques et codes). Cette
option est propose par dfaut mais vous pouvez optez
pour une autre solution en cochant la case Attendre
Retour Chariot pour passer la question suivante.
Si vous conservez loption propose par dfaut, ceci oblige,
lorsque la question contient plus de 10 modalits, taper
deux caractres pour les modalits de code infrieur 10
(03 par exemple) avant de passer la suivante. On peut
standardiser en obligeant dans tous les cas saisir deux
caractres : case Attendre toujours 2 caractres pour
une modalit.
En mode direct, on passe la question suivante en faisant
un retour chariot aprs avoir indiqu la rponse (ou en
agissant sur la flche vers la droite). Pour les rponses
textes, on aura le mme comportement en cochant loption
Pas de retour chariot dans les questions textes. Pour
les questions fermes, on peut faire afficher plusieurs
modalits par ligne ou une seule, et faire ou non apparatre
leurs numros.
Sphinx 2000
79
Saisir ou consulter
Contraintes
de saisie
Mode de consultation
par dfaut
Options de saisie en
mode rapide
Options de saisie en
mode direct
Rechercher des
observations
80
5. Rassembler / Fusionner
L'article du menu Grer permet de crer une enqute
unique partir de plusieurs enqutes.
Rassemblement d'enqutes
strictement identiques
Sphinx 2000
Fusion d'enqutes*
Deux enqutes prsentent une variable commune
permettant d'identifier une observation, par exemple deux
questionnaires portant sur des sujets diffrents ont t
proposs au personnel d'une socit. Dans chacune de
ces enqutes, on retrouve le nom de la personne.
La fusion des deux enqutes consiste crer une nouvelle
enqute dans laquelle on aura pour chaque personne les
rponses aux questions du premier questionnaire ET celles
du second. On pourra ainsi croiser les variables qui taient
au dpart dans des enqutes diffrentes.
On choisira dans les dialogues l'enqute fusionner avec
l'enqute courante, puis la variable permettant d'identifier
une observation, et enfin les variables conserver dans
l'enqute fusionne.
81
82
Sphinx 2000
83
3/ Choisissez un
mode
dimportation
1/ Slectionnez les
variables
importer
2/ Dfinissez le contenu
de vos donnes
84
4/ Ouvrez le fichier
des donnes
7. Gestion de panels*
Le Sphinx Plus2 comporte un systme complet de gestion
de panel. Cette activit consiste exploiter un fichier de
personnes, les panlistes, rgulirement consultes sur
diffrents sujets. Il contient des donnes permanentes
didentit. On appel campagne lactivit consistant
consulter par questionnaire tout ou partie du panel.
A chaque campagne, on est ainsi amen crer un
questionnaire pour ladresser une slection de panlistes.
On saisit leurs rponses pour ensuite les enrichir des
donnes permanentes contenues dans le panel.
Choisir un panel
A partir du questionnaire de la campagne, avec le bouton
Changer, on dsigne le fichier du panel et le nom de la
variable clef, celle qui permettra dassocier aux rpondants
de la campagne les informations contenues dans le panel.
85
Choisir le fichier
du panel
Affiner la slection
86
87
Mettre jour
CAMPAGNE
ENQUETE 1
PANEL
ENQUETE 2
Slectionner lenqute
ajouter
lenqute courante
88
Le Sphinx et lInternet
9. Scanner et Internet
Le Sphinx vous donne accs aux nouvelles technologies
de saisie : la lecture de questionnaires par scanner et
lutilisation dInternet. Pour mettre en uvre ces fonctions,
vous devez vous procurer les modules spcialiss
correspondants.
Sphinx 2000
89
2/ Impression
4/ Saisie
manuelle
4/ Saisie
scanner
4/ Rcupration des
rponses
5/ Traitements et analyses
6/ Edition dun
rapport papier
assez intelligente!
90
Extraction alatoire
On peut ajouter la dfinition des quotas une condition de
taille de lchantillon. Celle-ci ne pourra tre remplie que si
leffectif rsultant de lapplication des quotas lui est
suprieur.
Dans ce cas, la rduction se fait dune manire alatoire.
Attention, si les chantillons sont faibles, lajout dune telle
condition risque de vous loigner de la rpartition vise.
Cette fonction est surtout utile lorsquon travaille sur des
donnes trs nombreuses. Elle peut alors servir
slectionner de plus petits chantillons.
Aide lchantillonnage
Le bouton Aide dans le dialogue de dfinition des quotas
renvoie un rappel de la thorie des sondages et un outil
de simulation de la prcision et de la taille de lchantillon.
On peut dans ces conditions :
Calculer la prcision dune estimation en fonction de la
taille de lchantillon.
Dterminer la taille dun chantillon en fonction dune
prcision recherche.
Cette fonction vous permet donc de choisir lune des deux
options et de simuler leffet des paramtres intervenant
dans le calcul dune estimation :
La taille de lchantillon.
La proportion estimer.
Lerreur maximum admise (ou imprcision de lestimation)
en terme dintervalle de confiance.
Le risque accept mesur par la probabilit que la valeur
estime soit en dehors de lintervalle de confiance.
91
Slectionner les
variables
Dfinir
les
quotas
Extraction alatoire
Dtails de la
strate
Cration de la
variable dfinissant
lchantillon redress
92
93
Avant
Aprs
14 questions
2 + 4 *3
4 observations
7 questions
2 + 4 +1
10 observations
3*4 -2 (1 personne ne sest pas exprime
sur 2 des marques
Tableau crois pour
l ensemble des marques
94
FREQUENCE
SEXE
Nonrponse
Jamais
Rare
ment
Souvent
TOTAL
Un homme
Une femme
TOTAL
10
est
linverse
de
lclatement
dcrit
Sphinx 2000
95
Avant
Aprs
96
97
Supprimer
les doublons
Trier
les rponses
98
Sphinx 2000
99
Produire des
rsultats
100
Plan de dpouillement
1. Dpouiller
Les articles du menu Dpouiller offrent une premire
approche des rsultats base sur la restitution plat des
donnes. Vous prenez ainsi rapidement connaissance des
rsultats pour les sortir dans un rapport.
Dpouillement automatique
A lcran, limprimante, dans un rapport ou dans un
fichier, vous prenez connaissance des rsultats
lmentaires (tableaux plat, tris croiss dj dfinis,
tableaux rcapitulatifs) en excutant Dpouillement
automatique du menu Dpouiller.
Strates
Le Sphinx analyse soit lchantillon total, soit une strate
(sous-ensemble dindividus rpondant un profil
particulier). Larticle Strates du menu Dpouiller permet de
dfinir ce profil en le spcifiant par rapport une ou
plusieurs variables. Les strates sont conserves et vous
pouvez en changer en les slectionnant dans le dialogue et
en utilisant les boutons Modifier, Nouvelle et Appliquer.
Le bouton Caractriser permet de dcrire les individus de
la strate.
Options de dpouillement
Dans larticle Options de dpouillement du menu
Dpouiller, vous indiquez si vous souhaitez voir, dans les
rsultats, les lignes ou colonnes deffectif nul ainsi que les
non rponses. Cet article vous permet galement
dindiquer la prcision de vos rsultats, que ce soit pour les
effectifs ou pour les pourcentages.
Appliquer un barme
Cette fonction permet de calculer la valeur dun score
global dfini par un barme.
Tableaux de bord
Cet article permet de lancer Eurka! et de bnficier de
ses riches possibilits de prsentation.
Sphinx 2000
101
Options de dpouillement
Plan de dpouillement
102
2. Organiser et restreindre
la liste
2. Environnements de
dpouillement et danalyse
Avec le Sphinx, vous retrouverez la possibilit de voir vos
rsultats en les survolant (Dpouiller / Dpouillement
Automatique / A lcran Analyser / Rsultats) ou de
les analyser un par un (Analyser, Tableaux Plat,
Tableaux croiss). Un nouvel environnement vient
homogniser le dpouillement et lanalyse des questions
ouvertes (codes, dates et textes).
103
Survoler
Choisir
la prsentation
des rsultats
Naviguer :
choisir les variables
dpouiller
Analyser
Mettre en forme
Calculer
Tester
Tableaux listes :
textes, codes, dates
Prsenter
Transformer
Croiser
104
La fentre d'analyse
On y accde en venant de la fentre des rsultats par le
bouton Analyser le tableau ou aprs avoir slectionn,
partir du menu Analyser, un Tableau plat, un Tableau
crois ou un Tableau multiple.
Sphinx 2000
105
Environnement
de consultation
Environnement
danalyse
Fentre des
caractristiques
106
4. Tableaux rcapitulatifs
Ces tableaux donnent un aperu synthtique des donnes
recueillies en les regroupant par types de questions :
questions fermes, questions numriques, questions
textes. C'est une manire pratique de se faire une ide
rapide des rsultats.
On accde aux tableaux rcapitulatifs par le bouton
Rsultats, ou par la fonction Dpouillement automatique
du menu Dpouiller en slectionnant le type de traitement
adapt. Vous pouvez aussi utiliser l'article Tableaux
multiples du menu Analyser. On arrivera dans ce dernier
cas directement dans la fentre d'analyse.
Sphinx 2000
107
Tableaux rcapitulatifs
Dpouiller
Analyser
Variables nominales
et chelles
Supprimer
lignes,
colonnes
Variables
numriques et
chelles
Variables textes
108
Comparer des
moyennes
Changer de strate
Sphinx 2000
109
Changer de strate
Nommer la strate
Choisir la variable filtre
Dfinir le filtre
Filtre 1
Filtre 2
Ajouter et supprimer
un filtre
Dfinir et enregistrer
110
6. Filtres de slection
Dans diverses fonctions lors de la saisie ou lors des
traitements, il est ncessaire d'effectuer une slection
d'observations, par exemple :
pour dfinir une strate ;
pour obtenir une liste structure rduite un profil ;
pour dfinir une variable "PROFILS" ou "SCORE" ;
pour dfinir des renvois ou des restrictions.
Cette slection peut tre monocritre, c'est--dire que la
condition ne porte que sur une variable ou bien
multicritre lorsque la condition porte simultanment sur
plusieurs variables.
On choisit la question dans la liste droulante puis on
exprime la condition qui change selon le type de la
question.
Conditions de slection
Questions fermes : on slectionne dans la liste des
modalits la ou les modalits concernes.
On peut aussi procder par limination. Ainsi, pour
slectionner toutes les rponses l'exception des
possesseurs de Renault, on choisira l'option "#" (diffrent
de) et on cliquera sur Renault.
Questions fermes multiples : on procde de la mme
manire, les rponses slectionnes seront celles qui
montreront l'une ou l'autre des modalits slectionnes.
Questions fermes ordonnes : il est en outre possible
d'indiquer le rang auquel on devra trouver la ou les
modalits choisies dans la liste.
Questions numriques : on indiquera la condition de
slection par un ensemble de valeurs avec deux syntaxes
possibles :
Entre : on dfinit la slection par la valeur minimum et /
ou la valeur maximum attendue (une seule de ces deux
valeurs peut suffire).
Parmi : on dfinit la slection par un ensemble de valeurs
possibles sous la forme : 5 ; 8 ; 10-15 ; 20. Seront
slectionnes les observations pour lesquelles la variable
vaut 5 ou 8 ou une valeur comprise entre 10 et 15 ou
encore 20.
111
Conditions de slection
Question FERMEE UNIQUE ou MULTIPLE
Question NUMERIQUE
Enchaner
plusieurs filtres
112
Modification du
filtre
7. Produire automatiquement un
rapport complexe (Plan de
dpouillement)
Pour gagner du temps dans la production des rapports, on
peut enchaner automatiquement le lancement de
traitements de natures diffrentes et l'dition des rsultats
correspondants. Cela est particulirement intressant
lorsque les mmes analyses doivent tre rptes pour
des sous-populations diffrentes (par exemple un rapport
par agence, par catgorie d'individus...).
Pour cela, on dfinit tout d'abord un plan de dpouillement,
pour l'excuter ensuite. La possibilit de mmoriser
diffrents plans donne beaucoup de souplesse.
Excuter un plan
Pour excuter le plan de dpouillement que vous avez
sous les yeux, utilisez le bouton Excuter. Le dialogue
Mise en forme du rapport vous permet de prciser le
traitement de textes utilis et la forme dans laquelle vous
souhaitez rcuprer les tableaux.
Le plan s'excute dans votre traitement de textes partir
duquel vous pourrez l'imprimer. Si vous souhaitez l'enrichir
ou le modifier, l'utilisation du mode plan dans le traitement
de textes vous facilitera beaucoup le travail.
113
Choisir les
traitements
114
Structurer la liste
Prsenter la liste
Modifier la liste
A ce stade, vous avez lcran la liste souhaite, selon les
critres que vous avez dfinis. Des modifications sont
encore possibles grce aux onglets qui figurent en bas de
page : Autre liste permet de revoir la slection des
variables prendre en compte, Prsenter vous ramne
lordonnance et au format de la liste, et Structurer permet
de modifier le tri et le profil des individus figurant dans la
liste.
Utiliser la liste
Longlet Analyser vous donne accs au dpouillement de
votre liste par loption du tableau gnralis.
Sphinx 2000
115
Rpartition et spcificits
On peut examiner, pour la sous-population tudie, les
valeurs de la variable choisie en les numrant
(Observations), en calculant leur rpartition (Rpartition),
ou encore en cherchant mettre en vidence la spcificit
de leurs rponses (Spcificits).
On compare pour cela la rpartition ou la moyenne de la
variable dans la catgorie (local) sa rpartition ou
moyenne pour la totalit des effectifs (global). L'cart est
qualifi par le rapport des frquences (il est suprieur 1
pour les modalits sur-reprsentes), par le test du Chi, ou
par le test de comparaison de frquences (Options...).
Quand la variable est numrique, on utilise le test de
Student.
Afin de mieux mettre en vidence les spcificits de la
catgorie tudie, le haut du classement affiche les
modalits les plus reprsentes.
Sphinx 2000
117
Passer
dune cellule lautre
N dobservation
et valeur
Rpartition
selon la variable
Spcificit :
comparaison des rpartitions dans
la cellule et dans tout le tableau
118
Dtailler et
corriger
Sphinx 2000
119
Modifier les
donnes en les
recodant
120
1. Questions et variables
Diffrents vocabulaires
Le Sphinx est un logiciel de traitement d'enqutes et, ce
titre, il utilise le jargon des enqutes. On parle ainsi de
questions, de rponses, d'individus, de questionnaires, etc.
Lignes et colonnes
Pour bien comprendre les diverses phases de l'enqute, il
est bon de se la reprsenter comme une feuille de calcul
comme on les voit dans un tableur.
La premire ligne est le questionnaire (avec le nom des
variables).
Les autres lignes reprsentent chacune une rponse (ou
observation, individu, unit statistique, enregistrement).
Chaque colonne reprsente une variable, une question.
Dans une cellule, on a la rponse d'un individu une
question. Ce peut tre un nombre (Quel est votre ge ?) ou
un texte long (Racontez une dcision que vous avez prise).
Nouvelles variables
Les donnes, telles qu'on les a recueillies, ne permettent
pas toujours de produire directement les rsultats
escompts. Il est ncessaire d'appliquer des traitements
ces variables.
Sphinx 2000
121
Vocabulaires
Une question
Une observation
La rponse dun
individu une
question
122
Nouvelle variable
calcule ou
recode
2. Recoder
La recodification consiste transformer le format ou les
proprits des donnes saisies lorigine pour les rendre
plus maniables en cours danalyse. Cest notamment le cas
lorsquon prfre traiter une variable numrique en crant
des tranches, lorsquon veut remplacer un code postal par
un intitul de rgion, ou complter ltude dune question
ouverte par une grille thmatique. Le Sphinx offre dans
cette perspective une trs grande souplesse. On procdera
toujours en dsignant la variable transformer, et la
nouvelle variable cre. La transformation opre
dpendra de larticle de menu choisi.
Transformer et combiner*
Ce menu offre une bote outils grce laquelle vous
pourrez reprendre toutes vos variables et vous sortir de
toutes les difficults.
Transformer : il est possible de modifier la base initiale
pour regrouper les modalits dune variable nominale,
crer partir dune seule variable plusieurs autres
(chelles, uniques, oui/non), calculer le nombre de
rponses dune ferme multiple, ou changer le statut
dune variable.
Combiner : dans ce cas, on combine lanalyse de
plusieurs variables pour en crer une nouvelle (fusion,
croisement, profil ou compteur).
Redfinir les variables : cette fonction permet de passer
des chelles aux numriques et de modifier rapidement
les noms et intituls des variables.
Cacher des variables : les variables caches ne
figureront plus temporairement dans les listes
droulantes.
Modifications globales : ce chapitre regroupe un
ensemble de fonctions utiles pour modifier les donnes
(remplacer les non rponses, supprimer les colonnes
vides).
Sphinx 2000
123
Transformer / combiner
124
Sphinx 2000
Heures et minutes
Les variables de type date permettent aussi dindiquer des
heures. De la mme manire ces valeurs peuvent tre
regroupes, en heures rondes par exemple.
Remarque : si on veut calculer par exemple une dure de
sjour au service des urgences, on aura une variable heure
darrive et une variable heure de sortie.
La diffrence ne se calcule pas aussi simplement parce
quelle peut tre suprieure 24 heures.
Dans ce cas on utilisera la procdure de calcul dune
nouvelle variable avec le code suivant :
Si HEURE_SORTIE < HEURE_ARRIVEE Alors
DUREE = 24 + HEURE_SORTIE HEURE_ARRIVEE
Sinon
DUREE = HEURE_SORTIE HEURE_ARRIVEE
Fin Si
125
Produire la liste
des codes
Interprter
les catgories du
code
Crer
une nouvelle
variable
126
4. Calculer un barme
Un barme est un ensemble de valeurs associes aux
modalits dune variable nominale ou dune chelle. Ces
valeurs sont quivalentes une note affecte en fonction
de la rponse donne. Calculer un barme, cest faire la
somme de toutes ces notes en fonction des rponses.
Etablir un barme
On tablit le barme en affectant des valeurs aux modalits
des questions fermes (Voir le paragraphe Associer des
valeurs aux questions fermes). On peut galement
revenir sur cette dfinition au moment du calcul du barme.
La fonction Appliquer un barme du menu Dpouiller
affiche un dialogue dcrivant les rsultats du barme
(cran de bas ci-contre). On peut revenir sur la dfinition du
barme en cliquant sur le bouton Barme.
Calculer le barme
Larticle de menu Appliquer un barme
directement une fentre donnant, pour
observation, la valeur du barme.
conduit
chaque
Sphinx 2000
127
Activer/
dsactiver
le barme
Liste de
questions et
modalits
Valeurs
associes
Numrotation
automatique
Dfinition
du barme
Supprimer le
barme
Charger
un barme
Enregistrer le
barme
Editer
la valeur
Dfinition du
barme
Application
du barme
Score calcul
Dtail du score
Cration de la
variable score
128
129
Transformer
une ordonne
...
130
Sphinx 2000
131
Choisir un type
de calcul
Options
Liste
des fonctions de calcul
Ecrire la formule ou le
programme de calcul
Liste des
variables
Vrifier
le rsultat du
calcul
132
Nommer
la nouvelle variable
V=n
Sphinx2000\SphCalc\modles.txt.
Sphinx 2000
133
Slectionner la
variable
recalculer
Choisir un
modle ...
et le complter
Le rsultat du calcul
remplace
les donnes initiales
134
Sphinx 2000
Multi Oui/Non
Dans le questionnaire, l'usage des questions Oui/Non
facilite les rponses, mais alourdit le traitement. On peut
alors crer aprs coup une seule variable rponses
multiples regroupant plusieurs variables Oui/Non.
Verbose
Permet de prsenter sous la forme d'un texte l'ensemble
des rponses un questionnaire.
Variable Strates
Il sagit de crer une variables dont les modalits sont
parmi les strates cres. La variable sera unique ou multiple,
le nombre de rponses possibles sera calcul
automatiquement.
Cette combinaison est plus intressante que les profils
dans la mesure o les dfinitions de strates sont
conserves. Il sera ainsi plus simple de relancer le
processus aprs modification des donnes :
Supprimer la variable prcdemment calcule
Recrer une variable sur ces mmes strates
135
Compteur
Profil
Fusion
136
Sphinx 2000
137
138
Sphinx 2000
139
Double
clic
Dcrire
lobservation
courante
Dcrire
la strate
140
Sphinx 2000
141
Analyse
univarie, les
tableaux plat
142
Changer de strate
En changeant de strate, on actualise lanalyse en cours sur
les effectifs de la nouvelle strate.
Sphinx 2000
143
Tableau plat
Tableau crois
Tableau de moyennes
MARQUE
Renault
Peugeot
Citron
Talbot
Ford
Fiat
Volkswagen
Opel
Japonaise
Autre
TOTAL
144
18.KILOM 19.DEP
ETRAGE ENSE
1404
2771
1249
1604
2403
1287
3065
2803
3203
2166
2202
1061
1576
1022
1280
1483
803
1676
1633
1544
1360
1377
Corrlation et
nuage de points
KILOMETRAGE
313.25
198.08
DEPENSE
Options de dpouillement
Avec cet article, vous pouvez spcifier de ne pas afficher
les modalits d'effectif nul et modifier la prcision
d'affichage des rsultats.
Sphinx 2000
145
Questions fermes
rponse unique
Options de dpouillement
Nb. cit.
Frq.
CRITERES
Non- rponse
15
9,3%
Vitesse
73 45,1%
Confort
44 27,2%
Scurit
36 22,2%
Consommation
80 49,4%
Prix
56 34,6%
Publicit
29 17,9%
Distributeur
14
8,6%
S.A.V. Entretien
22 13,6%
TOTAL OBS.
162
Le nombre de citations est suprieur au
nombre d'observations du fait de rponses
multiples (3 au maximum).
Nb. cit.
Frq.
Non- rponse
15
4,1%
Vitesse
73 19,8%
Confort
44 11,9%
Scurit
36
9,8%
Consommation
80 21,7%
Prix
56 15,2%
Publicit
29
7,9%
Distributeur
14
3,8%
S.A.V. Entretien
22
6,0%
TOTAL CIT.
369 100%
Le nombre de citations est suprieur au
nombre d'observations du fait de rponses
multiples (3 au maximum).
38,8%
7,5%
2,7%
30,6%
12,9%
4,1%
0,0%
3,4%
4,2%
19,7%
18,3%
17,6%
23,9%
7,7%
4,9%
3,5%
15,4%
7,7%
9,2%
15,4%
4,6%
18,5%
10,8%
18,5%
73
44
36
80
56
29
14
22
354
20,6%
12,4%
10,2%
22,6%
15,8%
8,2%
4,0%
6,2%
100%
La question est 3 rponses multiples ordonnes. Le tableau donne les effectifs pour chaque rang
et pour la somme. Les pourcentages sont calculs par rapport au nombre de citations.
146
Options de dpouillement
Avec cet article du menu Dpouiller, vous affichez ou non
les modalits d'effectif nul et les non-rponses, et vous
indiquez la prcision de l'affichage. Ces choix, comme ceux
des polices, s'appliquent tous les tableaux et sont
conservs comme choix par dfaut.
Sphinx 2000
147
Regrouper
Supprimer
Permuter
148
Dimensions du graphique
comporte
de
nombreuses
possibilits
149
histogramme
MARQUE
MARQUE
secteurs
13,1%
41,4%
Renault
67
Peugeot
10,2%
Citron
Talbot
48,9%
Ford
Fiat
Etrangres
11,1%
8,6%
11,1%
13,1%
6,2%
2,5%
3,7%
4,4%
Ren
ault
Peu
geo
t
Citr
on
Tal
bot
Ford
MARQUE
barres
Renault
11,1%
Peugeot
8,6%
Citron
Talbot
Fiat
Etr
ang
re
profil, aire
7,3%
2,9%
MARQUE
22,0%
11,1%
2,5%
Ford
6,2%
3,7%
Fiat
Etrangres
41,4%
4,0%
Ren
ault
Peu
geo
Cit
ro
Tal
bot
Ford
Fiat
Vol
ksw
Opel
Jap
ona
Autre
MARQUE
radar
anneaux
Fiat
MARQUE
18
Etrangres
67
Renault
Peugeot
Citron
Ford
14
Ford
Fiat
6
10
Talbot
18
Renault
Etrangres
67
14
18
Talbot
18
Peugeot
Citron
Paramtrer les
graphiques
150
Ajuster
la taille
10
F5
tout
F6
F7
F8
hauteur
repres
Comparer 2 pourcentages
Slectionnez 2 lignes du tableau en cochant les triangles
repres, puis activez le bouton Comparer. Le logiciel
compare les frquences et affiche dans une fentre le
rsultat du test. Il vous indique si vous pouvez estimer que,
dans la population totale, les deux pourcentages sont
significativement diffrents.
Sphinx 2000
151
Pourcentages
(Observations ou Citations)
Intervalles de confiance
Comparaison de frquences
et de rpartitions
152
Sphinx 2000
153
Tableau de variables
numriques
Mise en classes
automatique
Tableau de variables
numriques: dfinition
contrle des classes
Tableau dchelles :
frquence et indicateur de
moyenne
154
Intervalle de confiance
Les variables numriques tant traites comme des
variables nominales aprs mise en classes, tous les tests
relatifs ce type danalyse sont disponibles.
De plus, la connaissance de l'cart type et de la moyenne
donne la fourchette qui situe la valeur de la moyenne dans
la population totale. Elle est gale [m-2,m+2] 95%
(risque 5%).
Comparaison de moyennes
On peut dsirer comparer les moyennes de 2 variables
numriques. Il faut pour cela aller consulter le tableau
rcapitulatif des variables numriques (option Tableaux
rcapitulatifs dans la fonction Rsultats du menu
Analyser) et l'analyser (bouton Analyser le tableau). On
peut alors, en slectionnant les lignes correspondant aux
variables que l'on souhaite comparer, lancer le test de
comparaison de moyennes (Comparer).
Signalons enfin qu'il est possible de comparer les valeurs
moyennes prises par une variable numrique pour
diffrentes catgories, dfinies par les modalits d'une
autre variable nominale. Ceci peut se faire en analysant le
tableau de moyennes correspondant (Analyser, Tableau
de moyennes).
Sphinx 2000
155
Entrer au clavier
156
Sphinx 2000
157
Question : Autre,
prcisez
Tableau de liste
158
Sphinx 2000
159
Analyses
bivaries, les
tableaux croiss
160
Options de calcul
1. Croiser 2 variables
L'analyse bivarie consiste examiner simultanment les
rponses 2 questions diffrentes en vue de rechercher
des influences, causalits ou concidences. La signification
des questions qu'on rapproche guide leur choix, et l'analyse
statistique permet d'indiquer si les donnes confirment ou
non les ides qui ont conduit les rapprocher. C'est ce
qu'on appelle aussi tester une hypothse.
Selon le type et les proprits statistiques des variables
tudies, les analyses diffrent. Nanmoins, vous pouvez
les slectionner pour les tudier dans des tableaux croiss
sans vous soucier a priori du traitement.
Sphinx 2000
161
Croiser 2 variables
Croiser une variable
avec plusieurs variables
Slectionner les
variables
croiser
V1 et V2 nominales
Tableau deffectifs
V1 et V2 numriques
Graphe de points
V1 ou V2 numriques
Tableau de moyennes
162
Sphinx 2000
163
Effectifs et pourcentages
Transformer le tableau
Supprimer, Regrouper
Ordonner, Permuter
Transposer
Dimensions
Revenir
164
Le baromtre
Ce graphique particulier permet de ne reprsenter quune
partie des modalits colonnes dun tableau en les opposant
sur la droite et la gauche dune mme ligne.
Les traits sinterprtent comme une jauge indiquant les
diffrences de comportement des modalits en ligne par
rapport celles quon a choisi de slectionner dans les
colonnes.
Le dialogue doption permet de choisir les modalits
opposer en offrant la possibilit galement dindiquer les
pourcentages relatifs une troisime colonne.
Contenu du graphique
Le bouton Carrousel permet de voir le graphique en le
rduisant lune de ses lignes ou colonnes. Cest trs
pratique pour mieux dchiffrer le graphique de lensemble.
Il suffit de cliquer sur Carrousel pour faire dfiler les profils
ou les radars de chaque colonne ou ligne. Le bouton
Transposer fait basculer de lune lautre.
On peut galement limiter les lments reprsents dans le
graphique en les slectionnant au pralable dans le
tableau. Par exemple, pour comparer 2 profils, on
slectionne les 2 colonnes correspondantes, puis on lance
le graphique.
Sphinx 2000
165
5.MARQUE x 7.CRITERES
28 Renault
34 Peugeot
34 Citron
7 Talbot
16 Ford
119 Etrangres
238 TOTAL
Vitesse
Confort
Consommation
Prix
Vitesse
Confort
Scurit
Conso
mmati
Renault
Citron
Volkswagen
Prix
Publicit
Distr
ibute
S.A.V.
Entretien
Scurit
Prix
CRITERES x MARQUE
34
Consommation
34
30
21
19
18
Vitesse
15
9 8
9
5
Scurit
Vitesse
8
3
Confort
5
1
Scurit
Confort
Baromtre
Renault
Peugeot
Ford
Etrangres
Citron
13
10
7
2
Conso
mmatio
n
Prix
Talbot
F5
F6
F7
F8
166
Un exemple
Le critre de choix a-t-il une influence sur la marque de
voiture achete ? On peut rpondre cette question en
comparant dans le tableau ci-contre les pourcentages en
colonne. Par exemple, ceux qui sont sensibles au confort
sont relativement plus nombreux choisir une Volkswagen
(27% contre 13% au total pour cette population). Ils sont
certainement attirs par cette marque. Tout l'inverse, ces
personnes boudent Renault.
On peut systmatiser cette analyse des carts en
effectuant un test du Chi. Ce test consiste comparer les
effectifs rels du tableau ceux quon devrait avoir
thoriquement si les critres n'avaient aucune influence sur
la marque. L'analyse des carts permet d'identifier les
cellules du tableau o ces carts sont les plus importants.
Dans l'exemple ci-contre, on encadre en bleu les carts
positifs et en rose les carts ngatifs.
du
test
s'affiche
Sphinx 2000
167
Test du Chi
168
5. Tableaux de moyennes
On obtient ce type de tableau en croisant une variable
ferme nominale avec une ou plusieurs variables
numriques. Pour chaque catgorie de la variable
nominale, le logiciel calcule la moyenne de la variable
numrique ainsi que d'autres indicateurs tels que lcart
type et la somme. On applique les tests de comparaison de
moyennes et d'analyse de variance (Fisher) ces rsultats.
Ils permettent d'tablir s'il existe des diffrences
significatives entre les catgories tudies.
Sphinx 2000
169
Modifier le tableau
Lancer les tests
170
6. Graphes de dispersion
De nombreuses possibilits sont offertes pour visualiser un
tableau de moyennes sous forme graphique : barres,
profils, aires, radars, dispersions, graphiques 2 critres. On
fait son choix dans la liste ouverte par le bouton
Graphique.
Sphinx 2000
171
Graphe de dispersion
172
Lecture du graphique
Options d'affichage
Diffrentes options permettent de mettre les lments
prpondrants en valeur :
afficher les valeurs sur les axes ;
afficher les valeurs pour chaque critre / catgorie ;
dimensionner les lments proportionnellement aux
carts types. L'lment prend la forme d'un losange dont
les diagonales sont fonction des carts types des critres
pour chacune des deux valuations ;
Sphinx 2000
173
174
175
Carte factorielle
Matrice et graphe
de corrlation
176
Sphinx 2000
177
AFC
Cliquez sur un nom de
modalit
et dplacez-le
Montrer ou cacher
les pourcentages sur
les axes
La taille est
proportionnelle la
moyenne quand le cercle
de corrlation nest pas
prsent
ACP
178
Dimensions de la carte
On peut faire varier la grandeur du graphique avec la
touche F5 ou le bouton Echelles. Par dfaut, l'origine des
axes est fixe aux valeurs minimales des 2 variables. On
peut choisir des chelles identiques ou diffrentes selon les
axes, ce qui modifiera beaucoup la perception.
Sphinx 2000
179
Nuage de
points
Double clic
Droite de
rgression
Test de
corrlation
Illustrer
Regrouper
180
Calculer un score
Le logiciel vous donne la possibilit de calculer pour
chaque individu :
la valeur thorique de la variable expliquer pour la
donne observe de la variable explicative ;
l'cart entre la valeur observe et la valeur calcule (le
rsidu).
Ces indicateurs peuvent tre trs intressants pour tablir
des prvisions ou des plans d'action. On les calcule partir
du bouton Variables.
Sphinx 2000
181
Echelles identiques
Regrouper les individus en
classes de proximit
Echelles diffrentes
Crer de nouvelles
variables
182
Typologie
Score
Sphinx 2000
analyse, le
directement
de lancer
les inclure
183
Lancer un plan de
dpouillement dans un
rapport
184
Sphinx 2000
185
Choix
des variables
analyser
Limiter
la liste
des variables
Mthodes
pertinentes
Slectionner et
lancer
une mthode
186
Sphinx 2000
187
Tableaux et
graphiques de
synthse
188
Tableaux de caractristiques
Tableaux multiples
Diffrents types de tableaux multiples peuvent tre
construits :
Tableaux rcapitulatifs : ces tableaux sont identiques
ceux quon obtient par le dpouillement. Ils donnent, par
type de variable, un rsum des principaux rsultats
(modalits les plus cites, moyennes, cart type).
Tableaux de groupes : ces tableaux prsentent en une
seule fois les rsultats des questions qui ont t
groupes dans le questionnaire.
Tableaux plat accols : ces tableaux regroupent
plusieurs variables numriques ou plusieurs variables
fermes ayant les mmes modalits. Ils sont quivalents
aux tableaux de groupes pour les variables nominales.
Tableaux croiss juxtaposs : ils prsentent cte cte
les tris croiss de plusieurs variables avec une mme
variable.
Tableaux croiss ventils : ils croisent les modalits dune
variable avec une liste de modalits provenant de
plusieurs autres variables.
Tableaux deffectifs quelconques : cette fonction permet
de rentrer au clavier ou de coller des tableaux deffectifs
quelconques pour les analyser ensuite avec les outils du
Sphinx (produire une carte dAFC par exemple).
Sphinx 2000
Dpouillement gnralis*
Ce type danalyse, dcrit plus haut, repose sur une autre
stratgie : examiner simultanment plusieurs variables
nominales, et prsenter les rsultats sans tenir compte du
dcoupage en variables, comme si on analysait le texte
form de la suite des modalits cites. Dans une enqute
de satisfaction on pourra ainsi, en croisant les points de
vue avec les services valus, comparer directement les
frquences de Trs satisfait, satisfait quelle que soit la
variable analyse.
189
Peu
important
Assez
important
Trs
important
25
38
0
8
23
94
18
23
15
39
34
129
70
33
145
83
69
400
47
66
0
30
34
177
TOTAL
160
160
160
160
160
800
Tableaux multiples
SEXE
Homme
Femme
TOTAL
PERMIS
Oui
PERMIS
Non
60
77
137
14
11
25
33
33
66
22
50
72
19%
81%
100%
78%
22%
100%
PERMIS
Oui
0%
100%
100%
Tableaux de caractristiques
MARQUE
Tableaux gnraliss
Renault (18)
Peugeot (14)
Citron (18)
8.VITESSE
10.SECURITE
Assez important (4)
11.CONSOMMATION
Trs important (17)
Talbot (4)
Distributeur (2)
Publicit (2)
Prix (3)
Ford (10)
Scurit (8)
S.A.V. Entretien (4)
Confort (11)
Japonaise (18)
ENSEMBLE (163)
190
7.CRITERES
Tableaux de groupes
Choisir le groupe tudier dans la liste des groupes
prdfinis.
Sphinx 2000
191
Questions groupes
dans le questionnaire
ou variables nominales ayant les
mmes modalits
Chi, AFC
Comparaison de moyennes
Variables numriques
ou chelles
192
Tableaux ventils
Comme prcdemment, on choisit la variable en ligne. Les
colonnes sont dfinies une une en slectionnant des
modalits parmi l'ensemble des variables. On peut ainsi
rapprocher des lments appartenant diffrentes
variables sans avoir considr toutes leurs modalits. On
obtiendrait le mme rsultat en construisant un tableau
crois juxtapos et en supprimant ensuite des colonnes.
Sphinx 2000
193
Tableau crois 3
dimensions
194
Caractriser
Un double clic sur une case de ce type de tableau permet
d'expliquer les slections opres dans les cellules.
Cliquez alors loption Spcificits.
Sphinx 2000
195
Modalits
sur-reprsentes
uniquement
Limiter en nombre
5. Elaborer un tableau de
caractristiques
Un tableau de caractristiques doit permettre de
communiquer l'information considre comme essentielle
de la manire la plus efficace.
On peut privilgier l'information dominante, celle qui met en
vidence les caractristiques les plus frquentes. Elle se
rpte souvent d'une catgorie l'autre et recoupe en
gnral ce qui domine dans l'ensemble de l'chantillon.
On peut s'intresser au contraire ce qui fait l'originalit de
chaque catgorie en ligne, ce en quoi elle se distingue des
autres. Selon la nature des donnes, cette information vient
confirmer les faits dominants ou les nuancer.
On peut souhaiter argumenter l'aide de chiffres, ou au
contraire vouloir prsenter l'information sans rfrence
statistique aucune, en se contentant de qualifier par les
libells slectionns.
La barre d'outils des tableaux de caractristiques offre
toutes ces liberts en permettant de reprendre le tableau
(suppression de lignes et de colonnes), mais surtout en
dterminant le contenu des tableaux de caractristiques.
Tests et jugement
La possibilit de choisir un indicateur et de paramtrer les
seuils permet d'essayer diffrentes solutions jusqu'
parvenir au tableau le plus synthtique pour communiquer.
Dans cet exercice, le jugement doit guider le choix des
seuils et des tests.
Sphinx 2000
197
198
Sphinx 2000
199
Choix des
variables
Options
Rduire
Calculer
Prsenter
Afficher
Classement toutes
questions confondues
Uniquement les
lments remarquables
200
201
Crer et
organiser
les lignes
Dfinir le
contenu des
lignes
Slectionner
les lments
Complter les
libells
Modifier la
dfinition du
tableau
Reprsenter
par un
baromtre
Analyser et
modifier la
prsentation
202
8. Les baromtres
Le baromtre est un type de graphique utilis dans les
tudes de satisfaction. Il a lavantage de donner une vue
synthtique et slective dun tableau crois, dun tableau
de groupe, dun tableau plat accol ou dun tableau
compos.
Le principe est de faciliter la comparaison des lignes dun
tableau en concentrant lanalyse sur les oppositions entre
des valeurs slectionnes en colonne.
On slectionne ce type de reprsentation dans la liste
droulante proposant les diffrents graphiques disponibles.
La mise en forme du baromtre se fait dans un dialogue
spcifique ouvert par le bouton Options.
Tableaux composs
Le baromtre offre une manire particulirement
intressante de prsenter les tableaux composs.
203
Tableau de groupe
Modalits
prsenter
Options de
prsentation
Rpartition pour
une variable
CRITERES
N
Tableau crois
204
Vitesse
Consommation
64 Non- rponse
18.8
32.8
37 Renault
10.8
48.6
35 Peugeot
25.7
20.0
40 Citron
20.0
25.0
11 Talbot
9.1
18.2
21 Ford
23.8
4.8
12 Fiat
0.0
41.7
45 Volkswagen
28.9
0.0
30 Opel
23.3
13.3
31 Japonaise
25.8
3.2
42 Autre
14.3
26.2
Options disponibles
Le bouton Options permet de choisir entre 3 modes
principaux :
une ligne = une rponse donne la liste des modalits ou
valeurs des variables slectionnes assorties de leur
frquence ;
une ligne = toutes les rponses donne tous les profils
associant les modalits dun mme individu et les classe
par frquence dcroissante ;
une ligne = un mot donne la liste de tous les mots
prsents dans les rponses (texte des rponses textes ou
mots formant les modalits des rponses fermes). Les
mots outils sont ignors de ce dcompte.
Sphinx 2000
205
Slectionner
plusieurs variables
Frquence de toutes
les modalits cites
Sortir le tableau
Crer une variable
206
Calculer l'importance
On peut galement demander aux rpondants d'exprimer
une performance globale sur le systme.
On peut alors calculer l'importance d'un critre. Un critre
est ainsi d'autant plus important qu'il participe beaucoup
la performance globale.
Cette "participation" est la corrlation entre le critre et la
performance globale.
Le graphique est dcrit au chapitre sur la corrlation
multiple.
207
208
Sphinx 2000
209
Analyses
multivaries*
210
1. Approfondir
Dans ce menu, on trouve les fonctions de statistiques
avances du Sphinx : les analyses multivaries, la
modlisation et le calcul de nouvelles variables (Cf Chap.
Calculer une nouvelle variable et Recalculer une
variable).
Lanalyse multivarie consiste analyser simultanment
plusieurs variables pour exploiter la structuration de
lensemble des donnes en vue de rduire les variables
un plus petit nombre de dimensions (Analyse factorielle)
et / ou de regrouper les observations en catgories
homognes (Typologie). Ces possibilits sont offertes par
les articles Classification automatique, Analyse
factorielle multiple et Analyse en composantes
principales.
Elle permet galement de rechercher les relations entre
une variable et plusieurs autres. On peut ainsi, en utilisant
larticle Corrlations multiples, construire des modles
explicatifs.
Classification automatique
Cet article conduit choisir les variables utiliser pour
dcrire lensemble que lon veut classifier. On a la libert de
choisir le nombre de classes recherches ou de le
dterminer en rfrence une classification dfinie par une
variable de ltude (celle-ci servira de classification initiale).
Lalgorithme utilis est celui des nues dynamiques : on
procde par essais successifs partir dune classification
initiale (dtermine de manire alatoire ou par le choix
dune rfrence). Il nexiste pas de mthode de
classification stable. Il faut donc essayer plusieurs
classifications et choisir celle qui convient le mieux en
sappuyant sur lanalyse de la variance lance aprs que
lon ait cr la variable (Crer une variable).
Sphinx 2000
Corrlations multiples
Grce cet article, on peut rechercher lquation qui
permet dexpliquer la valeur dune variable par celle de
plusieurs autres. On utilise la mthode de rgression
multiple pas pas (Rgression).
On peut construire dans cet environnement les graphiques
dits Performance/Importance (Profils). Ces graphiques,
trs utiliss dans les tudes de satisfaction, situent sur
laxe horizontal limportance des critres (value par leur
valeur moyenne) et sur laxe vertical leur performance
value par le coefficient de corrlation avec la satisfaction
globale ou tout autre indicateur de performance.
Analyses multivaries*
211
Matrice de corrlation
Carte factorielle
Typologie
Scores factoriels
212
2. Classification automatique
On cherche identifier dans la population des groupes
d'individus homognes. Par exemple dans une enqute de
satisfaction, identifier diffrentes catgories de ractions,
dans une tude d'opinion, des classes idologiques... Cet
exercice est d'autant plus difficile que les variables et les
individus sont nombreux.
Il existe de nombreuses mthodes de classifications. Dans
le Sphinx, on peut procder intuitivement en agrgeant des
individus sur une carte (Voir Construire une typologie
interactive) ou d'une manire automatique. Dans ce cas, il
suffit l'utilisateur de dfinir les variables par rapport
auxquelles il souhaite regrouper les individus. Le logiciel
proposera une ou plusieurs classifications selon la
mthode des nues dynamiques, qui consiste amliorer
par itrations une partition initiale. Le rsultat dpend de
cette donne de dpart. Elle peut tre fixe d'une manire
alatoire ou correspondre aux modalits d'une variable
existante.
La qualit du rsultat fait intervenir diffrents points de vue:
le nombre de classes (taille), la rpartition des effectifs
dans les classes, l'homognit des classes et leur
dispersion.
Sphinx 2000
Analyses multivaries*
213
Analyser
Crer
Caractriser
Description de la classification
slectionne
214
Nommer
Il faut pour cela lancer par exemple une ACP sur les
variables utilises pour construire votre classification
(Approfondir, Analyses en Composantes Principales),
puis avec le bouton Prsentation, slectionner Colorier
avec les modalits de la variable. La classification se
dessinera sur le nuage de points et on peut ainsi apprcier
sa qualit et interprter ses classes.
Attention : le bouton-radio Observations doit tre coch
pour voir le nuage de points. Dans le cas o la
classification ne fait intervenir que 2 variables numriques,
aller loption Corrlations du menu Analyser.
Sphinx 2000
Analyses multivaries*
215
Interprter en analysant
Interprter en visualisant
Interprter en confrontant
216
4. Analyse de la variance 2
facteurs (MANOVA)
Analyses multivaries*
217
Lgende Anova
Lgende Manova
218
5. Corrlation et rgression
multiple
Les possibilits offertes dans la fonction Rgression
multiple du menu Approfondir gnralisent plusieurs
variables les fonctionnalits proposes dans la fonction
Corrlations du menu Analyser.
Le coefficient de corrlation (r) tablit la qualit de
2
lajustement entre deux variables. Sa valeur absolue (ou r )
est comprise entre 0 et 1, son signe indique le sens de la
relation (croissante ou dcroissante).
Dans le cas dune rgression multiple, on cherche tablir
une relation du type V1=axV2+bxV3+cxV4+. Le coefficient
de corrlation multiple indique la qualit de lajustement
effectu par le modle et sinterprte comme un coefficient
de corrlation simple.
Sphinx 2000
Analyses multivaries*
219
Choisir les
variables
Coefficients de corrlation
Equation de rgression
Simuler
Profils d'influence
Ces profils permettent de visualiser l'influence de chaque
variable sur la variable explique. On les lance en
slectionnant le bouton Profils puis x=Corr. C'est un
graphique une seule dimension (x) reprsentant la valeur
du coefficient de corrlation (Corr.).
Le bouton Classer permet de choisir l'ordre de
prsentation des variables. Si on veut mettre en vidence
le sens de la relation, on choisira Corrlation (Valeur
signe). Sinon, loption Corrlation (Valeur absolue)
privilgie la qualit de l'ajustement.
Sphinx 2000
Analyses multivaries*
221
Profils
dinfluence
Graphe
dinfluence
performance
Options de
prsentation
222
7. Analyse en composantes
principales
L'article Analyse en Composantes principales du menu
Approfondir permet de choisir les variables analyser.
Avec cette mthode, on travaille sur des variables
numriques ou chelles qui sont alors traites comme des
numriques.
Matrice de corrlation
On peut la voir sous forme de tableau ou sous forme de
diagramme (bouton Matrice ou Diagramme). Le
diagramme visualise les relations sous forme de traits
d'paisseur variable selon la valeur de la corrlation. Le
bouton Options permet de fixer les seuils (Voir le
paragraphe Prsentation des cartes factorielles).
Analyses multivaries*
223
Variables
numriques
individus
variables
Contributions
Coefficients de corrlation
224
Analyses multivaries*
225
Variables
nominales
modalits
Carte : projection sur
les plans factoriels
individus
Effectifs
Contributions
226
Sphinx 2000
Analyses multivaries*
227
Regrouper
Seuil de projection
Cercle de corrlation
Pourcentage de variance
explique
228
Sphinx 2000
Analyses multivaries*
229
Nombre de dimensions
calculer
230
Sphinx 2000
Analyses multivaries*
231
232
Sphinx 2000
Analyses multivaries*
233
Traitement
simple des
questions textes
234
Analyse de contenu
Verbatim
Cette fonction permet de slectionner des extraits en
fonction de leur contexte (selon les rponses une autre
variable) ou de leur contenu (vocabulaire de la rponse).
Ces extraits peuvent tre prsents sous forme de liste
organise par catgories de rponses.
Linclusion de ces extraits dans un rapport permet de
rendre compte de lenqute par une illustration raisonne.
Tableaux de rponses
On peut prsenter les rponses dans des tableaux. Cette
prsentation est bien adapte dans le cas de rponses trs
rptitives quon pourra croiser avec dautres variables
caractrisant les rpondants.
On peut galement dresser le tableau des mots prsents
dans les rponses et ainsi oprer une recodification
automatique en fonction du vocabulaire.
Sphinx 2000
235
Analyse de contenu :
lire et interprter
Tableau de
rponses et de
mots :
dnombrer,
recoder, croiser
236
Verbatim : citer,
extraire, illustrer
2. Faire du verbatim
La manire la plus simple de traiter les questions ouvertes
consiste restituer les rponses dans leur intgralit ou
d'une manire raisonne en oprant des slections par
rapport au contexte ou au contenu.
On pourra produire des listes de rponses :
classes selon l'identit des rpondants ;
restreintes tel ou tel profil (les satisfaits, les
mcontents...) ;
contenant tel ou tel mot.
Les tapes consistent choisir la variable, dfinir les
conditions de l'extraction, et transfrer les citations ainsi
obtenues.
Sphinx 2000
237
Faire du Verbatim
Imprimer ou inclure
dans le rapport
238
1
Ces mots sont dfinis par le dictionnaire des mots outils prsent dans le
rpertoire dictionnaires motoutils.dic .
Sphinx 2000
239
Produire la liste
des rponses
Produire la liste
des mots
Croiser
Slectionner
Analyser
Recoder
240
La codification
4. Analyse de contenu
Lanalyse de contenu est un travail long qui peut tre
fastidieux. Lenvironnement de travail propos permet de le
rendre plus facile et plus rapide. Les thmes peuvent tre
enrichis en cours danalyse par lajout de modalits, par la
possibilit de passer dune rponse lautre en fonction de
son contenu (navigation lexicale), et par laffichage du
contenu dautres questions pour amliorer la qualit de la
lecture.
Sphinx 2000
241
Reprendre un travail en
cours
Crer une nouvelle
variable
Rponses en liste
242
Sphinx 2000
243
L'analyse
lexicale en bref
244
1. Les interfaces
Pour aller plus loin dans lanalyse lexicale, Plus et Lexica
donnent accs un environnement spcifique : latelier
lexical (Etudier les textes / Atelier lexical / Panneau de
commandes). Celui-ci permet de :
Calculer diffrentes formes de lexiques (rduits,
regroups par racine, relatifs un dictionnaire.) ;
Slectionner des mots pour retrouver toutes les rponses
qui les contiennent, produire des extraits ou des
associations de termes ;
Reprer les expressions du texte et les segments
rpts ;
Produire des tableaux lexicaux, des listes de mots
spcifiques (relatifs aux modalits dune autre variable),
et des rponses caractristiques ;
Transformer une variable texte en produisant un nouveau
texte expurg, fragment ou lemmatis ;
Coder automatiquement le texte en fonction de son
contenu lexical.
Latelier lexical
Cet cran est compos de 4 grandes parties :
A droite : une fentre prsente diffrentes vues du
corpus ;
A gauche : on peut voir le lexique des mots ou des
expressions. En cliquant dans le lexique, on fait dfiler les
contenus correspondants dans la fentre de droite
(navigation lexicale).
Le bandeau du haut contient un ensemble de boutons de
commande contrlant le calcul et la prsentation du
lexique, la mise en forme du corpus, sa prsentation, et
sa codification dans de nouvelles variables.
Les indications du bas de lcran donnent des statistiques
gnrales sur le texte tudi.
2
chaque forme est ramene sa racine grammaticale (infinitif,
singulier)
3
chaque forme est ramene ses x premiers caractres
Sphinx 2000
245
Panneau lexical
Analyse globale
Lexique et
associations lexicales
Lexique et contextes
Atelier lexical
Commandes
Vue : lexique
Vue : corpus
Navigation
246
Sphinx 2000
247
Corpus texte
Lapproximation lexicale
sommaire :
Rduire le texte au dbut du
lexique : lexamen des mots les
plus frquents donne une ide
du contenu.
Lexique
Calculer le lexique
Corpus texte
Lapproximation lexicale
contrle :
Rduire le texte son lexique et
contrler par la navigation
lexicale le bien fond des
interprtations faites partir du
lexique.
Lapproximation lexicale
slective :
Travailler sur un lexique rduit
aprs avoir limin les mots
outils et solidaris
les
segments.
Concentrer
lattention sur lexamen des
noms,
verbes,
adjectifs
(utilisation de dictionnaires et de
la lemmatisation).
Interpreter
Navigation
lexicale
Lexique
Corpus texte
Lemmatisation
Slectionner
Segments rpts
Corpus texte
lemmatis et solidaris
Dictionnaire
Lexique rduit et
structur
248
Verbatim
Navigation lexicale
Verbatim
Nouvelle vision
du texte
Sphinx 2000
249
Corpus texte
Segments rpts
Lemmatisation
Variable
de contexte
Corpus texte
lemmatis et solidaris
Navigation lexicale
Dictionnaire
Lexique rduit et
structur
Mettre jour
les structures
linguistiques
Listes demots
spcifiques
Tableau
lexical
Structures
Stat.
Phrases
caractristiques
Corpus texte
Lemmatisation
Variable
de contexte
Corpus texte
lemmatis et solidaris
Dictionnaire
Intgrer les
mthodes
Segments rpts
Navigation lexicale
Verbatim
Lexique rduit et
structur
Variables
fermes sur
les mots du
lexique
Mesures
lexicales :
intensits
banalits
Structures
Stat.
250
Statistiques lexicales
Production de lexiques
Le lexique des mots ou liste des formes graphiques
saffiche dans la fentre de gauche.
Il dpend des caractres sparateurs retenus (bouton
Apparier). Son contenu et sa prsentation sont affects
par les boutons Supprimer, Rduire, Regrouper,
Compter et Classer. On peut ainsi liminer ou regrouper
des lments et choisir lordre de leur prsentation ainsi
que les indicateurs statistiques les caractrisant (nombre
doccurrences ou nombre de rponses / fragments
concerns).
Le lexique des expressions (Lexica uniquement) prend la
place du lexique des mots. On slectionne pour cela
Expressions dans le menu droulant Lexique. Dans la
fentre qui apparat, on peut chercher les locutions et les
segments rpts.
Navigation lexicale
La navigation lexicale permet de faire apparatre, dans la
fentre du corpus, les fragments de texte contenant les
mots marqus dans le lexique. On passe dun fragment
lautre avec les flches situes sous la fentre droite. Les
rgles de navigation peuvent tre modifies par le menu
droulant Aller .
Un double clic dans la fentre du lexique fait apparatre le
contexte du mot slectionn (concordances ou lexiques
relatifs). Ltendue du contexte est paramtrable avec le
bouton Apparier. On revient par la touche Esc.
Le bouton Marquer permet de slectionner des lments
du lexique selon leurs proprits, et les boutons 0 <> @
servent annuler la slection, linverser ou tout
slectionner. Grce au bouton Illustrer, on fait apparatre
une autre variable illustrative dans la fentre du corpus.
Sphinx 2000
La barre d'outils
Toutes les fonctions qui viennent rapidement d'tre
voques se lancent partir de la barre d'outils. Les
fonctions suivantes ne sont disponibles que dans Lexica :
rechercher des expressions et des segments rpts,
analyser l'environnement d'un mot, construire des bilans,
des tableaux lexicaux ou des listes de mots spcifiques,
lemmatiser.
251
Latelier lexical
Lexique
Corpus
Statistiques lexicales
252
253
Calculer les
lexiques
Lexique rduit
Lexique des racines
Lexique lemmatis
254
Sphinx 2000
255
Segments rpts
Lexiques relatifs et
concordances
256
Bilan lexical
Le bilan lexical rassemble les principaux indicateurs
caractristiques de lnonciation : nombre de mots,
longueur des fragments, richesse lexicale, spcialisation
lexicale Ces indicateurs sont calculs pour les modalits
dune variable et permettent ainsi de comparer diffrents
locuteurs. La production du bilan est automatique : vous
navez qu indiquer la variable selon laquelle vous voulez
ltablir.
Tableaux lexicaux
Un tableau lexical ventile lutilisation des mots selon les
modalits dune variable de contexte. Vous avez galement
la possibilit de limiter la liste aux mots exclusifs, aux mots
communs ou aux mots sur-reprsents ou sousreprsents dans chaque catgorie. A cet effet, choisissez
dans le dialogue les mots que vous souhaitez inclure dans
la liste : Inclure les mots exclusifs dune catgorie,
Inclure les mots communs plusieurs catgories
Rponses caractristiques
Cette fonction repose sur la slection de mots spcifiques
mais donne comme rsultat une liste de rponses
slectionnes en fonction du nombre de mots spcifiques
quelles contiennent et de leur indice de spcificit moyen.
Mots spcifiques
Un mot est spcifique dune catgorie sil est surreprsent dans cette catgorie. On utilise le rapport des
frquences (observes / thoriques) comme indicateur de
spcificit. Le mot est dautant plus sur-reprsent (resp.
sous-reprsent) que ce rapport est suprieur (resp.
infrieur) 1. Il est infini pour les mots exclusifs quon
repre avec une toile.
Sphinx 2000
257
Variable de contexte
Bilan lexical
Conditions spcifiques
Tableau lexical
Mots spcifiques
Rponses
caractristiques
258
Sphinx 2000
259
La construction
des lexiques
260
1. Caractres sparateurs et
environnement
Pour identifier les diffrents lments composant un champ
textuel, on dfinit des caractres sparateurs.
Les sparateurs de fragments ou dobservations sont
dfinis au moment de lintgration dun fichier de donnes
(Voir Ouvrir un fichier de donnes textuelles).
Les sparateurs de formes graphiques permettent
disoler les mots. Le blanc est le sparateur naturel mais on
peut en retenir dautres ( ()..).
Les sparateurs de phrases ou de tout autre groupe
permettant de dfinir un sous-ensemble signifiant
(proposition, unit de signification...).
Apparier
La dfinition de ces sparateurs conditionne la construction
du lexique et la recherche de lenvironnement dun mot
(concordances, lexiques relatifs). On peut modifier ces
paramtres dans un dialogue ouvert par le bouton
Apparier.
Celui-ci permet de modifier les sparateurs de mots
(formes graphiques), groupes ou phrases, de fixer les
rgles suivre pour traiter les accents et majuscules et
grer les expressions formes de mots composs.
Sphinx 2000
261
Lexique
Concordances
Lexiques relatifs
Verbatim
262
263
En cliquant dans le
corpus
Rgles de recherche
Au clavier
Selon la frquence
Par dictionnaire
264
Supprimer
On peut passer en revue tout le lexique et marquer les
mots liminer. Le bouton Supprimer permettra de les
faire disparatre.
Lemmatiser
La lemmatisation (Lemmatiser) permet doprer des
regroupements intelligents en utilisant les rgles de la
syntaxe (singulier, pluriel, formes verbales ramenes
linfinitif). Elle prsente lavantage de rduire certaines
ambiguts en distinguant par exemple le nom du verbe
(voyage peut correspondre au nom voyage ou au verbe
voyager). Il est donc conseill doprer le travail de
rduction sur la base du texte lemmatis.
Regrouper
Le bouton Regrouper offre plusieurs choix pour remplacer
plusieurs lments par un seul :
Grouper les mots marqus dans le lexique : slectionnez
et donnez un nom au regroupement.
Rechercher tous les mots rpondant un modle et les
grouper. Entrez le modle : les lments qui y rpondent
seront automatiquement regroups, par exemple, *isme
pour les mots se terminant par isme.
Grouper les mots commenant par les mmes lettres :
groupement par racine ou stemmatisation. Indiquez le
nombre de caractres retenir pour la racine. Vous
pourrez contrler la validit de chaque groupe (Voir
Stemmatisation).
Grouper avec un dictionnaire. Choisissez un dictionnaire.
En utilisant un dictionnaire de groupement ou thsaurus,
vous pourrez oprer en une seule fois plusieurs
groupements (Voir Gestion de dictionnaires).
Sphinx 2000
265
266
Regrouper
4. Groupements automatiques
On gagne beaucoup de temps en procdant ainsi :
Stemmatisation
Ce terme indique le regroupement des mots ayant la mme
racine. Slectionner la case Grouper automatiquement,
puis de mme racine et indiquer le nombre de lettres
minimum que doit contenir la racine commune.
Dictionnaires
#faire*=faire=faire_la_cuisine=faire_plaisir=
faire_envie=faire_attention
#gote*=goter=goteux
#gastronomi*=gastronomie=gastronomique
#avoir_*=avoir_envie=avoir_faim
#quelque*=quelque_chose=quelquechose
#enfant*=enfant=enfants
#nature*=naturel=nature
#prendre*=prendre_son_temps=prendre
#vouloir*=vouloir=vouloir_dire
#nourri*=nourrir=nourriture
#cuisine*=cuisiner=cuisine
#lger*=lger=LEGERE
#restau*=restaurant=restau
Sphinx 2000
267
268
Ouvrir un dictionnaire
Les dictionnaires sont enregistrs comme des fichiers
textes. Le bouton Ouvrir donne accs au dialogue
Windows de gestion des fichiers. Lextension propose par
dfaut est .dic Elle nest pas obligatoire mais permet de
retrouver facilement les dictionnaires.
Crer un dictionnaire
Utiliser le bouton Nouveau, donner le nom au fichier (en
remplacement du nom donn par dfaut "DICO.DIC").
Cette procdure ouvre un dictionnaire vide. Vous pouvez :
Y ajouter les mots marqus dans le lexique : bouton
Ajouter.
Entrer au clavier les mots que vous dsirez. Placez le
curseur l'endroit o vous voulez insrer un nouveau mot
et entrez-le au clavier.
269
Ouvrir ou crer un
dictionnaire
Mettre dans le
dictionnaire les mots
marqus du lexique
Entrer des lments
nouveaux au clavier
Marquer les mots
correspondants dans le
lexique
Ouvrir ou crer un
dictionnaire
270
Sphinx 2000
271
Diffrents
dictionnaires
de mots
Lexique de rfrence
272
dexpressions
de groupements
Dictionnaire de codes
Sphinx 2000
273
Ajouter au clavier
Remplir partir
dun dictionnaire
Remplir en cherchant
les segments rpts
Naviguer du lexique au
corpus
Regrouper des expressions
274
Sphinx 2000
275
276
Sphinx 2000
277
Navigation
lexicale et
recherche de
contexte
278
1. Du lexique au corpus : la
navigation lexicale
La navigation lexicale sapparente la fonction dun hypertexte dont chaque mot serait lobjet dun renvoi possible.
On peut en effet, partir dun ou plusieurs mots marqus
dans le lexique ou dans le texte lui-mme :
retrouver toutes les rponses ou fragments de texte
contenant ce mot ou ces mots ;
afficher la valeur quelconque de lune des autres
variables pour situer le contexte de la rponse ;
dtailler toutes les donnes relatives la rponse ;
caractriser lemploi dun mot par la rpartition de telle ou
telle variable dans la strate des observations qui le
contiennent.
On a ainsi la possibilit d'oprer des slections pour
restituer des fragments de texte ou contrler l'interprtation
des termes mis en vidence dans le lexique. On peut le
faire en ne voyant qu'une rponse la fois ou en se plaant
dans une fentre dans laquelle tout le corpus s'affiche la
suite.
279
Donnes de contexte
Variable illustrative
Indicateurs statistiques
Navigation
Vue du corpus entier
Rgles de navigation
280
Sphinx 2000
281
Concordance
Lexiques relatifs
282
Mot pivot
283
Nombre
Positions par rapport au pivot
Indicateurs statistiques
Lexique de l'environnement -2 +2
284
4. Production d'extraits
Dans Plus et Lexica, la production d'extraits offre de plus
grandes possibilits que dans Primo, notamment car elle
peut tre guide partir d'une slection de mots dans le
lexique. En la lanant depuis l'atelier lexical, on peut
slectionner beaucoup plus finement les extraits selon leur
contenu.
Le dialogue abrg
Le dialogue complet
Le dialogue tendu offre de nombreuses possibilits :
restreindre aux observations contenant des mots
marqus dans le lexique : cochez lun des boutons Les
lments concerns ou Tous les lments. La slection
des extraits se fait en fonction de la rgle de navigation
lexicale retenue ;
fixer le contenu des extraits (cadre Contenu) : afficher le
texte de la variable tudie et ou celui d'une autre
variable ;
afficher la valeur des mesures lexicales relatives
lobservation : nombre de mots de lobservation (M),
nombre de mots marqus (MM), banalit de lobservation
(frquence moyenne des mots de la rponse), intensit
des mots marqus (MM/M) ;
mettre les mots marqus en majuscules.
Sphinx 2000
285
Dialogue abrg
Dialogue complet
Nb de rponses similaires
286
287
Tableaux : Caractriser
288
Sphinx 2000
289
Analyse
syntaxique et
lemmatisation
**
290
1. La lemmatisation
Principes de la lemmatisation
Lapproximation du contenu d'un texte par ses seules
formes graphiques lmentaires peut conduire des
contresens ou laisser planer une grande ambigut.
Lanalyse syntaxique permet de rsoudre correctement les
ambiguts lies la syntaxe. En appliquant les rgles de
la grammaire, on peut, dans la plupart des cas, distinguer
verbes, substantifs, adjectifs, et leur substituer leur forme
racine (singulier dun substantif, infinitif dun verbe par
exemple), mais aussi identifier les mots composs et les
locutions.
Voici un exemple illustrant ce procd :
Corpus et lexique originaux
Jai aperu les grands avions que
nous avions vus hier avec grand
pre
avions (2), aperu, avec, grand,
grands, hier, j, pre que, les, nous,
vus
291
Corpus lemmatis
Corpus lemmatis avec
indication des catgories
syntaxiques
292
2. Lancer la lemmatisation
Lanalyseur syntaxique
Le lemmatiseur intgr au Sphinx est l'analyseur
syntaxique SYLEX, dvelopp par la socit Ingnia
Langage Naturel. Il est constitu dun analyseur syntaxique
et dun dictionnaire. Le dictionnaire franais contient 61 400
entres, 521 400 formes lexicales et 25 600 locutions. Une
version anglaise de lanalyseur syntaxique et un
dictionnaire danglais sont galement disponibles sur
demande.
La lemmatisation consiste faire lanalyse syntaxique de la
variable. Une nouvelle variable contenant la version
lemmatise du corpus sera ajoute la base de donnes.
Cette variable pourra tre ouverte et analyse comme
nimporte quelle autre variable texte.
On accde au lemmatiseur par le bouton Lemmatiser.
Options de lemmatisation
Lanalyseur syntaxique procde par tape. Il dtermine le
statut du mot, recherche sa forme racine et tablit une
nouvelle phrase compose des formes racines. Ces
nouvelles phrases forment le corpus lemmatis. Les
options disponibles sont les suivantes :
Filtrer des mots grammaticaux : les mots grammaticaux
napparatront pas dans le texte lemmatis. A la
diffrence de la rduction du lexique par les mots outils,
cette option a pour effet de faire disparatre du nouveau
corpus les mots grammaticaux ;
Reprer les locutions usuelles : elles figureront dans le
nouveau corpus relis par un tiret : pomme_de_terre ;
Indiquer la catgorie des mots : chaque mot sera
attach lun des suffixes qui le caractrise : _V pour le
Verbe, _N pour un Nom commun, _P pour un nom
Propre, _A pour un Adjectif, _B pour un adverBe, _G pour
un mot Grammatical.
Des conditions syntaxiques supplmentaires peuvent tre
ajoutes en cliquant sur le bouton Grammaire
complmentaire.
Sphinx 2000
Faire un essai
Lanalyse syntaxique met en uvre des techniques de
lintelligence artificielle, elle peut prendre quelques minutes
pour un texte trs long, surtout si votre machine nest pas
trs rapide. Vous pouvez vous faire une ide en ne
lemmatisant quune partie du texte. Placez-vous sur
lobservation de votre choix et cliquer sur le bouton Aperu
pour lemmatiser le fragment correspondant.
293
Corpus dorigine
Contrler, corriger
Corpus lemmatis
294
Sphinx 2000
295
Corpus
lemmatis
Corpus
dorigine
Raccourcis du
panneau lexical
296
4. Modifier le corpus
On peut directement apporter des modifications dans le
corpus. Le plus souvent, on le fera pour corriger des fautes
de frappe ou des fautes d'orthographe. A cet gard,
lorsqu'on travaille sur des textes imports, on a tout intrt
les soumettre au pralable au correcteur orthographique.
Remplacer
Cette fonction est analogue celle des logiciels de
traitement de textes. Elle est trs utile pour faire des
substitutions systmatiques. On y accde par le bouton
Remplacer de la barre doutils.
Reconstruire le lexique
Tant que vous n'avez pas revenir sur le lexique des fins
d'interprtation, vous n'avez pas intrt cocher le bouton
Reconstruire immdiatement le lexique car cela peut
ralentir inutilement le travail.
Sphinx 2000
297
Modifier le corpus
298
Sphinx 2000
299
La statistique
lexicale**
300
Sphinx 2000
La statistique lexicale**
301
Nb. occurrences
Nb. observations
Stat. globales
Stat. de l observation
pourcentage de
lecture des mots
marqus
302
2. Bilan lexical
Au stade du traitement, le tableau rcapitulatif des
variables textes donne, pour chaque variable, la taille du
corpus (nombre de mots), celle du lexique (nombre de
mots diffrents), et la longueur moyenne d'une observation
(nombre de mots moyens...). Ce tableau est trs utile pour
comparer la manire dont ces variables sont documentes.
Sphinx 2000
La statistique lexicale**
303
Bilan lexical
cadres moyens
304
employs
employs
ouvriers
Dfinition du tableau
Pour dfinir les lignes du tableau, il faut marquer dans le
lexique les mots qui figureront en ligne dans le tableau puis
slectionner Tableau lexical dans le menu Vue.
Le dialogue qui apparat permet de choisir la variable selon
laquelle ventiler le lexique en cours d'analyse. On peut se
limiter certaines catgories en slectionnant celles qui
nous intressent dans la liste des modalits. Le bouton
Croiser permet de slectionner une autre variable.
Sphinx 2000
La statistique lexicale**
305
4/ Analyser
306
Tableau lexical
Sphinx 2000
La statistique lexicale**
307
308
Indice de spcificit
Sphinx 2000
La statistique lexicale**
309
Mot sur-reprsent
Mot sous-reprsent
Mots exclusifs
310
Indice de spcificit
6. L'indice de spcificit
Dans le Sphinx, les calculs de spcificit sont utiliss en
diffrentes circonstances : rechercher des caractristiques
(Caractriser, Tableau de caractristiques), tablir des
listes de modalits spcifiques (Tableau de modalits
spcifiques). Ils obissent toujours au mme principe.
La mthode de calcul
Si on note N le nombre total de mots dans le corpus, m le
mot utilis, c la catgorie considre, Nm le nombre de fois
o le mot m est utilis par toutes les catgories
confondues, Nc le nombre total de mots dans la catgorie c
et Ncm le nombre de fois o le mot m est utilis dans la
catgorie c, lindicateur de spcificit est gal :
Ncm / (Nc * Nm / N)
Par dfaut, cet indicateur est calcul par rapport l'effectif
total des seuls mots figurant dans le tableau. Pour que N et
Nc soient calculs pour tous les mots prsents dans le
lexique courant il faut cocher loption Calcul sur
lensemble du lexique (bouton Compter).
En gnral, le calcul par rapport l'ensemble des mots du
lexique a plus de pertinence. Il renvoie la globalit du
discours. En se limitant l'ensemble des mots
slectionns, on risque de se rfrer un ensemble dnu
de fondement en terme d'nonciation.
Sphinx 2000
La statistique lexicale**
311
Indicateur de spcificit
Tableau lexical
Effectif thorique
(hypothse de rpartition
proportionnelle)
Indicateur de
spcificit
Nb d occurrence du mot
toutes catgories (Nm)
Effectif
thorique
312
7. Comparer un lexique de
rfrence
La fonction Comparer, accessible par un des boutons de
commande de latelier lexical, permet deffectuer une
comparaison du lexique avec un dictionnaire de rfrence.
Le dictionnaire de rfrence est un ensemble de mots
assortis dune frquence.
Comparer le lexique du corpus tudi avec un dictionnaire
de rfrence, cest retrouver les mots qui sont surreprsents ou sous-reprsents dans le texte par rapport
cette rfrence.
Quelle rfrence ?
Limiter la comparaison
24
31
23
94
45
Sphinx 2000
Rsultats de la comparaison
Options de calcul
jaune
rouge
vert
bleu
noir
La statistique lexicale**
313
314
Sphinx 2000
315
Codification
automatique
des textes
316
Dnomination et enregistrement de la
nouvelle variable
Le dialogue habituel de cration d'une nouvelle variable
s'affiche. La premire tape consiste donner un nom
cette variable. Pour la suite des analyses, il est utile de
noter toutes les indications ncessaires afin de retrouver
lorigine des nouvelles variables ainsi cres. A cet effet,
utiliser le cadre prvu pour la description de la variable en
notant les principales tapes qui la dfinissent.
Sphinx 2000
317
Transformer le texte
318
2. Codification lexicale
Il s'agit de codifier le texte en reprant automatiquement la
prsence, dans les rponses, des mots marqus dans le
lexique. Cette mthode est trs efficace si le lexique a t
au pralable correctement mis en forme : lemmatisation ou
regroupement des diffrentes formes dun mme mot,
regroupement des synonymes ou quivalents, usage de
dictionnaires thmatiques pour regrouper entre eux tous les
termes porteurs dune mme signification.
Sous ces conditions, on peut faire lconomie de la
mthode classique danalyse de contenu (Voir Coder des
textes) dont les inconvnients sont largement compenss
par le caractre automatique et objectif de la procdure qui
suit.
La dmarche gnrale est la suivante :
prparer le lexique : analyser de prfrence un corpus
lemmatis et effectuer les groupements ncessaires ;
marquer dans le lexique les lments que lon souhaite
reprer dans la rponse. Sil sagit de termes regroups
(lments commenant par un #), la prsence dun au
moins des lments du groupe suffit pour identifier la
prsence du thme correspondant ;
agir sur le bouton Recoder et choisir Variable ferme
pour dfinir le type de variable crer.
Sphinx 2000
319
Elments lexicaux
pris en compte
Plaisir de manger 12
Oui
Non
TOTAL OBS.
Plaisir de manger_R2
320
Non- rponse
manger
bon
repas
ami
got
plaisir
plat
faim
aliment
#famille
restaurant
table
TOTAL OBS.
Nb. cit.
Frq.
236
74
310
76,1%
23,9%
100%
Nb. cit.
74
107
95
50
38
24
23
19
15
14
26
13
10
310
Frq.
23,9%
34,5%
30,6%
16,1%
12,3%
7,7%
7,4%
6,1%
4,8%
4,5%
8,4%
4,2%
3,2%
3. Mesures lexicales
On cherche caractriser les noncs par le poids de
certains mots ou l'nonciation par les caractristiques de
chaque observation. Ceci peut donner lieu aux mesures
suivantes :
Banalit de l'observation
Cet indicateur est gal au nombre de fois o les mots de
l'observation apparaissent en moyenne dans tout le corpus.
Cette variable permet ensuite de slectionner les rponses
les plus banales, les moins banales et de les lister... Il est
prfrable de calculer la banalit en ignorant les mots
outils.
Richesse de l'observation
Sphinx 2000
321
Mesures lexicales
Groupe
des variables de
chaque mot
Valeur
moyenne
Somme
0,37
0,34
0,17
0,09
0,08
0,08
0,08
0,06
0,05
0,05
0,04
0,03
0,12
115
105
53
29
26
24
24
20
15
14
13
10
448
manger_O
bon_O
repas_O
chose_O
#en_famille_O
got_O
plaisir_O
plat_O
faim_O
aliment_O
restaurant_O
table_O
Ensemble
Plaisir de manger__R
Banalit
Richesse
322
Frq.
1
0,3%
Non- rponse
73 23,5%
Moins de 1,00
104 33,5%
De 1,00 2,00
71 22,9%
De 2,00 3,00
38 12,3%
De 3,00 4,00
18
5,8%
De 4,00 5,00
5
1,6%
Plus de 5,00
310 100%
TOTAL OBS.
Minimum = 0, Maximum = 6
Somme = 458
Moyenne = 1,48 Ecart-type = 1,24
Intensit
Nb. cit.
Sphinx 2000
323
Modifier le texte
324
Sphinx 2000
325
326
Sphinx 2000
327
Ouvrir un fichier
de donnes
textuelles**
328
Sphinx 2000
329
Du texte
Variables de
contexte
Variables
textes
Questions
Rponses
Questions
Rponses
Identit de linterview
Statut du texte (question/rponse)
3 entretiens
330
24 rpliques
12 changes question/rponse
Ouvrir le fichier
Avec le dialogue habituel de Windows, cherchez votre
fichier et ouvrez le. Une nouvelle fentre apparat et vous
montre le contenu du fichier. Si vous ne reconnaissez pas
vos donnes, vous vous tes tromp de fichier ou ce n'est
pas un fichier au format texte.
L'ouverture ne se passera correctement que si le fichier
n'est pas utilis en mme temps dans un autre logiciel.
Sphinx 2000
331
2/ Ouvrir le fichier
3/ Choisir le format correspondant la
structuration de vos donnes
Annot :
rapports,
textes littraires,
comptes rendus
Balis :
bases de donnes,
collection de documents,
entretiens non structurs
332
3. Texte balis
On obtient par exemple un texte balis en extrayant des
lments d'une base de donnes ou en compilant un
ensemble de messages lectroniques. Ces donnes sont
en effet structures par les balises qui indiquent les
diffrentes rubriques. Toutes ne sont pas forcment
prsentes, mais chaque information est rattache l'une
d'elles.
A partir des balises, le logiciel peut organiser la nouvelle
base de donnes : il repre les balises dans le texte et les
soumet pour validation l'utilisateur. Puis il cre une
variable par balise, et parcourt le texte en affectant ce qui
suit chaque balise la variable correspondante. Lorsqu'il
rencontre nouveau une balise, il cre une nouvelle
observation.
Sphinx 2000
333
334
Sphinx 2000
335
Signaltique
Variables de
contexte
Parties de
linterview
Questions
Rponses
336
Variables
textes
5. Texte annot
On utilise cette approche lorsque le ou les textes
analyser sont faiblement structurs ou pas du tout. Se pose
alors la question du dcoupage en fragments lmentaires.
La dmarche la plus simple consiste s'appuyer sur la
structuration naturelle du texte. Enfin, la possibilit
d'interprter des annotations apportes dans le texte
permet d'en reprer les lments et/ou de les commenter.
337
1/ Dcouper
2/ Structurer
Sparateur
338
Analyse de discours
On peut ramener ce cas celui de tout texte mono bloc
dans lequel aucune structuration particulire n'est mise en
vidence hors mis celle de la syntaxe.
La solution la mieux approprie consiste :
fragmenter le texte en phrases et dnombrer les
paragraphes. Chaque phrase se trouve ainsi affecte
un paragraphe repr par son numro. Pour cela,
slectionner Niveaux et entrer les caractres de
ponctuation forte dans la case de gauche et le retour
chariot dans la case de droite ;
dcouper le texte en 5 parties conscutives et de
longueur gale (en nombre de fragments). On peut ainsi
identifier des parties de dbut, de milieu et de fin du texte.
Pour cela, dans le dialogue Numrotation cocher
Numrotation des parties et Indicateur de partie : 5.
La base de donnes obtenue comporte la variable texte et
3 variables de contexte contenant le numro de fragment le
numro de paragraphe et de partie.
Pice de thtre
Ce cas peut se ramener au cas prcdent : on fait prcder
chaque
rplique
d'une
marque
Personnage
:
[M=Harpagon], [M=Elise]. En dbut de chaque Scne, on
pose un Jalon [J=Acte I Scne 1]..... Pour identifier les
Actes indpendamment les uns des autres, on peut utiliser
un sparateur de niveau en posant par exemple des $ au
dbut de chaque Acte.
La fragmentation peut se faire par phrases ou par
rpliques. Dans ce dernier cas, faire concider la rplique et
le paragraphe ou introduisez un niveau rplique.
339
Annotations
Jalons
acte et scne
liste des
personnages
prsents
Marques
nom du personnage
didascalies
340
O(texte)
O(texte)
F(unique)
F(unique)
O(numrique)
O(numrique)
F(multiples;11)
tous les
n mots : on obtiendra des fragments de
longueur identique ;
avant le style "unstyle" : en rptant cette opration pour
les styles Titre1, Titre2, Titre3, on aura un fragment pour
chaque sous-partie du texte.
Sphinx 2000
341
Mthodologie
Microsoft Word
propose des options de
recherche gnriques
ou par attributs
342
Sphinx 2000
343
Travailler avec
le Sphinx
344
1. Enregistrements et fichiers
Le Sphinx gre automatiquement vos donnes. Chaque
fois que vous quittez le logiciel aprs avoir apport des
modifications, il vous propose de les enregistrer. La
premire fois, vous choisirez le nom de votre enqute en
modifiant, de prfrence, le nom propos par dfaut.
Exporter et convertir
Les 2 boutons Exporter les donnes et Exporter les
rsultats permettent de rcuprer les donnes brutes ou
les dpouillements plat dans des fichiers textes (*.txt) ; ce
qui permet de les reprendre avec d'autres logiciels,
notamment Excel.
Avec loption Convertir lenqute pour, vous pourrez
crer, partir de votre tude Sphinx, un fichier de donnes
(.sav) que Spss sait relire. Avec cet article, vous pourrez
aussi revenir au format de la version 2 du Sphinx.
Sauvegarde automatique
Au fur et mesure de la saisie, une sauvegarde
automatique est mise jour dans le rpertoire
C:\Sphinx2000\Sauvegarde.
Le nom de ce rpertoire peut tre chang dans le dialogue
des prfrences.
Si au cours des traitements, vous supprimez
malencontreusement des variables ou des donnes, vous
pourrez toujours revenir cette sauvegarde qui nvolue
pas aprs la fin de la saisie.
345
Enregistrer ltude :
le questionnaire
et les donnes
3 fichiers : .que, .rep, .ouv
Enregistrer le questionnaire
uniquement
Convertir dans
un autre format
Exporter
Le fichier des donnes
Les rsultats
346
Exporter
Cette fonction enregistre dans un fichier texte sans autre
mise en forme que la tabulation.
Transfrer
Ce bouton, notamment prsent dans l'environnement
d'analyse lexicale, permet de choisir entre les 4 principaux
modes : Impression, Copier, Inclure dans le rapport,
Exporter dans un fichier.
Copier / Coller
L'article Copier, du menu Edition met dans le pressepapiers le contenu de la fentre active ou la zone de texte
slectionne (raccourci Ctrl+C). En faisant Coller (Ctrl+V)
dans l'application cible, on y transfre le contenu du
presse-papiers.
Larticle Copier copie comme une image le contenu
graphique de la fentre ( l'exclusion des titres et
lgendes). Le menu Copier en texte permet de transfrer
titres, tableaux et lgendes en mode texte (sans les
encadrs et autres signes graphiques).
347
Exporter
Plan de
dpouillement
Dpouillement automatique
348
Plan de dpouillement
Dpannage
Principe de fonctionnement
Le Sphinx place dans le presse-papiers successivement
tous les lments (le titre, le sous-titre, le tableau, le
graphique, le commentaire). Aprs chaque tape, le Sphinx
envoie un message au traitement de textes en lui indiquant
quil est ncessaire de coller le contenu du presse-papiers.
Le succs de l'opration demande donc une coopration
de la part du traitement de textes.
Windows propose en standard un traitement de textes
simple (WordPad). Vous pouvez dans tous les cas
construire votre rapport dans ce traitement de textes,
l'enregistrer puis fermer le document avant de le rouvrir
partir de votre traitement de textes habituel.
Alternative
A cette fonction Inclure dans le rapport, on peut toujours
substituer le Copier / Coller, qui nopre qulment par
lment et qui transfre les tableaux sous forme dimages
mais qui a lavantage de ne pas tre soumis aux incidents
cits ci-dessus.
349
ATTENTION : la premire
installation, il faut dsactiver la
protection antivirus de Microsoft
350
4. Aperu rapide
La fonction permet de prendre connaissance, sous une
forme rsume, de la structure du questionnaire et de l'tat
de l'enqute.
Le bouton Transfrer permet de transfrer le texte contenu
dans la fentre.
Sphinx 2000
351
F3
Maj + F3
Ctrl + F3
352
5. Prfrences
Polices de caractres
Les polices
globalement.
de
caractres
peuvent
tre
modifies
On choisit ainsi :
une police pour les crans de saisie directe ;
une police pour laffichage de la liste des questions ;
une police pour les nombres des tableaux (grande
police) ;
une police pour les tiquettes et les commentaires (petite
police) ;
une taille de police pour les textes dans latelier lexical (la
police elle-mme doit tre de largeur constante comme la
police courrier).
Larticle Caractres du menu Edition permet de changer
ces polices.
Les polices de caractres pour limpression sont choisies
dans le dialogue de mise en page.
Couleurs
Les couleurs des lments de graphiques sont galement
modifiables.
A chacune des modalits correspond une couleur que lon
peut changer. Les valeurs par dfaut (que lon peut tout
moment Restaurer) sont les plus adaptes limpression
en noir et blanc.
Options gnrales
Ce dialogue, appel par larticle Options du menu Edition,
permet divers paramtrages.
Notamment, effectuer des copies de sauvegarde au cours
de la saisie (Voir le chapitre Enregistrements et fichiers).
Les autres options sexpliquent delles-mmes sur le
dialogue reproduit ci-contre.
Sphinx 2000
353
Rpertoire
des
sauvegardes
automatiques
Ouvrir le fichier des
initialisations
manipuler avec
prcaution
354
6. Acclrateurs et raccourcis
De nombreuses fonctions ont des raccourcis qui permettent
d'viter le passage par un dialogue.
Des combinaisons de touches (Touche Ctrl + lettre)
existent aussi pour les principales fonctions (voir en face
des articles de menus).
Acclrateurs Windows
ALT + TABULATION pour basculer dune application vers
une autre (par exemple pour passer de Sphinx vers Word
aprs avoir transfr un rsultat).
ALT + le caractre soulign dans un nom de contrle
pour l'activer.
ALT + IMPR ECRAN pour copier l'image de la fentre
active dans le presse-papiers.
Gnral
CTRL + K ouvre le dialogue de slection d'un tableau
plat.
CTRL + R ouvre la fentre des rsultats.
CTRL + C pour copier dans le presse-papiers.
ECHAPPEMENT pour revenir l'cran principal.
RETOUR CHARIOT enfonc au dmarrage pour ouvrir la
dernire enqute utilise.
CTRL + ESPACE pour mettre la fentre de l'analyse
courante en plein cran.
F3, MAJ + F3, CTRL + F3 pour avoir un aperu des
variables, des donnes, du dpouillement.
F1 pour avoir de l'aide sur la fonction en cours.
F2 pour consulter ou rdiger un mmo d'aide
complmentaire sur la fonction en cours.
Analyse lexicale
La touche F5 (resp. MAJ + F5) augmente (resp. diminue)
la position des tabulations pour les listes.
La touche F11 bascule entre 1, 2 et 4 lexiques relatifs
(vue Environnement de l'analyse lexicale).
La touche F12 change l'ordre de prsentation du lexique
ou des lexiques relatifs.
Divers
Double-clic sur un point dans une analyse factorielle pour
voir la fiche de l'individu correspondant.
Double-clic sur une case de tableau pour caractriser les
observations correspondantes.
Enfoncer la touche RETOUR CHARIOT au dmarrage
pour activer la dernire enqute ouverte.
Pour les acclrateurs cits plus haut qui modifient des
tailles, le pas est modifi par la touche CTRL si elle est
enfonce simultanment.
355
Aide en ligne
Pour
vous
guider
Site Internet
Mmos
personnels
356
Un texte analyser
Un tableau d'effectifs
Vous pouvez analyser des rsultats provenant d'autres
applications en les lisant avec le Sphinx. Ouvrez le fichier
contenant le tableau que vous voulez analyser, vous
retrouverez l'environnement d'analyse des tableaux
d'effectifs avec toutes les possibilits graphiques et
statistiques qu'il offre. Vous pourrez ainsi reprsenter votre
tableau avec une carte d'AFC.
Sphinx 2000
357
Tables de
donnes
Fiches de
donnes
Textes
Fichier Spss : *.sav
Tableau dun fichier ou entre au clavier
358
Base dimages
Donnes tabules
Elles correspondent aux structures de table comportant des
individus (ou observations) dcrits par un certain nombre
de champs (ou variables) qui se rptent l'identique et
dans le mme ordre d'un individu l'autre. Les marqueurs
de structure sont dans ce cas des caractres spciaux
indiquant le passage d'un champ ou d'une variable l'autre
(sparateurs de variables) et d'un individu ou d'une
observation l'autre (sparateurs d'observations).
Dans le cas d'une table Individus x Variables, la tabulation
(^t) est le sparateur de variables, et le retour chariot le
sparateur d'observations.
Donnes balises
Cette situation correspond aux structures de fiches dont les
fichiers bibliographiques sont un bon exemple. Chaque
fiche contient un certain nombre d'articles ou rubriques
dont le nombre et l'ordre peuvent varier mais dont le
contenu est signal par un titre dispos d'une manire
constante et reprable : une balise.
Les marqueurs de structure sont les caractres qui
encadrent les balises. Par exemple, le retour chariot en
ouverture et le caractre 2 points en fin.
Sphinx 2000
359
Donnes formates
Donnes balises
1/ Reconnatre la structure
Donnes tabules
1/ Reconnatre la structure
4/ 5
Enregistrer la
nouvelle base
Sphinx
360
Sphinx 2000
361
Eurka ! le
compagnon du
Sphinx
362
1. Amliorer la communication
grce aux modules
complmentaires
Eurka! est un logiciel compagnon du Sphinx. Ses
fonctions de prsentation apportent une plus grande
souplesse pour l'laboration des documents, des
questionnaires ou des tableaux de bord, et ceci quel que
soit le mdia utilis : impression papier, publication sur le
Web, cran et autres supports multimdia.
Ce module complmentaire s'intgre totalement au Sphinx
2000 et peut tre appel directement depuis les panneaux
de commandes du Sphinx.
Selon le stade de votre travail dans le Sphinx, vous pourrez
ainsi :
enrichir la prsentation et la mise en page de vos
questionnaires en utilisant la fonction Dfinir des
formulaires ;
adapter l'interface de saisie en fonction des circonstances
: saisie scanner, saisie par oprateur de saisie (CATI),
saisie effectue par le rpondant lui-mme via Internet ou
sur un poste dispos dans un espace public CASI.
Communiquer le Questionnaire
La fonction Dfinir les formulaires permet de prparer
des formulaires avec toutes les fonctions graphiques des
logiciels de PAO.
Chaque question est compose du libell, d'une zone de
saisie (cases cocher pour les questions fermes, zone
vierge pour les questions ouvertes) et d'une consigne
ditable.
Des logos peuvent tre imports sur le formulaire, les
modalits peuvent tre associes des pictogrammes
(content-pas content par exemple).
Les couleurs, polices, tailles, formes de chaque question
peuvent tre modifies individuellement.
Faciliter la saisie
La saisie automatique des questionnaires par scanner
permet d'envisager des enqutes volumineuses avec des
ressources humaines constantes.
La saisie par oprateur se fait dans des crans similaires
au questionnaire papier ; ce qui simplifie beaucoup la tche
d'interprtation.
Pour la saisie l'cran par les rpondants eux-mmes
(dans le cadre d'une enqute Internet par exemple), ou
pour la saisie par oprateur, Eurka! offre des possibilits
plus tendues que celles disponibles d'une manire
standard dans le Sphinx :
Utilisation de la structuration du questionnaire : parties,
renvois, contrles de saisie (mme sur Internet) ;
Regroupement de questions sur un mme cran ;
Paramtrages du fonctionnement : passage automatique
la question suivante, retour interdit,
363
Ranimation
Soins Intensifs
Maternit
Cardiologie
O.R.L.
Pneumologie
Griatrie
Urologie
Gastrologie
Psychiatrie
ttt
Trs
Plutt
Plutt
mcontent mcontent satisfait
Trs
satisfait
la dure
l'information
le rconfort
la disponibilit du personnel
le confort
autres
Trs mcontent
6,50%
Plutt mcontent
Services
Accueil
Plutt mcontent
12,25%
Plutt satisfait
46,00%
Trs mcontent
22,00%
Plutt satisfait
35,25%
Trs satisfait
Comptence
13,25%
29,00%
Trs satisfait
22,50%
Plutt satisfait
35,75%
Critres
16,75%
Plutt mcontent
28,00%
Trs satisfait
l'accueil
32,75%
13,49%
la dure
10,99%
l'information
Soins_qualit
Trs mcontent
Tableau de bord
prsentant les
rsultats
Soins_rapidit
9,25%
Plutt mcontent
Trs mcontent
23,00%
Plutt mcontent
Plutt satisfait
33,50%
Plutt satisfait
Trs satisfait
34,25%
Trs satisfait
Disponibilit
8,50%
Trs mcontent
15,75%
Plutt mcontent
28,75%
5,79%
la disponibilit du personnel
16,00%
Plutt satisfait
47,00%
26,97%
le rconfort
8,00%
le confort
34,00%
Trs satisfait
5,39%
30,97%
3,30%
autres
3,10%
42,00%
note_globale
...et interdpendants
Informations
2,28
1,63
Soins_qualit
2,12
1,55
Informations
2,30
1,58
Disponibilit
2,25
1,60
Comptence
2,01
1,54
Accueil
2,32
1,62
Total
2,21
1,59
Moyenne =13,81
Mdiane =14,00
6,00
Disponibilit
Soins_rapidit
Soins_qualit
Accueil
PROFESSION
Agriculteur
AGE
Retrait
SEXE
Moyenne =35,02
20,00
14,00
Comptence
Ouvrier
Fminin (41,00%)
2,00
82,00
32,00
Masculin (59,00%)
4,58%
7,82%
9,43%
16,17%
Cadre Moyen
16,71%
Employ
Autre
364
2,16%
20,49%
22,64%
Sphinx 2000
365
Rdaction du questionnaire
Enqute PAPIER
Mise en forme et
enrichissement du formulaire
Impression et
reproduction
Collecte des
rponses
Saisie
manuelle
Saisie par
scanner
Traitements et analyses
laboration de tableau de bord
Impression et reproduction
du rapport crit
Rature
Cases non
reconnues
Tches
366
Sphinx 2000
367
Rdaction du questionnaire
Mise en forme et
enrichissement du formulaire
Enqute INTERNET
Enqute E-MAIL
Publication sur le
serveur
Diffusion (email ou lien
vers le questionnaire)
Tlchargement
des rponses
Traitements et analyses
laboration de tableau de bord
Publication automatique du
tableau de bord sur Internet
Java ou HTML
368
Sphinx 2000
369
Rdaction du questionnaire
Mise en forme et
enrichissement du formulaire
Enqute DISQUETTE
Enqute RESEAU
laboration du modle de
tableau de bord
Paramtrage du module de
saisie et/ou de consultation
des rsultats
Reproduction et
diffusion d une
disquette autonome
Installation sur un
rseau local
Rassemblement
de toutes les
disquettes
Traitements en analyses sur
lensemble des rponses
370
Sphinx 2000
371
372
Sphinx 2000
373
Mthodologie
374
Le questionnaire
Le questionnaire est donc destin capter, dans la
population interroge, les lments de rponses aux
questions que lon se pose. Il a alors deux objectifs :
provoquer une raction chez les interviews et servir de
support linterviewer qui pourra y enregistrer ses
informations de faon complte et prcise. La rdaction du
questionnaire est soigner dans ce sens.
Le questionnaire incorpore non seulement les questions
poser mais galement les plages de rponses. Il est
souvent bon dindiquer un titre ainsi quun commentaire
vocateur pour la population interroge.
Cest un instrument trs flexible du fait de la grande varit
des questions qui peuvent tre poses. Llaboration dun
bon questionnaire requiert une trs grande comptence et
peut tre intgre dans des logiciels spcialiss en analyse
statistique. Cest le cas du Sphinx qui propose une gamme
varie de fonctions destines la conception du
questionnaire.
Le pr-test
La phase de conception dune enqute sachve en
gnral par le test dune enqute pilote qui permet de
valider, sur un nombre restreint de personnes, les choix
effectus dans le cadre de ltude.
Ce test permet de dcouvrir si le protocole dtude est
raliste, si le contenu et la forme des questions sont
adapts aux objectifs de ltude.
Mthodologie
375
Le dpouillement et lanalyse de
donnes
Une fois les rponses saisies, on sintresse aux rsultats
qui vont ressortir de cette tude. On peut alors distinguer
plusieurs niveaux danalyse : on commencera par le
constat des rponses donnes par les interviews, cest-dire le dpouillement. Cette phase sera complte par des
calculs ou des tests statistiques et par un
approfondissement des analyses pour parvenir aux
rsultats significatifs de lenqute, ce qui permettra
dadapter les dcisions et les actions aux conclusions de
ltude.
Le dpouillement des rsultats donne rapidement un
aperu de lensemble des rsultats de lenqute en
produisant des tableaux ou graphiques de rsultats et des
listes de rponses donnes. Il est dabord conseill de
prendre connaissance des rsultats des variables
considres indpendamment les unes des autres et de
procder ensuite la mise en relation de plusieurs
variables.
La phase danalyse permet deffectuer des tests et des
calculs sur les rsultats extraits du dpouillement. Elle a
pour objectif danalyser les rsultats de faon prcise et
daider linterprtation et la dcision.
376
La communication
Le travail d'enqute et d'tude s'apparente un travail de
communication :
communication amont pour la transmission du
questionnaire, l'expos des questions, le recueil des
rponses ;
communication avale pour la diffusion des rsultats, le
travail d'argumentation et d'aide la dcision.
Les nouvelles technologies offrent de nouvelles
opportunits de mise en page, de prsentation, d'illustration
par des couleurs ou des images, d'interactivit dans les
changes avec les rpondants ou le destinataire du
rapport. Avec l'volution des logiciels, le charg d'tudes
peut ainsi de mieux en mieux matriser cet aspect important
de son travail.
Entretien en face--face
Les protagonistes de l'entretien se font face et peuvent
ainsi dialoguer en utilisant toutes les ressources de la
communication interpersonnelle. Les circonstances de ce
type d'entretien - communication de sujet sujet prsentent des avantages certains. L'enquteur sollicite
activement le rpondant tout en interagissant avec lui pour
rguler l'entretien dans sa dure. Des questions peuvent
tre prcises ou expliques, l'interprtation des rponses
peut tre vrifie, au risque cependant d'influencer ou de
biaiser l'observation.
Cette mthode n'est pas exclusive de l'observation directe.
L'enquteur peut, en cours ou l'issue de l'entretien, noter
les caractristiques du comportement de son interlocuteur.
Dure de l'entretien, perception de l'assurance, de la
sincrit de l'interlocuteur, prsence ou absence de
certains indices sur les lieux de l'interview, de
comportement a priori dfinis.
Entretien tlphonique
Mthodologie
377
AVANTAGES
Enqute par
observation
directe
Enqute en
face face
Enqute
tlphonique
Enqute par
courrier postal
ou lectronique
378
INCONVENIENTS
- Impossibilit dobserver des
opinions ou attitudes.
- Difficult de mise en uvre
pratique (condition de lobservation,
formation de lenquteur).
- Problme dontologique. On
observe des gens leur insu.
- Coteux.
- Lenquteur
rpondant.
influence
le
rponses
assistes.
- Impossibilit de passer des
questionnaires trop longs.
Sphinx 2000
Mthodologie
379
Les actions
envisages
Les questions
quon se pose
Les questions
quon pose
Qui ?
Comportement
Fait quoi ?
Motifs
Pourquoi ?
Opinions valeurs
Quel sens
cela a ?
Opinions valeurs
Qui fait quoi ?
Quels motifs expliquent les
comportements ?
Quel sens accorder
au comportement ?
Identit
Comportement
380
Sphinx 2000
Mthodologie
381
L'HYPOTHESE
La question qu'on se pose
Quelle radio vient en tte , ou :
Combien de personnes coutent journellement telle radio ?
LA
METHODE
D'OBSERVATION
Les questions
qu'on
pose
Les rponses
qu'on
enregistre
De ce que le rpondant dit
ce que l'enquteur
enregistre
De ce que l'enquteur
prononce ce que le
rpondant comprend
Guide d'entretien
LA VARIABLE
Les rsultats qu'on obtient
Formulaire
d'enregistrement
382
L'INDICATEUR
Sphinx 2000
Mthodologie
383
ENTRETIEN SEMI-OUVERT
FERME
IIIENTRETIEN
OUVERT
ou:
Question: Possdez vous une automobile,
si oui quelle en est la marque ?
Rponse du rpondant Citron
Enregistrement rponse
384
IIENTRETIEN
Citron
1 5
2Scurit
5Vitesse
8Autre
IV
Le rpondant ne peut
se satisfaire des
rponses proposes.
Prciser la catgorie "Autre
doivent
tre
Introduire le questionnaire
Sphinx 2000
Il faut viter de faire dbuter un questionnaire en face-face par des questions d'identit. Ce qui se justifie du point
de vue de l'analyse risquerait de transformer l'entretien en
interrogatoire de police. Il faut prvoir des questions
d'introduction ou de transition. Peut tre inutiles pour
l'analyse, elles ont pour but de rendre l'entretien plus facile.
Enfin, l'ordre des questions doit tenir compte des effets
perturbateurs de l'entretien. Les questions rponse
spontane doivent prcder les questions assistes. Dans
le mme esprit, il faut rvler le plus tard possible le but
prcis du questionnaire. En effet, certaines rponses
risquent d'tre influences par celui-ci. Mme par courrier,
il faut respecter cette rgle. On veillera galement ce que
les questions dont les rponses peuvent tre lies figurent
sur des pages diffrentes.
Longueur du questionnaire
Plus un questionnaire est long, plus il est difficile
administrer. Cette contrainte joue en particulier pour les
enqutes par courrier et tlphoniques.
Mthodologie
385
Type de variables
Suivant le type de questions, les rponses obtenues
qualifient des tats possibles (variables qualitatives), ou
mesurent des grandeurs (variables quantitatives).
Les variables quantitatives sont plus riches et autorisent
des traitements plus complexes : calculs de moyennes,
d'carts types, corrlations, rgressions, analyse en
composantes principales. Ces indicateurs ou mthodes
permettent des analyses plus fines et plus puissantes que
celles autorises par l'usage des variables qualitatives.
Il faut donc tre capable, ds la conception du
questionnaire, de dfinir les traitements envisags, pour
recueillir les informations ncessaires selon le bon format.
Ce choix consiste dterminer le format de la rponse
(texte, code, ferme, chelle, numrique) en fonction des
analyses envisages.
Ds la conception du questionnaire,
tenir compte de l'analyse des donnes
Certains choix effectus au moment de la rdaction du
questionnaire conditionnent fortement les possibilits
ultrieures d'analyse. Ainsi, s'il est toujours possible de
transformer une rponse numrique en variable qualitative,
l'inverse n'est pas toujours possible. Si d'autre part, aucune
question ouverte n'a t prvue, le questionnaire ne
permettra aucune vritable dcouverte, et sans numrique,
aucune mesure n'est facilement ralisable.
Les traitements
Expliquer
Relier
Mesurer
Toujours
possible
Classifier
Mettre en
correspondance
Que si
les modalits sont
dans le bon ordre
Evaluer
Dcrire
Explorer
386
Le questionnaire
Le sondage alatoire
L'estimation statistique ne peut tre effectue que sous les
conditions d'un sondage alatoire. Celles-ci impliquent que
la population soit de trs grande taille par rapport celle
de l'chantillon et que chaque individu de la population ait
exactement la mme chance de faire partie de l'chantillon.
Sous ces conditions, le calcul de probabilit montre qu'on
obtient un chantillon dont la composition est voisine de
celle de la population mre.
L'estimation statistique
Dans l'hypothse du sondage alatoire, on peut calculer,
partir d'un rsultat observ dans l'chantillon, l'intervalle
dans lequel doit normalement se situer la valeur
correspondante dans la population totale. Cette fourchette
appele intervalle de confiance indique ainsi la marge
d'imprcision que comporte toute estimation. On a
l'habitude de la distinguer du risque d'erreur pris en
acceptant cette fourchette comme valide. Plus on souhaite
rduire le risque, plus la fourchette sera large et les
rsultats imprcis, au contraire, on peut dsirer afficher des
rsultats plus prcis mais avec un risque d'erreur plus
grand. La seule manire d'amliorer la prcision sans
augmenter le risque d'erreur est d'augmenter la taille de
l'chantillon.
Attention: la qualit de l'estimation ne dpend que de la
taille de l'chantillon, sous rserve que le tirage est bien
alatoire. Si l'interrogation porte sur une population entire,
les rsultats sont exacts et il n'y a plus lieu de parler
d'estimation.
Sphinx 2000
Mthodologie
387
p
Proportion
dans lchantillon
Echantillon
[p-t, p+t]
Intervalle de confiance
dans la population
100%
50%
[p-t, p+t]
0%
388
Echantillons homognes
On est dans cette situation lorsque les analyses ne portent
que sur l'chantillon total. On cherchera dans ce cas
slectionner l'chantillon le plus grand possible compte
tenu des moyens disponibles. Plus l'chantillon est grand,
plus il faudra interroger de personnes supplmentaires
pour gagner en prcision. A partir d'un certain seuil, les
gains en prcision ne justifient plus le cot supplmentaire
que cela implique.
Redressement d'chantillon
Dans le cas prcdent, on redressera l'chantillon total
pour composer un nouvel chantillon dans lequel chaque
catgorie sera reprsente proportion de son poids dans
la population totale.
Procder ainsi conduit, au niveau de l'analyse, travailler
sur les chantillons propres chaque strate et sur un
chantillon redress pour analyser la population totale.
Echantillons htrognes
Cette situation correspond au cas o lon souhaite tablir
des rsultats sur des sous-ensembles de l'chantillon. Si
l'chantillon est alatoire, on obtiendra des effectifs trs
faibles pour les catgories peu reprsentes ; ce qui risque
d'interdire toute estimation sur les strates correspondantes.
Ainsi, pour analyser la strate d'une catgorie reprsentant
2% de la population totale, il faut un chantillon contenant
au moins 30 personnes dans cette catgorie ; ce qui
ncessite l'interrogation de 1500 personnes. Mais cet
effectif ne se justifie pas pour tudier la population dans
son ensemble. Il faudra donc trancher entre renoncer
analyser toutes les strates ou supporter le cot
d'interrogation de 1500 personnes.
Sphinx 2000
Mthodologie
389
Taille de
lchantillon
Taux
derreur
Intervalle de confiance
pour p=50%
200
300
6,93%
5,65%
[43,07% , 56,93%]
[44,34% , 55,65%]
2000
3000
2,19%
1,79%
[47,81% , 52,19%]
[48,21% , 51,79%]
Sondage alatoire
B
A
C
E
D
B
C
E
D
Redresser
une solution conomique
Sondage par quota
B
E
D
390
Le niveau d'analyse
Les dpouillements peuvent se faire diffrents niveaux :
Au niveau de l'individu. On s'intresse aux donnes de
dtail en vue d'entreprendre des actions individuelles. Les
traitements se ramnent alors restituer tout ou une
partie de l'information propre chaque observation. Les
rsultats sont produits sous forme de listes plus ou moins
tendues et structures selon le nombre d'individus
dcrits. Ces extractions peuvent tre effectues au stade
de la saisie (Consulter un profil d'individus), ou au stade
du dpouillement en produisant des listes.
Au niveau de la population entire. On cherche
synthtiser les informations dcrivant chaque individu
pour traiter la population comme un tout. Ceci revient
gommer les variations individuelles pour dcrire chaque
variable par un ou plusieurs indicateurs synthtiques :
valeur moyenne pour les variables numriques,
frquence relative des modalits d'une variable nominale.
Au niveau d'un sous-ensemble de la population. On
analyse des catgories particulires d'individus pour tenir
compte de l'htrognit de la population. En dfinissant
les conditions auxquelles doit rpondre le sous ensemble
tudi, on construit la strate qui se substitue alors
l'examen de l'chantillon total. La fonction Changer de
strate permet ainsi d'analyser comme un tout n'importe
quel sous-ensemble d'individus.
La recodification
Les donnes disponibles ne se trouvent pas toujours dans
un format adquat. La recodification permet de gnrer de
nouvelles variables mieux appropries l'analyse. On peut
distinguer :
La recodification d'une seule variable : mettre en classes
une variable numrique, agrger les modalits d'une
variable nominale, recoder une variable texte en fonction
de son contenu.
La recodification de plusieurs variables : calculer un score
partir des donnes de plusieurs variables nominales,
calculer une nouvelle variable en application d'une
formule en faisant intervenir plusieurs variables, crer de
nouvelles variables calcules en application d'une
analyse multivarie (scores factoriels, classifications...).
De l'univari au multivari
On peut distinguer 3 grandes problmatiques auxquelles
rpondent 3 manires d'aborder l'analyse :
Sphinx 2000
Mthodologie
391
Individus i
Analyser les donnes individuelles: dtailler
Les problmatiques
Analyse univarie
Dcrire une variable la fois
Analyse bivarie
Mettre en relations 2 variables, expliquer
Analyse multivarie
Analyser simultanment
plusieurs variables, synthtiser
392
L'analyse univarie
L'analyse univarie consiste donner une description
synthtique de l'ensemble des individus observs ou d'un
de ses sous-ensembles. La manire d'effectuer ces
descriptions dpend de la nature statistique des variables
en jeu. Dans le cas d'tude par sondage, on peut
galement se livrer l'estimation des proprits de la
population mre.
Dcrire
Sphinx 2000
Mthodologie
393
394
L'analyse bivarie
L'analyse bivarie commence par la formulation d'une
hypothse oriente par la signification des variables et se
poursuit par la mise en uvre d'une mthode rsultant de
la nature des variables.
La smantique : explication et
relations causales
Lanalyse bivarie conduit formuler un nonc de type
Si..V1.. Alors V2 postulant l'hypothse d'une relation
causale entre 2 variables. A ce stade, c'est la smantique
qui guide l'analyse : la signification des variables conduit
formuler une thorie justifiant la relation et son sens. La
statistique peut confirmer ou invalider son existence mais
seule la thorie en donne le sens. Ainsi, on peut tablir
statistiquement un lien entre le niveau d'ducation et le
revenu. Mais c'est en fonction d'une thorie qu'on
interprtera cette relation pour dire que le revenu
conditionne l'ducation (thorie du cot) ou que l'ducation
dtermine le revenu (thorie du rendement).
L'anlayse bivarie commence donc par la formulation des
hypothses que la statistique permettra de tester. Le
modle ci-contre peut orienter la rflexion : parmi toutes les
relations envisageables, 3 renvoient des thories trs
gnrales du comportement humain :
1 - Le dterminisme sociologique : laction obit aux
habitudes et aux contraintes.
2 - La dcision et la rationalit : laction rsulte des choix
et des calculs.
3 - Les psychologismes : laction est modalit
dexpression.
Mthodologie
395
Opinions Valeurs
Identit
3
Comportements
2
Motifs
La statistique : la nature des variables dtermine la mthode
1 Tris croiss
3 Analyse de la variance
396
3 Analyse de la variance
2 Corrlation
Le calcul du Chi2
Le test du Chi consiste dterminer si le tableau tudi
correspond cette hypothse. Sil sen carte beaucoup,
on prsume lexistence dun lien dautant plus significatif
que lcart est grand. Le Chi est la mesure de cet cart.
A partir d'un tableau de contingence L lignes Li et C
colonnes Cj, on dtermine dabord, pour chaque
case, leffectif thorique. C'est le produit du total de sa ligne
(Li,.) par le total de sa colonne (C.,j) divis par le total
gnral (n) soit (Li,.*C.,j/n). On calcule ensuite la somme
des carrs des carts entre effectif rel et effectif thorique.
Plus lcart est grand, plus le Chi est lev, et plus on a de
chances dtre en prsence dun lien significatif.
Cette apprciation dpend bien sr de la dimension du
tableau, cest--dire du nombre de degrs de libert : ddl =
(L-1)* (C-1). Plus il y a de cases, plus la somme risque
dtre leve. Si la valeur du Chi permet dindiquer
lexistence dun lien, il faut, pour le qualifier, examiner
comment celui-ci est compos.
Mthodologie
397
398
V1
V1
Coefficient de corrlation
Le coefficient de corrlation (r) tablit la qualit de
lajustement entre deux variables V1 et V2. Sa valeur
absolue (ou r2) est comprise entre 0 et 1.
Elle est gale 1 si lajustement est parfait : il existe une
fonction V1=axV2+b dont le rsultat donne toujours
exactement la valeur observe de V1 : on peut alors dire
que V1 dpend exactement de V2.
V2
V2
V2
Mthodologie
399
400
Reprsentation graphique de la
dispersion
Analyse de la variance
Son but est dtablir si, au regard des valeurs de la variable
numrique, les groupes dindividus correspondant aux
modalits de la variable nominale sont significativement
diffrents les uns des autres. Elle met en uvre les
principes suivants :
Pour chaque modalit de la variable nominale, la
moyenne de la variable numrique dissimule une
dispersion autour de cette moyenne. La variance (le carr
de lcart-type) mesure cette dispersion appele variance
interne.
Dune modalit lautre, la moyenne varie et rvle une
htrognit, plus ou moins grande, mesure par un
autre calcul de variance : la variance entre modalits.
Le test danalyse de variance porte sur le rapport entre la
variance entre modalits et la moyenne des variances
internes. Il a pour but de vrifier si lhtrognit entre
modalits est plus grande que lhtrognit lintrieur
des modalits. Si ce rapport not F est suffisamment lev,
on dit que la variable numrique discrimine les modalits
de la variable nominale.
Sphinx 2000
Mthodologie
401
402
Synthtiser
Il s'agit de rsumer la masse des informations concernant
un grand nombre dindividus dcrits par de nombreuses
variables.
On cherche dcrire les donnes par une expression plus
conomique afin den rendre compte plus simplement.
Deux voies sont envisageables :
La classification ou la typologie : elle consiste regrouper
les individus de la base de donnes en classes (ou types)
dindividus selon les similarits qui permettent de les
rassembler. Par exemple : dcrire une population en
identifiant diffrentes classes de styles de vie.
La rduction des dimensions danalyse : elle consiste
rduire un grand nombre de variables quelques
dimensions communes. Par exemple, ramener la varit
des opinions exprimes par les rponses vingt
questions diffrentes, 2 dimensions opposant dune
part, le sentiment la raison, et dautre part, la tradition
au changement.
Analyser
On cherche les influences de plusieurs variables entre elles
pour mettre en vidence comment celles-ci se dterminent
les unes et les autres.
On cherche expliquer en construisant des modles
permettant dexpliquer une variable par les variations de
plusieurs autres, en cherchant ainsi des liens de causalit
plus complexes que la simple relation entre deux variables.
Les mthodes
Les mthodes disponibles sont nombreuses :
Certaines sont directes. Elles peuvent consister :
combiner entre elles plusieurs variables pour calculer une
nouvelle variable qui les rsume (une somme, une
moyenne, un score...).
Sphinx 2000
Mthodologie
403
Expliquer
V1
V2
V3
V3
Synthtiser
Rduire le nombre des
dimensions
danalyse
:
cartes factorielles, scores
factoriels.
Analyse factorielle multiple (AFCM)
: n variables nominales
Analyse en composantes principales (ACP)
: n variables numriques
Analyse factorielle des correspondances (AFC) : 2 nominales
Analyse en composantes principales
dun tableau de moyennes (ACP)
: 1 nominale n numriques
Classifier
Regrouper les individus en
classes
homognes.
Classification automatique,
typologie vue.
Classification automatique
Typologie AFCM
Typologie ACP
404
: n numriques
: n nominales
: n numriques
AFCM et ACP
Sphinx 2000
Mthodologie
405
Rduire les
dimensions
Donnes initiales
Synthse
Regrouper
les individus
Variables numriques :
Variables nominales
406
Sphinx 2000
Mthodologie
407
F2
C3
C5
C1
F1
C6
C4
C2
A
B
B
F
F
A
C
E
E
D
408
Sphinx 2000
Mthodologie
409
V1
V2
V3
V0
Variable explique
Vn
Variables explicatives
Evaluations
Coefficients dimportance relative
Equation de rgression multiple
note_globale = +0.970 * Restauration +0.891 * Confort -0.652 * Soins_qualit
+0.639 * Informations -0.510 * Rconfort +0.390 * Hygine -0.219 * Services
+9.709
Matrice de corrlation
note
_glo
1,00
note globale
0,42
Restauration
0,35
Confort
0,26
Hygine
0,23
Informations
Soins rapidit 0,15
0,15
Comptence
0,14
Disponibilit
-0,00
Rconfort
-0,06
Accueil
-0,06
Services
Soins qualit -0,14
410
Rest
aura
Conf
ort
Hygi
ne
Infor
mati
Soin
s_ra
Com
pte
Disp
onib
1,00
0,17
0,33
0,12
0,22
0,22
0,26
0,15
-0,04
0,04
0,15
1,00
0,09
0,05
0,16
0,25
0,17
0,18
-0,02
-0,03
0,10
1,00
0,12
0,19
0,08
0,22
0,29
-0,03
0,18
-0,04
1,00
0,17
0,08
0,22
0,12
0,02
-0,00
0,07
1,00
0,17
0,31
0,18
-0,09
0,03
0,09
1,00
0,15
0,14
-0,00
-0,02
0,08
1,00
0,20
-0,06
0,04
0,08
Rc
onfo
1,00
0,03
0,00
0,01
Acc
ueil
1,00
0,02
-0,04
Serv
ices
Soin
s_q
1,00
0,04
1,00
Classification automatique
La classification automatique rpond lobjectif suivant :
regrouper les individus dune population en classes formant
une partition. Cest--dire que tout individu appartient une
classe et une seule. La partition est lensemble des
classes.
Sphinx 2000
Mthodologie
411
412
Sphinx 2000
Mthodologie
413
Table des
matires
dtaille
414
Avant de commencer.............................8
1. L'organisation du Sphinx et les
diffrents logiciels ......................................9
Les quatre stades d'une tude...................... 9
Les trois niveaux de logiciels........................ 9
Le Sphinx Primo ............................................. 9
2
Le Sphinx Plus .............................................. 9
Le Sphinx Lexica ............................................ 9
Version 2000 et versions antrieures ........... 9
Eurka ! ........................................................... 9
Caractriser .................................................. 35
Dcouvrir les statistiques............................ 35
Le Sphinx en direct ...................................... 36
5. Bibliothque de questions....................... 47
Utiliser la bibliothque................................. 47
Enrichir la bibliothque ............................... 47
Crer une bibliothque ................................ 47
9. Organiser le questionnaire...................... 55
Titres, consignes et parties......................... 55
Dplacer des questions ou des parties...... 55
Modifier des questions ................................ 55
Grouper des questions ................................ 55
415
16.Exporter le questionnaire.........................69
Inclure dans le rapport................................. 69
Enregistrement du questionnaire au
format Texte.................................................. 69
Modifications dans le traitement de
textes............................................................. 69
9. Scanner et Internet.................................. 89
La saisie par scanner................................... 89
Le Sphinx et lInternet.................................. 89
Publier les rsultats ..................................... 89
416
2. Environnements de dpouillement et
danalyse ...............................................103
Dpouiller les rsultats.............................. 103
Analyser les rsultats ................................ 103
Produire des tableaux de questions
ouvertes ...................................................... 103
2. Recoder................................................. 123
4. Tableaux rcapitulatifs...........................107
417
Tableaux et graphiques de
synthse .............................................188
1. Les analyses synthtiques.................... 189
Tableaux multiples..................................... 189
Tableaux de caractristiques .................... 189
Dpouillement gnralis* ........................ 189
Les tableaux composs* ........................... 189
419
5. Elaborer un tableau de
caractristiques......................................197
Afficher les traits dominants..................... 197
Mettre en vidences toutes les
spcificits.................................................. 197
Focaliser sur les originalits..................... 197
Tests et jugement....................................... 197
8. Les baromtres......................................203
Slectionner les modalits
reprsenter ................................................. 203
Mettre en forme le baromtre.................... 203
Cas des tableaux plat accols ............... 203
Tableaux composs ................................... 203
2. Classification automatique.....................213
Lancer une classification automatique .... 213
Choisir une classification.......................... 213
Exploiter une classification....................... 213
2. Faire du verbatim...................................237
Slectionner une variable texte................. 237
Prsenter les extraits en les classant....... 237
Dfinir un profil de recherche ................... 237
Contrler les rsultats et les diter .......... 237
Produire des listes ..................................... 237
Sphinx 2000
421
Analyse syntaxique et
lemmatisation** ..................................290
1. La lemmatisation ................................... 291
Principes de la lemmatisation................... 291
Rduire la forme graphique au mot
racine .......................................................... 291
Rsoudre les ambiguts smantiques.... 291
Identifier les formes grammaticales et
les locutions ............................................... 291
6. L'indice de spcificit.............................311
Comparer la distribution observe
une distribution de rfrence .................... 311
La mthode de calcul................................. 311
Choisir un seuil de slection..................... 311
2. Codification lexicale...............................319
Cration de variables oui/non ................... 319
Sphinx 2000
423
5. Prfrences ...........................................353
Polices de caractres ................................ 353
Couleurs...................................................... 353
Options gnrales...................................... 353
Mthodologie......................................374
Rappel des principes de lenqute par
questionnaire......................................... 375
Dfinition des objectifs.............................. 375
La dtermination des chantillons ........... 375
Les diffrentes formes denqutes........... 375
Le questionnaire ........................................ 375
Le pr-test................................................... 375
Le recueil des donnes ............................. 376
Le dpouillement et lanalyse de
donnes ...................................................... 376
La prsentation des rsultats ................... 376
La communication ..................................... 376
La smantique : explication et
relations causales ...................................... 395
La statistique : mettre en uvre la
mthode adapte........................................ 395
Dcrire......................................................... 393
Les indicateurs selon le type de
variable ....................................................... 393
Extrapoler la population totale............... 393
425
Classification automatique..........................411
Diffrentes approches de
classification .............................................. 411
Dfinir une classification........................... 411
La mthode des centres mobiles.............. 411
Analyser la classification obtenue ........... 411
426
Sphinx 2000
427
Bibliographie
428
smiotique
du
discours
appliques
Sphinx 2000
la
gestion
analysis
(SAGE
Bibliographie
429
430