Documente Academic
Documente Profesional
Documente Cultură
Informatique. L3.
STATISTICA Version 6.
FASCICULE DAIDE A LUTILISATION.
LICENCE DE PSYCHOLOGIE
ANNEE 2004 / 2005
________________________________________
STATISTICA est un logiciel de traitement et danalyse de donnes. Il existe un grand nombre
dautres logiciels du mme type, les plus connus sont SPSS (souvent utilis en psychologie
sociale), S Plus (ce logiciel comporte une interface peu attractive, il est surtout utilis par les
personnes qui effectuent leurs analyses en lignes de commande) et SAS (ce logiciel est
probablement lun des plus performant, mais il ne sutilise quasiment quen lignes de
commande et possde une interface avec menu droulant trs rduite).
Lavantage de STATISTICA rside dans la qualit de son interface menu droulant. Toutes
les analyses sont ralisables partir de cette interface. Il faut noter que, si cela est un avantage
indniable pour les personnes qui ne connaissent pas les syntaxes en lignes de commande,
cest aussi un inconvnient dans la mesure o il est ncessaire de connatre parfaitement les
calculs qui permettent darriver un rsultat particulier.
Ce fascicule a pour objectif de vous donner certaines indications qui vous permettront de
raliser une analyse de variance (ANOVA) sur STATISTICA. Bien entendu, il nest en aucun
cas exhaustif, ni reprsentatif des diffrentes possibilits quoffre STATISTICA.
Les diffrentes explications donnes dans ce fascicule sont bases sur un fichier de donnes
EXCEL, les donnes dans ce fichier doivent tre, pralablement son exportation sur
STATISTICA, organise de faon ce que vos variables inter soient en lignes et vos variables
intra en colonnes (voir exemple donn en TD ou encore lexemple ci-dessous).
Enfin, les commandes dcrites dans ce fascicule sont en langue anglaise. Il est possible que
vous possdiez une version de STATISTICA en langue franaise, cela ne change rien la
disposition des commandes. Dautre part, la traduction est trs souvent aise.
NB : laide en ligne de STATISTICA est trs performante, utilisez-la sans modration.
STATISTICA
Psychologie L3.
_______________________________
Si vous voulez ouvrir un fichier statistica existant, cliquez sur ouvrir (voir figure 1) et vous
votre fichier depuis lemplacement o il se trouve. Si vous voulez ouvrir un nouveau fichier
(fichier excel par exemple), vous cliquez sur ouvrir ; la bote de dialogue suivante apparat :
Lorsque vous cliquez sur Ouvrir , la bote de dialogue ci-dessus apparat. Vous pouvez
importer lensemble du fichier ou certaine parties uniquement. Par exemple pour un fichier
Excel comportant plusieurs feuilles, vous voulez importer uniquement la feuille sur laquelle
se trouvent les donnes que vous voulez traiter. Pour cela, cliquez sur Import selected sheet
to a Spreadsheet . Cela vous permet, comme lindique la figure suivante de choisir la feuille
que vous voulez importer.
Cette bote de dialogue prsente en quelque sorte un rsum de votre fichier de donnes, elle
indique le nombre de lignes et de colonnes de votre fichier. De plus, elle vous permet de
dutiliser la premire ligne du fichier de donnes comme titres de colonnes (celle qui dfinie
vos conditions).
STATISTICA autorise utiliser la premire ligne du fichier de donnes pour mettre une
lgende sur les diffrentes conditions exprimentales, et la premire colonne pour reprer les
diffrents groupes. Si cela est le cas dans votre fichier de donnes, indiquez-le en cochant
loption Get variable names from first rowe , puis cliquez sur le bouton OK .
Votre fichier apparat alors lcran (voir figure 3). Vous remarquerez que les titres des
colonnes sont en format texte, de mme que certaines donnes telles que les sujets, ainsi que
les diffrentes conditions inter ( comest , rapide , par exemple). Statistica supporte le
format texte dans la dfinition du code de vos variables, quelles soient inter ou intra sujets,
mais il possible aussi de dfinir vos variables par des codes numriques.
Figure 3 : fichier de donnes (tir dexcel) tel quil apparat sur statistica lorsquil est import.
NB : Noubliez pas denregistrer votre fichier statistica (donnez-lui un nom spcifique et
que vous reconnatrez.
STATISTICA vous propose denregistrer votre fichier de donnes sous le format.sta. Ceci
vous permet de garder intacte votre fichier dorigine pour une analyse ultrieure. Modifier le
nom du fichier si besoin est, et cliquer sur le bouton Enregistrer .
Avant tout, vous devez avoir en tte que lANOVA nest pas la seule analyse statistique
applicable des donnes. Il existe un grand nombre de tests statistiques, et une grande partie
dentre eux sont ralisables sur Satistica. Nous nous intresserons pour notre part uniquement
lANOVA (cependant nhsitez pas explorer ce logiciel, laide en ligne tant trs
complte). LANOVA nest quun cas spcifique dun modle plus global danalyse de la
variance qui est le Modle Linaire Gnral (GLM). Statistica inclut donc lANOVA dans le
module GLM.
Pour raliser une analyse de variance (voir figure ci-dessous) :
Cette bote de dialogue permet de dfinir quel test statistique inclus dans le GLM, vous voulez
utiliser. Vous remarquerez que plusieurs types dANOVA sont proposs.
a) One-way ANOVA : Elle permet danalyser les plans exprimentaux ne comprenant
quune seule variable indpendante catgorielle (un seul facteur plus de deux
modalits).
b) Main effects ANOVA : Elle permet danalyser les effets principaux (pas les
interactions) de diffrentes variables indpendantes catgorielles.
c) Factorial ANOVA : Elle permet de tester les effets dinteraction de plusieurs variables
catgorielles.
d) Repeated measures ANOVA : Elle permet de raliser des tests avec des plans
exprimentaux mixtes, ou intra. Lutilisation des repeated measures permet danalyser
des plans exprimentaux dans lesquels il y a une ou plusieurs variables intra et une ou
plusieurs variables inter.
Voici un exemple avec un plan mixte comprenant 2 VI inter et 2 VI intra, chacune deux
modalits. Pour raliser cette analyse nous utiliserons donc le module Repeated measures
ANOVA
Lorsque vous cliquez sur Repeated measures ANOVA , la fentre ci-dessus apparat, elle
vous permet de dclarer vos variables et surtout lagencement de ces variables. Longlet
Variables vous permet de slectionner les variables sur lesquelles vont porter les analyses.
Lorsque vous cliquez sur cet onglet, la fentre ci-dessous apparat, avec les intituls de toutes
les variables. Les variables intra doivent tre dclares dans la partie gauche Dependant
variable list et le variables inter dans la partie de droite Categorical predictors (factors) .
une fois vos variables slectionnes, cliquez sur OK.
NB : Pour slectionner une variable dans une catgorie (les variables inter-groupes dans la
liste de droite et les variables intra-sujets dans la liste de gauche), cliquez sur la variable
laide de la souris dans la liste considre ; la variable apparat alors en sur-brillance. Pour
slectionner plusieurs variables dans la mme colonne, slectionner les variables une une
en appuyant sur la touche Ctrl du clavier et simultanment sur chacune des variables que
vous voulez slectionner.
La fentre ci-dessous apparat (voir figure 7). Cette fentre vous permet de dfinir les
diffrents niveaux de vos variables inter et intra, autrement dit, cest ici que vous indiquez le
nombre de modalit de vos facteurs.
a) Dclaration des variables intra : cliquez sur Within effects , la fentre qui se trouve
droite sur la figure 7 apparat.
Attention : Lordre dans lequel on dclare les variables intra-sujets est trs
important. La rgle consiste dclarer dabord les variables qui tournent le moins
vite, en loccurrence les variables de haut niveau. Lexemple suivant va nous
permettre de mieux comprendre cette notion.
Supposons par exemple un plan danalyse comportant 2 variables entirement rptes : une
variable A ( deux modalits : A1 et A2) et une variable B ( 3 modalits : B1, B2 et B3). Ceci
conduit dfinir les conditions exprimentales suivantes : A1B1 ; A1B2 ; A1B3 ; A2B1 ;
A2B2 ; A2B3. Dans ce cas on dit que la variable A tourne moins vite que la variable B, car
en faisant le tour de A on fait trois tours de B. Dans ce cas on dclare dabord la
variable A en indiquant ses deux niveaux, puis la variable B en indiquant ses trois niveaux
(pour notre exemple, il faut se rfrer la faon dont nous avons choisi de rentrer les
variables).
Pour chaque variable intra-sujet, il faut saisir dans le champ No of levels le nombre de
modalits de la variable, et dans le champ Factor name , le nom que lon veut assigner
la variable. On clique ensuite sur OK pour finir.
Figure 7
b) dclaration des variables inter : cliquez sur Factor codes :
La fentre suivante apparat. Si vous
cliquez sur OK, Statistica prendra en
compte toutes les modalits de tous les
facteurs inter. Vous pouvez en revanche
slectionner seulement certaines modalits
en cliquant sur Zoom et en choisissant
ensuite les modalits qui vous intressent.
NB : il est gnralement conseiller de
slectionner toutes les modalits.
Aprs avoir indiquer le statut de chaque variable du plan danalyse, cliquer sur le bouton
OK pour finir.
La bote de dialogue suivante apparat. Elle vous permet dobtenir diffrentes informations.
En cliquant sur More results vous disposerez de plus doptions (voir figure 9).
Figure 8 : bote de dialogue permettant lanalyse des donnes selon le plan dexprience que
vous avez rentr.
4) Calcul des effets et mise en forme des rsultats.
10
a) Les fonctions dcrites ci-dessous sobtiennent lorsque vous cliquez sur longlet
Summary dans la fentre prcdente (figure 9).
Cliquer sur Test all effects pour obtenir tous les effets (principaux et interactions).
Vous obtiendrez le tableau ci-dessous (la lecture de ce tableau sera dtaille en TD).
Figure 10
Cliquer sur Descriptive cell statistics pour avoir une table des moyennes et / ou une
reprsentation graphique des rsultats. Cette fonction permet dobtenir les moyennes
(Mean), les carts-types (Std. Dev.), etc.
Figure 11
11
Figure 12
5) Les graphiques
Dans le menu Graphs de STATISTICA, on dispose dun ventail trs large de graphiques
pour la mise en forme des rsultats. A vous de choisir le graphique qui reprsentera le mieux
vos rsultats. Les graphiques les plus utiliss sont les courbes (que vous obtenez directement
dans longlet Summary , puis All effects/graphs ), les histogrammes ( Graphs ;
Histograms ou Graphs ; 2D graphs ; Histograms ).
Figure 13 : Comment obtenir des courbes des effets sans passer par le menu Graphique
12
Ensuite vous devez slectionner leffet que vous voulez reprsenter sous forme graphique
(voir figure ci-dessous).
Sur la figure ci-dessus, leffet pour lequel nous voulons obtenir un graphique est en
surbrillance (surlign). Pour obtenir un graphique de cet effet (ici leffet dinteraction), vous
devez cliquer sur OK, la fentre suivante apparat. Cette fentre vous permet de dcider quelle
variable vous aller disposer sur laxe des abscisses (ensuite cliquez OK).
Par dfaut, Statistica propose le graphique suivant. Vous pouvez le retoucher, c'est--dire
ajouter les valeurs, changer la couleur des traits, indiquer le nom des variables, etc.
13
NB : vous pouvez copier un graphique Statistica dans une feuille de calcul EXCEL ou sur une
page WORD. Attention, ces graphiques sont des fichiers trs lourds qui vont rapidement faire
augmenter la taille de votre fichier Word ou Excel.
14
Lorsque vous choisissez le type de t-test que vous dsirez raliser, vous devez ensuite dclarer
(dfinir) les variables ; autrement dit ce que vous voulez comparer. Lorsque vous cliquez sur
lun des t-test possibles, une fentre apparat dans laquelle vous devez dclarer vos variables
(voir figure ci-dessous).
15
16
2 Corrlation
Pour obtenir une matrice de corrlation1, c'est--dire un indice qui indique de quelle faon
covarient vos variables, il existe plusieurs possibilits. La possibilit la plus simple est de
cliquer sur Statistics ; Basic Statistics/Tables ; Correlation Matrix . La fentre
suivante apparat :
A partir de cette fentre, slectionnez vos
variables (vous pouvez demander les corrlations
entre toutes vos variables = One variable list
ou deux groupes de variables = Two lists .
Puis cliquez sur Summary ou Summary :
Correlation matrix .
Le tableau de rsultats ci-dessous apparat. Par
convention, Statistica colore en rouge les
rsultats significatifs (en loccurrence ici les
corrlations). Vous remarquerez que la diagonale
est remplie de 1, a signifie tout simplement
quune condition (par exemple DA_DISS_Signe)
corrle parfaitement avec elle-mmece qui na
rien dtonnant !! Vous remarquerez aussi, que
les corrlations qui se trouvent au-dessus et audessous de la diagonale sont identiques, vous
pouvez donc vous passer dune partie des
corrlations !
Enfin, vous noterez que les corrlations sont
donnes significatives un seuil p de .05
La corrlation est un indice indpendant de la moyenne, elle permet de dterminer sil existe une relation (i.e.
une relation de linarit) entre deux variables (deux mesures par exemple). Par exemple, si lon fait passer 2
preuves 10 individus et que lon regarde si les deux preuves corrlent, cela signifie que ces deux preuves
classent les individus de la mme faon, c'est--dire quun individu qui russit lpreuve 1 russira aussi
lpreuve 2. Lindice de corrlation le plus connu est le r de Bravais Pearson, il peut prendre toutes les valeurs
entre -1 et 1.
17
Une seconde faon dobtenir exactement la mme matrice de corrlation est de cliquer dans le
menu Statistics sur Non Parametrics , puis Correlations (Spearman, Kendal tau,
gamma) ; la fentre suivante apparat. Elle permet de slectionner les variables (notez que
comme prcdemment, vous pouvez demander les corrlations entre toutes les variables
Square matrix ou pour 2 listes Matrix of two lists ou un rapport dtaill Detailed
report ). Cliquez sur Spearman R ou Spearman rank R pour obtenir le tableau de
rsultats.
18
7) Glossaire
Termes anglais
2D graphs
Advanced linear/non linear models
All effects/Graphs
All files
Graphiques 2D
Modles linaires/non linaires avancs
Tous les effets/graphiques
Tous les fichiers
Variables indpendantes (prdicteurs catgoriels ou
Categorical predictors (factors)
facteurs)
Correlation Matrix
Matrice des corrlations
Data files
Fichier de donnes
Dependant variable list
Variables dpendantes
Descriptive cell statistics
Statistiques descriptives
Factor codes
Codes des facteurs intra
Factor name
Nom du facteur
Factorial ANOVA
ANOVA factorielle
General linea model
Modle linaire gnral
Get variable names from first rowe
Prendre les noms des variables de la premire ligne
Graphs
Graphiques
Histograms
Histogrammes
Import all sheets to a workbook
Importer toutes les feuilles
Import cell formating
Importer avec formatage des cellules
Import selected sheet to a Spreadsheet Slectionner une feuille importer
Main effects ANOVA
ANOVA effets principaux
Mean
Moyenne
More results
Plus de rsultats
No of levels
Nombre de niveaux
Non Parametrics
Non paramtriques (statistiques non paramtriques)
One variable list
Liste de variables
One-way ANOVA
Anova un facteur
Repeated measures ANOVA
ANOVA mesures rptes
Statistics
Statistiques
Std. Dev
Ecart-types
Summary
Rsum
Test all effects
Tous les effets
Two lists
Deux listes
Within effects
Effets intra
* Ces traductions sont tires de la version 5 de Statistica, il se peut que certaines traductions aient t
changes dans la version 6.
19