Documente Academic
Documente Profesional
Documente Cultură
2
Sommaire..........................................................................................................................................2
Notions de base..........................................................................................................................3
Population.........................................................................................................................................3
Les chantillons.........................................................................................................................3
chantillon reprsentatif.................................................................................................................3 chantillonnage alatoire................................................................................................................4 chantillonnage en strate................................................................................................................5 Conclusion........................................................................................................................................6
Introduction...............................................................................................................................6
Sommaire..........................................................................................................................................7
Comparaisons statistiques.......................................................................................................16 Ainsi, l'estimation de la moyenne d'une population calcule partir d'un chantillon s'exprime comme suit :............................................................................................................16 Zone de vrification de l'hypothse de recherche...................................................................16 Vrification bilatrale..............................................................................................................16 Vrification unilatrale............................................................................................................17 Reprenons l'hypothse nulle prcdente et changeons l pour :...........................................17 Les travailleurs immigrants ont une productivit moyenne suprieure 5 units .........17 Dans ce cas, on connat la direction. La vrification est alors unilatrale. L'expression anglaise s'crit comme ceci one tailed test ........................................................................17 Un niveau de confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %..........18 Gnralement, on tablit le niveau de confiance 95 % et mme 99 %. Dans des circonstances dfavorables, on se contente d'un niveau de 90 %..........................................18 Par exemple, la moyenne suivante pourrait tre fiable 95 %..............................................18 = 5 2....................................................................................................................................18
Ce qui signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Par contre, la fiabilit 99 % serait la suivante :..................................................................19 = 5 2,6.................................................................................................................................19 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6..................19 Comparer les observations la population ou une hypothse............................................19
Avertissements................................................................................................................................20 Sommaire........................................................................................................................................20
Exemple ...................................................................................................................................23 Comparaison du pourcentage d'un groupe la population..................................................25 Formules mathmatiques pour le pourcentage......................................................................25 Exemple....................................................................................................................................26
Comparaison de la moyenne d'un groupe avec celle d'une population avec un logiciel...........27 Interprtation des rsultats...........................................................................................................28 Procdure pour les pourcentages..................................................................................................30
L'chantillonnage
L'chantillonnage est une part importante des statistiques. Elle nous permet de comprendre ce qui se passe dans une population sans avoir interroger chacun des individus. Le principe tant qu'une cuillre suffit pour goter toute la soupe. Pour avoir de bonnes analyses statistiques, il est important de savoir et de comprendre le type d'chantillonnage utilis.
Sommaire
Notions de base
Population Les chantillons chantillon reprsentatif chantillonnage alatoire chantillonnage au hasard simple L'chantillonnage en grappes chantillonnage en strate Conclusion
Notions de base
Population
La population est le groupe que l'on tudie. Par exemple, pour Statistique Canada la population peut tre l'ensemble des canadiens. videmment, la population peut tre un ensemble plus rduit. Pour une enqute sur les travailleurs, la population sera la main-d'oeuvre active : les gens gs de 15 65 ans ce qui exclue les enfants et les retraits. La population est l'ensemble des units qui dfinissent l'objet d'tude. Les units peuvent tre des individus tels que des travailleurs, des patrons, des tudiants, etc. Ils peuvent tre aussi des objets tels que des organisations, des socits ou des quipements. Quelquefois, les microdonnes comportent toute une population, ce qui facilite grandement l'interprtation des donnes. Nous dfinissons la population que nous tudions pour notre travail de recherche ds le dbut de nos travaux dans le cadre opratoire.
Les chantillons
L'chantillon c'est une partie de la population. Peu d'organismes peuvent recueillir des donnes de toute la population. Cela cause des cots levs que suppose une telle opration et que gnralement il y a peu d'intrt le faire. En effet, les statistiques nous permettent de prendre un chantillon et de gnraliser nos mesures toute la population. Nous verrons comment un peu plus loin. Il existe plusieurs manires de faire l'chantillonnage, nous allons tudier quelquesunes d'entre elles.
chantillon reprsentatif
Un chantillonnage reprsentatif est un chantillon qui reproduit les caractristiques d'une population de manire ce que les conclusions obtenues avec cet chantillon se gnralisent la population. En utilisant des microdonnes produites par Statistiques Canada c'est gnralement le cas, mais pas toujours. Le problme vient du fait qu'il faut avoir une liste valable et complte de la population. Malheureusement, ce n'est pas toujours le cas. Par exemple, il n'existe pas de liste complte de travailleurs volant de l'quipement leur usine. Une enqute sur ce sujet ne peut donc pas tre base sur un chantillonnage reprsentatif, la population des voleurs tant discrte. Quand vous utilisez des microdonnes, vrifiez la documentation de l'enqute pour savoir si l'chantillonnage est reprsentatif.
chantillonnage alatoire
Mode d'chantillonnage sur une population qui rpond ces critres : 1. 2. 3. 4. Connaissance de l'ensemble des chantillons; Chaque chantillon a une probabilit connue de slection; Chaque chantillon a une probabilit non nulle de slection; Chaque chantillon est choisi alatoirement.
Une fois ces conditions remplies, les statisticiens pigent au hasard des chantillons. Les mthodes les plus connues sont :
Menu Donnes --> Slectionner des observations, une fentre du mme nom s'ouvre; Slectionnez la case Par chantillonnage alatoire et cliquez sur le bouton chantillon . Une fentre intitule Slectionner des observations : chantillon alatoire ;
crivez le pourcentage d'observations et cliquez sur Poursuivre ; ou : o Cliquez sur Exactement , crivez le nombre d'observations dsires, crivez le nombre exact d'observations que vous avez et cliquez sur Poursuivre ; Cliquez sur OK .
o
L'chantillonnage en grappes
Imaginons que vous fassiez une enqute sur la productivit des travailleurs immigrants. Comme aucune liste de travailleurs n'existe pour votre ville, vous devrez vous promener d'usine en usine pour faire la liste et ensuite faire votre chantillonnage. Cela risque d'tre trs long et trop coteux mme pour Statistique Canada. Pour faire un chantillonnage en grappes, vous pouvez slectionner au hasard des quartiers dans la ville et dans ses quartiers slectionner des usines au hasard et dans les usines slectionner des ateliers au hasard. Si vous manquez d'immigrants au niveau de l'atelier, il se peut que vous soyez oblig de remonter au niveau de l'usine. Dans un monde compltement alatoire, ce mode de fonctionnement est lgitime. Mais on sait que les membres d'une mme famille travaillent ensemble dans la mme usine, ce qui apporte une distorsion statistique importante. Il faut donc se mfier de ce type d'chantillonnage. L'chantillonnage en grappes est un chantillonnage probabiliste reposant sur la slection alatoire de grappes. Une grappe est un ensemble d'units d'une population qu'on constitue l'aide de critres bien dfinis. Il peut s'agir d'un groupe qui existe dans la population (pts de maison, hpital, etc.) ou d'un groupe thorique (ensembles de rues sur une carte, etc.). Si vous lisez le plan d'chantillonnage associ aux microdonnes, on spcifie gnralement ce qu'il faut faire si l'chantillonnage est en grappe.
chantillonnage en strate
Reprenons l'exemple o vous analysez la productivit des travailleurs immigrants. Vous voulez comparer cette productivit celle des travailleurs locaux. Si vous considrez que la population aux fins de votre recherche est celle de tous les travailleurs au Canada, vous devrez recueillir un nombre norme d'observations pour avoir un sous-groupe contenant suffisamment de travailleurs immigrants. Plutt que de faire ce travail de collecte, vous pouvez considrer une population compose de deux groupes, de deux strates et faire l'chantillonnage pour chacune de ces strates. Dans le cas prcdent, nous avons un chantillonnage stratifi disproportionn o les strates de l'chantillon global reprsentent des proportions diffrentes de la population. Avant d'utiliser l'chantillon global, il faut faire un redressement, accorder
chacune des strates un coefficient de pondration en fonction de la proportion qu'elles reprsentent dans la population. Beaucoup d'enqutes sont stratifies. Prenons l'exemple d'une enqute canadienne o l'on veut avoir les rsultats par province. On sait qu'un chantillon de quelques milliers d'individus par province est ncessaire pour avoir une prcision statistique suffisante. Pour le Qubec et l'Ontario, cela reprsente une faible proportion de la population. Mais pour l'le-du-Prince-douard, avec moins de 200 000 habitants, le nombre est important. Pour avoir le rsultat canadien, il faut mettre les rsultats de l'le avec ceux des autres provinces, il faut pondrer les donnes par un facteur 30. On veut viter que les habitants de l'le-du-Prince-douard aient une importance plus grande que ceux du Qubec. Si vous lisez le plan d'chantillonnage associ aux microdonnes on spcifie gnralement ce qu'il faut faire si l'chantillonnage est en strate et comment faire la pondration.
Conclusion
Avant d'utiliser les microdonnes, il importe de lire le plan d'chantillonnage. Celui-ci a un impact direct sur la qualit des donnes et sur leur traitement. Importez toujours un maximum de microdonnes, autant que votre lien Internet et que votre ordinateur peuvent soutenir. Cela augmente la prcision et la valeur de vos travaux de recherche. Si vous chantillonnez des microdonnes, il est important de suivre la mthode d'chantillonnage alatoire, dcrite dans ce texte.
Voir aussi:
Pour estimer la taille des chantillons et les erreurs d'chantillonnage.
Introduction
L'chantillonnage permet de comprendre ce qui se passe dans une population sans avoir interroger chacun des individus. C'est trs pratique et trs conomique. Nous verrons que le plus le nombre d'chantillons est faible plus l'erreur est leve sur les mesures comme la moyenne et les pourcentages. Nous devons valuer ces erreurs.
Rciproquement la prcision de nos mesures, nous pouvons valuer le nombre d'observations ncessaires selon la prcision dsire pour la moyenne ou les pourcentages.
Sommaire
Erreurs d'chantillonnage et erreur type Estimation de l'erreur sur la moyenne Valeur critique Z et redressement selon la taille de la population Exemple, calcul de l'erreur sur la moyenne Estimation de l'erreur sur le pourcentage Exemple de calcul de l'intervalle de confiance du pourcentage d'une population Impact du nombre d'observations Exemple de calcul de la taille de l'chantillon
x = o
s n
Cela signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Pour garantir un rsultat 99 %, il faut se donner une marge d'erreur plus grande. Pour que la moyenne soit fiable 99 %, on augmente notre marge d'erreur : = 5 2,6 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6.
Selon l'intervalle de confiance, l'erreur sur la moyenne Em, se calcule comme suit : E m = Z x N n s =Z N 1 n N n N 1
o E m Erreur sur la moyenne Z x s N n Pondration selon le niveau de confiance Erreur type cart type de l' chantillon Taille de la population Taille de l' chantillon
Remarquez le coefficient Z, il prend les valeurs suivantes selon l'intervalle de confiance dsir : Niveau de confiance (%) Valeurs de Z 90 1,64
95 1,96 99 2,58 Si la taille de la population est plus de 20 fois celle de l'chantillon, on peut ngliger le calcul du radical et la formule s'crit : E m = Z x = Z s n
o E m Erreur sur la moyenne Z x s n Pondration selon le niveau de confiance Erreur type cart type de l' chantillon Taille de l' chantillon
Note : ces formules sont valides pour un minimum de 30 observations. En dessous de ce minimum, la valeur de Z n'est plus fiable. Certains livres de statistiques fournissent une procdure spcialement adapte pour ces cas difficiles traiter. Heureusement, les utilisateurs de microdonnes ont gnralement une abondance d'observations.
N n s N n =Z N 1 n N 1 o pour cet exemple : Em Erreur sur la moyenne E m = Z x Z = 2,58 Pondration selon le niveau de confiance pour 99% x Erreur type s=4 cart type de l' chantillon N = 500 Taille de la population n = 100 Taille de l' chantillon En remplaant les symboles par les valeurs de cet exemple : E m = 2,58 4 100 500 100 = 0.92 500 1
La moyenne de la population s'exprime donc par : = 50 0,92 On peut affirmer que la moyenne de la population se trouve dans l'intervalle 49,08 50,92 avec une confiance de 99 %
Niveau de 90 1,64 95 1,96 99 2,58 L'estimation sur l'erreur de pourcentage se calcule comme suit : p = o p p n N p (100 p ) n N n N 1
Estimation de l' erreur sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon Taille de la population
Cette formule n'est pas assez prcise pour valuer les pourcentages infrieurs 10 %.
p = 75 Pourcentage de l' chantillon n = 200 Taille de l' chantillon N = 800 Taille de la population En remplaant les symboles par des chiffres :
p = 75(100 75) 800 200 = 2,65 200 800 1
On peut affirmer que le pourcentage de travailleurs immigrants de la population se trouve dans l'intervalle 69,81 80,19 avec une confiance de 95 %
Pour nous donner une ide de l'erreur en fonction du nombre d'observations, examinons le tableau suivant, fait pour un intervalle de confiance de 95% : Erreur en % Nombre d'observations 20 24 19
27 18 30 17 33 16 38 15 43 14 49 13 57 12 67 11 79 10 96 9 119 8 150 7 196 6 267 5 384 4 600 3 1067 2 2401 1 9604 Le graphique est tout aussi instructif :
Le graphique et le tableau nous montrent que pour une prcision de 7 % moins de 200 observations suffisent, mais qu'au-del le nombre d'observations ncessaires pour diminuer l'erreur monte trs rapidement. Observez le nombre d'chantillons ncessaires pour abaisser l'erreur de 2 % 1 %.
n=
Donc, un chantillon comprenant 700 personnes est ncessaire pour atteindre les objectifs de prcision.
Conclusion
Avant d'utiliser les microdonnes, il importe de s'informer du plan d'chantillonnage. Celui-ci a un impact direct sur la qualit des donnes et mme sur le traitement des donnes. Importez toujours un maximum de microdonnes, autant que votre lien Internet et que votre ordinateur peuvent le soutenir. Cela augmente la prcision et la valeur de vos travaux de recherche. Si vous chantillonnez des microdonnes, il est important de suivre la mthode d'chantillonnage alatoire, dcrite dans ce texte. Comparaisons statistiques Un chantillon n'est qu'une partie de la population. Comme les observations varient d'un chantillon l'autre au hasard, il y a des diffrences que l'on appelle erreurs d'chantillonnage. Ce qui fait que la valeur des paramtres statistiques comme la moyenne fluctue d'un chantillon l'autre. Ils ne sont connus qu'avec une marge d'erreur. Ainsi, l'estimation de la moyenne d'une population calcule partir d'un chantillon s'exprime comme suit
= X erreur
Zone de vrification de l'hypothse de recherche Vrification bilatrale Prenons le cas hypothtique que l'hypothse nulle de recherche est que la moyenne de la productivit d'un groupe de travailleurs est 5 : H0: = 2,5 l'analyse des rsultats, vous obtenez une moyenne de productivit des travailleurs de 5 units par heure et que l'erreur d'chantillonnage est de 2. Le graphique cidessous illustre la distribution normale de la probabilit de mesure de la moyenne selon les donnes recueillies :
En plein centre du graphique, on observe la moyenne valant 5. La zone colore contient les valeurs possibles qu'elle peut prendre, puisque la moyenne n'est pas connue avec une prcision absolue cause des erreurs d'chantillonnages. Les zones grises aux extrmits correspondent aux zones de rejets de l'hypothse ou rgion critique. C'est la zone ou il y a 5 % des chances que la moyenne mesure soit infrieure 3 ou suprieure 7. Comme notre hypothse nulle est dans la zone de rejet, nous rejetons l'hypothse nulle et acceptons notre hypothse de recherche. Comme il faut vrifier les zones de rejets de chaque extrmit, on dit que l'on doit faire une vrification bilatrale. L'expression anglaise s'crit comme ceci two tailed test . Vrification unilatrale Reprenons l'hypothse nulle prcdente et changeons l pour : Les travailleurs immigrants ont une productivit moyenne suprieure 5 units H0: >6 Dans ce cas, on connat la direction. La vrification est alors unilatrale. L'expression anglaise s'crit comme ceci one tailed test .
Dans cet exemple, la valeur de l'hypothse nulle n'est pas dans la zone de rejet, on ne peut donc pas la rejeter. Ce qui laisse notre hypothse de recherche en suspend. Le niveau signification Aprs avoir tabli votre hypothse, il faut tablir le seuil de signification. cause des erreurs d'chantillonnage, la moyenne d'une population n'est pas connue avec une prcision absolue. cette tape, on dtermine justement la prcision que l'on vise. C'est le seuil de signification, (alpha), la probabilit de commettre une erreur de mesure. Plus le seuil de signification est faible, plus la probabilit qu'on doive rejeter l'hypothse nulle est faible. Niveau de confiance Un niveau de confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %. Gnralement, on tablit le niveau de confiance 95 % et mme 99 %. Dans des circonstances dfavorables, on se contente d'un niveau de 90 %. Par exemple, la moyenne suivante pourrait tre fiable 95 % =52
Ce qui signifie qu'il y a 95 % des chances que la moyenne de la population soit entre 3 et 7. Par contre, la fiabilit 99 % serait la suivante : = 5 2,6 Il y a 99 % des chances que la moyenne de la population serait entre 2,4 et 7,6
Comparer les observations la population ou une hypothse Aprs avoir recueilli un chantillon de donnes et fait les analyses statistiques de base, on dsire comparer l'chantillon la population ou le confronter l'hypothse de recherche. Cette comparaison permet d'tablir si les observations sont statistiquement diffrentes de la population. Par exemple, si on recueille des donnes sur les travailleurs immigrants, ce qui forme un groupe, et les comparer la population canadienne pour tudier s'ils sont plus productifs. Ces comparaisons peuvent demander une connaissance assez prcise de la moyenne ou d'autres compilations statistiques de la population. Gnralement les sites de microdonnes, offrent des compilations statistiques sous forme de tableaux de donnes.
Pour bien comprendre les concepts que nous utilisons, nous vous suggrons de lire les explications sur l'chantillonnage et l'introduction sur les comparaisons statistiques.
Avertissements
Ces explications ne sont valides que pour des donnes respectant la distribution normale. Nous conseillons d'utiliser les formules et mthodes que nous dcrivons seulement si vous avez plus de trente observations dans votre chantillon. Avec moins de trente observations, vous devez utiliser d'autres techniques statistiques. Comme cela se produit rarement avec les microdonnes, nous ne traitons pas de ces cas difficiles ici. Advenant le cas o vous russissez obtenir toutes les observations de votre population, vous n'avez pas d'erreurs d'chantillonnage, vous avez la mesure exacte. Vous n'avez pas donc pas faire les calculs de cette page.
Sommaire
Comparaison de la moyenne d'un groupe avec la population Formules mathmatiques Seuil de signification Exemple Comparaison de la moyenne en utilisant un logiciel Procdure de calcul dans SPSS Interprtation des rsultats Procdure pour les pourcentages Comparaison du pourcentage d'un groupe la population Formules mathmatiques Exemple Procdure SPSS pour les pourcentages
Formules mathmatiques
Comparaison de la moyenne d'un groupe la population
Le rejet ou l'acceptation d'une hypothse de recherche base sur la moyenne de la population demande l'valuation de la moyenne et de l'cart-type de l'chantillon. Une fois ces informations obtenues, on value la valeur critique Z..Cette valeur nous indique si les moyennes, de l'chantillon et de la population (ou de votre hypothse), sont statistiquement diffrentes. Z est l'cart entre la moyenne de l'chantillon et la moyenne de la population que l'on pondre par l'erreur type de l'chantillon. Plus la valeur de Z est leve, plus il est probable que les moyennes de la population et de celle de votre hypothse sont statistiquement diffrentes. Le calcul de Z est relativement simple :
Z= o Z X X
X X Facteur critique Moyenne de l' chantillon Moyenne selon l' hypothse nulle Erreur type de l' chantillon
Seuil de signification
C'est Z qui nous dit si les moyennes sont statistiquement diffrentes et si l'on doit rejeter ou accepter notre hypothse : Bilatral 2,58 1.96 1.64 Unilatral 2,33 1.64 1.28 On rejette l'hypothse si la valeur absolue de la valeur de Z dpasse celle du tableau ci-dessus selon que la vrification est bilatrale ou unilatrale. Certains prfrent utiliser l'expression Seuil de signification , il est gal 100 moins le Niveau de confiance . Donc, une confiance 95 % correspond un seuil de signification de 5 %. L'inverse est vrai, un seuil de signification de 1 % correspond un niveau de confiance de 99 %. Si le calcul de Z donne 2,25 et que je veux vrifier 95% de confiance si la moyenne de mon chantillon diffre de celle de la population, je consulte le tableau ci-dessus. Selon le tableau, la valeur minimum de Z est 1,96. Comme je dpasse cette valeur, ma moyenne diffre donc de manire certaine. Observez que je ne peux tre certain 99 % puisque Z devrait valoir au minimum 2,58.
Exemple
Comparaison de la moyenne d'un groupe la population
Refaisons l'exemple en suivant les tapes de recherche :
4 Calcul de Z
Aprs avoir recueilli les informations, on calcule la moyenne et l'cart-type de l'chantillon pour faire l'valuation de la valeur critique Z . Supposons que la moyenne de l'chantillon vaut 7, que l'cart-type vaut 8 et que l'effectif est de 100, nous pouvons faire le calcul : Commenons par calculer l'erreur type :
x = o x s =8
x =
8 = 0,8 100
On peut maintenant calculer Z : Z= o Z X =7 =5 X = 0,8 X X Facteur critique Moyenne de l' chantillon Moyenne selon l' hypothse nulle cart type de l' chantillon
En remplaant les symboles par les valeurs de cet exemple : Z= 75 = 2,5 0,8
p = o p p n
p(100 p ) n Estimation de l' erreur type sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon
Une fois que la valeur de Z est dtermine, l'acceptation ou le rejet de l'hypothse nulle se fait selon la mme logique que pour la moyenne.
Exemple
Pour la comparaison du pourcentage d'un groupe la population
4 Calcul de Z
Aprs avoir recueilli les informations, on doit calculer le pourcentage de bilinguisme dans notre chantillon et le nombre de participants. Supposons que nous obtenons 80 % de bilingue et que nous avons 200 participants.
Commenons par le calcul de p : p = o p p = 80 n = 200 p (100 p ) n Estimation de l' erreur type sur le pourcentage Pourcentage de l' chantillon Taille de l' chantillon
Z=
80 75 = 1,77 2,83
Comparaison de la moyenne d'un groupe avec celle d'une population avec un logiciel
Logiciel utilis : SPSS version 10 en franais Entrez vos donnes dans SPSS. Les donnes utilises dans cette exemple sont fictives. Pour suivre cet exemple, tlchargez les donnes dans l'un des deux formats suivants : SPSS (prfrable) ou ASCII (difficile).
Menu Analyse --> Comparer les moyennes --> Test T pour chantillon uniqu Une fentre du mme nom s'ouvre. En utilisant les flches en forme de triangles, placez la variable Productivit des travailleurs dans la bote Variables tester . crivez dans la case Valeur de test le chiffre 5. C'est la valeur contre laquelle la moyenne de la variable Productivit des travailleurs est teste.
Si vous cliquez sur le bouton Option , vous pouvez choisir l'intervalle de confiance :
La variable Productivit des travailleurs a un effectif de 22 observations, une moyenne de 7 et un cart-type de 2,16 et l'erreur standard que nous appelons Erreur type vaut 0,65;
Avec ces donnes, SPSS calcule les rponses pour notre analyse :
On remarque en haut du tableau le titre : Test sur chantillon unique. Il est important de remarquer en dessous le titre de l'analyse Valeur du test = 5 . C'est--dire que l'on compare notre chantillon avec la valeur de notre hypothse 5.
t = 3.086 : valeur critique Z, SPSS utilise le nom t au lieu de Z . Statistique utilise pour tester l'hypothse nulle selon laquelle deux populations ont la mme moyenne; ddl = 21 : degr de libert. Se calcule en soustrayant du nombre d'observations, 22 dans ce cas, le nombre de paramtres, 1 dans ce cas; Sig. (bilatrale) = 0,006. Le niveau de signification ou en d'autres mots la probabilit d'obtenir ce rsultat par hasard. Si le niveau de signification est trs petit, moins de 0,05, on rejette l'hypothse nulle. En d'autres termes, un niveau de signification faible indique que les rsultats ne sont probablement pas dus au hasard. Dans notre cas la probabilit est de 0,006, il y a donc 0,6 % de chance d'obtenir ce rsultat par hasard. Nos donnes tablissent clairement que les travailleurs immigrants ont une moyenne diffrente de 5.
Diffrence moyenne = 2. C'est la diffrence entre la moyenne de nos observations, 7 dans notre cas, et 5 la valeur de test que nous avons crit au dbut du test; Intervalle de confiance 95 % de la diffrence. Intervalle bas sur les diffrences entre les moyennes des chantillons. Si l'intervalle calcul par SPSS ne contient pas 0, la diffrence entre la moyenne de notre chantillon et celle de l'hypothse prsente une diffrence assez importante pour rejeter l'hypothse nulle : o Infrieur = 0,65. Borne infrieure de l'intervalle; o Suprieur = 3,35. Borne suprieure de l'intervalle.
Raliser un questionnaire
1. Raliser une enqute de terrain consiste interroger la clientle cible au moyen d'un questionnaire. Ce travail consiste : 1) Choisir un chantillon de personnes questionner. 2) Dfinir le type de questions poser : questions fermes, ouvertes, 3) Structurer le questionnaire. 4) Dterminer l'endroit o doit se drouler l'enqute (dans la rue, par courrier, sur internet, ). 5) Raliser l'enqute : choix de la date, des interviewer, etc... 6) Organiser la saisie et traiter les rsultats : tris plat, tris croiss, moyennes.
Pour des raisons de temps et de cots, il est quasiment impossible d'interroger tous les clients potentiels prsents sur une zone d'enqute (recensement). Le porteur de projet doit donc calculer et dterminer un chantillon reprsentatif de la population tudier.
Dans cet exemple, l'enquteur (qui est gnralement le porteur de projet) devra interroger 192 hommes et 208 femmes, et suivre, en fonction des objectifs qu'il s'est fixs, les autres cls de rpartition, afin de "coller" la population cible.
Un conseil : ne pas multiplier les critres de segmentation, ce qui pourrait rendre l'enqute ingrable sur le terrain.
L'chantillonnage en grappes
le contenu du questionnaire
Les rgles de base respecter
Ne jamais oublier les objectifs atteindre : quelles sont les informations accumuler ? A quoi vont-elles servir ? Ce sont les objectifs qui guident la rdaction du questionnaire. Toujours proposer des questions courtes, facilement comprhensibles de tous. Relire et faire relire le questionnaire : les questions doivent se suivre et s'enchaner sans problme. Un questionnaire structur permettra aux sonds de rpondre plus spontanment.
Inutile de rdiger un long questionnaire : l'interview se lassera trs vite et y mettra fin prmaturment ou rpondra sans forcment rflchir pour se dbarrasser d'un exercice devenu ennuyeux. Au sein d'un questionnaire, le choix du type de questions aura galement une incidence sur les rsultats de l'enqute. Voici les types les plus courants :
Type d'interrogation La question ferme choix unique Exemple : - Quel ge avez-vous ? - Possdez vous un ordinateur ? oui non La question ferme choix multiples Exemple : Comment avez-vous connu le site de l'APCE ? - par un moteur de recherche - par un organisme de conseil & d'accompagnement - par la presse La question ouverte Elle laisse la libre parole l'interview. Exemple : Que pensez-vous de l'installation d'une suprette dans le quartier ? Les chelles Elles mesurent, l'aide d'un rapport de grandeur, l'avis ou l'attente du sond sur certains points prcis de la satisfaction d'un service ou produit. Exemple : Dans quelle mesure tes-vous satisfait des services de votre garagiste ? |10 |9 |8 |7 |6 |5 |4 - Spontanit des rponses recueillies. - Richesse des contenus. - Difficile dpouiller et analyser les rsultats. - Risque d'un grand nombre de nonrponses. - Simplicit de traitement et de dpouillement. Avantages - Rapidit d'administration. - Simplicit de traitement. Inconvnients
- Influence les personnes interroges par des rponses proposes. - Difficile pour le sond de mmoriser une longue liste d'lments. Les propositions cites en dbut ou en fin de liste sont souvent choisies par dpit, ou bien la question n'obtient pas de rponse.
- Quelquefois difficile mettre en place. - Risque de retrouver des mesures mdianes pour les indcis sur une chelle compose d'un nombre impair de graduation.
La structuration du questionnaire Quelques rgles garder l'esprit : Plus le questionnaire sera long, plus il sera difficile de trouver un nombre important de personnes qui accepteront d'y rpondre. L'ordre des questions agit sur le rsultat de l'enqute. Il est donc ncessaire de structurer le questionnaire en utilisant notamment "la mthode de l'entonnoir", qui consiste : - dans un premier temps poser des questions d'ordre gnral, - puis, peu peu, aboutir des questions prcises, voire trs personnelles. Toujours remercier l'interview pour sa participation l'enqute. Insrer si possible une "question de contrle" permettant de vrifier le srieux ou la cohrence des rponses du sond, en l'interrogeant sur un sujet dj abord plus tt dans le questionnaire. Enfin, pour gagner en rapidit de saisie des rponses lors du traitement du questionnaire, numroter chaque question (Q1, Q2, ) et codifier les rponses. Exemple : On n'indiquera pas : Question 6 Consommez vous du pain ? : - si la rponse est oui, question suivante, - si la rponse est non, passer la question n 20 Mais : Q6 Consommez vous du pain ? a : Oui ==> Q7 b : Non ==> Q20 L'intervieweur entourera la rponse a ou b. Pour les questions ouvertes, leurs rponses seront codifier aprs l'administration du questionnaire.
Attention ! Tout questionnaire doit tre pralablement test auprs d'une petite partie de l'chantillon. Ce test en grandeur nature permet de reprer des incohrences dans le contenu et dans le "droul" du questionnaire. Les premires analyses des rponses peuvent galement mettre l'accent sur des problmes bien plus profonds : un mauvais ciblage de l'chantillon, l'utilisation d'une liste obsolte, un lieu inadapt pour administrer le questionnaire, Il vaut mieux se rendre compte d'une erreur au moment du test qu'au dpouillement final de l'enqute.
L'administration du questionnaire
Le type d'administration du questionnaire dpend de plusieurs facteurs : du type d'enqute, de la qualit et du nombre de personnes interroges, des informations releves, mais aussi et surtout du cot (on y revient toujours). Il est donc conseill de chiffrer le plus finement possible ces besoins techniques et humains.
C'est le type d'enqute le plus utilis. Ralis dans la rue, au domicile des sonds, etc., il permet de toucher directement le cur de la population cible. Il prsente galement l'avantage de recueillir les ractions et commentaires effectus par les interviews. Par contre, il ncessite de runir et de former une quipe plus importante qui doit tre disponible pendant un laps de temps plus ou moins long (une journe, une semaine,). Les cots de formation et d'immobilisation de ces enquteurs peuvent considrablement alourdir le budget de l'tude. On peut naturellement tre tent d'administrer seul son questionnaire sur un lieu de passage important situ proximit de son futur emplacement. Dans ce cas, il faut absolument vrifier que les sonds interrogs correspondent vritablement la cible recherche et s'obliger ne pas influer sur les rponses...
Le face face
C'est une mthode d'administration rapide et conomique. Toutefois plusieurs cueils peuvent rendre difficile la collecte des informations : - la liste des numros de tlphone des interviews est rarement jour, Les enqutes - en moyenne, plusieurs appels au mme numro seront ncessaires pour par contacter l'interlocuteur, tlphone - le nombre de "non rponses" : pour un sond, Il est plus facile de mettre fin au questionnaire au tlphone qu'en face face : "Je n'ai pas le temps de vous rpondre". Il sera donc important de raliser un questionnaire bref compos de questions courtes. Tout comme l'enqute tlphonique, l'enqute par courrier runit un cot attrayant et une simplicit de mise en place. Nanmoins, les taux de retour sont en gnral trs faibles (pas plus de 5 % dans certains cas). Il faut donc : Les enqutes prvoir une enveloppe T ou une enveloppe pr-timbre afin de faciliter le retour des questionnaires remplis, par voie rdiger un questionnaire compos de questions courtes et simples. postale Il est galement courant de motiver les interviews en leur proposant de participer un jeu par tirage au sort. Celui-ci est rserv aux seuls individus acceptant de rpondre au questionnaire.
Ces dernires annes, les enqutes en ligne ont pris une place de plus en plus importante sur le rseau. Il est vrai que cette formule rassemble de nombreux avantages : - le questionnaire est disponible auprs d'un nombre important de sonds simultanment partout dans le monde et tout moment du jour et de la nuit, - le traitement des rsultats (tris plat) peut tre ralis quasiment en temps rel, - le cot d'une telle enqute est trs attractif. Les enqutes Cependant, ces atouts ne doivent pas occulter que tout le monde n'est pas quip d'une connexion internet et que l'tude d'un march ne revt pas simplement une par internet porte nationale ou internationale. Bien souvent l'objectif d'un porteur de projet consistera acqurir des connaissances sur les attitudes de consommateurs voluant sur un march dont la zone gographique est locale voire rgionale. A visiter, deux sites (liste non exhaustive) spcialiss dans les tudes par internet : www.creatests.com www.opremys.net
Le traitement du questionnaire
Une fois les questionnaires remplis, un autre processus doit tre entam : le dpouillement des rsultats. Avant de se lancer dans ce long travail de saisie et d'analyse, il est fortement conseill de :
boulangerie situe rue de la Rpublique ?" , les interviews ont rpondus "franchement pas terrible" - "moyen" - "bon" - "passable" - "pas assez cuit" "immangeable", etc. Si les qualificatifs sont trs nombreux et diffrents, il est impossible de faire ressortir des ides phares. "Immangeable" et "pas terrible" pourrait donc tre regroups sous l'ide de "mauvaise qualit". Il est prfrable d'effectuer cet exercice plusieurs afin d'viter les interprtations "partisanes".
Les tris croiss : il s'agit de runir sous un mme tableau le croisement des rsultats de deux variables ou plus. Le choix de croiser les rsultats d'une question une autre est motiv par l'analyse et la connaissance plus fine des rponses des personnes interroges. Attention la multiplication des tris croiss allonge le temps d'analyse des rsultats.
Exemple : Les rsultats des questions Q.1 et Q.20 sont croiss : Q.1 "Achetez vous du pain ?" a. Oui b. Non Q.20 "Quel est votre catgorie socioprofessionnelle ?" a. Agriculteurs exploitants b. Artisans, commerants, Chefs d'entreprise c. Cadres d. Professions intermdiaires e. Employs f. Ouvriers
Sur certaines questions ouvertes rpertoriant des informations chiffres, il est souvent ncessaire de faire ressortir les rsultats sous la forme de moyennes. C'est particulirement le cas lors de l'analyse de donnes portant sur l'ge de la population interroge, l'estimation du prix d'un produit ou d'un service, Une fois les rsultats de l'enqute connus et runis sous la forme de tableaux, le porteur de projet va devoir extraire les lments phares en rdigeant un rapport d'tude.