Documente Academic
Documente Profesional
Documente Cultură
Intervalles de fluctuation,estimation
Objectifs de la squence
Dans
Dans
Sommaire
1. Pr-requis
2. Intervalles de fluctuation
3. Estimation
4. Synthse de la squence
5. Exercices de synthse
Squence 9 MA01
1 Pr-requis
chantillonnage
En statistiques, un chantillon de taille n est la liste des n rsultats obtenus par
n rptitions indpendantes de la mme exprience alatoire. Ici lexprience
rpte est une preuve de Bernoulli, cest--dire quelle ne prend que deux
valeurs : chec / russite, oui / non, homme / femme, 0 / 1
Par exemple, un chantillon de taille 100 du lancer dune pice dans lequel on
compte le nombre de fois o on obtient Pile est la liste des rsultats obtenus en
lanant effectivement 100 fois la pice.
Le nombre de russites dans un chantillon de taille n suit la loi binomiale
(n ; p ).
On appelle f la frquence du nombre de russites dans lchantillon.
Dfinition
Un intervalle de uctuation au seuil de 95%, relatif aux chantillons de taille
On a vu en Seconde que :
Lintervalle p 1 ; p + 1 est un intervalle de uctuation approch au
n
n
;p+
p
n
n
comprises entre 0,2 et 0,8 et des chantillons de taille n suprieure ou gale 25.
Squence 9 MA01
Remarque
Remarque
Exercice
;p+
p
.
n
n
Prise de dcision
On a dcouvert une pice ancienne et on se demande si elle est bien quilibre.
Comment faire ?
On lance n fois la pice et on note la frquence f dapparition de Pile.
On dtermine un intervalle de fluctuation I n au seuil de 95%, de la frquence
dapparition de Pile dans des chantillons de taille n.
Squence 9 MA01
Rgle de dcision : si f appartient lintervalle I n , on dcide que la pice est quilibre, si f nappartient pas lintervalle I n on dcide que la pice nest pas quilibre.
Dans chacun des deux cas suivants, quelle est la dcision prise ?
n = 100 et f = 0,56
n = 1000 et f = 0,560.
Squence 9 MA01
2 Intervalles de fluctuation
A
Objectifs du chapitre
Quand on ralise une exprience alatoire, on observe bien sr que les rsultats
obtenus ne sont pas toujours les mmes, cest la fluctuation dchantillonnage.
Mais on observe aussi que, plus on rpte une exprience un grand nombre de
fois, plus la rgularit de la frquence des rsultats est grande.
On dfinit les intervalles de fluctuation asymptotique et on en donne un exemple.
On peut alors dcider si on considre que des rsultats obtenus lors dune exprience sont dus au hasard (cest--dire la fluctuation dchantillonnage), ou
si on considre quils sont statistiquement significatifs dune diffrence avec le
modle choisi.
B
Activit 1
Pour dbuter
Sur le tableur Open Office, on a simul 100 chantillons de n lancers dun d
ttradrique bien quilibr.
On a dtermin les frquences o la face marque 1 est la face cache ( p = 0,25),
elles sont indiques en ordonnes sur le graphique.
Dans chacun des trois cas, dterminer :
Le pourcentage des frquences appartenant lintervalle p 1 ; p + 1 ,
p (1 p )
p (1 p )
; p + 1,96
p 1,96
.
n
n
Squence 9 MA01
Premier cas
n = 50
p = 0,25
40
60
0,35
frquence
0,3
0,25
0,2
0,15
0,1
0,05
0
0
20
80
100
Deuxime cas
frquence
0,4
p = 0,25
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0
20
40
60
80
100
Squence 9 MA01
Troisime cas
frquence
0,35
p = 0,25
0,3
0,25
0,2
0,15
0,1
0,05
0
0
20
40
60
80
100
Cours
1. Intervalles de fluctuation asymptotique
Dans ce qui suit, on considre des variables alatoires X n suivant chacune une
loi binomiale (n ; p ).
(exemple : on lance n fois une pice quilibre, X n est le nombre de Pile obtenus, X n suit la loi (n ; 0,5)).
X
La variable alatoire Fn = n donne donc la frquence du nombre de sucn
cs (attention : il sagit dune utilisation du mot frquence diffrente de ce qui
est fait en statistique lorsquon parle de frquence dun caractre, ici la frquence
est une variable alatoire).
Squence 9 MA01
Proprit 1
X
La variable alatoire Fn = n :
n
n
1
2
prend n + 1 valeurs : 0, , , ...,
;
n n
n
X
a pour esprance le nombre p : E n = p .
n
Dmonstration
X
Un intervalle de fluctuation asymptotique de la variable alatoire Fn = n
n
au seuil de 95 % , est un intervalle dtermin partir de p et de n et qui
contient Fn avec une probabilit dautant plus proche de 95 % que n est
grand.
Exemple 1
1
1
X
fluctuation asymptotique de la variable alatoire Fn = n au seuil de 95%. En
n
classe de seconde, ceci a t nonc sous forme simplifie, le caractre asymptotique ne pouvant pas tre introduit. Des exemples dutilisation ont t donns
dans les pr-requis.
Squence 9 MA01
p (1 p )
p (1 p )
Lintervalle I n = p 1,96
; p + 1,96
est un intervalle
n
n
X
de uctuation asymptotique de la variable alatoire Fn = n au seuil de
n
95%.
Dans lactivit 1, on a pu faire des observations cohrentes avec ces rsultats. Mais, la dfinition dun intervalle de fluctuation est exprime avec une
probabilit. Si vous faites dautres simulations avec le fichier qui est sur le
site, il se peut que quelques observations donnent des pourcentages ventuellement infrieurs 95%.
Remarque
Remarque
Conditions dutilisation
Les exigences habituelles de prcision pour utiliser cette approximation
sont : n 30, np 5 et n (1 p ) 5.
Exemple 2
n = 100 et p = 0,5.
Solution
10
Squence 9 MA01
0,5 0,5
0,5 0,5
I100 = 0,5 1,96
; 0,5 + 1,96
soit [ 0,402 ; 0,598 ].
100
100
Cet exemple modlise 100 lancers dune pice quilibre. On peut donc dire que,
pour environ 95 % des sries de 100 lancers, la frquence du nombre de Pile
obtenus se situe dans lintervalle [ 0,402 ; 0,598 ].
Remarque
X
Fn = n avec une probabilit dautant plus proche de 0,95 que n est grand.
n
Lintervalle I n contient donc environ 95% des frquences observes dans les
chantillons de taille n sufsamment grande. Des frquences (environ 5%) de
certains chantillons ne sont pas dans I n , cest la uctuation dchantillonnage.
En fonction de lappartenance ou non de la frquence observe f lintervalle
11
Remarque
de 95%.
Le technicien va-t-il modifier le rglage de la machine ?
Quelle aurait t sa dcision sil y avait eu 21 succs sur 200 jeux ?
Solution
On a f =
9
0,106.
85
0,06 0,94
0,06 0,94 Comme 0,009 est une
; p + 1,96
0,06 1,96
.
85
85
0,06 0,94
et 0,111 est une
85
0,06 0,94
, alors [ 0,009 ; 0,111]
85
0,06 0,94
0,06 0,94
; 0,06 + 1,96
et [ 0,009 ; 0,111]
contient 0,06 1,96
85
85
est donc un intervalle de fluctuation lgrement plus large que celui du cours.
12
Squence 9 MA01
200
p (1 p )
n
1
1
;p+
p
n
n
p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
.
n
n
1
est vrifie (la fonction poly4
2
nme du second degr p p (1 p ) = p + p admet un maximum car le coef-
1
et il vaut donc
2
1 1 1
1 = ).
2 2 4
On en dduit que 1,96 p (1 p ) 1,96
1
1.
4
Squence 9 MA01
13
On obtient :
p (1 p )
p (1 p )
1
1
.
p 1,96
p + 1,96
p+
n
n
n
n
1
1
X
1
1
X
entrane que P n I n P p
.
n p+
n
n
n
n
1
1
;p+
Donc lintervalle p
contient Fn avec une probabilit supn
n
;p+
Donc lintervalle p
contient Fn avec une probabilit dautant
n
n
Conclusion
1
1
Lintervalle p
;p+
est bien un intervalle de uctuation asymptotique
n
n
D
Exercice 1
Exercices dapprentissage
(daprs ressources Education nationale)
Les enfants sont dits prmaturs lorsque la dure gestationnelle est infrieure
ou gale 259 jours. La proportion de ces naissances est de 6%. Des chercheurs
suggrent que les femmes ayant eu un travail pnible pendant leur grossesse
sont plus susceptibles davoir un enfant prmatur que les autres. Il est dcid
de raliser une enqute auprs dun chantillon alatoire de 400 naissances correspondant des femmes ayant eu pendant leur grossesse un travail pnible. Les
chercheurs dcident a priori que si la proportion denfants ns prmaturs dans
cet chantillon est suprieure la borne suprieure dun intervalle de fluctuation
asymptotique au seuil de 0,95 alors leur hypothse sera accepte. Finalement le
nombre denfants prmaturs est de 50. Quelle est donc la conclusion ?
14
Squence 9 MA01
Exercice 2
dans le monde ?
Exercice 3
On
souhaite
utiliser
lintervalle
de
fluctuation
asymptotique
p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
.
n
n
dutilisation : n 30, np 5 et n (1 p ) 5.
Dterminer ensuite la plus petite valeur de n pour laquelle lamplitude de
Squence 9 MA01
15
3 Estimation
A
Objectifs du chapitre
On souhaite connatre dans une population, la valeur dune proportion p (proportion des pices dfectueuses parmi les pices fabriques par une usine, proportion des gauchers en France, intentions de vote pour un rfrendum, )
Pour des raisons matrielles, financires ou autres (par exemple, on ne peut pas
tester le bon fonctionnement de toutes les allumettes dune production car dans
ce cas tester une allumette amne la dtruire !), on ne peut pas toujours runir
les donnes concernant la population tout entire.
On va donc estimer la proportion p que lon cherche partir de la frquence f
observe dans un chantillon.
Mais on sait que cette frquence observe va varier dun chantillon lautre,
cest la fluctuation dchantillonnage autour de p.
Il est donc ncessaire de tenir compte de cette fluctuation en donnant un rsultat
sous forme dun intervalle, appel intervalle de confiance en prcisant aussi le
niveau de confiance que lon accorde cette rponse.
Dans ce chapitre, on montre comment on peut dterminer un intervalle de
confiance au niveau 0,95.
Cet intervalle dpendant de la taille de lchantillon, on dtermine la taille de
lchantillon qui est suffisante pour obtenir une prcision donne (qui dpend
de lamplitude de lintervalle de confiance), le niveau de confiance tant toujours
0,95.
Pour dbuter
Dans ce chapitre, on montrera comment rpondre des questions analogues
celles qui suivent.
On considre une urne contenant un trs grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche
estimer p partir dun chantillon de taille n.
On effectue 100 tirages successifs avec remise et on obtient 71 billes noires et
29 billes blanches, combien peut-on estimer p ?
Mme question sachant quon a effectu 1000 tirages et obtenu 693 billes
noires et 307 billes blanches.
16
Squence 9 MA01
Cours
1. Rsultat prliminaire
Dmontrer que, pour tous rels x et y et pour tout rel r positif, on a :
x r y x +r y r x y +r .
Solution
x r y x y + r
x r y x +r
y r x y +r .
y x + r
y r x
Remarque
La double ingalit x r y x + r quivaut r y x r qui signifie que lcart entre les deux nombres x et y est compris entre r et r, les
deux nombres x et y jouant le mme rle.
2. Exemple de rfrence
Avant daborder les dfinitions et les proprits bien mises en forme mais un peu
difficiles au premier abord, nous allons tudier un exemple.
On considre une urne contenant un trs grand nombre de petites billes de couleur blanche ou noire, la proportion p de billes noires est inconnue. On cherche
estimer p partir dun chantillon de taille n.
La probabilit dobtenir une bille noire quand on fait un tirage au hasard est
gale la proportion p.
On sait donc que, parmi tous les chantillons de taille n quon peut obtenir, environ 95% dentre eux ont une frquence f qui appartient lintervalle de fluctuation p 1 ; p + 1 . Le rsultat prliminaire du prouve que :
n
n
1
1
1
1
ce qui permet de dduire que :
f p +
f
p f +
p
n
n
n
n
1
1
1
1 est quivalent
" p f
;f +
"f p
;p+
"
n
n
n
n
".
Donc, parmi tous les chantillons de taille n quon peut obtenir, environ 95%
1
1
;f +
sont tels que lintervalle associ f
contient le nombre p que
n
n
Squence 9 MA01
17
;f +
f
.
n
n
1
1
1
1
niveau 0,95.
Exemple 4
noires.
Solution
1
1
lintervalle 0,71
; 0,71+
, soit [ 0,61; 0,81].
100
100
1
1
;f +
est
n
n
Un
intervalle
de
confiance
au
niveau
95%
est
donc
1
1
; 0,693 +
0,693
.
1000
1000
Pour donner un intervalle dont les bornes sont des nombres dcimaux ayant trois
chiffres aprs la virgule, on dtermine une valeur approche par excs de la borne
de droite et une valeur approche par dfaut de la borne de gauche : on obtient
[0,661; 0,725].
La proportion de billes noires est estime 0,693 avec lintervalle de confiance
de [ 0,661; 0,725] au niveau 0,95.
1
1
;f +
Une fois lchantillon ralis, lintervalle f
est dtermin et il
n
n
18
Squence 9 MA01
(de mme quand on a lanc une pice, on a obtenu Pile ou on a obtenu Face).
Cest pourquoi on ne sexprime plus en termes de probabilit. Pour exprimer
lide quon a obtenu un intervalle et quenviron 95% des intervalles quon peut
obtenir ainsi contiennent la proportion cherche, on a choisi le mot confiance .
3. Dfinition
Comme dans le chapitre prcdent, on considre une suite de variables alatoires
on lance n fois une pice et X n est le nombre de Pile obtenus). La variable alaX
toire Fn = n donne donc la frquence du nombre de succs .
n
On dit quun intervalle est alatoire lorsque ses bornes sont dfinies par des
variables alatoires.
La ralisation dun intervalle alatoire est lintervalle obtenu aprs avoir ralis lexprience alatoire (aprs avoir lanc 500 fois une pice, interrog 1000 personnes).
Dfinition 2
Un intervalle de confiance pour une proportion p un niveau de
confiance 95% est la ralisation, partir dun chantillon, dun intervalle alatoire contenant la proportion p avec une probabilit suprieure
ou gale 95%.
Proprit 2 admise
1
1
; Fn +
Pour une valeur de p fixe, lintervalle alatoire Fn
n
n
;f +
f
avec un niveau de confiance dau moins 0,95, o f dsigne
n
n
Squence 9 MA01
19
A savoir
On se place dans le cas o lchantillon contient au moins 30 lments, n 30. Si la frquence f observe est telle que nf 5 et
;f +
valle f
est un intervalle de confiance au niveau 0,95
n
n
pour la proportion p.
Cet intervalle est aussi appel fourchette de sondage .
4. Taille de lchantillon pour obtenir une prcision donne au niveau de confiance 0,95
La prcision de lestimation est donne par lamplitude de lintervalle
1
1 qui est gale
;f +
f
n
n
lchantillon.
20
Prcision a
0,06
0,04
0,02
0,01
1112
2500
10000
40000
Squence 9 MA01
Les sondages sont souvent faits avec des chantillons denviron 1000 personnes,
la prcision obtenue est donc denviron 0,06.
Ainsi, questionner 1112 personnes suffit pour avoir une fourchette de sondage
damplitude 0,06, quil sagisse dun sondage pour un rfrendum local concernant 100000 lecteurs ou pour le deuxime tour dune lection prsidentielle
concernant 35 millions dlecteurs.
Il faut bien sr savoir cela quand on reoit des informations o les sondages sont
un lment important.
Dans cet exercice, la population est suffisamment grande pour que les sondages
soient assimils des tirages avec remise. On ne tient compte que des rponses
exprimes, cest--dire quon ne tient pas compte des prvisions dabstentions
ou des intentions de vote nul. Les sondages sont faits auprs de 1112 personnes.
Au deuxime tour de llection prsidentielle, le dernier sondage de linstitut A
indique 52,5% dintentions de vote pour le candidat X et 47,5% pour le candidat Y.
Linstitut B indique 50,5% dintentions de vote pour le candidat X et 49,5%
pour le candidat Y.
Y-a-t-il une contradiction entre les rsultats de ces deux instituts de sondage ?
Le candidat X peut-il tre totalement rassur ?
Solution
1
1
;f +
n
n
obtenu partir des rsultats de linstitut A qui donne f = 0,525 pour le candidat
X est environ gal [ 0,495 ; 0,555]. En utilisant les rsultats de linstitut B qui
donne f = 0,505, on obtient environ [ 0,475 ; 0,535]. Les deux fourchettes de
sondage ont une partie commune, donc les rsultats de ces deux instituts de
sondage ne sont pas en contradiction.
Le candidat X ne peut pas tre totalement rassur car les deux fourchettes de
6. Simulation
Pour mieux voir ce quest un intervalle de confiance, une fourchette de sondage,
on a ralis 20 sries de 200 tirages de 0 et de 1 au hasard.
Squence 9 MA01
21
On constate ici que 19 dentre eux contiennent p = 0,5 qui est la proportion
relle dans cet exemple de tirage au hasard. Un seul intervalle ne contient pas
p = 0,5.
Dans dautres simulations, on peut bien sr trouver plusieurs intervalles de
confiance qui ne contiennent pas p ou aucun.
Quand on veut estimer une proportion, on utilise un seul intervalle de confiance.
La simulation permet de voir quenviron 95% des intervalles de confiance
contiennent p.
22
Squence 9 MA01
intervalle de confiance qui est utilis dans certains cas. On ne le justifiera pas ici.
D
Exercice 4
Exercices dapprentissage
Une usine vient dinstaller une chane de fabrication pour fabriquer une nou-
en trouve 9 dfectueuses.
Dterminer lintervalle de confiance correspondant.
Conclure.
Exercice 5
Dans une grande ville, un nouveau cinma va tre construit. La municipalit propose un terrain proximit du centre ancien.
Un premier sondage est effectu auprs de 100 personnes choisies de faon
alatoire et indique 53 avis favorables. Peut-on dire que la majorit de la population est favorable cet emplacement ?
Un deuxime sondage effectu auprs de 500 personnes indique la mme
Squence 9 MA01
23
4 Synthse de la squence
Intervalle de fluctuation asymptotique
Dfinition
Un intervalle de fluctuation asymptotique de la variable alatoire
X
Fn = n au seuil de 95% est un intervalle dtermin partir de p et de
n
n et qui contient Fn avec une probabilit dautant plus proche de 95% que
n est grand.
p (1 p )
p (1 p )
I n = p 1,96
; p + 1,96
est un intervalle de
n
n
Conditions dutilisation
Les exigences habituelles de prcision pour utiliser cette approximation sont :
n 30, np 5 et n (1 p ) 5.
faut savoir utiliser un intervalle de fluctuation pour prendre une dcision.
La rgle de dcision adopte tant la suivante :
Il
si,
sinon, on
Intervalle de confiance
Dfinition
Un intervalle de confiance pour une proportion p un niveau de confiance
0,95 est la ralisation, partir dun chantillon, dun intervalle alatoire
contenant la proportion p avec une probabilit suprieure ou gale 95%.
24
Squence 9 MA01
n
n
Conditions dutilisation
On se place dans le cas o lchantillon contient au moins 30 lments et o la
frquence f observe est telle que nf 5 et n (1 f ) 5.
z La prcision de lestimation est donne par lamplitude de lintervalle
1
1 qui est gale 2 et dpend donc de la taille n de
;f +
f
n
n
n
lchantillon.
Squence 9 MA01
25
5 Exercices de synthse
Exercice I
300
condition I n 0 ;
.
n
300
a) Montrer que, si I n 0 ;
, alors 0,85n + 1,96 0,1275 n 300 0.
n
b) On dfinit sur [1; + [ la fonction f par f ( x ) = 0,85x + 1,96 0,1275 x 300.
26
Squence 9 MA01
Commenter.
Exercice II
Intervalle de confiance
Pour estimer dans une population la proportion p des individus possdant le
caractre A, on interroge au hasard 80 lments de cette population. On observe
que 18 individus possdent le caractre A.
Donner pour p un intervalle de confiance au niveau 0,95.
Donner une condition sur le nombre n dindividus interrogs, pour que la prcision obtenue par lintervalle de confiance au niveau 0,95 soit infrieure 0,05.
Donner une condition sur le nombre n dindividus interrogs, pour quavec
Squence 9 MA01
27