Sunteți pe pagina 1din 4

Bernoulli, binomiale, etc...

M1 MEEF
2018-2019

Vademecum sur la loi binomiale et quelques éléments de cours sur les


intervalles de fluctuation et de confiance.

La loi de Bernoulli modélise une expérience aléatoire ayant


deux issues possibles 1 : le succès auquel est associé une probabilité 1. Une telle expérience aléatoire est une
p ∈ [0, 1] et l’échec auquel est associé la probabilité q = 1 − p. On épreuve de Bernoulli

note cette loi B( p).


Si X ∼ B( p) alors X est à valeurs dans {0, 1} et
1
1
P( X = 1) = p, P( X = 0) = q, E( X ) = p, V( X ) = pq. 1
0
1
0
Un schéma de Bernoulli correspond à la répétition d’épreuves de 0
Bernoulli identiques et indépendantes. 1
1
0
0
Si on répète n fois l’épreuve de bernoulli, on note (nk)
le nombre de 1
0
schémas possédant k succès. On a, pour k dans {0, . . . , n}, 0
        Figure 1: Arbre des possibles.
n n n n
= 1, = 1, = 1
n 0 k n−k 1 2 1
1 3 3 1
et la formule de Pascal, pour n ∈ N∗ et k ∈ {0, . . . , n − 1} 1 4 6 4 1
1 5 10 10 5 1
n−1 n−1
     
n 1 6 15 20 15 6 1
= + . Figure 2: Triangle de Pascal.
k k−1 k

La loi binomiale B(n, p) modélise le nombre de succès lors de la


n=10, p=0.5 n=10, p=0.75 n=10, p=0.25

répétition de n épreuves de Bernoulli de paramètre p indépendantes.


0.25

0.25
0.20

0.20

0.20
0.15

0.15

0.15
Si X ∼ B(n, p) alors X est à valeurs dans {0, 1, . . . , n} et pour k ∈
0.10

0.10

0.10
0.05

0.05

0.05
0.00

0.00

0.00

{0, 1, . . . , n},
Figure 3: Fonction de masse
  k 7→ P( X = k ) pour n = 10 et
n k n−k p = 0.5, 0.75, 0.25.
P( X = k) = p q , E( X ) = np, V( X ) = npq.
k

Quelques exercices...
1. Montrer toutes les formules apparaissant ci-dessus.
2. Montrer que pour n ∈ N∗ et k ∈ {0, . . . , n}, (nk) = n!
k!(n−k )!
.
3. Montrer que la somme de deux variables aléatoires indépendantes
de loi B(n1 , p) et B(n2 , p) suit une loi B(n1 + n2 , p).

Le théorème de Moivre 2 -Laplace 3 nous indique que si B n suit 2. 1667-1754


3. 1749-1827.
bernoulli, binomiale, etc... 2

une loi binomiale de paramètre n et p ∈] 0, 1 [ . Pour tout réel x, on a

1.0
0.8
! Z x
Bn − n p 1 1 2
lim P p ≤x = √ e − 2 t dt.

0.6
n→∞ n p(1 − p −∞ 2π

0.4
 
B −np
En d’autres termes, la suite de variable aléatoire √ n

0.2
np(1− p
n∈N∗

0.0
converge en loi vers la loi normale centrée réduite, notée N (0, 1) et −4 −2 0 2 4

ayant pour densité sur R,


Figure 4:
 La fonction de
 répartition
1 − 12 x2 x 7→ P √Bn −np ≤ x pour des
x 7→ √ e . np(1− p
2π valeurs de n allant de 50 à 400. En
rouge, la fonction de répartition de la
Quelques exercices... loi normale centrée réduite.

1. Montrer que si Z ∼ N (0, 1) alors E( Z ) = 0 et V( Z ) = 1.


2. Si Z suit une loi normale N (0, 1), montrer que aZ + b ( avec a et b
deux réels, a étant non nul), suit une loi normale d’espérance b et

0.4
de variance a2 , c’est-à-dire ayant pour densité

0.3
1 − 1 ( x − b )2
x 7→ √ e 2a2 .

0.2
2πa2

0.1
3. Montrer que la somme de deux lois normales indépendantes est
encore une loi normale.

0.0
−4 −2 0 2 4

Un intervalle de fluctuations, pour une variable aléatoire Z, Figure 5: Densité de la loi normale
N (0, 1), la fameuse courbe en cloche.
au seuil de (1 − α)% est un intervalle déterministe I tel que

P( X ∈ I ) = 1 − α.

Par exemple, pour un schéma de Bernoulli correspondant à n expé-


riences, le nombre de succès Bn suit une loi binomiale de paramètre n
et p (la probabilité de succès) et un intervalle de fluctuation
h iau seuil
Bn a b
de 95% pour la fréquence de succès n est de la forme n, n où

P( Bn < a) ≤ 0.025 et P( Bn > b) ≤ 0.025.

Le théorème de Moivre-Laplace nous permet de déterminer un inter-


valle de fluctuation asymptotique pour la fréquence de succès Bnn au
seuil 95% :
" r r #
p (1 − p ) p (1 − p )
p − q97.5% , p + q97.5% ,
n n

où q97.5% est le quantile d’ordre 97.5% pour la loi normale centrée


réduite 4 . Le terme asymptotique signifie que 4. Par définition, P( Z ≤ q97.5% ) = 97.5%.
" r r #! On a q97.5% ' 1.96
Bn p (1 − p ) p (1 − p )
lim P ∈ p − q97.5% , p + q97.5% = 95%.
n→∞ n n n
bernoulli, binomiale, etc... 3

Une méthode de prise de décision, utilisée afin de décider si


une variable aléatoire X suit une certaine loi P, suivante.
1. On se fixe un seuil 1 − α (souvent 95%). 5 5. A quoi correspond α ? Si X suit la loi
P, α est la probabilité de ne pas être
2. En supposant que la variable suit cette loi P, on calcule un inter- dans I, et donc de rejeter l’hypothèse :
valle de fluctuation I pour X au seuil 1 − α. c’est donc la probabilité de se tromper
en rejetant à tort l’hypothèse.
3. On effectue une expérience pour avoir une réalisation de X. Il y a une autre erreur qui peut se
produire, celle consistant à ne pas reje-
4. Si la valeur observée pour X : ter l’hypothèse alors qu’on le devrait :
(a) n’est pas dans I, on rejette l’hypothèse que X suit la loi P : on sa probabilité est souvent beaucoup
plus difficile à calculer.
considère que ce qu’on a observé était trop improbable, et qu’on
a donc « une bonne raison de rejeter l’hypothèse ».
(b) est dans I, on ne rejette pas l’hypothèse que X suit la loi P (on
dit parfois qu’on accepte l’hypothèse) : à noter que dans ce cas
on n’a pas de « bonne raison » de rejeter l’hypothèse, mais on
n’en a pas non plus vraiment de confirmer l’hypothèse.

Un exercice...
Lors d’une étude sur la population des poissons d’un lac, suppo-
sée très nombreuse, la proportion de salmonidés a été évaluée à 45 %.
Dix ans plus tard une nouvelle étude est effectuée : sur 50 poissons
prélevés, 15 sont des salmonidés.
1. Si on suppose que la situation est inchangée et que la proportion
de salmonidés dans le lac est toujours de 45 %, et en supposant
que le prélèvement s’effectue avec remise, quelle est la loi suivie
par le nombre de salmonidés prélevés parmi les 50 poissons ?
2. Soit S suivant loi binomiale B(50, 0.45). 6 Déterminer a et b tels P(S ≤ 14) = 0.0104
P(S ≤ 15) = 0.0220
que P(S < a) ≤ 0.025 et P(S > b) ≤ 0.025. P(S ≤ 16) = 0.0427
3. Calculer P(S ∈ [ a, b]). En déduire un intervalle de fluctuation pour P(S ≤ 17) = 0.0765
6. On donne :
P(S ≤ 27) = 0.922
S au seuil 0.95. P(S ≤ 28) = 0.9526
4. Que peut-on conclure ? P(S ≤ 29) = 0.9765
P(S ≤ 30) = 0.9885

Un intervalle de confiance est un intervalle aléatoire (contrai-


rement à un intervalle de fluctuation) relié à l’estimation d’un para-
mètre statistique.
Soit ( Xi )1≤i≤n un n-échantillon, c’est-à-dire une famille de n va-
riables aléatoires indépendantes et de même loi et p un paramètre
attaché à cette loi. Un intervalle de confiance pour p au niveau de
confiance (1 − α)% est un intervalle I (( Xi )1≤i≤n ) dont les bornes
dépendent du n-échantillon, tel que

P( p ∈ I (( Xi )1≤i≤n )) = 1 − α.

Que signifie cet intervalle ? À chaque fois que l’on fait une expé-
rience, on obtient une réalisation du n-échantillon, noté alors ( xi )1≤i≤n
bernoulli, binomiale, etc... 4

qui permet d’évaluer l’intervalle de confiance I (( xi )1≤i≤n ). Si on ré-


pète l’expérience, on va obtenir une autre réalisation du n-échantillon
et donc une autre réalisation de l’intervalle de confiance. Si l’on ré-
pète cette procédure de nombreuses fois, la proportion d’intervalles
de confiance calculés qui contiennent effectivement le paramètre p
tend vers (1 − α)%.

Deux exercices...
1. En 1973, on a mesuré les baleineaux sur un échantillon de 60
individus dans les criques de l’île Somerset. On a trouvé une taille
moyenne de 199 cm et une variance de 1252 cm2 . En supposant
que la taille des baleineaux suit une loi normale de variance 1252,
donner un intervalle de confiance pour la taille des baleineaux au
risque 0.05.
2. Un laboratoire d’agronomie a effectué une étude sur le maintien
du pouvoir germinatif des graines de Papivorus subaquaticus
après une conservation de 3 ans. Sur un lot de 100 graines, 64 ont
germé. Donner, au risque d’erreur 5 pour 100 un intervalle de
confiance asymptotique pour la probabilité de germination des
graines de Papivorus subaquaticus après une conservation de 3
ans.

S-ar putea să vă placă și