Documente Academic
Documente Profesional
Documente Cultură
Anne 2011-2012
TD de Rappels
Estimateurs, intervalles de confiance, tests
Exercice 1 : EMV
Exercice 2 : IC
On dispose d'un chantillon gaussien X1 , . . . Xn de moyenne et de variance 2 . On veut dterminer les intervalles de conance pour ces paramtres.
1. On suppose que l'on connat 2 . Dterminer l'intervalle de conance bilatral au niveau
de .
Application : on tudie la rsistance l'clatement d'un certain type de rservoir. Aprs
des essais antrieurs, on peut supposer que cette rsistance suit un loi normale d'cart type
4kg/cm2 . Aucours de ces essais sur un chantillon de 9 rservoirs, on a relev une rsistance
moyenne de 215kg/cm2 . Donner l'intervalle de conance bilatral 95% pour la rsistance.
2. Dterminer l'intervalle de conance bilatral au niveau de la moyenne dans le cas o la
variance est inconnue.
Application : an d'estimer le salaire journalier d'un ouvrier, on a observ le salaire d'un
chantillon de 16 ouvriers :
41
45
40
52
45
40
50
48
41
50
41
40
40
47
43
46
On suppose que la variable "salaire journalier" suit une loi normale. Calculer les estimateurs
de et 2 et donner un intervalle de conance au niveau = 10%.
3. On suppose prsent que l'on connait et on veut estimer 2 . Dterminer, partir des
observations, l'intervalle de conance bilatral au niveau .
Application : on veut tester la prcision d'une balance, en eectuant une srie de 15 mesures
du poids d'un kilo de riz. On obtient les mesures suivantes :
996.17
997.01
994.45
999.36
998.78
997.64
997.2
993.81
1007.01
1004.33
998.45
991.38
1003.93
1000.97
995.23
Exercice 3 : Application
Soit N le nombre d'oiseaux sur une le. On suppose N trs grand. On capture 800 oiseaux que
l'on marque et que l'on relche. On en recapture 1000, et on constate que 250 d'entre eux sont
marqus. Btir un intervalle de conance pour N .
Une entreprise de chimie achte un catalyseur et convient par contrat avec son fournisseur que
la surface spcique du catalyseur doit tre suprieure ou gale 360m2 /g . Une socit de contrle
fait "au hasard" 20 prlvements au moment de la fabrication. Puis elle tire un sous-chantillon de
10 prlvements (groupe 1) parmi ces 20. Sur chaque prlvement, elle mesure la surface spcique
an de pouvoir porter un jugement sur la qualit du lot. On obtient le tableau suivant :
Groupe 1
Groupe 2
322.1
314.5
361.5
343.8
345.6
345.8
346.4
323.3
382.3
361.6
361.8
353.7
334.1
348
321.1
355.4
374.6
333.7
330.4
351.1
Lors d'un TP de chimie, deux groupes ont dos la teneur en Arsenic (As) d'une solution I et
d'une solution II. Les rsultats sont rsums dans le tableau ci-dessous
Solution I
Solution II
3.16
3.14
3.13
3.19
3.17
2.98
2.68
3.26
3.06
3.01
2.91
3.30
3.37
3.04
3.08
3.19
2.73
3.22
3.32
3.40
3.18
On admettra que ces teneurs en Arsenic se rpartissent selon une loi Normale.
1. On se demande tout d'abord si un groupe d'tudiant est plus prcis dans son dosage. Pour
cela, on va tester l'galit des variances entre ces deux chantillons. Calculer les estimateurs
2
2
de la variance et eectuer le test de Fisher suivant : H0 : I2 = II
contre H1 : I2 6= II
,
en xant l'erreur de premire espce = 5%. Conclure.
2. Tester H0 : I = II contre H0 : I 6= II .
Le couvert vgtal du domaine vital d'un orignal (lan d'amrique) se compose de peuplement
feuillus (25% de la supercie du domaine vital), de peuplements mixtes (38% de la supercie), de
peuplements rsineux (25.8%) et d'un marcage (10.4%). Dans ce domaine, l'orignal a t localis
511 reprises au cours de l'anne. Sur les 511 localisations, 118 se trouvaient dans les feuillus, 201
dans les peuplements mixtes, 110 dans les rsineux et 82 dans les marcages.
1. On veut montrer que l'orignal frquente prfrentiellement certains milieux. Proposer un test
statistique pour vrier cette hypothse.
2. Raliser le test et proposer une interprtation biologique du rsultats.
3.16
Anne 2009-2010
TP de Rappels
Estimateurs, intervalles de confiance, tests
X
2 = n1 i=1 (Xi X
teurs s2 = n1
i
i=1
2
d'chantillons gaussiens ci-dessus, montrer que s est un meilleur estimateur de la variance
que 2 .
5. Crer une fonction qui gnre un chantillon gaussien de taille 100 de moyenne un nombre
alatoire entre 5 et 10 et de variance un nombre alatoire entre 1 et 2 et qui donne un
estimateur de la variance et un intervalle de conance 95% de cet estimateur.
On veut comparer prsent le poids des poulpes mles celui des femelles. On veut valider de
manire statistique une dirence de poids entre les poulpes de sexe dirent.
1. Rcuprer le chier "poulpe.csv" l'aide de la commande
>poulpe<-read.table("poulpe.csv",header=T,sep=";")
4. On suppose prsent que les donnes suivent une loi normale. Tester l'galit des variances
l'aide de la commande
>var.test(Poids~Sexe,data=poulpe)
Conclure. Discuter les arguments de la fonction t.test. Comment procder si on considre les
variances direntes ?
6. Proposer une fonction qui dtermine la puissance observe du test de Student. Est-ce utile
ici avec ce jeu de donne ?
On tudie l'inuence du sexe sur la couleur des cheveux d'lves d'un district cossais. Nous
souhaitons savoir si la couleur des cheveux est indpendante du sexe. Pour cela, on dispose du
tableau de donnes suivant :
Garon
Fille
Blond
592
544
Roux
119
97
Chtain
849
677
Brun
504
451
Noir de jais
36
14
2. Reprsenter les donnes l'aide de diagrammes en barres, o on reprsente les donnes par
sexe sur un mme graphique :
>par(mfrow=c(2,1))
>barplot(tab[1,],main="Garons")
>barplot(tab2,],main="Filles")
4. Prcisez les couleurs qui contribuent le plus au Khi2. Ces contributions sont dans l'objet
residuals. En divisant chaque valeur par la statistique de test (contenu dans l'objet stat),
on obtient les pourcentages suivants :
>round(100*resultat$residuals^2/resultat$stat,1)
2. Comparer les rsultats obtenus avec le test de Kolmogorov Smirnov. Proposer, sans utiliser
de boucle for, une sortie graphique permettant de comparer les deux test (Shapiro-Wilk et
Kolmogorov-Smirnov) sur un grand nombres d'chantillons. Discuter et conclure.
3. A prsent on va tester l'adquation en loi entre deux chantillons issue du mme gnrateur
alatoire. Gnrer deux chantillons gaussiens de loi N (10, 2) et tester H0 : Les deux vecteurs
ont la mme loi" contre l'alternative H1 : Les deux vecteurs ne sont pas issus de la mme
loi" grce au test de Kolmogorov-Smirnov.
4. Enn, on va comparer l'ecacit du test de Kolmogorov-Smirnov par rapport au test du
Khi2 pour tester l'adquation de deux chantillons. Pour cela, gnrer un grand nombre
de fois deux chantillons gaussiens de loi N (10, 2) et tester l'adquation avec les fonctions
shapiro.test et chisq.test. Proposer une manire graphique de comparer les rsultats. Discuter
et conclure.