Documente Academic
Documente Profesional
Documente Cultură
Biostatistiques avancées
Responsable du cours : Yves Desdevises
Travaux Dirigés n 2 o
Corrigé
Exercice 1
Les diamètres de branches de corail peuvent être mesurés de façon rapide à l’aide d’une méthode
photogrammétrique. On veut s’assurer que cette méthode n’est pas biaisée, et donc vérifier
qu’elle ne donne pas des valeurs systématiquement trop élevées où trop faibles. Pour cela, les
diamètres de 12 branches de corail prélevées aléatoirement ont été mesurés avec cette méthode, et
à l’aide d’un pied à coulisse (diamètres réels). Les résultats, en mm, sont les suivants.
Photo. Réel
168,56 165,55
168,75 166,84
165,53 167,86
173,22 169,34
163,61 165,59
163,07 165,05
168,49 164,94
169,64 163,85
169,87 165,74
169,67 169,49
167,12 164,30
168,19 167,10
1. Quel test paramétrique permet de répondre à la question ? Quelles sont ses conditions
d’applications ? Réalisez ce test si ces conditions d’applications sont vérifiées.
Dans ce cas, nous avons affaire à des données appariées, et il faut utiliser le test t pour de telles
données, si les distributions sont normales. Ce test demande les mêmes conditions d'applications
que le test t pour groupes indépendants.
Les paires sont indépendantes.
Les données sont appariées : il n'est pas nécessaire de tester l'homogénéité des variances.
corail=read.table(file.choose(),header=T)
attach(corail)
shapiro.test(Photo)
Shapiro-Wilk normality test
data: Photo
1
W = 0.9354, p-value = 0.4409
shapiro.test(Reel)
Shapiro-Wilk normality test
data: Reel
W = 0.92573, p-value = 0.337
t.test(Photo,Reel,paired=TRUE)
Paired t-test
data: Photo and Reel
t = 2.1508, df = 11, p-value = 0.05457
alternative hypothesis: true difference in means is not equal to
0
95 percent confidence interval:
-0.03905331 3.38405331
sample estimates:
mean of the differences
1.6725
On ne rejette pas H , la méthode photogrammétrique n’est pas biaisée [notez que la décision
0
2. Traitez le problème en considérant que vous ne disposez que des 4 premières observations
pour chaque méthode.
Dans ce cas les effectifs sont trop petits pour tester la normalité et réaliser un test paramétrique, il
faut utiliser l’équivalent non paramétrique, le test de Wilcoxon :
wilcox.test(Photo,Reel,paired=TRUE)
Wilcoxon signed rank test
data: Photo and Reel
V = 8, p-value = 0.375
alternative hypothesis: true location shift is not equal to 0
Même conclusion.
On peut aussi utiliser un test-t pour données appariées par permutation :
source("/Users/yves/…/t.paired.perm.R")
t.paired.perm(Photo,Reel,nperm=999)
t-test comparing the means of two related samples
Number of objects: 4
Mean of the differences: 1.6175
t statistic (paired observations): 1.17536
95 percent confidence interval of t: -2.762101 5.997101
Degrees of freedom: 3
Alternative hypothesis: two.sided
Prob (parametric): 0.3246423
Prob ( 999 permutations): 0.39400
2
$t.ref
t
1.17536
$p.param
[1] 0.3246423
$p.perm
[1] 0.394
$nperm
[1] 999
Même conclusion.
3
Exercice 2
On a chargé un médecin de répondre à la question suivante : l'aspirine (acide acétylsalycilique =
AAS) diminue-t-elle l'espérance de vie des patients asthmatiques ?
Ce médecin a récolté des données selon les critères suivants : individus asthmatiques et décédés
de façon naturelle au cours des 5 dernières années. Les informations retenues sont l'âge au décès
et si de l'aspirine a été recommandée au patient (Oui : O ; Non : N). Le tableau suivant présente
un échantillon aléatoire des milliers de réponses obtenues.
4
attach(dataAAS)
boxplot(Age~AAS)
70
65
60
55
50
45
N O
Test de normalité :
tapply(Age,AAS,shapiro.test)
$N
Shapiro-Wilk normality test
data: X[[i]]
W = 0.93106, p-value = 0.2267
$O
Shapiro-Wilk normality test
data: X[[i]]
W = 0.95135, p-value = 0.4165
Test F :
var.test(Age~AAS)
F test to compare two variances
data: Age by AAS
F = 1.7322, num df = 16, denom df = 18, p-value = 0.2615
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.6560455 4.7063676
sample estimates:
ratio of variances
1.732191
On ne peut pas rejeter l'hypothèse nulle, on considère que les deux variances sont homogènes.
Test t :
t.test(Age~AAS,var.equal=TRUE,alternative="greater")
Two Sample t-test
data: Age by AAS
t = -3.2661, df = 34, p-value = 0.001247
5
alternative hypothesis: true difference in means is less than 0
95 percent confidence interval:
-Inf -3.466506
sample estimates:
mean of x mean of y
54.83105 62.01882
On rejette H , les deux moyennes sont significativement différentes, l'âge au décès des patients
0
dataAASred=read.table(file.choose(),header=T)
attach(dataAASred)
wilcox.test(Age~AAS,paired=FALSE,alternative="greater")
Wilcoxon rank sum test
data: Age by AAS
W = 2, p-value = 0.03175
alternative hypothesis: true location shift is less than 0