Sunteți pe pagina 1din 1

Relation entre la hauteur dun enfant

(en cm) et lge (en mois).


Nom et prnom : Mokhtar Selmi
Rsum :
L'objectif de cette note est de l'existence d'une relation entre la
hauteur des enfants et lge. Cette tude est faite partir d'un
chantillon de 23 populations utilisant un modle de rgression
linaire. Ce modle nous a montr une relation linaire entre ces
deux variables.

2-Dautre part, le paramtre est diffrent de zro. Pour justifier


cela, nous traons le graphique dun ellipsode qui montre que ce
dernier ne contient pas le point (0,0).

1 Introduction.
Existe-t-il une relation entre la hauteur des enfants et lge ?
Pour rpondre cette question, nous disposons dun chantillon
de 20 populations ou on a enregistr La hauteur appele variable
HEIGHT et lge appele variable AGE. Le tableau suivant
montre une partie de ces donnes :
AGE. mois
HEIGHT.cm
18
76.1
.
.
.
.
39
88
40
89
En observant le diagramme de dispersion reprsent dans la figure1, on remarque que ce graphique montre bien lexistence dune
relation entre les deux variables tudies.

*
figure-2 : intervalle de confiance

Pour savoir lexistence ou non des valeurs aberrantes, on doit


utiliser les rsidus jacknife.
1-La figure 3-a montre que tous les rsidus se trouvent dans une
bande autour de laxe y=0.
2-La figure 3-b montre que les rsidus suivent une loi de student
17 ddl. En outre, on effectue un test de Kolmogorov-Smirnov pour
lhypothse nulle H : la loi des rsidus jacknife est bien une
student. La p-valeur de ce test est leve, elle vaut 0.95Donc H
peut tre accepte.

Figure-1 : Diagramme de Dispersion de longueur de lenfant en fonction du taux de lge

Dans la prochaine section nous prsentons le modle trouv et nous


ferons une tude de sa validit.

2 Un modle de rgression.
Le graphique de dispersion de la figure-1 suggre qu'il existe une
relation linaire entre les observations de la variable HEIGHT et la
variable AGE. Commenons d'abord par considrer le modle
suivant :
i=1..23.
O
sont les observations de la variable HEIGHT alors que
sont les observations de la variable AGE. On suppose que
sont des variable i.i.d. de loi Normale
(0, ) et que , et sont les paramtres inconnus du
modle. En utilisant R, lestimation du modle donne les rsultats
suivants :
Call:
lm(formula = HEIGHT.cm. ~ AGE.mois., data = Datasetg)
Residuals:
Min
1Q Median
3Q
Max
-0.71848 -0.23261 0.04397 0.25094 0.71739
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 67.05899 0.37911 176.88 <2e-16 ***
AGE.mois. 0.54219 0.01274 42.55 <2e-16 ***
--Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 0.4054 on 21 degrees of freedom
Multiple R-squared: 0.9885, Adjusted R-squared: 0.988
F-statistic: 1810 on 1 and 21 DF, p-value: < 2.2e-16
1-la relation linaire entre les deux variables tudies est
significative. En effet la p-valeur du test H :==0
Contre non nul est gale 8.663e-07 qui est infrieure un seuil
gal 5%.

(a)-graphe des rsidus jacknife

(b)-Comparaison avec la loi de student

Figure-3 : Rsidus jacknife

Enfin, calculons la bande de confiance du modle un niveau gale


95%. A partir de la reprsentation Graphique de la figure-4,
presque 60%des points se trouvent lintrieur de la bande. Ceci
montre bien quil y a un ajustement du modle aux observations.
Nous remarquons en plus, que toutes les valeurs se trouvent
lintrieur de lintervalle de prdiction (Gris).

Figure 5 : Bande de prdiction de niveau 95%

S-ar putea să vă placă și