Documente Academic
Documente Profesional
Documente Cultură
3 traitements (Temprature) dtermins par le chercheur la variable dpendante est le taux de croissance (8), et le facteur (T) est la temprature T tant contrl, on peut estimer leffet de laugmentation dune unit de T (temprature) sur 8 (le taux de croissance) et prdire 8 pour dautres tempratures
Temprature (C)
3 sites (groupes) chantillonns La variable dpendante est le poids et le site est le facteur Pour des sites diffrents les facteurs contrlant la variabilit sont inconnus alors, on ne peut prdire le poids pour dautres sites
200
160
Procdure
ANOVA 1 facteur
Variable dpendante
1 continue
Variable(s) indpendante(s)
1 discontinue*
La croissance dun poisson est compare pour diffrentes tempratures. Si la thorie prvoit quau-dessous de 10 la croissance devient trs faible, voire nulle, les comparaisons se feront donc au-dessus et en dessous de cette valeur seuil (critique).
La croissance dun poisson est compare pour diffrentes tempratures. Si la thorie prvoit seulement que la croissance baisse quand la temprature baisse, les comparaisons se feront donc entre tous les chantillons.
Attention : lANOVA est plus fiable et plus robuste que les comparaisons multiples. Une CM ne doit pas tre faite si H0 (1 phase ANOVA) est accepte ! Elle pourrait ventuellement voir des diffrences l o il ny en a pas !!
Facteur Y
x
Y1 x Y2
x x x x
Facteur X
X: pas deffet; Y: faible effet (ou rien si mme ligne); pas dinteraction
Exemple : la croissance en taille dun poisson en fonction du pH et de la temprature de leau, tous deux fixs par lexprimentateur. La variable dpendante est le taux de croissance et les deux facteurs sont le pH et la temprature. Comme les facteurs sont contrls, on peut estimer l'effet de l'accroissement d'une unit de temprature ou de pH sur le taux de croissance et le prdire pour d'autres truites.
Il faut donc renseigner soigneusement le modle dans le logiciel utilis pour faire les calculs !
Procdure
ANOVA 1 facteur
Variable dpendante
1 continue
Variable(s) indpendante(s)
1 discontinue* 2 ou plus discontinues *
Rgression simple
Ajustement dune ligne droite travers un nuage de points Test et quantification de leffet dune variable indpendante X sur la variable dpendante Y Lintensit de leffet est donne par la pente (b) de la rgression Limportance de leffet est donn par le coefficient de dtermination (r2)
observ
prdit
b=
( X i X )(Yi Y )
i =1
r=
Cov ( X , Y ) X Y
( X i X )2
i =1
Alors
Cov ( X , Y )
X
2
X r=b Y
Procdure
ANOVA 1 facteur
Variable dpendante
1 continue
Variable(s) indpendante(s)
1 discontinue* 2 ou plus discontinues * 1 continue 2 ou plus continues
Rgression et ANOVA
Comparaison Taille-Poids chez diffrents groupes de Vertbrs Pour une taille donne, il est normal (on sattend ) que le poids dun mammifre soit plus important que celui dun oiseau. Deux rgressions diffrentes simposent. Maintenant imaginons que lon cherche comparer des tailles et des poids sans tenir compte du groupe taxinomique : R serait probablement trs faible (pas de corrlation et donc pas de rgression) !
Taille Masse
Taille
Rgression et ANOVA
Comparaison du Poids dun animal en fonction de diffrents rgime alimentaire Si le rgime alimentaire est riche, il est normal (on sattend ) que le poids de lanimal soit plus lev. Si plus de 2 rgimes alimentaires sont compars, une ANOVA 1 facteur (le rgime) simpose. Mais quelle est la condition respecter ? Le poids dpend de la taille; il faut donc quau dbut de lexprience, avant lapplication du rgime alimentaire test, le poids, donc la taille, de dpart soit identique. Si cette condition nest pas respecte, lexprience est biaise. Si cette condition nest pas ralise, il est possible dintroduire dans le modle la variabilit que lon connat dj : leffet de la taille. Cest donc une ANOVA (1 facteur) avec une co-variable (taille). On parle dANCOVA
Rgression et ANOVA
Gain en Poids
Une ANOVA classique mettra en vidence une diffrence significative entre les rgimes alimentaires. Par contre, une simple observation du graphique montre que les gains en poids ne sont lis qu aux gammes diffrentes de taille utilises. Rgime 2 Lintroduction de la taille en co-variable ne mettra plus en vidence de diffrence significative entre les rgimes alimentaires !
Rgime 1
Contrle Variable Dpendante : continue Facteur (=var. indp.) : discret (discontinu) Co-variable : continue Taille
Utilisation de lANCOVA
Lorsque lon fait ces comparaisons, on suppose que les modles sont qualitativement similaires pour tous les niveaux de la variable discontinue (la covariable) autrement ce serait comme comparer des pommes et des oranges ! ANCOVA est utilise afin de comparer des modles linaires gnralement.
Y
Modles qualitativement similaires
Y
Modles qualitativement diffrents
X1
Variable dpendante
1 continue
Variable(s) indpendante(s)
1 discontinue* 2 ou plus discontinues * 1 continue 2 ou plus continues Au moins 1 discontinue* et au moins une 1 continue
Yi = a + bX i + ei
alors, toutes les rgressions simples sont dcrites par 2 paramtres: lordonne lorigine (a) et la pente (b)
ei
a (ordonne lorigine)
Xi Observes Prdites
X1
Y: variable dpendante; X: co-facteur (Prdicteur Continu); G: variable indpendante (Prdicteur Catgoriel; discret). On teste les effets de X, G et X*G (interaction) sur la variable Y
Y
Groupe 1 Groupe 2
Cas 1 : X est significatif, G et X*G ne le sont pas. Y change en changeant X, alors X a un effet significatif sur Y. Par contre, les deux points dintersection et les deux pentes sont les mmes.
X
Y
Groupe 1 Groupe 2
Cas 2 : G est significatif, X et X*G ne le sont pas. Y ne change pas en changeant X, alors X n'a pas d'effet sur Y. Les points d'intersection des deux groupes sont diffrents, alors G a un effet significatif sur Y. Par contre, les deux pentes sont gales (zro) donc G*X n'a pas d'effet sur Y.
X
Groupe 1 Groupe 2
Cas 3 : G et X sont significatifs, X*G ne l'est pas. Y change en changeant X, alors X affecte Y. Les points d'intersection des deux groupes sont diffrents, alors G affecte Y galement. Par contre, les deux pentes sont gales (les lignes sont parallles) donc l'effet de Y sur X ne varie pas en fonction de la valeur de G (c'est--dire, dpendant du groupe). Alors X*G n'est pas significatif. Cas 4 : G, X et X*G sont significatifs. Y change en changeant X, alors X affecte Y. Les points d'intersection des deux groupes sont diffrents, alors G affecte Y galement. En plus, les deux pentes sont diffrentes (les lignes ne sont pas parallles) donc l'effet de Y sur X dpend de la valeur de G (c'est--dire, dpend du groupe). Alors X*G est significatif.
X
X
Y
Groupe 1 Groupe 2
Tester les pentes revient tester les interactions Tester les ordonnes lorigine revient tester le prdicteur catgoriel
Mles
1.7
LFKL
LFKL
Femelles
1.8
1.7
1.6
1.6
1.5 1.0
1.1
1.2
1.6
1.7
1.5 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 LAGE
1.8
Analyse
1.7
Mles
LFKL
Log(forklength)(LFKL) est la variable dpendante, log(age) (LAGE) est la variable indpendante continue, et sex (SEX$) est la variable discontinue (2 niveaux) Q1: la pente de la rgression de LFKL sur LAGE est la mme pour les deux sexes?
1.6
1.1
1.5 1.6
1.7
1.8
LFKL
Femelles
1.7
1.6
1.5 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 LAGE
Analysis of Variance Source LAGE SEX$ SEX$*LAGE Error Sum-of-Squares df Mean-Square 0.143 0.000 0.000 0.071 1 1 1 88 0.143 0.000 0.000 0.001 F-ratio 176.650 0.504 0.337 P 0.000 0.479 0.563
Conclusion 1 : la pente est la mme pour les deux sexes - p(SEX$*LAGE) > .05 Q2 : lordonne lorigine est-elle la mme?
Analysis of Variance Source SEX$ LAGE Error Sum-of-Squares df Mean-Square 0.001 0.143 0.072 1 1 89 0.001 0.143 0.001 F-ratio P 0.177 0.000
1.851 178.163
Conclusion 2 : Ordonne lorigine est la mme pour les deux sexes - p(SEX$ > .05) Le meilleur modle est donc la rgression commune.
Dep Var: LFKL N: 92 Multiple R: 0.830 Squared multiple R: 0.690 Adjusted squared multiple R: 0.686 Standard error of estimate: 0.029 Effect CONSTANT LAGE Coefficient 1.211 0.336 Std Error 0.031 0.024 Std Coef Tolerance 0.0 0.830 . 1.000 t 39.191 14.144 P(2 Tail) 0.000 0.000
Dans cet exemple, il ny a pas dinteraction entre le prdicteur catgoriel (Group) et le prdicteur continu (IQ). La mthode denseignement dispense aux diffrents groupes (Group) est suppose indpendante du niveau intellectuel des tudiants (IQ).
ANOVA 1 facteur
ANCOVA 1 facteur
prendre loption gnrale Homogeneity of Slopes : permet de tester si oui ou non les pentes diffrent (pas da priori) si les pentes diffrent rellement [p(interaction) < 0.05], passer au modle de co-variance pentes spares (Separate-slope model) si les pentes ne diffrent pas [p(interaction) > 0.05], passer au modle traditionnel (Analysis of covariance)