Documente Academic
Documente Profesional
Documente Cultură
DE
DATE
PENTRU
AFACERI
1
Structura cursului de azi
– MANOVA
Erorile de tip I si II in testarea
ipotezelor
– Test statistic utilizat cand dorim sa comparam mai mult de doua grupe de subiecti
Exemplu:
– Putem utiliza ANOVA pentru a compara consumul mediu de energie al gospodăriilor
din cele patru regiuni din SUA
ANOVA
– Ipotezele testului:
H0: nu sunt diferente intre medii
H1: mediile sunt diferite una fata de cealalta
– Exemplu:
H0: m1 = m2 =m3 = m4 (pentru 4 esantioane)
H1: cel putin doua medii difera semnificativ
Interpretare:
p > 0.05 => nu se respinde H0, diferenta este nesemnificativa la pragul de incredere de 95%
p < 0.05 => se respinge H0 cu pragul de semnificatie de 95% => Cel putin doua medii difera semnificativ
ANOVA
Exista mai multe tipuri de ANOVA, acestea fiind cel mai des intalnite:
– ANOVA unifactoriala
– Se aplica atunci cand avem o variabila depedenta masurata pe o scala de interval/raport
pentru 3 sau mai multe valori ale unei variabile independente categoriale masurata pe o
scala nominal/ordinala
– ANOVA bifactoriala
– ANOVA multifactoriala
ANOVA unifactoriala
(One-Way ANOVA )
Aplicatie 1. a.
– testarea efectelor a 3 tipuri de îngrășăminte asupra randamentului culturilor.
ANOVA unifactoriala
Cod in R
install.packages(c("ggplot2", "ggpubr", "tidyverse", "broom", "AICcmodavg"))
library(ggplot2)
library(ggpubr)
library(tidyverse)
library(broom)
library(AICcmodavg)
summary(crop_data)
ANOVA unifactoriala
Datele
crop_data
ANOVA unifactoriala
(One-Way ANOVA )
Conditii:
– Distributie normala
summary(one.way)
Interpretare:
p <0,001, deci se pare că tipul de îngrășământ utilizat are un impact real asupra
randamentului final al culturii
ANOVA unifactoriala
Output
– Output-ul listează mai întâi variabilele independente testate în model (în acest
caz avem doar una, „îngrășământ”) și reziduurile modelului („residuals”).
– Toată variația care nu este explicată de variabilele independente se numește
varianță reziduală.
ANOVA unifactoriala
Output
Df afișează gradele de libertate.
Sum Sq afișează suma pătratelor (adică variația totală între media grupului și
media generală).
Mean Sq este media sumei pătratelor, calculată prin împărțirea sumei pătratelor la
gradele de libertate pentru fiecare parametru.
F value este testul statistic (F-test), iar cu cât aceasta valoare este mai mare, cu
atât este mai probabil ca variația cauzată de variabila independentă să fie reală și
nu datorată întâmplării.
Pr (> F) este valoarea p a statisticii F.
ANOVA bifactoriala
(Two-Way ANOVA )
Aplicatie 1. b.
– adăugăm o variabilă independentă suplimentară: densitatea plantării.
– testarea efectelor a 3 tipuri de îngrășăminte și a 2 densități diferite de plantare
asupra randamentului culturilor
ANOVA bifactoriala
Cod in R
two.way <- aov(yield ~ fertilizer + density, data = crop_data)
summary(two.way)
Interpretare:
Adăugarea variabilei pare să fi îmbunătățit modelul: a redus varianța reziduală
(suma reziduală a pătratelor a trecut de la 35,89 la 30,765)
Densitatea plantării și tipul de îngrășământ sunt semnificative din punct de vedere
statistic (ambele avand p <0,001)
ANOVA bifactoriala
Output
ANOVA bifactoriala
Adăugarea de interacțiuni între variabile
Interpretare:
Variabila „îngrășământ: densitate” are o valoare mică a sumei pătratelor și o
valoare p ridicată, ceea ce înseamnă că nu există prea multe variații care pot fi
explicate prin interacțiunea dintre îngrășământ și densitatea plantării.
MANOVA
Analiza de varianta multivariata
– Este o varianta a analizei ANOVA care aplica atunci cand dorim sa analizam mai
multe variabile dependente concomitent