Documente Academic
Documente Profesional
Documente Cultură
6Latabladeanlisisdevarianza(ANOVA)ylapruebaF|STAT501
STAT501
Losmtodosderegresin
2.6Elanlisisdevarianzamesa(ANOVA)ylapruebaF
versinparaimprimir(https://onlinecourses.science.psu.edu/stat501/print/book/export/html/266)
Hemoscubiertounpocodetierra.Vamosarevisarlatabladeanlisisdevarianzaparaelejemploenrelacin
conlamortalidadporcncerdepielylatitud(skincancer.txt
(https://onlinecourses.science.psu.edu/stat501/sites/onlinecourses.science.psu.edu.stat501/files/data/skincancer.txt)).
Recordemosquehaba49estadosenelconjuntodedatos.
LosgradosdelibertadasociadosconSSRsernsiempre1paraelmodeloderegresinlinealsimple.Los
gradosdelibertadasociadosconSSTOesn1=491=48.LosgradosdelibertadasociadosconSSEesn
2=492=47.Ylosgradosdelibertadsesuman:1+47=48.
Lassumasdecuadradossesuman:SSTO=SSR+SSE.Esdecir,aqu:53637=36464+17173.
Vamosaabordaralgunasmscolumnasdelatabladeanlisisdevarianza,asaber,el"cuadradomediodela
columna",labledMS,yelFcolumnaestadstica,conlaetiquetaF.
Lasdefinicionesdeloscuadradosmedios
Yasabemosqueel"errorcuadrticomedio(MSE)"sedefinecomo:
\[MSE=\frac{\sum(y_i\hat{y}_i)^2}{n2}=\frac{SSE}{n2}.\]
Esdecir,seobtieneelerrorcuadradomediodividiendolasumadecuadradosporsusgradosdelibertad
asociadosn2.Delmismomodo,seobtienela"regresincuadrticamedia(MSR)"dividiendolasumade
cuadradosderegresinporsusgradosdelibertad1:
https://onlinecourses.science.psu.edu/stat501/node/266 1/3
10/5/2017 2.6Latabladeanlisisdevarianza(ANOVA)ylapruebaF|STAT501
\[MSR=\frac{\sum(\hat{y}_i\bar{y})^2}{1}=\frac{SSR}{1}.\]
Porsupuesto,esosignificaquelasumadecuadradosderegresin(SSR)ylaregresincuadradomedio(MSR
)sonsiempreidnticosparaelmodeloderegresinlinealsimple.
Ahora,porqunosimportacuadradosmedios?Debidoasusvaloresesperadossugierencmoponeraprueba
lahiptesisnulaH0:1=0encontradelahiptesisalternativaHA:10.
cuadradosmediosesperados
Imagneseeltomarmuchas,muchasmuestrasaleatoriasdetamaondealgunapoblacin,ylaestimacindela
lneaderegresinydeterminandoMSRyMSEparacadaconjuntodedatosobtenidos.Sehademostradoquela
media(esdecir,elvaloresperado)delatotalidaddelMSRssepuedeobteneresiguala:
\[E(MSR)=\sigma^2+\beta_{1}^{2}\sum_{i=1}^{n}(X_i\bar{X})^2\]
Delmismomodo,sehademostradoquelamedia(esdecir,elvaloresperado)detodoelMSEssepuede
obteneresiguala:
\[E(MSE)=\sigma^2\]
EstosvaloresesperadossugierencmoprobarH0:1=0frenteaHA:10:
Si1=0,entoncesesdeesperarquelarelacinMSR/MSEseaiguala1.
Si10,entoncesesdeesperarquelarelacinMSR/MSEseamayorque1.
Estosdoshechossugierenquedeberamosusarlarelacin,MSR/MSE,paradeterminarsiono1=0.
Tengaencuentaque,debido1seelevaalcuadradoenE(MSR),nopodemosutilizarlarelacinMSR/MSE:
apruebaH0:1=0frenteaHA:1<0
oparaprobarH0:1=0frenteaHA:1>0.
SlopodemosutilizarMSR/MSEparaprobarH0:1=0frenteaHA:10.
Hemoscompletadonuestrainvestigacindetodaslasentradasdeunanlisisestndardelatabladevarianza.
Lafrmulaparacadaentradaseresumeparaqueenlasiguientetabladeanlisisdevarianza:
FuentedeVariacin DF SS SRA F
\(F^*=\
\(SSR=\sum_{i=1}^
\(MSR=\frac frac{}
Regresin 1 {n}(\hat{y}_i\bar
{SSR}{1}\) {MSRMSE}
{y})^2\)
\)
\(SSE=\sum_{i=1}^
\(MSE=\frac
errorresidual n2 {n}(y_i\hat{y}_i)^2
{SSE}{n2}\)
\)
\(SSTO=\sum_{i=1}
Total n1 ^{n}(y_i\bar{y})^2
\)
https://onlinecourses.science.psu.edu/stat501/node/266 2/3
10/5/2017 2.6Latabladeanlisisdevarianza(ANOVA)ylapruebaF|STAT501
Sinembargo,siemprevamosadejarqueMinitabhacereltrabajosuciodecalcularlosvaloresparanosotros.
PorqueslarelacinMSR/MSEetiquetadoF*enlatabladeanlisisdevarianza?Esoesporquelarelacin
esconocidaparaseguirunFdistribucincon1gradodelibertaddelnumeradoryn2gradosdelibertaddel
denominador.Porestarazn,amenudoserefierecomoelanlisisdelavarianzaFtest.Lasiguienteseccin
resumeloformalFtest.
ElformaldeFtestparaelparmetrodelapendiente1
LahiptesisnulaesH0:1=0.
LahiptesisalternativaesHA:10.
Laestadsticadepruebaes\(F^*=\frac{}{MSRMSE}\).
Comosiempre,elPvalorseobtieneporresponderalapregunta:"Culeslaprobabilidaddeque
conseguiramosunF*?Estadsticatangrandecomolohicimos,silahiptesisnulaesverdadera"
ElPvalorsedeterminamediantelacomparacindeF*aunaFdedistribucincon1gradodelibertaddel
numeradoryn2gradosdelibertaddeldenominador.
Enrealidad,vamosadejarqueMinitabcalcularelF*estadsticayelPvalorparanosotros.Vamosaprobarlo
enunnuevoejemplo!
<2.5AnlisisdelaVarianza:Laideabsica de 2.7Ejemplo:Sonloshombrescadavez
(/stat501/node/265) hasta msrpido?>(/stat501/node/267)
(/stat501/node/260)
https://onlinecourses.science.psu.edu/stat501/node/266 3/3