Documente Academic
Documente Profesional
Documente Cultură
RegresinyCorrelacinSimple
Estadsticadescriptiva.JseMariaMonteroLorenzo.Madrid:Paraninfo,2007.p129189.
Copyright:COPYRIGHT2007CengageLearningParaninfo,S.A.
Textocompleto:
Pgina129
RegresinyCorrelacinSimple
5.1.Introducin
5.2.RegresindetipoIyrazndecorrelacin
5.2.1RegresindetipoI
5.2.2Razndecorrelacin
5.2.3Varianzadebidaalaregresinyvarianzaresidual
5.3.RegresindetipoIIycoeficientededeterminacin
5.3.1ConceptoderegresindetipoII
5.3.2Coeficientededeterminacin
5.4.Regresinlineal
5.4.1Estimacindelosparametrosdelaregresinlineal
5.4.2.Coeficientededeterminacinlineal
5.4.3.Varianzadebidaalaregresinlinealyvarianzaresidual
5.4.4.Correlacinlinealeindependenciaestadstica
5.5.Regresinycorrelacinnolineal
5.5.1Introduccin
5.5.2Regresinpolinmicaycoeficientededeterminacin
5.5.3AlgunasregresionesdetipoIInolinealessusceptiblesdereduccinalineales
5.6.Algunasconsideracionesfinalessobrelaregresin
Pgina130|Iniciodelartculo
5.1.Introduccin
Enelcaptuloprecedentesepusodemanifiestoelintersdeestudiarsimultneamentedosomscaracteres,XeY,
sobrelamismapoblacin,conelpropsitodedetectarsiexistedependenciaestadsticaentreellososi,porel
contrario,sonindependientes.
Amododeejemplo,enelcasodecaracterescuantitativos(marcoenelcualseenglobaestecaptulo),sepuede
pensarqueexisterelacinentreelsalariodelostrabajadoresysuantigedadenlaempresa,entreelnmerode
afiliadosenaltaalaSeguridadSocialylaproduccindelaeconomaespaola,entreeltiempodebsquedade
empleodelosparadosysuedad,etc.
Puesbien,enestecaptuloelpuntodepartidaserlaexistenciaderelacinodependenciaestadsticaentrelas
variablesobjetodeestudio,yelinterssecentrarenestimarlaformaoestructuradetalrelacinydeterminarla
intensidaddelamisma.Enestesentido,sedistingueentreteoradelaregresinyteoradelacorrelacin,
orientadasalprimerysegundotipodeanlisis,respectivamente.Ambosestnntimamenteligados,demaneraque
siempreseharreferenciaalacorrelacinsegnunadeterminadaestructuradedependenciaentrelasvariables.
Endefinitiva,lateoradelaregresintratadeexplicar1elcomportamientodeunavariable,denominadaexplicada
(dependienteoendgena),enfuncindeotrauotras,denominadasexplicativas(independientesoexgenas).Se
puedeestablecerunaprimeraclasificacinenfuncindelnmerodevariablesexplicativas:laregresin(y
correlacin)sersimplesinicamentehayunavariableexplicativaporelcontrario,sermltiplesielnmerode
variablesexplicativassonvarias.As,sisequiereexplicarelsalariodelostrabajadoresenfuncindesuantigedad
enlaempresalaregresinsersimple.Si,ademsdelaantigedadenlaempresa,seconsideratambinelgrado
deformacindelostrabajadoresalahoradeexplicarsusalario,laregresinsermltiple.
Encualquieradelasdossituacionesanteriores(regresinsimpleomltiple),lacuestinqueseplanteaesquvalor
delavariableexplicadalecorrespondeacadaunodelosvaloresdelavariableovariablesexplicativas.Enelcaso
deunasolavariableexplicativa,sistaesXlaregresinserdeYsobreX(Y/Xdeformaabreviada),mientrasque
siesY,laregresinserdeXsobreY(X/Ydeformaabreviada).Enelcasomltiplelasvariablesexplicativasse
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 1/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
denotan,engeneral,porPgina131|IniciodelartculoX1,X2,,Xp,ylaexplicadaporY,denotndoseporY/X1,
X2,,XplaregresindeYsobreX1,X2,,Xp.
Estecaptuloabordarlaregresinsimple,dejandolaregresinmltipleparaelCaptulo6.
Atendiendoalcriteriodeestimacindelosvaloresdelavariableexplicada,sepuedeestablecerotraclasificacinde
laregresin:
RegresindetipoI.Seasignaacadavalordelavariableexplicativa(oconjuntodevaloresdelas
variablesexplicativas,enelcasomltiple)lamediadelavariableexplicadacondicionadaatalvalor(es)
dela(s)variable(s)explicativa(s).Porconsiguiente,sloproveerestimacionesdeYparalosvaloresde
Xcontenidosenladistribucindefrecuencias.
RegresindetipoII.Sesuponequelafunciny=f(x)oy=f(x1,x2,,xp)queligalavariableexplicada
conlaexplicativa(oexplicativas)tieneformaparamtrica,esdecir,YserelacionaconXatravsde
unaseriedecoeficientesoparmetros.Enconsecuencia,proporcionaestimacionesdeYpara
cualquiervalordeX,estcontenidoenladistribucinono.Enestesentido,sepuedeestableceruna
clasificacindelaregresindetipoIIatendiendoaltipodefuncinquerelacionala(s)variable(s)
explicativa(s)conlavariableexplicada.As,laregresin(ycorrelacin)serlineal2cuandotalfuncin
seaunarecta(silaregresinessimple),unplanoounhiperplano(silaregresinesmltiple).Encaso
contrario,laregresin(ycorrelacin)sernolineal.Dichafuncinseelegirdemodoqueseajustelo
mejorposiblealasobservaciones,resultandodegranutilidadaestosefectoslarepresentacingrfica
delasmismas,tambinllamadanubedepuntosogrficodedispersin.
ElGrfico5.1muestradistintassituaciones:elGrfico5.1(a)reflejaausenciaderelacinentrelasvariablesXeY
losGrficos5.1(b)y5.1(c)sugierenunarelacinlineal,positivaynegativa,respectivamenteelGrfico5.1(d)indica
untipoderelacinnolineal.
Lainformacinapartirdelacualsellevaracaboelanlisisderegresinycorrelacinsesupondrquevienedada
delaformamsgeneral,esdecir:
Pgina132|Iniciodelartculo
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 2/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Grfico5.1.
dondeelnmerodevaloresdistintosdeXsonnylosdeYsonm,siendoeltotaldeobservacionesN.
Evidentemente,laregresindeunavariablesobreotra(s)noproporcionaelvalorrealdelaprimera,porloquedicho
valorreal,yj,sepuedeobtenercomoelvalorestimadomediantelaregresin,i=f(xi),msoporuntrminodeerror
(estimado,puestoqueseobtienepordiferenciaentreelvalorrealyelvalorestimado):
Pgina133|Iniciodelartculo
Ntesequeparacadavalorxideladistribucinbidimensionaldefrecuenciaslaregresinproporcionaunvalor
estimadodeY,i.Sinembargo,existenjvaloresobservadosde
erroresdeestimacin(ij=yji).
Enloquesigue,ysalvoquesemanifiestelocontrario,seconsiderarquedichotrminodeerrorse
incorporaenlarelacinentreyjeideformaaditivayquenoseimponerestriccinalgunasobrelos
parmetrosocoeficientes.
Unavezintroducidoelproblemadelaregresinylacorrelacin,elrestodelcaptulo,dedicadoaregresiny
correlacinsimple,seestructuracomosigue:enelapartado5.2seplantealaregresindetipoIylamedicindel
gradodedependenciaestadsticaentredosvariablesdeacuerdocontalregresinenel5.3seabordalaregresin
detipoIIylacuantificacindeladependenciaestadsticaentrelasvariablesobjetodeestudiobajolafuncinde
regresinseleccionadaelapartado5.4sedetieneenlaregresindetipoIIdecarcterlineal,enel5.5seabordan
lasrelacionesnolineales,yenel5.6seofrecenalgunasreflexionesfinales.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 3/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
5.2.RegresindetipoIyrazndecorrelacin
5.2.1.REGRESINDETIPOI
Sealadistribucinbidimensional(xiyjnij)genrica
representadagrficamenteporlanubedepuntosquesemuestraenlapginasiguiente.
TomandoYcomovariableaexplicaryXcomovariableexplicativa,laprimeracuestinqueseplanteaeslasiguiente:
QuvalordeYselehacecorresponderaPgina134|IniciodelartculocadavalordeX?O,enotrostrminos:
CuleselvalorestimadodeYparacadavalordeX,xi?3.
DenotandoelvalorestimadodeYparaundeterminadoxicomo/xi,uncriteriobasadoenelsentidocomnesquela
sumadeloscuadradosdelosNerroresdeestimacin4sehagamnima.Ycundosehacemnimalasumadelos
cuadradosdeloserroresdeestimacin(SCE)?Segnlapropiedad2delamediaaritmtica:
Pgina135|Iniciodelartculo
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 4/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Engeneral,paracualquiervalorxi,cuando
siendo
lamediadelasobservacionesdeYquevanacompaadasenladistribucindefrecuenciasporelvalorX=xi.
Vesedeotraforma.TeniendoencuentaqueelvalorestimadoparaYcorrespondientealisimovalordelavariable
denotaelerrorcometidoenlaestimacindeYcorrespondientealvalordeximediantelaregresindetipoIdeY
sobreX(recurdesequehayNerroresdeestimacin),considreselaidentidad
Elevandoalcuadrado(paraevitarcompensacionesdeloserroresdeestimacinpositivosynegativos)ysumando
paratodaslasobservacionesbidimensionales,setiene
dondeeltrminodelaizquierdaesSCE.Porconsiguiente,
ParaobtenerlosvaloresiqueminimizanSCEseprocedecomosigue5:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 5/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina136|Iniciodelartculo
Finalmentesecompruebaquesetratadeunmnimo:
Aestetipoderegresin,enlacualacadavalordelavariableXseleasignalamediadelosvaloresdeYque
aparecencondichovalorx,seledenominaregresindetipoIdeYsobreX.Enconsecuencia,laregresindetipo
IdeYsobreXestformadaporlosparesdevalores(
).Anlogamente,laregresindetipoIdeXsobreYestaraformadaporlosparesdevalores(
).
Porconsiguiente,enelcasodelaregresindetipoIdeYsobreXsetienequeelvalordelasobservacionesdeY
plasmadasenladistribucinbidimensionaldefrecuencias,yj,sepuedeexpresarcomoyj=i+ij,donde
,siendo
/xilamediadelasobservacionesdeYqueaparecenconjuntamenteconX=xiyijelerrorquesecometealestimar
yjatravsde
/xi.
EJEMPLO5.1
Lasventas(eneuros)realizadasen2006porunamuestradecomercialesdeempresasdelsectorfarmacutico
espaol,ascomolaantigedaddelosmismosenelsector(enaos),sereflejaenlasiguientetabla:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 6/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
LlveseacabolaregresindetipoIdelniveldeventasdeloscomercialesdelsectorfarmacuticoespaolsobrela
antigedadensuprofesincomocomercialenelsector.
Pgina137
Solucin:
LaregresindetipoIestablece,comoestimacindelniveldeventasrealizadasporloscomerciales,paracadanivel
deantigedad,lamediadelasventasrealizadaspordichoscomerciales.
Elclculodelasmediasdelasventas,condicionadasacadaniveldeantigedad,sepuedellevaracabofcilmente
apartirdelatablaexpuestaenelenunciado.Noobstante,paraellectorqueloprefiera,seofreceacontinuacin
dichatablaenlaformaconvencionaldeunadistribucindefrecuenciasbidimensionales.
Dichasmediascondicionadas,paracadaniveldeantigedaddeloscomercialesenelsector,sonlassiguientes:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 7/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina138
obtenindosecomo:
Portanto,laregresindetipoIvendradadaporlosparesdevalores6:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 8/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
LanubedepuntosogrficodedispersinsemuestraenelGrfico5.2(sibienhayquetenerencuentaquemuchos
delospuntosconfluyen,dadalasimilituddelasventasrealizadasporloscomercialesdelosmenoresnivelesde
antigedad).Enltambinsemuestranlasmediascondicionadasacadaniveldeantigedad(representadasporun
rombo).
Pgina139
Grfico5.2.
LosN=30erroresdeestimacinij(enmilesdeeuros)son:
Pgina140
EJEMPLO5.2
Enunaempresadesoftwaretrabajan10asalariadosdiplomadoseninformtica,8licenciadoseninformticay6con
elgradodedoctorendichamateria.Susretribucionesmensuales,queentreotrascosasestnenfuncindesunivel
deformacin,sonlasqueseofrecenacontinuacin.Siuntrabajadorelevasuniveldeformacin,automticamente
cambiasucontrato,detalformaqueseleconsideraelnuevonivelalcanzado:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 9/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Apartirdelainformacinanterior,llveseacabolaregresindetipoIdelaretribucinmensualdelostrabajadores
delaempresaencuestinsobresuniveldeformacin.Cmomejoraraelsalariodeundiplomadosiselicenciase?
Yeldeunlicenciadosiobtuvieseelgradodedoctor?
Solucin:
Aunqueenestecaptulolasvariablesqueseconsideransondecarctercuantitativo,seharunapequea
excepcinyseabordarestecaso,dondelavariableexplicativaescualitativa(esunfactor),contresniveles.El
objetodeesteejemploesintroducirallectorenlatcnicaestadsticadelAnlisisdelaVarianza.
LaregresindetipoIdeY(salario)sobreX(niveldeformacin)vienedadapor:
Encuantoalefectosobreelsalarioquetieneelpasodediplomadoalicenciadoydelicenciadoadoctor,su
estimacineslasiguiente:
EsteresultadoeselresultadofundamentaldelAnlisisdelaVarianza,enelcualsepretendeestimarelefectoen
unavariablecuantitativaYdepasardeunoaotrodelosnivelesdelavariableXlgicamente,alhaberdicho
nivelesseestpresuponiendoquelavariableXescualitativa.
Pgina141
Noobstante,enelAnlisisdelaVarianza,laestimacindelnivelsalarialmensualparacadaunodelostrestiposde
formacinpuedeexpresarse,entreotrasmuchasmaneras,as:
esdecir,conunapartecomn.Enestecaso,sehatomadocomopartecomndecadaestimacinelsalariomedio
mensualdelostrabajadoresdelaempresa(2.089,5833euros/mes)portanto,elsalarioestimadodeuntrabajador
dedichaempresaeslasumadedoscomponentes:unocomnatodosellos(elsalariomedio)yotrodiferencialque
incrementaodisminuyelaretribucinestimadasobreelsalariomedioenfuncindelniveldeformacin.La
estimacindelcambioenelsalarioalpasardeunniveldeformacinaotrosellevaraacabomediantelas
diferenciasentrelossegundossumandosdelossegundostrminos.
Enelcasoenquelavariableexplicativaseacualitativa,laregresindetipoIslotienesentidocuandodichavariable
presentaunnmeropredeterminadodeniveles.
5.2.2.RAZNDECORRELACIN
Vayamosunpocomslejos.EnelapartadoanteriorsehaminimizadoSCEperoestonosignificaquestaseamuy
pequea.PudierasergrandeyresultarqueconotrasestimacionesdeYdistintasdelasmediascondicionadasfuera
anmsgrande.Evidentemente,cuantomspequeaseaSCEmejoreslaregresinenelsentidodeque,
globalmente,secometenmenoreserroresdeestimacin.Esms,loidealseraqueSCE=0.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 10/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Ahoralacuestines:Cmoidearunamedidaquecuantifiquelabondaddelaregresinllevadaacabo?Esdecir,
cmomedirlagananciaderivadadelhechodeconocerlosvaloresdeXquesedanconjuntamenteconlosdeYa
lahoradeexplicaroestimarestosltimos?Larespuestaeslasiguiente:
1.SinoseconocieseconquvalordeXvaemparejadocadavalordeYlamejorestimacindeY(tambinporla
propiedad2delamediaaritmtica)seralamediadelavariableY,siendolasumadecuadradosdeloserroresde
estimacincometidos
2.Ahorabien,conociendoelvalordeXquevaemparejadoconcadavalordeY,lamejorestimacindeestaltima
eslamediadelasobservacionesdeYemparejadasconelvalorencuestindeX,siendolasumadecuadradosde
loserroresdeestimacincometidos,comosehavistoanteriormente,
Pgina142
3.Porconsiguiente,lareduccinproporcionalenelerrorcometido(respectodelquesecometacuandonose
disponadeinformacinalgunasobrelavariableX)esunabuenamedidadeloqueayudalavariableXenla
explicacindelavariabilidaddelavariableY.Talreduccinproporcionalenelerrordeestimacincometidoes:
quesedenominarazndecorrelacin7(enestecasoconcretodeYsobreX)ysedenotaporY/X.
LarazndecorrelacindeYsobreXtambinpuedeexpresarsecomosigue:
DescomponiendolavarianzadeYenvarianzaintragruposyvarianzaintergrupos(propiedad3delavarianza)se
tiene
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 11/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
dedonde
Pgina143
llegndosea
Porsupropiaconstruccin,larazndecorrelacinestcomprendidaentre0y1,puestoquesicomoconsecuencia
delainclusindelavariableXlasumadecuadradosdelerrordeestimacinnosereducenada,entonceslarazn
decorrelacinvale0,mientrasquesisereducea0larazndecorrelacinvaldrlaunidad.
Loanterioreslgicopuestoque,comosehavistoanteriormente,cuandoi=
/xisetieneque
donde(1)esNveceslavarianzadelosvaloresobservadosdeYolaSCEquesecometealestimarsininformacin
algunasobrelosvaloresdeXqueacompaanalosdeY(3)eslaSCEquesealcanzacuandoseestimaconel
conocimientodelosxiy(2)esladiferenciaentreambosoreduccin(envalorabsoluto)enSCEcomoconsecuencia
deconocerelvalordeXalquevaasociadocadaobservacindeY(esdecir,comoconsecuenciadelaregresin).
Evidentemente,esdeseableque(2)seamximoy(3)mnimoonulo.Peroelmnimovalorde(3)es0yelmximo
es(1)ydeahquelarazndecorrelacintomevaloresentre0y1.
Obviamente,cuantomayorsealarazndecorrelacinmayorserlapotenciadeXalahoradeexplicarelvalorque
tomaY.LavariableYnotomasiemprelosmismosvaloressinoquepresentaciertavariabilidad(muchaopoca,
dependedecadacasoconcreto),y,silarazndecorrelacineselevada,dichavariabilidaddeYcabeseratribuidaa
lavariabilidaddeX.PorquvaranlosvaloresquetomaY?PorquevaranlosquetomaX.Silaraznde
correlacineselevada,XeslamanijaquemueveaY.Encasodequelarazndecorrelacinseapequea(cercana
acero)lavariabilidadquetieneYnocabeseratribuida(osloenpequeamedida)aX,sinoaotrascausasno
consideradasenelanlisis.Enotrostrminos:XnoeselfactorqueexplicalosmovimientosdeYosuparticipacin
enlaexplicacindelavariabilidaddeYesmuypequeay,portanto,nodebeserutilizadacomoinstrumentapara
estimarY.
Pgina144
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 12/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Hayquetenerencuentalasiguientecircunstancia:encasodequeladistribucinbidimensionaldefrecuenciassea
unitaria,larazndecorrelacinvalenecesariamentelaunidad.Ello,msquesignificarunajusteperfecto,loque
vieneasignificareslainconvenienciadellevaracabounprocedimientoderegresindetipoI,puessiacadavalor
deXlecorrespondeunoyslounodeYdicharegresincarecedesentido8.
Finalmente,cabesealarque(supngaselaregresindeYsobreX),nicamentesiy/xesdeunaciertaintensidad,
tienesentidoutilizarlosvaloresi=
/xicomoestimacionesdelosvaloresdeYcorrespondientesalosvaloresdeXqueaparecenenladistribucinde
frecuencias.Encasocontrario,sielvalordelarazndecorrelacinestcercanoa0,carecedesentidoutilizartales
valorescomoestimadoresesdecir,carecedesentidolaregresindetipoI:Qusentidotendraestimarlosvalores
deYatravsdelosdeX(porelprocedimientoquesea)sinoexistedependenciaestadstica,oexistemuypoca,de
YrespectodeX?
EJEMPLO5.3
ApartirdelainformacincontenidaenelEjemplo5.1,calculelarazndecorrelacindelasventasdelos
comercialessobresuantigedadcomoprofesionalesenelsector.
Solucin:
Enlatabladelapginasiguientesemuestranlosclculosnecesariosparaobtenerlarazndecorrelacin.
Apartirdeellaseobtienelavarianzadelasventasdeloscomercialescomo
siendo
y,portanto,suvarianza:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 13/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina145
Finalmente,seobtienelarazndecorrelacindeY(ventasdeloscomerciales)sobreX(niveldeantigedaddelos
mismosenelsector)como
EstevalordeY/X=0,9957indicaquelasumadeloscuadradosdeloserrorescometidosenlaestimacindelas
ventasmediantelaregresinIsereduceenun99,57%respectodelacometidaencasodenoconocerlaantigedad
deloscomercialesenelsector,dedondesededucequelavariableXaportamuchainformacinsobrelavariableY,
yporconsiguiente,lasventasdeloscomercialespuedenexplicarsemuybienenfuncindelosnivelesde
antigedadconsideradosenladistribucin.
5.2.3.VARIANZADEBIDAALAREGRESINYVARIANZARESIDUAL
Comohapodidoverseenelapartado5.2.2,
Pgina146
Portanto,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 14/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
dedondesepuedeapreciarquelavarianzatotaldelavariableYsepuededescomponerenlasumadedos
componentes:lavarianzadeloserroresdeestimacin(tambindenominadosresiduosdelaregresin)yun
porcentajedelavarianzadeYquesedebealainclusindelavariableXenelanlisis,quesedenominarvarianza
deYexplicadaporlaregresindetipoIdeYsobreX,oporlainclusindelavariableXenlaregresin.En
consecuencia,larazndecorrelacindeYsobreXnoessinolavarianzadebidaalaregresindetipoIdeYsobre
XdivididaentrelavarianzadelavariableY.
Perocomotambin
entonces
dondeelprimertrminodelladoderechodelaexpresineslaanteriormentedenominadavarianzadeYexplicada
porlaregresindetipoIovarianzadelasestimacionesproporcionadasporlaregresindetipoI9(S2y)y,el
segundo,lavarianzadeloserroresdeestimacin(S2e).Evidentemente,lavarianzadeYexplicadaporla
regresindetipoIesunporcentajedesuvarianzatotalquevienedeterminadoporlarazndecorrelacin.Enotros
trminos:losvaloresdeYnosonsiemprelosmismos,ypartedesuvariabilidadsedebealvalordeXquelos
acompaaenestesentido,larazndecorrelacinseinterpretacomoelporcentajedelavariabilidaddeYqueviene
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 15/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
determinadoestadsticamenteporlavariabilidaddelosvaloresdeXyporellopuedeconsiderarsecomoel
porcentajedelavariabilidaddeYquesedebealhechodeconsiderarXcomofactorexplicativodelamisma
medianteunaregresindetipoI.Entrminosmsintuitivos:elporcentajedelcomportamientodelavariableY
provocado,entrminosestadsticos,porelcomportamientodelavariableX.
Pgina147
EJEMPLO5.4
Enesteejemploseprocedealadescomposicindelavarianzadelasventasrealizadasporloscomercialesdel
sectorfarmacuticoespaolconsideradosenelEjemplo5.1enlavarianzaexplicadaporlaregresindetipoI(S2r)y
lavarianzadeloserroresdeestimacin(S2e).Paraello,seconstruyelasiguientetabla:
Deellasededucefcilmenteelvalordelavarianzadebidaalaregresin
yeldelavarianzadeloserroresdeestimacin
Sepuedecomprobarque
Pgina148
5.3.RegresindetipoIIycoeficientededeterminacin
5.3.1.CONCEPTODEREGRESINDETIPOII
LaformadeprocederenlaregresindetipoIesasignaracadaunodelosvaloresdeunavariablecuantitativaX
queaparecenenladistribucin(queenalgunoscasospudieranserlosnicosquetomalavariableX),oaun
nmeropredeterminadodenivelesdeunavariablecualitativa(comosevioenelEjemplo5.2),unvalorestimadode
Y.Endefinitiva,asignarestimacionesdeYalconjuntofinitodevaloresdeXconelquesetrabaja.
Ahoralapreguntaeslasiguiente:cuandolavariableexplicativaescuantitativaypuedetomarcualquiervalor
razonable,cmohabraqueprocederparaestimarsurelacinconlavariableaexplicarcuandosedispone
nicamentedelosvalores(xiyj)contenidosenladistribucindefrecuencias,peroquenosontodoslosquepuede
tomarlavariablebidimensional?
Enestecaso,siseestimaYmediantelasmediasdedichavariablecorrespondientesacadavalordeXsecometer
elmenorerrordeestimacinposibleperonosepodrnrealizarestimacionesdeYparaotrosvaloresdeXno
contenidosenladistribucin.SlosedispondrdeestimacionesdeYparalosvaloresdeXqueaparecenenla
misma.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 16/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Anteestatesitura,lamejorsolucinesobservarlanubedepuntosyelegiruntipodefuncincontinuaqueseadecue
aella.Posteriormente,seestimarnlosvaloresdelosparmetrosdedichafuncinquehacenmnimalasumade
cuadradosdelerrordeestimacin.Dichodeotraforma:setratadeobtenerlafuncinquepasamscercadetodos
lospuntosdelanubeyque,porconsiguiente,generalosmenoreserroresdeestimacin.
Ellectorpodrapensarquetalfuncinessencilla.Segnlapropiedad2delamediaaritmticaserunaquepase
porlasmediasdeYparacadavalordeX.Estoescierto,peroentonceshabraqueajustarunpolinomiodegrado
demasiadoelevado,esdecir,lafuncinserademasiadocomplejaadems,seraelmejorajusteposibleparalos
datosdeladistribucin(loquenoquieredecirnecesariamentequeseamuybueno,puesellodependerdela
variabilidaddelosvaloresdeYcondicionadaacadavalordeX)pero,muyprobablemente,generalizaramalpara
otrosdistintos.EspreferibleunafuncinmssencillaqueproporcioneelcomportamientogeneraldelavariableYa
medidaqueevolucionalavariableX.TalfuncinsedenominafuncinderegresindetipoIIyentreellaslams
comneslarecta,sibienexistenotrascomolaparbola,lafuncinexponencial,lapotencial,etc.
Porconsiguiente,enelcasoqueseesttratando,puedesurgiruntradeoffentreminimizacindeSCE(estimacin
mediantemediascondicionadas)ygeneralizacinPgina149(estimacinmedianteunafuncinsencillaque
proporcioneelcomportamientodelmovimientoconjuntodelasvariablesXeY),puestoqueamedidaqueesta
funcinsealejedelasmediascondicionadasaumentarSCE.Enelcasoenquelasmediascondicionadassiganla
funcinsencillatendencialestetradeoffhabrdesaparecidoperoestasituacinesinusual.
Ahorabien,unacuestinimportanteeslasiguiente.Antesdebuscarlafuncinsencillatendencial(funcinde
regresindetipoII)sedebecalcularlarazndecorrelacin,puestoquealcalcularsestaconlasmedias
condicionadasproporcionalamximareduccinproporcionaldeSCEalincluirlavariableXenelprocedimientode
estimacindeY(elgradodedependenciaestadsticadeYrespectodeX).Sidichareduccinespequea(por
ejemplo,el20%,esdecir,Y/X=0,2),notendrsentidobuscarunafuncinderegresindetipoIIdeYsobreXen
arasdelageneralizacin,puestoquelareduccinenSCEser,utilizandoestafuncin,inferioral20%y,dadoqueel
gradodedependenciaestadsticadeYrespectodeXatravsdedichafuncinderegresindetipoIIesmuy
pequeo,talfuncincarecerdeutilidadalahoradeestimarYatravsdeX.Porelcontario,cuandolaraznde
correlacineselevada,stienesentidobuscarunaestructuradedependenciasencillapuestoque,aunquesepierda
enreduccinenSCE,stapuedesertodavaelevada.
5.3.2,COEFICIENTEDEDETERMINACIN
10
UnavezelegidoelmodelodefuncinderegresindetipoIIyestimadoslosvaloresdesusparmetrosquehacen
mnimaSCE11,lacuestinqueseplanteaescmomedirelgradodedependenciadeYrespectodeXbajola
suposicindequeseestimaYmediantedichafuncinconcretadeX.Talgradodedependenciaserdenotadopor
R2Y/X,ysedenominacoeficientededeterminacindelaregresindeYsobreX(R2X/Y,cuandolaregresinseade
XsobreY).
EnconsonanciaconladefinicindeY/X,R2Y/XdeberserdefinidocomolareduccinproporcionalenSCEquese
consiguealestimarlosvaloresdeYatravsdelosdeXmediantelafuncinderegresindetipoIIelegidaenvezde
mediante
.Esdecir,
Pgina150
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 17/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Anlogamente,
LaeficienciarelativadelaregresindeYsobreX,esdecir,elporcentajedeladependenciaestadsticadeY
respectodeX(Y/X)querecogelafuncinderegresindetipoIIelegida,vienedadaporlaexpresin
interpretndosecomoloefectivaqueeslacurvaofuncinajustadaalahoraderecogerladependenciaestadstica
deYrespectodeX.Endefinitiva,comoyaseindicanteriormente,representaelporcentajedeY/Xquerecogela
funcinderegresindetipoIIelegida.
EnelcasodelaregresindeXsobreYsetiene
LafuncinderegresindetipoIImscomnmenteutilizadapararelacionarestadsticamenteYconXeslarecta,ya
queesdefcilmanejoy,conciertafrecuencia,seajustabastantebienalarealidad.Porestarazn,elsiguiente
apartadoestdedicadoalaregresinlineal.
Pgina151
5.4.Regresinlineal
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 18/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Antesdecomenzarconesteapartadoresultaesencialentenderquseentiendeporlineal,yaquehaydosposibles
interpretaciones:linealidadenlasvariablesylinealidadenlosparmetros.
Unafunciny=f(x)sedicequeeslinealenXsilavariableXaparececonpotenciaunitaria(portanto,seexcluyen
trminoscomox2,x3,1/x,x,porejemplo)ynoestmultiplicadanidivididaporotravariable.Porejemplo,yj=a+
bxi+cxi2noesunafuncinlinealenlasvariablespuestoquelavariableXapareceelevadaalcuadrado.
Sedicequeunafuncineslinealenlosparmetrossistosaparecenconfrecuenciaunitariaynoestn
multiplicadosnidivididosporcualquierotroparmetro.Amododeejemplo,yj=a+bxinoesunafuncinlinealen
losparmetros.Sinembargo,yj=a+bxi+cxi2sloes.
Delasdosinterpretacionesdelinealidad,lalinealidadenlosparmetroseslamsrelevanteenelcontextodela
teoradelaregresinydelacorrelacin.Sinembargo,enloquesigue,seexigirtantolalinealidadenlos
parmetroscomoenlasvariablesparaquelaregresinseacalificadadelineal12.
5.4.1.ESTIMACINDELOSPARMETROSDELAREGRESINLINEAL
EnelcasoenquesepresumaquelarelacindedependenciadeYsobreXesdecarcterlineal,yj=a+bxi+eij,
dondeeijrepresentaelerrorquesecometecomoconsecuenciadequepudierahaberotrasvariablesqueinfluyesen
enelcomportamientodelavariableY,lacuestines:Cmoestimarlosparmetrosaybdelamisma?
Grfico5.4.
Pgina152
ComoenestatesituralafuncinderegresindetipoIIelegidasera
representandoelvalordeYqueseestimaatravsdetalfuncinlinealparaX=xienbasealainformacin
disponible,obviamentelasestimacionesdedichosparmetros,y
,sernaquellasqueminimicenSCE:
Derivandoparcialmenterespectoay
eigualandoacero,setieneque
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 19/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
yoperando:
sistemadenominadodeecuacionesnormales.
DividiendoambasecuacionesporNseobtiene
yrestandodelasegundalaprimeramultiplicadapora10sellegaa
dedonde
ydespejandodelaprimeradelasecuacionesdelsistemasetieneque
conloquelarectaderegresinsepuedeescribirenformaexplcitacomo
obien,enformapuntopendiente,como
Pgina153
Obviamente,aybsondosparmetros(novaran),mientrasquey
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 20/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
sonestimacionesobtenidasapartirdeunconjuntofinitodeobservaciones.Sienlugardelasobservaciones
disponiblessetuviesenotras,losvaloresdey
diferirandelosestimadospreviamente.
Alosvaloresy
selesdenominacoeficientesdelaregresinlinealdeYsobreXo,simplemente,coeficientesderegresin.El
coeficiente
,cuyosignoeseldelacovarianzaentrelasvariables,eslapendientedelarectaderegresindeYsobre
,eindicalavariacindeYanteunincrementounitariodeX.Eltrminoindependienteuordenadaenelorigen,desde
unenfoquegeomtrico,eselpuntodecorteentrelarectaderegresinyelejedeordenadas.Analticamentepuede
interpretarsecomoelvalorestimadoparaYcuandoX=0,aunqueestainterpretatinanalticapuedenotener
sentidoalgunoenlarealidad.
DividiendoporSYenambosladosdelaecuacinderegresinlinealseobtiene
esdecir,enlaregresinlineal,dadoque
esmenoroigualquelaunidadenvalorabsoluto,elvalorestimadodeYparaunvalordeXdeterminadoesmenos
raroenladistribucindeYquetalvalordeXenladistribucindeX(enelsentidodeque,entrminosrelativosa
sudesviacintpica,estmscercanoalamedia),yaque
Laexpresin
puededenominarse,deformaintroductoria,covarianzarelativa.Noobstante,enelapartado5.4.2recibirel
nombredecoeficientedecorrelacinlinealentreXeY,denominacinporlaqueesconocida,ysedenotarporr.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 21/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Enlaestimacindeloscoeficientesayb(odelarectaderegresin)esindiferentetrabajarconlosvalores
observadosdelavariableYoconsusmediascondicionadasrepetidasni.veces13puestoquecomo
Pgina154
entonces
ysumandoparatodaslasobservaciones
ycomoeltercertrminodelladoderechodelaecuacinseanula(vasenotaapiedepgina134),setieneque
Obsrveseelsegundotrminodelladoderechodelaanteriorecuacin.Porlasegundapropiedaddelamedia
aritmtica,paracadavalorxiladiferenciacuadrticaseminimizacuandoelsustraendodeyjesprecisamente
/xi.Comoestoocurrecualquieraqueseaelvalorxi,resultarquelasumaparatodoidedichasdiferencias
cuadrticasserlamnimaposibley,enconsecuencia:
Adems,analticamente,alderivarSCErespectodey
,comoelsegundotrminodeladerechanolosincluye,noinfluyeparanadaenlosresultadosqueseobtengan,
puessuderivadarespectodecualquieradeellosesnula.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 22/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Evidentemente,loexpuestoesvlidoparacualquierfuncinqueseajustealosdatos(omedias),noteniendopor
quserexclusivodelcasolineal.
DeformaanlogaacomoseharealizadolaregresinlinealdeYsobreXsellevaraacabolaregresindeXsobre
Y,
,con
Pgina155
Ambasregresioneslineales,ladeYsobreXyladeXsobreY,pasanporelpunto(
),quesedenominacentrodegravedaddeladistribucindefrecuencias.
EJEMPLO5.5
SuponiendoquesehaoptadoporunarectacomolamejorfuncinquepuedeajustarlanubedepuntosdelEjemplo
5.1,obtngaselaestimacindeloscoeficientesdelarectaderegresineinterprtense.Utilicedicharectapara
estimarlasventasdeuncomercialcon17aosdeantigedadenelsector.
Solucin:
Paraelclculodeloscoeficientesderegresin,seconstruyelasiguientetabla,enlaqueseincorporanlasmarcas
declasedelosintervalosdeantigedad:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 23/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Deellasededucenelvalormediodelaantigedaddeloscomercialesenelsector:
Pgina156
Grfico5.5.
suvarianza
Pgina157
ylacovarianzaentrelaantigedadcomocomercialesenelsectorylasventasdelosmismos,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 24/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
necesariasparaelclculodeloscoeficientesderegresin:
Finalmente,larectaderegresindelavariableYsobrelavariableXvienedadapor
Encuantoalainterpretacindeloscoeficientesderegresin,dedicharectasededuceque,cuandolaantigedad
deuncomercialenelsectoraumentaunao,susventasseincrementanen46.488,89.Sinembargo,respectoala
interpretacindelcoeficiente,steseraunodeloscasosenlosquecarecedesentidotalinterpretacin,yaque
resultaquelasventasgeneradasporuncomercialsinantigedadenelsectorserande62.508,57,locuales
absurdoyaquelasventasnopuedensernegativas.
Estarectaderegresin,adiferenciadelaregresindetipoI,permiteestimarvaloresdeYcorrespondientesa
valoresdeXquenoseencuentranenladistribucin.Porejemplo,sepuedenestimarlasventasquele
corresponderanauncomercialcon17aosdeantigedadenelsectorcomo
5.4.2.COEFICIENTEDEDETERMINACINLINEAL
UnavezelegidalafuncinrectilneapararepresentarlarelacindedependenciadeYsobreXyestimadossus
parmetrosayb,acontinuacinseprocedealcmputodelcoeficientededeterminacinlinealconobjetodemedir
elgradodedependenciadeYsobreXbajolafuncinderegresinlinealestimada.
Enelcasolineal,
,elcoeficientededeterminacinadoptalasiguienteexpresin:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 25/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina158
Dichaexpresinsedenomina,lgicamente,coeficientededeterminacinlinealsimple,r2,porseruna
particularizacindelarazndecorrelacin,ymsconcretamentedelcoeficientededeterminacin14.
Sucampodevariacines[01],interpretndosecomosigue:
r2=0significaquelarelacinlinealentreYyXnoreduceenabsolutalaSCEquetienelugaralahora
deprocederalaestimacindelosvaloresdeYsinconocimientodelosvaloresdeX(i=
)y,porconsiguiente,laregresinlinealnoaportanadaalahorademejorarlasestimacionesdeY
(seguirsiendolarectai=
).
r2=1indicaquelaestimacindelosvaloresdeYatravsdelarectaderegresinesperfecta,por
cuantoescapazdehacernulaSCE.Enotrostrminos:YdependefuncionalmentedeXatravsdela
rectaestimada.
Cuantomsseacerqueaceror2,menorserlacapacidaddelarectaestimadaalahoradeexplicarla
relacindedependenciadeYsobreX.Lgicamente,cuantomsseacerquealaunidad,mayorser
sucapacidaddeexplicartalrelacin.
EnelcasodelaregresinlinealdeXsobreYelcoeficientededeterminacinseraelmismo,sinqueelloimplique
quelavarianzadeloserroresdeestimacinPgina159sealamismaqueenlaregresindeYsobreX,locual
nicamenteocurriraenelcasodequestafuesenula.Loquescoincideeslaraznentrelavarianzadelos
erroresdeestimacinenlaregresindeYsobreXylavarianzadeYconlarazndeloserroresdeestimacinenla
regresindeXsobreYylavarianzadeX.Efectivamente,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 26/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
dedondesededuceque
Dadoqueenamboscasos,enlaregresindeYsobreXyenladeXsobreY,elcoeficientededeterminacinlineal
eselmismo,stevieneaindicarelgradodedependenciamutuadelasvariablesatravsdeunarecta.
Esfcilcomprobarque
=r2.
LaeficienciarelativadelaregresinlinealdeYsobreXsemideatravsdelaexpresin
yseinterpretacomolacapacidadquetienelaregresinlinealalahoraderecogerladependenciadelavariablea
explicarrespectodelaexplicativa.
EnelcasodelaregresindeXsobreYsetieneque
Larazcuadradadelcoeficientededeterminacinlinealseconocecomocoeficientedecorrelacinlinealsimple(en
elCaptulo4,ascomoenelepgrafePgina160precedente,sedenomincovarianzarelativaamodointroductorio)
ytambincoincideenlaregresindeYsobreXyenladeXsobreY.
Dadoquer2varaentre0y1,rvariarentre1y1,noexistiendoproblemaalgunoconelsigno,puestoqueesel
mismoqueeldelacovarianzaentreambasvariables.Porconsiguiente,obviandolacuestindelaambigedaddel
signo,setieneque
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 27/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Losvaloresderseinterpretancomosigue:
r=1:enestecasolasvariablespresentanunarelacinfuncionalypositiva(lapendientedelarectade
regresinespositiva).Enotrostrminos,todoslosvaloresestimadoscoincidenconlosobservados,por
locualSCEesnula.Enestecaso,adems,lasrectasderegresindeYsobreXydeXsobreY
coinciden.
r=1:enestatesituralasvariablespresentanunarelacinfuncionalynegativa.Tambinenestecaso
todoslosvaloresestimadoscoincidenconlosobservados,porlocualSCEesnula,ylasdosrectasde
regresincoinciden,sibiensondecrecientes.
r=0:enestecasonoexistecorrelacinlinealentrelasvariablesylasrectasderegresinson
perpendiculares.Enconcreto,larectaderegresindeYsobreXesunaparalelaalejeXtrazadaporel
punto
delejedeordenadasyladeXsobreYunaparalelaalejeYtrazadaporelpunto
delejedeabscisas.
Pgina161
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 28/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Grfico5.6.
EsimportanteresaltarquelaausenciadecorrelacinlinealseidentificaconlaincapacidaddelavariableXpara
explicarmejor(conmenorSCE)losvaloresdelavariableYatravsdeunarectaqueenlasituacinenlaquenose
disponedeinformacinsobreXyseestimanlosvaloresdeYatravsdesumediaaritmtica(j=
).
Portanto,loquesignificarealmenteuncoeficientedecorrelacinlinealr=0esquelaintroduccindeXenforma
linealnoreducelavariabilidaddeYrespectodecuandonoseconocaXyseestimabanlosvaloresdeYmediantela
mediadeestavariable.
1<r<0:lacorrelacinlinealentrelasvariablesesnegativaytantomscuantomsseacerquera
1.Ambasrectasderegresintienenpendientenegativa,sibiensondistintas.
0<r<1:lacorrelacinlinealentrelasvariablesespositivaytantomscuantomsseacerquera1.
Ambasrectasderegresintienenpendientepositiva,sibiensondistintas.
Otrascaractersticasderatenerencuentasonlassiguientes:
1.Esinvariantealoscambiosdeorigen,yaquetantolacovarianzacomolavarianzaloson.
2.Esinvariantealoscambiosdeescalaencuantoasuvalorabsoluto.Si
entonces
Pgina162
Sinembargo,noloesencuantoalsigno.Sielcambiodeescalaserealizaenunasoladelasvariablescambiarde
signocuandok1ok2(dependedelavariableenlacualseopereelcambiodeescala)seanegativoynolohar
cuandoseapositivoSielcambiodeescalasellevaacaboenlasdosvariables,cambiardesignocuandok1yk2
tengansignodistintoynoloharcuandosusignoseaelmismo.
Apesardelaligaznexistenteentreloscoeficientesdedeterminacinycorrelacinlineal,enlaprctica,la
utilizacindeambossueleserdiferente:elprimeroesmsutilizadoparamedirlavariabilidaddelavariablea
explicarquesedebealavariabilidaddelavariableexplicativaatravsdeunarelacinlineal,mientrasqueel
segundosueleemplearseparamedirelgradoderelacinlinealentredosvariables,yaseaporquelatengande
formadirectaodebidoalainfluenciasobreambasdeunaterceravariable.
EJEMPLO5.6
EstdieselabondaddelaregresinllevadaacaboenelEjemplo5.5.
Solutin:
LaregresinllevadaacaboenelEjemplo5.5sertantomsfiablecuantomayorseaelcoeficientededeterminacin
lineal.Portanto,bastaprocederasuclculo
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 29/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
paraconcluirquelaregresinlineal(oajuste)realizadaesmuysatisfactoria,yaqueelvalordedichocoeficienteest
muycercanoalaunidad.ElloindicaquelaSCEenausenciadeinformacinacercadelaantigedaddelcomercial
enelsectoresrebajadaenun92,52%cuandosedisponedetalinformacinyseincorporaenunarectade
regresinparaestimarlosvaloresdelavariableY.
5.4.3.VARIANZADEBIDAALAREGRESINLINEALYVARIANZARESIDUAL
Delapartado5.2.3sesabeque
dondeelprimertrminodelladoderechodelaigualdadeslavarianzadebidaalaregresinyelsegundolavarianza
residual.
Pgina163
EnelcasodelaregresindetipoII,laexpresinanteriorsetransformaen15
ysidicharegresinesdetipolineal,esdecir,
,setieneque
Ahorabien,enelcasolineallasumadelosresiduos(y,portanto,sumedia)esnula,igualqueocurraenla
regresindetipoI,yaque
y,porconsiguiente,elsegundotrminodeladerechaenlaexpresin
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 30/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
quenoessinoelmomentodeorden2deloserroresdeestimacin(oresiduos),coincideconlavarianzadelos
mismos,pudindoseconcluirquelavarianzadelavariableYsepuededescomponerendospartes:lavarianza
debidaalaregresin,opartedelavariabilidaddeYqueseexplicaporlainclusindeXenelanlisis,ylavarianza
deloserroresdeestimacinovarianzaresidual.
EJEMPLO5.7
DescompngaselavarianzadelasventasdeloscomercialesdelsectorfarmacuticodelEjemplo5.1envarianza
debidaalaregresinlinealyvarianzadeloserroresdeestimacin.
Solucin:
ComopudoverseenelEjemplo5.3,S2y=271.460.888.888,89.Ahora,apartirdelasiguientetabla:
Pgina164
sededuceelvalordelavarianzadebidaalaregresin
yelvalordelavarianzadeloserrores
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 31/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
pudiendocomprobarsefcilmenteque
Pgina165
5.4.4.CORRELACINLINEALEINDEPENDENCIAESTADSTICA
Enelapartado5.4.2sehavistoque
dondeSXSYnoessinoelvalorabsolutodelmximovalordelacovarianzaentredosvariables(Captulo4,apartado
4.4.4),porloqueelcoeficientedecorrelacinlinealnohacesinoredimensionarelcampodevariacindela
covarianzaentre1y1.Dichoesto,ahorasepuedeentenderporqulacovarianzaentredosvariablesindicasu
gradodecorrelacinlinealatravsdelarecta
.Laventajadelcoeficientedecorrelacinlinealrespectodelacovarianza,alahorademedirlacorrelacinlineal
entreXeY,esque,mientraselcampodevariacindelacovarianza[SXSY+SXSY]dependedecadadistribucin
bidimensional,eldelcoeficientedecorrelacinlineales[11]paratodaslasdistribuciones.
Enelapartado4.4.4tambinsepusodemanifiestoqueenelcasodequedosvariablesXeYfuesen
estadsticamenteindependientessucovarianzaeranula.Obviamente,enelcasodeindependencia,alserla
covarianzanula,elcoeficientedecorrelacinrtambinsernulo:silasvariablessonindependientes,tambinlo
sernlinealmente.Ahorabien,elrecproconotieneporquserciertonecesariamente:lacorrelacinlinealentrelas
variablesXeYpuedesernula(r=0)ysinembargonoserindependientes.
SilasvariablesXeYsonestadsticamenteindependientes,entoncestambinlosernlinealmenteySXY=r=0.Sin
embargo,puedeocurrirqueSXY=r=0ylasvariablesnoseanindependientes,yaquelacovarianzasepuede
anularsinquesecumplalacondicindeindependencia.Veseconunejemplo.
EJEMPLO5.8
Sealasiguientedistribucindefrecuencias:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 32/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina166
dondelasvariablesXeYestnrelacionadascomosigue:Y=X2.
Grfico5.7.
Enladistribucinanteriorsetieneque
conloqueSXY=0,r=0ylasvariablesestnincorrelacionadaslinealmente.Sinembargo,lasvariablesson
dependientesbajounaformaparablica.
SisellevaraacabounaregresinlinealdeYsobreX,larectaserai=2,5=
,esdecir,seestimaraYporsumediaaritmticafuesecualfueseelvalordeX,igualqueseharaenlatesituraen
quelosvaloresdeXqueacompaanalosdeYfuesendesconocidos.Laregresinlinealnohareducidoniunpice
laSCE=S2YquesetenaalestimarlosvaloresdeYsinayudadelosdeX.Ellosedebeaquenoexisterelacin
linealalgunaentreYyX.
Porconsiguiente,dosvariablespuedenestarincorrelacionadaslinealmenteyserdependientesbajocualquierotro
tipodefuncin.Elhechodequer=0lonicoqueimplicaeslainexistenciadedependenciaestadsticaentreXeY
decarcterlineal,perosloesolasvariablespuedendependersegnotrotipodefuncin.
5.5RegresinYcorrelacinnolineal
5.5.1.INTRODUCCIN
LaregresinsimpledetipoIInolinealesunaregresinentredosvariablespero,comosupropionombreindica,la
funciny=f(x)notienecarcterlineal,pornoserloenlosparmetroso/yenlasvariables.
EjemplosdefuncionesderegresindetipoIInolinealessonlossiguientes:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 33/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina167
Enloquesigue,seabordarelcasodelaregresinpolinmicaydealgunasfuncionesquesonsusceptiblesdeser
reducidasalineales(lasmsrelevantessonlasexpuestascomoejemplos,aexcepcindelaltima).
5.5.2.REGRESINPOLINMICAYCOEFICIENTEDEDETERMINACIN
16
5.5.2.1.Regresinpolinmica
Comosehaindicadoanteriormente,enestecasolafuncinderegresindetipoIIes
Elerrordeestimacinseobtienecomosigue:
siendolasumadecuadradosdelerrordeestimacin
Paraobtenerelvalorestimadodelosparmetrosa,b,c,queminimizanSCEmediantelafuncinencuestin,se
derivaparcialmenterespectode
,igualandoposteriormentedichasderivadasaceroyresolviendofinalmenteelsistemadeecuaciones:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 34/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Comoyaesconocido,estasecuacionessedenominanecuacionesnormales,ydesusolucinseobtienen
Pgina168
DenominandoijaladiferenciaentreelvalorestimadoyelvalorobservadodeYenelisimopar(xiyj),las
ecuacionesanterioressepuedenreescribircomo:
LaregresinpolinmicadeXsobreYsellevaraacabodeformaanloga.
5.5.2.2.Coeficientededeterminacinpolinmico
Apartirdelaexpresindelcoeficientededeterminacingeneral
elcoeficientededeterminacinpolinmicoseobtienesinmsquehacer
Sucampodevariacin,evidentemente,es[01]conlainterpretacinyaconocida.
EJEMPLO5.9
ApartirdelosdatosdelEjemplo5.1,llveseacabounajusteparablicoycomprubesesiescapazdemejoraral
ajustelinealanteriormenterealizadoenelEjemplo5.5.
Solucin:
Enelcasoconcretodeunpolinomiodeorden2,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 35/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
lasecuacionesnormales,resultadodeminimizarlaSCE,sonlassiguientes
Pgina169
dedonde
DividiendoentreNaambosladosdelaigualdadenlastresecuacionesdelsistemaseobtiene:
queexpresadoenformamatricialequivalea
Elclculodeloselementosdelamatrizdecoeficientesdelsistemaseobtieneapartirdelasiguientetabla,que
incluyelasmarcasdeclasedelosintervalosdeantigedad:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 36/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina170
Deellasededucenlosvaloresde
yrecordandodelosEjemplos5.3y5.5elrestodevaloresnecesarios:
=9,02,
=356.666,67,a11=8.618.333,33,a20=197,51ya02=398.672.000.000,seobtieneelsistema:
Susolucinvienedadapor
dedondesededucequelaparbolaquemejorajustalanubedepuntoses
Apartirdelatablaqueseexponeenlapginasiguiente,seprocedealclculodelcoeficientededeterminacin
parablicoconlafinalidaddedeterminarlabondaddelajusterealizado.
DeellasededucequeSCE=44.785.676.397,82y,portanto,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 37/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Comoelcoeficientededeterminacinlinealsimpleesr2=0,9252(vaseEjemplo5.6),seconcluyequeelmodelo
parablicoestimadoajustamejorquelarecta(i=62.508,5754+46.488,89xi)losdatosrelativosalasventasde
loscomercialesysuantigedadenelsector.
Pgina171
Grfico5.8.
Pgina172
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 38/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Adems,comoy/X=0,9957(vaseEjemplo5.3),laregresinparablicallevadaacaboescapazderecogerla
prcticatotalidaddeladependenciadeYrespectodeX,yaquelaeficienciarelativadelamismaes
5.5.3.ALGUNASREGRESIONESDETIPOIINOLINEALESSUSCEPTIBLESDEREDUCCINA
LINEALES
AlgunasfuncionesderegresindetipoIInolinealespuedenreducirsealinealeshaciendounatransformacin
adecuada.Algunosejemplossonlossiguientes:
Funcinexponencial:i=
xi
Loprimeroqueesnecesarioponerdemanifiestoesqueelerrortericodebeintervenirdeformamultiplicativa,esto
es,
conlocual,tomandologaritmos17,lafuncinexponencialsetransformaenunalineal.
Ntesequesieltrminodeerrorinterviniesesumandolalinealizacinnoseraposible.
Unavezrealizadalatransformacinlogartmicaseestimaelmodelotransformado(lineal),obtenindoselarectade
regresin
,dondelaregresinlinealdeInYsobreXproporcionalosvaloresde
.Evidentemente,nosequiereestimarInayInb,sinoaybsinembargo,lasestimacionesdeaybseobtienen
fcilmentesinmsquedeshacerlatransformacinlogartmica.
Puedeapreciarseque,suponiendodosobservacionescontiguas(x1y1)y(x2y2),conx2=x1+1,yprescindiendo
deltrminodeerror,setieneque
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 39/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina173
conloque
esdecir,(
1)100estimaelincrementoporcentual(constante)queexperimentalavariableYanteincrementosunitariosenel
valordeX.
Como
elcoeficientedelapendientedelmodeloenlogaritmos,estoes,
,estima,aproximadamente,elincrementoentantosporunodeYanteunaumentodeXenunaunidad.Obviamente,
100
esunaestimacinaproximadadelavariacinporcentualdeYanteunaumentodeXenunaunidad.
LosmodelosdeltipoInYj=a+bxi+eijlinealesenlosparmetrosaybyenlasvariablesXyInY,sedenominan,
comoconsecuenciadedichalinealidad,modelosloglin,debidoaqueYseencuentraenformalogartmica(sifuese
Xlavariablequeseencontraseenformalogartmica,elmodelosedenominaralinlog)ysucaracterstica
fundamentalesqueelcoeficientedelapendiente(b)mide,aproximadamente,lavariacinrelativaconstanteenY,
entantosporuno,anteuncambiounitarioenelvalordeX18.Porello,losmodelosloglinresultanespecialmente
tilesensituacionesenlasqueXesunavariabledetendenciaeneltiempo,puestoqueenesecaso100b
proporcionalatasaporcentualdecrecimientoodecrecimientoconstanteenlavariableYantevariacionesunitarias
enelvalordelavariableX.Porellotambinesdenominadomodelodecrecimiento(constante).
Obviamente,elmodelotransformadoInyj=Ina+xiInb+Ineijesuncasoparticulardelosmodelosloglinenelque
elcoeficientedelapendienteesInb.
Funcinpotencial:i=x
Igualqueenelcasoexponencial,paraquelafuncinpotencialsealinealizableeltrminodeerrordebeentraren
formamultiplicativa,
yaquesientraaditivamentelalinealizacinnoesfactible.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 40/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina174
Elmodelotransformadoadoptalaforma
porloquelaregresinlinealquesellevaacaboinicialmentees
,regresindeInYsobreInX,queproporciona
.Posteriormente,laregresini=x
iseobtienesinmsquecalcularmedianteelantilogaritmoneperianode.
ElmodeloInyj=Ina+bInxi+Ineij,linealenlosparmetrosInaybylinealenloslogaritmosneperianosdelas
variablesXeY,sedenomina,debidoadichalinealidad,modelologlog,doblelogologlineal.Unacaracterstica
atractivadeestetipodemodelos,porlacualsehanhechobastantepopulares,esqueelcoeficientebmidela
elasticidaddeYrespectoaX.Porotraparte,elmodelologlogasumequeelcoeficientedeelasticidadbpermanece
constante,porloquetambinsehadadoendenominarmodelodeelasticidadconstante.
Efectivamente,
dedonde
Tambinsepuedecomprobarque,suponiendodosobservacionescontiguas(x1:y1)y(x2y2),yprescindiendodel
trminodeerror,setieneque
conloque
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 41/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
ycomo
Pgina175
esdecir,queparacambiosinfinitesimalesenXelcambioabsolutoenelInXesigualalavariacinrelativaenX,se
tieneque,paracambiospequeos(noinfinitesimales):
porloque
estima,aproximadamente,lavariacinporcentualdeYanteunavariacindeun1%enX.
ComomuestraelGrfico5.9,elcambioenelInYporunidaddecambioenelInX,esdecir,laelasticidadb,
permanececonstanteindependientementedelInXdondesemidalaelasticidad.
Grfico5.9.
UnmodelodeelasticidadconstanteproporcionauncambioporcentualconstanteenYanteuncambioporcentual
dadoenX,independientementedelnivelabsolutadeste.Aefectosdelasoportunascomparaciones,lafuncinde
regresinlineal=+
xproporcionalavariacinabsolutaenYporunidad(absoluta)decambioenX.
Amododeejemplo,enelmodeloi=5x2isilosvaloresdeXseincrementansucesivamenteenun1%,losdeY
aumentanenun2,01%,y,silosvaloresdeXseincrementansucesivamenteenun10%,losdeYaumentanenun
21%.
Enelmodelodedosvariables,lamaneramssencilladedecidirsielmodelologlinealajustabienlosdatosconsiste
enrealizarungrficodeldiagramadedispersindelInXyInXyversilospuntosdelanubeseencuentran
aproximadamentesobreunalnearecta(comoenelgrficodeladerecha).
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 42/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina176
Funcinhiperblicaequilteraorecproca:
Haciendo
,laregresinlinealdeYsobreZproporcionay
ElmodelorecproconoeslinealenlavariableX(estexpresadaenformainversaorecproca),perosenlos
parmetros.Elmodelotransformado
eslinealtantoenlosparmetroscomoenlasvariablesYyZ.
Unejemploclsicodeestemodeloeslarelacindelcostefijomedioconelniveldeproduccin,puesamedidaque
aumentaesteltimoelprimerodeclinacontinuamente(debidoaqueelcostetotalfijosereparteentreungran
nmerodeunidadesdeproducto)yfinalmentesevuelveasintticoconelejedeproduccinalnivela.Otradesus
aplicacionesmspopulareseslaconocidacurvadePhillips.Amododeejemplo,conbaseenlainformacin
suministradaenlatablaqueseexponeacontinuacin,relativaalosincrementosinteranualesdelatasadesalarios
(Y)ylatasadeparo(X)paraelReinoUnidoduranteelperiodo19501966,cuandoseajustelmodelorecprocose
obtuvoelsiguienteresultado:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 43/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Pgina177
Salvoenesteltimocaso(elrecproco),enelque
enlosotrosdos(exponencialypotencial)nosedebeutilizarlaexpresindelcoeficientededeterminacinlinealcon
lasvariablestransformadas(enelcasoexponencialXnosetransforma)paramedirelgradodedependencialineal
deYsobreX,yaqueloqueseobtendra,realmente,seraelgradodedependencialinealdeInYsobreX,enelcaso
exponencial,ydeInYsobreInX,enelcasopotencial.Adems,en
con
enelcasoexponencialy
enelcasopotencial,sepuedeapreciarque
norepresentaelporcentajedevarianzadeYnoexplicadaporlaregresinllevadaacabo.Loqueexpresaesel
porcentajedevarianzadeInYnoexplicadapordicharegresin.
Lgicamente,estacircunstanciasuponeunproblemaalahoradecompararlabondaddedosregresiones,enbasea
lamismadistribucinbidimensionaldefrecuencias,cuandounadeellashasufridoalgntipodetransformacin.En
laliteratureestadsticasepuedenencontrarvariassolucionesprcticasaesteproblema.Noobstante,existeprctica
unanimidadenqueunasolucintilysencillaconsisteencompararlasumadelasdiferenciascuadrticasentrelos
valoresobservadosdelavariableaexplicarysusvaloresestimados,eligiendoaquellaconmenorresultado(criterio
delamnimaSCE,considerando,encualquiercaso,ij=yji).
EJEMPLO5.10
AlavistadelanubedepuntosdelEjemplo5.1,sepodraelegirunafuncinexponencialobienunapotencialpara
intentarcaracterizarelcomportamientogeneraldelasventasdeloscomercialesdelsectorfarmactico.Portanto,en
esteejemploseprocedeinicialmentealaestimacindelosparmetrosderegresinenambostiposdemodelo.
Posteriormente,secomparalabondaddelaregresinexponencial,laregresinpotencialylasdemsregresiones
realizadasconlosdatosdelEjemplo5.1(laregresindetipoI,laregresinlinealylaregresinparablica)alahora
deajustarlanubedepuntos.
Pgina178
Solucin:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 44/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Funcinexponencial:
Dadoquesepretendeobtenerk=
xi,parafacilitarlaobtencindelasestimacionesdelosparmetrosaybdelmodeloexponencialseconsidera,como
pasoprevio,latransformationlogartmicadedichomodelo,queconducealasiguienteregresinlineal:
Portanto,alavistadelarectaderegresinanterior,paraestimarlosparmetrosInayInbseprocedeala
construccindelasiguientetabla,cuyaprimeracolumnahacereferenciaalasmarcasdeclasedelosintervalosde
antigedad:
DeellasedesprendenlosvaloresdelamediadeZ=InY
ydelacovarianzaentreXyZ=InY
Pgina179
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 45/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
porloquelarectaderegresindeZsobreXsera
esdecir,enformaexplcita:
Deaqusededuceque
,dedondeseobtienenlasestimacionesdelosparmetrosdelmodeloexponencial:
Finalmente,lafuncinexponencialestimadaes
donde(
1)100=11,15%estimaelincrementoporcentual(constante)queexperimentalavariableYanteincrementos
unitariosenelvalorde
=10,57%esunaestimacinaproximadadelavariacinporcentualdeYanteunaumentodeXenunaunidad.
Funcinpotencial:
Procediendodeformaanlogaconlafuncinpotential,dadoquesepretendeobteneri=x
i,parafacilitarlaobtencindelasestimacionesdelosparmetrosaybdelmodelopotencialseconsidera,como
pasointermedio,latransformacinlogartmicadedichomodelo,queconducealasiguienteregresinlineal:
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 46/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
ParaobtenerlasestimacionesdelosparmetrosInaybdelaregresinlinealdeInYsobreInXseconstruyela
siguientetabla,dondetambinlaprimeracolumnaincorporalasmarcasdeclasedelosestratosdeantigedad
considerados:
Pgina180
apartirdelacualseobtienenlosvaloresdelamediadeW=InX:
delavarianzadeW=InX
ydelacovarianzaentreW=InXyZ=InY
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 47/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
porloquelarectaderegresindelInYsobreelInXadoptalaexpresin
Despejando
setiene
Delaexpresinanteriorsededuceque
yque
=0,7215,porloquelaestimacindeasera
Finalmente,lafuncinpotencialestimadaes
Pgina181
donde
=0,72estimalaelasticidaddeYrespectoaXeindica,aproximadamente,lavariacinporcentualdeYanteuna
variacindeun1%enX.
Unavezobtenidaslasestimacionesdelasfuncionesexponentialypotencial,paradilucidarculdeellasesmejor,en
trminosdelabondaddelajuste,ydadoqueenambosmodeloslasestimacionesyloserroresdeestimacinse
relacionanenformamultiplicativa,seprocedealclculodelaSCEderivadadecadaunadeellas.Aestosefectos,
recurdesequeelerrordeestimacinsetomacomo
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 48/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Funcinexponencial:
Paraelclculodelasumadeloscuadradosdeloserroresdeestimacin,SCE,seconstruyelasiguientetabla:
dedondeSCE=3.669.078.152.200,63.
Funcinpotencial:
Igualqueenelcasoexponencial,seprocedeinicialmentealclculodelasestimacionesobtenidasmediantela
regresinpotencialparalosdistintosintervalosdeantigedad,deloserrorescometidosenlaestimacinydela
sumadesuscuadrados:
Pgina182
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 49/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
obtenindosequeSCE=2.784.042.217.387,24.
Apartirdelosclculosrealizados,ydadoqueSCEpotencial<SCEexponencial,pareceintuitivoquelafuncinpotencial
ajustamejorlanubedepuntosquelafuncinexponencial.
LareduccinproporcionalenlaSCEobtenidacuandoseestimasininformacinalgunasobreXqueproporcionanlos
modelosexponencialypotenciales,respectivamente:
Sinembargo,adichasreduccionesproporcionalesenelerrorcometidocuandonosedisponadeinformacinalguna
sobreX,RPSCEpotencialyRPSCEexponencial,nocabedenominarlascoeficientesdedeterminaciny,adems,su
interpretacinesconfusa,porcuantoeltrminodeerrorentramultiplicandoenambosmodelosy,como
consecuencia,lamediadelasobservacionesdeYnocoincideconlamediadesusestimaciones,motivoporelcual
lavarianzadelasobservacionesnopuededescomponerseenvarianzadebidaalaregresinyvarianzaresidual,y
porelcualRPSCEpotencialyRPSCEexponencialnopuedenentendersecomolavarianzadebidaalaregresindividida
porlavarianzadelavariableY.
Pgina183
Porltimo,comparandotodoslosajustesrealizados,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 50/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
seconcluyeque:
1.LamenorSCElaproporcionalaregresindetipoI,queeslamejorregresinaunquenoseauna
funcincontinuay,portanto,nosirvaparaestimarencualquierpunto.
2.SCEparbola>SCErecta>SCEpotencial>SCEexponencial,dedondeseintuyeque,entrelasfunciones
continuasplanteadas,elmejorajuste,entrminosdeSCE,eselparablico,seguidodellineal,del
potencialy,porltimo,delexponencial.
Grficamente,
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 51/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Grfico5.10.
Pgina184
5.6Algunasconsideracionesfinalessobrelaregresin
Antesdeprocederallevaracabounaregresinentredosvariablessehadereflexionarsobrelaposiblerelacinreal
entreellas,puesprocederdirectamentearegresarunavariablesobreotrapuedeconducirasituacionesabsurdas.
Porejemplo:sepuederegresarlaantigedaddelostrabajadoresdeunaempresasobreelsalariodelosmismosy
estimarlafuncinderegresin,peronotienesentidoeconmicoalgunoquelaantigedaddependadelsalarioes
justoalrevs.
Tambinpuededarselacircunstanciadequedosvariablesestnrelacionadasestadsticamenteperonotengan
ningntipoderelacinterica.Porejemplo,pudierasucederqueexistaunarelacinestadsticaintensaentrelas
toneladasdecarbnproducidasanualmenteenelReinoUnidoyelnmerodeaccidenteslaboralesanualesen
Espaaenelsectordelaconstruccin.Sinembargo,talrelacinestadsticasedeberaalazar,noexistiendo
ningunafundamentacintericalatente.
Igualmente,pudieraocurrirquehubieseunacorrelacinlinealfuerteentrelossalariosanualesyelnmerode
accidenteslaborales,tambinanualmente,enelsectordelaconstruccinenEspaa.Denuevo,noexisteninguna
relacintericaentreambasvariables,perosisellevaseacabounaregresinlinealseobtendraunacorrelacin
positivadeciertaintensidadentreambas.Ellolonicoquesignificaraesqueunaterceravariable,laactividaddel
sectordelaconstruccin,estinfluenciandotantolossalariosdelsector(quesemuevenenfuncindelnivelde
actividad)comoelnmerodeaccidenteslaboralesqueseproducenenelmismo(quetambinestnenrelacin
directaconlaactividaddelsector),peronadams.
Portanto,unpasoprevioalaregresinentredosvariableseslareflexinpreviaylaconstatacindequeexiste
fundamentotericoparallevaracabotalregresin.
Porotraparte,unadelaslaboresmssolicitadasaloseconomistaseslalabordeprediccin(pronsticoafuturo)y
saesunatareaquesehaencomendadodurantemuchotiempo,ysesigueencomendando,alosmodelosde
regresin.Amododeejemplo,sepuedellevaracabounaregresindelsalariomedioenEspaaenfuncindel
tiempoyutilizarlafuncinderegresinestimadaparapredecirelsalariomedioenEspaaenunaovenidero.Sin
embargo,comoapuntanCroxtonyCowdenquenosotrossepamos,nohayfrmulasmgicasparapredecirlos
acontecimientosCualquierprocedimientodeprediccinqueimpliquesimplementelaprolongacindeunacurvao
laaplicacinautomticadeunafrmula,sinhaceralmismotiempounestudiominuciosodeloselementos
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 52/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
modificadoresdemayorinfluencia,merecepocaconfianza,sobretodosilascondicioneseconmicasson
inestables.
Pgina185
Estacircunstanciaeliminalavalidezdelaregresinocualquierotromodelocomoinstrumentodeprediccin?
Evidentementeno,sobretodosilabondaddelajustellevadoacaboessatisfactoria,perohayquetenerencuenta
quelafuncinderegresin,ocualquierotraexpresin,constituyenicamenteunmuro,importanteperoslouno,del
complicadoedificiodelaprediccin.Comoapuntanlosautoresanteriormentecitados,tratardepreverloque
sucederenelfuturorequiereunacomprensinperfectadelfenmenoapredecir,unconocimientominuciosodelos
ltimosacontecimientosenlasactividadesafinesyelreconocimientodelaslimitacionesdecualquierartificio
mecnicoparapredecir.
Enelmundoreal,sinembargo,noesinusualestimarfuncionesderegresinconnimodeprediccinsinteneren
cuentalosconsejosdelosautoresanteriormentecitados,utilizndose,ennopocasocasiones,losartificiosde
prediccinparajustificardeterminadashiptesisdeconveniencia.Noobstante,conestonosepretendeinvalidarlas
tcnicasestadsticasquesedestinanalaprediccinpuestoque,porlomenos,estnbasadasenlaobservacinde
larealidad.Loquesepretendeponerdemanifiestoesquehayquemanejarlasconcuidadoyserconscientesdesus
limitacionespues,parafraseandounavezmsaCroxtonyCowden,laprediccinesinciertaypeligrosa.
Finalmente,cabesealarquelasestimacionesdelasfuncionesderegresinnecesitandatosyquedelaexactitud
y/overacidaddelosmismosdependerelxitodelalaborderegresin.Silosdatosapartirdeloscualesseestima
lafuncinderegresinsonmalos,laregresinysusestimacionesnovalendenada.Enconsecuencia,otropaso
previoalaestimacindelafuncinderegresineselanlisisdelacalidaddelainformacindisponible.
Pgina186
APNDICE.Origendeltrminoregresin
Considreselasiguientedistribucindealturasmediasdepadres(mediaentreladelpadreylamadre)ehijos
adultos(hijosdedichospadres)(enpulgadas)19:
Delasimpleobservacindelatablaanteriorsedesprendequeexisteunaciertarelacinestadsticaentrelaestatura
mediapaternalylaestaturamediafilial:padresaltostienen,porlogeneral,hijosaltosypadresbajos,hijosbajos.
AnalceseelGrfico5.11,dondelalneagrisdiscontinuamarcalaalturamediadeloshijosencasodequefuese
igualalamediadeladelospadreslalneanegracontinuaeslacurvademedianas20filialescondicionadasalas
alturaspromediodelospadreslalneanegradiscontinuaeslaregresinlinealdelasalturasmediasdeloshijos
sobrelasdelospadresylalneagriscontinuaeslaalturamedianadelaPgina187poblacin.Laalturamediana
delapoblacin(padresehijos)sesitaenelcorteentrelalneanegradiscontinuaylalneagrisdiscontinua(68,25
pulgadas68,25pulgadas).
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 53/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Grfico5.11.
Quseobserva?:Quelasalturaspromediodeloshijosseacercanmsalamedianapoblacionalquelasdelos
padres.Galtondeterminquelaproporcinencualquierpunto(cualquieraquesealaalturapromediopaternal)entre
lasdistanciasdelalneanegradiscontinuaalagriscontinuaydelalneagrisdiscontinuaalagriscontinuaerade
2/3esdecir,ladesviacinfilialalpromediopoblacionalesdosterciosdeladesviacinpaternaadichopromedio.
Yollamoaestaproporcinde2a3laproporcinderegresinfilial.Eslaproporcinenlacualelhijoes,en
promedio,menosexcepcionalqueelpadre,sealaGalton.
Yprosiguemsadelante:Estevalordedosterciosseaceptar,porlotanto,comolacantidadderegresin,a
partirdelamediademuchoscasos,delaestaturamediapaternalhacialamediafilial,cualquieraquesealaestatura
mediapaternal()Portanto,depadrespromedioaltossaldrnhijospromedioaltos,peronotanaltoscomoellos
puesrevertirnhacialamediapoblacionaligualmente,depadrespromediobajossaldrnhijospromediosbajos,
peronotantocomoellosporquelaalturadeloshijosrevertiralamediageneral.Lomismopasaconotrosmuchos
dones.
Otroejemploclsico
OtroejemploclsicoeselqueproporcionaK.PearsonensuGramticadelaCiencia,concretamenteenlapgina
414.
Pgina188
Pearsonproponetrabajarcon5.513plantasdeadormiderasilvestrerecogidasenlacumbredeChilterns.Decada
plantaarrancadoshojasyenlacajaocpsuladecadaunadeellascuentaelnmerodebandasestigmticas.Los
resultadosobtenidosfueronlossiguientes:
Comopuedeapreciarse,eltotalnosonlos5.513paresdeadormiderasinojustamenteeldoble.Laraznesque
Pearsoncuentacualquieradelasdoscajascomolaprimera(poresolatabladecorrelacinessimtricarespectode
ladiagonalprincipal).Peroestonoafectaalrazonamiento.Podrasuponersequeexisten11.026paresdecajassin
problemaalguno.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 54/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
Delatablaexpuesta,sinningntipodeanlisisestadstico,sepuedeextraerlasiguienteconclusin:amedidaque
aumentaelnmerodebandasestigmticasenunmiembrodelparaumentatambinlamediadelnmerodebandas
estigmticasdelotromiembrodelpar.Enotrostrminos,lamediadelsegundomiembrodelpardependedelnmero
debandasestigmticasdelprimero.Difieredel(delnmerodebandasestigmticasdelprimero)enladireccinde
lamediadelapoblacingeneral(deadormideras),quees10,4.As,para5lamediaes6,33,para6lamediaes
7,11,,para11es10,73,para12es10,96,etc.
Pgina189
steeselfenmenoderegresin,asaber,queenparesasociadosycorrelativossiseseleccionaunmiembrocon
unvalordadodelcarcter,elsegundotiene,portrminomedio,unvalormenor(omayor)queregresaalgohaciala
mediadelapoblacingeneral.Porejemplo,paraunaplantaenlaqueunodesusmiembrostiene9bandas
estigmticas,lamediadebandasdelotromiembronoes9ni10,04sino9,51,esdecir,regresadesde9haciala
mediageneraldelapoblacin.
Lafilademediasdemuestraqueestaleyesuniversal:elpromediodecpsulasasociadastiendealamediageneral.
1Engeneral,seutilizaeltrminoexplicarsloensentidoestadstico,sinqueelloimpliquerelacincausaefecto,
puestoquenoexisteningunatcnicaestadsticaquepuedadeterminardemaneraestrictalaexistenciade
causalidadentrelasvariables,correspondiendodichalaboralosexpertosenlamateriaobjetodeestudio.Ahora
bien,comolasrelacionesdeinterssonlasdecarctercausal,sedeterminarnlasvariablesexplicaday
explicativa(s)detalmaneraquelaregresinrealizadatengasentidoterico,puestoqueelfundamentotericodela
relacinestablecidapermitirdarelpasoderelacinestadsticaarelacindecausalidad.
2VanselosprimerosprrafosdelApartado5.4paramayorabundamientoenlacuestin.
3Obviamente,tambinpodraconsiderarseYcomovariableexplicativayXcomovariableaexplicaryplantearla
cuestinrelativaaquvalordeXselehacecorresponderacadavalordeY.Sistefueseelcaso,enloquesigue
nohabramsquecambiarlasXporYylasYporX.
4Inicialmente,podrapensarseenminimizarlasumadeloserroresdeestimacin(yi/xi)peroestecriterio,
ademsdeotrosinconvenientes,podraprovocarlacompensacindegrandeserrorespositivosynegativos.Para
evitardichosinconvenientes,otraopcinpodraconsistirenminimizarlasumadelosvaloresabsolutosdelos
erroresdeestimacin|yi/xi|,peroestecriterionoseprestaamanipulacionesalgebraicas.Porello,lasolucinque
seadoptafinalmenteesminimizarlasumadeloscuadradosdeloserroresdeestimacin(yj/xi)2,yaqueevitala
compensacindeloserroresnegativosypositivos,esunaexpresinmanipulablealgebraicamenteyresultaun
criterioptimofrenteaotrosalternativoscuandosecumplenciertascondiciones.
5Elprocedimientosedenominaestimacinmnimocuadrticaporcuantosetratadeobtenerlosvaloresique
hacenmnimalasumadecuadradosdelerrordeestimacin.
6Enrealidad,enestecaso,estformadaporparesdeintervalosyvalores.
7Enrealidad,loquesehadenominadovarianzadelerrordeestimacineselmomentodeorden2respectodel
origendelerrordeestimacin,perodadoquelamediadelerrordeestimacinesnulaenlaregresindetipoI,
puededenominarsetambinvarianzadeloserroresdeestimacin.Acontinuacinsecompruebaque,
efectivamente,lamediadeloserroresdeestimacinenlaregresindetipoIesnula:
8Noobstante,enelcasoenqueelnmerodeelementosdelatablabidimensionalseaescasoy,sinembargo,el
nmerodeceldasdedichatablaseaelevado,Pearsonproporcionunacorreccindelarazndecorrelacin.Pero
estacuestinsobrepasaelmbitodeestemanual.Obviamente,cuantomayoresseanlasfrecuenciasconjuntas
contenidasenlatablabidimensionaldefrecuencias,msrepresentativoserelvalorobtenidodelaraznde
correlacin.
9Tngaseencuentaque,alconsiderarqueeltrminodeerrorsesumaalaestimacinproporcionadaporla
regresindetipoI,lamediadelasestimacionescoincideconlamediadelasobservaciones.
10Recurdeseque,salvoquesedigalocontrario,sesuponequeloserroresylasestimacionestienenunarelacin
aditivayquenoexistenrestriccionessobreloscoeficientesoparmetrosdelaregresin.
11Enlosapartados5.4.1y5.5.1puedeverseelprocedimientodeestimacindedichosparmetrosenelcasolineal
yalgunoscasosnolineales,respectivamente.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 55/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple
12Algunosautoresconsideranquebastalalinealidadenlosparmetrosparaquelaregresinseaconsiderada
lineal.
13Siemprequeeltrminodeerrorentreenformaaditiva.
14Dadalasencillezdesuexpresin,enlaprcticapudieraserrecomendablesuclculoantesdeprocederala
estimacindelarectaderegresin,puesnotendrasentidolaestimacindestasielvalorder2noes
razonablementeelevado.Noobstante,losclculosnecesariosparalaestimacindelosparmetrosaybson
prcticamentelosmismosqueparaelcmputoder2.
15Conelerrorylasestimacionesrelacionadosenformaaditivaysinrestriccionesenlosparmetrosocoeficientes
delaregresin.
16Aunquelaregresinpolinmicapodratratarsecomouncasoparticulardelaregresinmltiple,sehapreferido
incluirlaenestecaptulodadoquesloexisteunavariableexplicativa.
17Sehaoptadoportomarlogaritmosneperianosporseraquellosconlosqueestmsfamiliarizadoelalumno,si
bien,puedeutilizarsecualquierotrabase.
18Enelcasodelmodelolinlog,yj=a+bInxi+eij,elcoeficientedelapendiente(b)mide,aproximadamente,la
variacinconstanteenYanteuncambiorelativounitarioenelvalordeX.Estoes,
19TomadodeGalton,F.(1988):HerenciayEugenesia.Reimpresin.AlianzaUniversidad.Madrid.Pag.157.
20Galtontrabajabaconmedianasperopuedeutilizarselamediasinprdidadegeneralidad.
Citadefuente(MLA8thEdition)
MonteroLorenzo,JseMaria."RegresinyCorrelacinSimple."Estadsticadescriptiva,Paraninfo,2007,pp.129
189.GaleVirtualReferenceLibrary,go.galegroup.com/ps/i.do?
p=GVRL&sw=w&u=unad&v=2.1&id=GALE%7CCX4052100011&it=r&asid=b82c81e98fcc1361e1929abe203c8219.
Accessed25Apr.2017.
NmerodedocumentodeGale:GALE|CX4052100011
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 56/56