Sunteți pe pagina 1din 56

25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

RegresinyCorrelacinSimple
Estadsticadescriptiva.JseMariaMonteroLorenzo.Madrid:Paraninfo,2007.p129189.
Copyright:COPYRIGHT2007CengageLearningParaninfo,S.A.
Textocompleto:
Pgina129

RegresinyCorrelacinSimple
5.1.Introducin
5.2.RegresindetipoIyrazndecorrelacin
5.2.1RegresindetipoI
5.2.2Razndecorrelacin
5.2.3Varianzadebidaalaregresinyvarianzaresidual
5.3.RegresindetipoIIycoeficientededeterminacin
5.3.1ConceptoderegresindetipoII
5.3.2Coeficientededeterminacin
5.4.Regresinlineal
5.4.1Estimacindelosparametrosdelaregresinlineal
5.4.2.Coeficientededeterminacinlineal
5.4.3.Varianzadebidaalaregresinlinealyvarianzaresidual
5.4.4.Correlacinlinealeindependenciaestadstica
5.5.Regresinycorrelacinnolineal
5.5.1Introduccin
5.5.2Regresinpolinmicaycoeficientededeterminacin
5.5.3AlgunasregresionesdetipoIInolinealessusceptiblesdereduccinalineales
5.6.Algunasconsideracionesfinalessobrelaregresin

Pgina130|Iniciodelartculo

5.1.Introduccin
Enelcaptuloprecedentesepusodemanifiestoelintersdeestudiarsimultneamentedosomscaracteres,XeY,
sobrelamismapoblacin,conelpropsitodedetectarsiexistedependenciaestadsticaentreellososi,porel
contrario,sonindependientes.

Amododeejemplo,enelcasodecaracterescuantitativos(marcoenelcualseenglobaestecaptulo),sepuede
pensarqueexisterelacinentreelsalariodelostrabajadoresysuantigedadenlaempresa,entreelnmerode
afiliadosenaltaalaSeguridadSocialylaproduccindelaeconomaespaola,entreeltiempodebsquedade
empleodelosparadosysuedad,etc.

Puesbien,enestecaptuloelpuntodepartidaserlaexistenciaderelacinodependenciaestadsticaentrelas
variablesobjetodeestudio,yelinterssecentrarenestimarlaformaoestructuradetalrelacinydeterminarla
intensidaddelamisma.Enestesentido,sedistingueentreteoradelaregresinyteoradelacorrelacin,
orientadasalprimerysegundotipodeanlisis,respectivamente.Ambosestnntimamenteligados,demaneraque
siempreseharreferenciaalacorrelacinsegnunadeterminadaestructuradedependenciaentrelasvariables.

Endefinitiva,lateoradelaregresintratadeexplicar1elcomportamientodeunavariable,denominadaexplicada
(dependienteoendgena),enfuncindeotrauotras,denominadasexplicativas(independientesoexgenas).Se
puedeestablecerunaprimeraclasificacinenfuncindelnmerodevariablesexplicativas:laregresin(y
correlacin)sersimplesinicamentehayunavariableexplicativaporelcontrario,sermltiplesielnmerode
variablesexplicativassonvarias.As,sisequiereexplicarelsalariodelostrabajadoresenfuncindesuantigedad
enlaempresalaregresinsersimple.Si,ademsdelaantigedadenlaempresa,seconsideratambinelgrado
deformacindelostrabajadoresalahoradeexplicarsusalario,laregresinsermltiple.

Encualquieradelasdossituacionesanteriores(regresinsimpleomltiple),lacuestinqueseplanteaesquvalor
delavariableexplicadalecorrespondeacadaunodelosvaloresdelavariableovariablesexplicativas.Enelcaso
deunasolavariableexplicativa,sistaesXlaregresinserdeYsobreX(Y/Xdeformaabreviada),mientrasque
siesY,laregresinserdeXsobreY(X/Ydeformaabreviada).Enelcasomltiplelasvariablesexplicativasse

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 1/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

denotan,engeneral,porPgina131|IniciodelartculoX1,X2,,Xp,ylaexplicadaporY,denotndoseporY/X1,
X2,,XplaregresindeYsobreX1,X2,,Xp.

Estecaptuloabordarlaregresinsimple,dejandolaregresinmltipleparaelCaptulo6.

Atendiendoalcriteriodeestimacindelosvaloresdelavariableexplicada,sepuedeestablecerotraclasificacinde
laregresin:

RegresindetipoI.Seasignaacadavalordelavariableexplicativa(oconjuntodevaloresdelas
variablesexplicativas,enelcasomltiple)lamediadelavariableexplicadacondicionadaatalvalor(es)
dela(s)variable(s)explicativa(s).Porconsiguiente,sloproveerestimacionesdeYparalosvaloresde
Xcontenidosenladistribucindefrecuencias.
RegresindetipoII.Sesuponequelafunciny=f(x)oy=f(x1,x2,,xp)queligalavariableexplicada
conlaexplicativa(oexplicativas)tieneformaparamtrica,esdecir,YserelacionaconXatravsde
unaseriedecoeficientesoparmetros.Enconsecuencia,proporcionaestimacionesdeYpara
cualquiervalordeX,estcontenidoenladistribucinono.Enestesentido,sepuedeestableceruna
clasificacindelaregresindetipoIIatendiendoaltipodefuncinquerelacionala(s)variable(s)
explicativa(s)conlavariableexplicada.As,laregresin(ycorrelacin)serlineal2cuandotalfuncin
seaunarecta(silaregresinessimple),unplanoounhiperplano(silaregresinesmltiple).Encaso
contrario,laregresin(ycorrelacin)sernolineal.Dichafuncinseelegirdemodoqueseajustelo
mejorposiblealasobservaciones,resultandodegranutilidadaestosefectoslarepresentacingrfica
delasmismas,tambinllamadanubedepuntosogrficodedispersin.

ElGrfico5.1muestradistintassituaciones:elGrfico5.1(a)reflejaausenciaderelacinentrelasvariablesXeY
losGrficos5.1(b)y5.1(c)sugierenunarelacinlineal,positivaynegativa,respectivamenteelGrfico5.1(d)indica
untipoderelacinnolineal.

Lainformacinapartirdelacualsellevaracaboelanlisisderegresinycorrelacinsesupondrquevienedada
delaformamsgeneral,esdecir:

Pgina132|Iniciodelartculo

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 2/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Grfico5.1.

dondeelnmerodevaloresdistintosdeXsonnylosdeYsonm,siendoeltotaldeobservacionesN.

Evidentemente,laregresindeunavariablesobreotra(s)noproporcionaelvalorrealdelaprimera,porloquedicho
valorreal,yj,sepuedeobtenercomoelvalorestimadomediantelaregresin,i=f(xi),msoporuntrminodeerror
(estimado,puestoqueseobtienepordiferenciaentreelvalorrealyelvalorestimado):

Pgina133|Iniciodelartculo

Ntesequeparacadavalorxideladistribucinbidimensionaldefrecuenciaslaregresinproporcionaunvalor
estimadodeY,i.Sinembargo,existenjvaloresobservadosde

erroresdeestimacin(ij=yji).

Enloquesigue,ysalvoquesemanifiestelocontrario,seconsiderarquedichotrminodeerrorse
incorporaenlarelacinentreyjeideformaaditivayquenoseimponerestriccinalgunasobrelos
parmetrosocoeficientes.

Unavezintroducidoelproblemadelaregresinylacorrelacin,elrestodelcaptulo,dedicadoaregresiny
correlacinsimple,seestructuracomosigue:enelapartado5.2seplantealaregresindetipoIylamedicindel
gradodedependenciaestadsticaentredosvariablesdeacuerdocontalregresinenel5.3seabordalaregresin
detipoIIylacuantificacindeladependenciaestadsticaentrelasvariablesobjetodeestudiobajolafuncinde
regresinseleccionadaelapartado5.4sedetieneenlaregresindetipoIIdecarcterlineal,enel5.5seabordan
lasrelacionesnolineales,yenel5.6seofrecenalgunasreflexionesfinales.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 3/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

5.2.RegresindetipoIyrazndecorrelacin
5.2.1.REGRESINDETIPOI

Sealadistribucinbidimensional(xiyjnij)genrica

representadagrficamenteporlanubedepuntosquesemuestraenlapginasiguiente.

TomandoYcomovariableaexplicaryXcomovariableexplicativa,laprimeracuestinqueseplanteaeslasiguiente:
QuvalordeYselehacecorresponderaPgina134|IniciodelartculocadavalordeX?O,enotrostrminos:
CuleselvalorestimadodeYparacadavalordeX,xi?3.

DenotandoelvalorestimadodeYparaundeterminadoxicomo/xi,uncriteriobasadoenelsentidocomnesquela
sumadeloscuadradosdelosNerroresdeestimacin4sehagamnima.Ycundosehacemnimalasumadelos
cuadradosdeloserroresdeestimacin(SCE)?Segnlapropiedad2delamediaaritmtica:

Pgina135|Iniciodelartculo
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 4/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Engeneral,paracualquiervalorxi,cuando

siendo

lamediadelasobservacionesdeYquevanacompaadasenladistribucindefrecuenciasporelvalorX=xi.

Vesedeotraforma.TeniendoencuentaqueelvalorestimadoparaYcorrespondientealisimovalordelavariable

denotaelerrorcometidoenlaestimacindeYcorrespondientealvalordeximediantelaregresindetipoIdeY
sobreX(recurdesequehayNerroresdeestimacin),considreselaidentidad

Elevandoalcuadrado(paraevitarcompensacionesdeloserroresdeestimacinpositivosynegativos)ysumando
paratodaslasobservacionesbidimensionales,setiene

dondeeltrminodelaizquierdaesSCE.Porconsiguiente,

ParaobtenerlosvaloresiqueminimizanSCEseprocedecomosigue5:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 5/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina136|Iniciodelartculo

Finalmentesecompruebaquesetratadeunmnimo:

Aestetipoderegresin,enlacualacadavalordelavariableXseleasignalamediadelosvaloresdeYque
aparecencondichovalorx,seledenominaregresindetipoIdeYsobreX.Enconsecuencia,laregresindetipo
IdeYsobreXestformadaporlosparesdevalores(

).Anlogamente,laregresindetipoIdeXsobreYestaraformadaporlosparesdevalores(

).

Porconsiguiente,enelcasodelaregresindetipoIdeYsobreXsetienequeelvalordelasobservacionesdeY
plasmadasenladistribucinbidimensionaldefrecuencias,yj,sepuedeexpresarcomoyj=i+ij,donde

,siendo

/xilamediadelasobservacionesdeYqueaparecenconjuntamenteconX=xiyijelerrorquesecometealestimar
yjatravsde

/xi.

EJEMPLO5.1
Lasventas(eneuros)realizadasen2006porunamuestradecomercialesdeempresasdelsectorfarmacutico
espaol,ascomolaantigedaddelosmismosenelsector(enaos),sereflejaenlasiguientetabla:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 6/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

LlveseacabolaregresindetipoIdelniveldeventasdeloscomercialesdelsectorfarmacuticoespaolsobrela
antigedadensuprofesincomocomercialenelsector.

Pgina137

Solucin:

LaregresindetipoIestablece,comoestimacindelniveldeventasrealizadasporloscomerciales,paracadanivel
deantigedad,lamediadelasventasrealizadaspordichoscomerciales.

Elclculodelasmediasdelasventas,condicionadasacadaniveldeantigedad,sepuedellevaracabofcilmente
apartirdelatablaexpuestaenelenunciado.Noobstante,paraellectorqueloprefiera,seofreceacontinuacin
dichatablaenlaformaconvencionaldeunadistribucindefrecuenciasbidimensionales.

Dichasmediascondicionadas,paracadaniveldeantigedaddeloscomercialesenelsector,sonlassiguientes:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 7/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina138

obtenindosecomo:

Portanto,laregresindetipoIvendradadaporlosparesdevalores6:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 8/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

LanubedepuntosogrficodedispersinsemuestraenelGrfico5.2(sibienhayquetenerencuentaquemuchos
delospuntosconfluyen,dadalasimilituddelasventasrealizadasporloscomercialesdelosmenoresnivelesde
antigedad).Enltambinsemuestranlasmediascondicionadasacadaniveldeantigedad(representadasporun
rombo).

Pgina139

Grfico5.2.

LosN=30erroresdeestimacinij(enmilesdeeuros)son:

Pgina140

EJEMPLO5.2
Enunaempresadesoftwaretrabajan10asalariadosdiplomadoseninformtica,8licenciadoseninformticay6con
elgradodedoctorendichamateria.Susretribucionesmensuales,queentreotrascosasestnenfuncindesunivel
deformacin,sonlasqueseofrecenacontinuacin.Siuntrabajadorelevasuniveldeformacin,automticamente
cambiasucontrato,detalformaqueseleconsideraelnuevonivelalcanzado:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 9/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Apartirdelainformacinanterior,llveseacabolaregresindetipoIdelaretribucinmensualdelostrabajadores
delaempresaencuestinsobresuniveldeformacin.Cmomejoraraelsalariodeundiplomadosiselicenciase?
Yeldeunlicenciadosiobtuvieseelgradodedoctor?

Solucin:

Aunqueenestecaptulolasvariablesqueseconsideransondecarctercuantitativo,seharunapequea
excepcinyseabordarestecaso,dondelavariableexplicativaescualitativa(esunfactor),contresniveles.El
objetodeesteejemploesintroducirallectorenlatcnicaestadsticadelAnlisisdelaVarianza.

LaregresindetipoIdeY(salario)sobreX(niveldeformacin)vienedadapor:

Encuantoalefectosobreelsalarioquetieneelpasodediplomadoalicenciadoydelicenciadoadoctor,su
estimacineslasiguiente:

EsteresultadoeselresultadofundamentaldelAnlisisdelaVarianza,enelcualsepretendeestimarelefectoen
unavariablecuantitativaYdepasardeunoaotrodelosnivelesdelavariableXlgicamente,alhaberdicho
nivelesseestpresuponiendoquelavariableXescualitativa.

Pgina141

Noobstante,enelAnlisisdelaVarianza,laestimacindelnivelsalarialmensualparacadaunodelostrestiposde
formacinpuedeexpresarse,entreotrasmuchasmaneras,as:

esdecir,conunapartecomn.Enestecaso,sehatomadocomopartecomndecadaestimacinelsalariomedio
mensualdelostrabajadoresdelaempresa(2.089,5833euros/mes)portanto,elsalarioestimadodeuntrabajador
dedichaempresaeslasumadedoscomponentes:unocomnatodosellos(elsalariomedio)yotrodiferencialque
incrementaodisminuyelaretribucinestimadasobreelsalariomedioenfuncindelniveldeformacin.La
estimacindelcambioenelsalarioalpasardeunniveldeformacinaotrosellevaraacabomediantelas
diferenciasentrelossegundossumandosdelossegundostrminos.

Enelcasoenquelavariableexplicativaseacualitativa,laregresindetipoIslotienesentidocuandodichavariable
presentaunnmeropredeterminadodeniveles.

5.2.2.RAZNDECORRELACIN
Vayamosunpocomslejos.EnelapartadoanteriorsehaminimizadoSCEperoestonosignificaquestaseamuy
pequea.PudierasergrandeyresultarqueconotrasestimacionesdeYdistintasdelasmediascondicionadasfuera
anmsgrande.Evidentemente,cuantomspequeaseaSCEmejoreslaregresinenelsentidodeque,
globalmente,secometenmenoreserroresdeestimacin.Esms,loidealseraqueSCE=0.
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 10/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Ahoralacuestines:Cmoidearunamedidaquecuantifiquelabondaddelaregresinllevadaacabo?Esdecir,
cmomedirlagananciaderivadadelhechodeconocerlosvaloresdeXquesedanconjuntamenteconlosdeYa
lahoradeexplicaroestimarestosltimos?Larespuestaeslasiguiente:

1.SinoseconocieseconquvalordeXvaemparejadocadavalordeYlamejorestimacindeY(tambinporla
propiedad2delamediaaritmtica)seralamediadelavariableY,siendolasumadecuadradosdeloserroresde
estimacincometidos

2.Ahorabien,conociendoelvalordeXquevaemparejadoconcadavalordeY,lamejorestimacindeestaltima
eslamediadelasobservacionesdeYemparejadasconelvalorencuestindeX,siendolasumadecuadradosde
loserroresdeestimacincometidos,comosehavistoanteriormente,

Pgina142

3.Porconsiguiente,lareduccinproporcionalenelerrorcometido(respectodelquesecometacuandonose
disponadeinformacinalgunasobrelavariableX)esunabuenamedidadeloqueayudalavariableXenla
explicacindelavariabilidaddelavariableY.Talreduccinproporcionalenelerrordeestimacincometidoes:

quesedenominarazndecorrelacin7(enestecasoconcretodeYsobreX)ysedenotaporY/X.

LarazndecorrelacindeYsobreXtambinpuedeexpresarsecomosigue:

DescomponiendolavarianzadeYenvarianzaintragruposyvarianzaintergrupos(propiedad3delavarianza)se
tiene

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 11/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

dedonde

Pgina143

llegndosea

Porsupropiaconstruccin,larazndecorrelacinestcomprendidaentre0y1,puestoquesicomoconsecuencia
delainclusindelavariableXlasumadecuadradosdelerrordeestimacinnosereducenada,entonceslarazn
decorrelacinvale0,mientrasquesisereducea0larazndecorrelacinvaldrlaunidad.

Loanterioreslgicopuestoque,comosehavistoanteriormente,cuandoi=

/xisetieneque

donde(1)esNveceslavarianzadelosvaloresobservadosdeYolaSCEquesecometealestimarsininformacin
algunasobrelosvaloresdeXqueacompaanalosdeY(3)eslaSCEquesealcanzacuandoseestimaconel
conocimientodelosxiy(2)esladiferenciaentreambosoreduccin(envalorabsoluto)enSCEcomoconsecuencia
deconocerelvalordeXalquevaasociadocadaobservacindeY(esdecir,comoconsecuenciadelaregresin).
Evidentemente,esdeseableque(2)seamximoy(3)mnimoonulo.Peroelmnimovalorde(3)es0yelmximo
es(1)ydeahquelarazndecorrelacintomevaloresentre0y1.

Obviamente,cuantomayorsealarazndecorrelacinmayorserlapotenciadeXalahoradeexplicarelvalorque
tomaY.LavariableYnotomasiemprelosmismosvaloressinoquepresentaciertavariabilidad(muchaopoca,
dependedecadacasoconcreto),y,silarazndecorrelacineselevada,dichavariabilidaddeYcabeseratribuidaa
lavariabilidaddeX.PorquvaranlosvaloresquetomaY?PorquevaranlosquetomaX.Silaraznde
correlacineselevada,XeslamanijaquemueveaY.Encasodequelarazndecorrelacinseapequea(cercana
acero)lavariabilidadquetieneYnocabeseratribuida(osloenpequeamedida)aX,sinoaotrascausasno
consideradasenelanlisis.Enotrostrminos:XnoeselfactorqueexplicalosmovimientosdeYosuparticipacin
enlaexplicacindelavariabilidaddeYesmuypequeay,portanto,nodebeserutilizadacomoinstrumentapara
estimarY.

Pgina144

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 12/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Hayquetenerencuentalasiguientecircunstancia:encasodequeladistribucinbidimensionaldefrecuenciassea
unitaria,larazndecorrelacinvalenecesariamentelaunidad.Ello,msquesignificarunajusteperfecto,loque
vieneasignificareslainconvenienciadellevaracabounprocedimientoderegresindetipoI,puessiacadavalor
deXlecorrespondeunoyslounodeYdicharegresincarecedesentido8.

Finalmente,cabesealarque(supngaselaregresindeYsobreX),nicamentesiy/xesdeunaciertaintensidad,
tienesentidoutilizarlosvaloresi=

/xicomoestimacionesdelosvaloresdeYcorrespondientesalosvaloresdeXqueaparecenenladistribucinde
frecuencias.Encasocontrario,sielvalordelarazndecorrelacinestcercanoa0,carecedesentidoutilizartales
valorescomoestimadoresesdecir,carecedesentidolaregresindetipoI:Qusentidotendraestimarlosvalores
deYatravsdelosdeX(porelprocedimientoquesea)sinoexistedependenciaestadstica,oexistemuypoca,de
YrespectodeX?

EJEMPLO5.3
ApartirdelainformacincontenidaenelEjemplo5.1,calculelarazndecorrelacindelasventasdelos
comercialessobresuantigedadcomoprofesionalesenelsector.

Solucin:

Enlatabladelapginasiguientesemuestranlosclculosnecesariosparaobtenerlarazndecorrelacin.

Apartirdeellaseobtienelavarianzadelasventasdeloscomercialescomo

siendo

y,portanto,suvarianza:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 13/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina145

Finalmente,seobtienelarazndecorrelacindeY(ventasdeloscomerciales)sobreX(niveldeantigedaddelos
mismosenelsector)como

EstevalordeY/X=0,9957indicaquelasumadeloscuadradosdeloserrorescometidosenlaestimacindelas
ventasmediantelaregresinIsereduceenun99,57%respectodelacometidaencasodenoconocerlaantigedad
deloscomercialesenelsector,dedondesededucequelavariableXaportamuchainformacinsobrelavariableY,
yporconsiguiente,lasventasdeloscomercialespuedenexplicarsemuybienenfuncindelosnivelesde
antigedadconsideradosenladistribucin.

5.2.3.VARIANZADEBIDAALAREGRESINYVARIANZARESIDUAL
Comohapodidoverseenelapartado5.2.2,

Pgina146

Portanto,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 14/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

dedondesepuedeapreciarquelavarianzatotaldelavariableYsepuededescomponerenlasumadedos
componentes:lavarianzadeloserroresdeestimacin(tambindenominadosresiduosdelaregresin)yun
porcentajedelavarianzadeYquesedebealainclusindelavariableXenelanlisis,quesedenominarvarianza
deYexplicadaporlaregresindetipoIdeYsobreX,oporlainclusindelavariableXenlaregresin.En
consecuencia,larazndecorrelacindeYsobreXnoessinolavarianzadebidaalaregresindetipoIdeYsobre
XdivididaentrelavarianzadelavariableY.

Perocomotambin

entonces

dondeelprimertrminodelladoderechodelaexpresineslaanteriormentedenominadavarianzadeYexplicada
porlaregresindetipoIovarianzadelasestimacionesproporcionadasporlaregresindetipoI9(S2y)y,el
segundo,lavarianzadeloserroresdeestimacin(S2e).Evidentemente,lavarianzadeYexplicadaporla
regresindetipoIesunporcentajedesuvarianzatotalquevienedeterminadoporlarazndecorrelacin.Enotros
trminos:losvaloresdeYnosonsiemprelosmismos,ypartedesuvariabilidadsedebealvalordeXquelos
acompaaenestesentido,larazndecorrelacinseinterpretacomoelporcentajedelavariabilidaddeYqueviene

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 15/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

determinadoestadsticamenteporlavariabilidaddelosvaloresdeXyporellopuedeconsiderarsecomoel
porcentajedelavariabilidaddeYquesedebealhechodeconsiderarXcomofactorexplicativodelamisma
medianteunaregresindetipoI.Entrminosmsintuitivos:elporcentajedelcomportamientodelavariableY
provocado,entrminosestadsticos,porelcomportamientodelavariableX.

Pgina147

EJEMPLO5.4
Enesteejemploseprocedealadescomposicindelavarianzadelasventasrealizadasporloscomercialesdel
sectorfarmacuticoespaolconsideradosenelEjemplo5.1enlavarianzaexplicadaporlaregresindetipoI(S2r)y
lavarianzadeloserroresdeestimacin(S2e).Paraello,seconstruyelasiguientetabla:

Deellasededucefcilmenteelvalordelavarianzadebidaalaregresin

yeldelavarianzadeloserroresdeestimacin

Sepuedecomprobarque

Pgina148

5.3.RegresindetipoIIycoeficientededeterminacin
5.3.1.CONCEPTODEREGRESINDETIPOII

LaformadeprocederenlaregresindetipoIesasignaracadaunodelosvaloresdeunavariablecuantitativaX
queaparecenenladistribucin(queenalgunoscasospudieranserlosnicosquetomalavariableX),oaun
nmeropredeterminadodenivelesdeunavariablecualitativa(comosevioenelEjemplo5.2),unvalorestimadode
Y.Endefinitiva,asignarestimacionesdeYalconjuntofinitodevaloresdeXconelquesetrabaja.

Ahoralapreguntaeslasiguiente:cuandolavariableexplicativaescuantitativaypuedetomarcualquiervalor
razonable,cmohabraqueprocederparaestimarsurelacinconlavariableaexplicarcuandosedispone
nicamentedelosvalores(xiyj)contenidosenladistribucindefrecuencias,peroquenosontodoslosquepuede
tomarlavariablebidimensional?

Enestecaso,siseestimaYmediantelasmediasdedichavariablecorrespondientesacadavalordeXsecometer
elmenorerrordeestimacinposibleperonosepodrnrealizarestimacionesdeYparaotrosvaloresdeXno
contenidosenladistribucin.SlosedispondrdeestimacionesdeYparalosvaloresdeXqueaparecenenla
misma.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 16/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Anteestatesitura,lamejorsolucinesobservarlanubedepuntosyelegiruntipodefuncincontinuaqueseadecue
aella.Posteriormente,seestimarnlosvaloresdelosparmetrosdedichafuncinquehacenmnimalasumade
cuadradosdelerrordeestimacin.Dichodeotraforma:setratadeobtenerlafuncinquepasamscercadetodos
lospuntosdelanubeyque,porconsiguiente,generalosmenoreserroresdeestimacin.

Ellectorpodrapensarquetalfuncinessencilla.Segnlapropiedad2delamediaaritmticaserunaquepase
porlasmediasdeYparacadavalordeX.Estoescierto,peroentonceshabraqueajustarunpolinomiodegrado
demasiadoelevado,esdecir,lafuncinserademasiadocomplejaadems,seraelmejorajusteposibleparalos
datosdeladistribucin(loquenoquieredecirnecesariamentequeseamuybueno,puesellodependerdela
variabilidaddelosvaloresdeYcondicionadaacadavalordeX)pero,muyprobablemente,generalizaramalpara
otrosdistintos.EspreferibleunafuncinmssencillaqueproporcioneelcomportamientogeneraldelavariableYa
medidaqueevolucionalavariableX.TalfuncinsedenominafuncinderegresindetipoIIyentreellaslams
comneslarecta,sibienexistenotrascomolaparbola,lafuncinexponencial,lapotencial,etc.

Porconsiguiente,enelcasoqueseesttratando,puedesurgiruntradeoffentreminimizacindeSCE(estimacin
mediantemediascondicionadas)ygeneralizacinPgina149(estimacinmedianteunafuncinsencillaque
proporcioneelcomportamientodelmovimientoconjuntodelasvariablesXeY),puestoqueamedidaqueesta
funcinsealejedelasmediascondicionadasaumentarSCE.Enelcasoenquelasmediascondicionadassiganla
funcinsencillatendencialestetradeoffhabrdesaparecidoperoestasituacinesinusual.

Ahorabien,unacuestinimportanteeslasiguiente.Antesdebuscarlafuncinsencillatendencial(funcinde
regresindetipoII)sedebecalcularlarazndecorrelacin,puestoquealcalcularsestaconlasmedias
condicionadasproporcionalamximareduccinproporcionaldeSCEalincluirlavariableXenelprocedimientode
estimacindeY(elgradodedependenciaestadsticadeYrespectodeX).Sidichareduccinespequea(por
ejemplo,el20%,esdecir,Y/X=0,2),notendrsentidobuscarunafuncinderegresindetipoIIdeYsobreXen
arasdelageneralizacin,puestoquelareduccinenSCEser,utilizandoestafuncin,inferioral20%y,dadoqueel
gradodedependenciaestadsticadeYrespectodeXatravsdedichafuncinderegresindetipoIIesmuy
pequeo,talfuncincarecerdeutilidadalahoradeestimarYatravsdeX.Porelcontario,cuandolaraznde
correlacineselevada,stienesentidobuscarunaestructuradedependenciasencillapuestoque,aunquesepierda
enreduccinenSCE,stapuedesertodavaelevada.

5.3.2,COEFICIENTEDEDETERMINACIN
10

UnavezelegidoelmodelodefuncinderegresindetipoIIyestimadoslosvaloresdesusparmetrosquehacen
mnimaSCE11,lacuestinqueseplanteaescmomedirelgradodedependenciadeYrespectodeXbajola
suposicindequeseestimaYmediantedichafuncinconcretadeX.Talgradodedependenciaserdenotadopor
R2Y/X,ysedenominacoeficientededeterminacindelaregresindeYsobreX(R2X/Y,cuandolaregresinseade
XsobreY).

EnconsonanciaconladefinicindeY/X,R2Y/XdeberserdefinidocomolareduccinproporcionalenSCEquese
consiguealestimarlosvaloresdeYatravsdelosdeXmediantelafuncinderegresindetipoIIelegidaenvezde
mediante

.Esdecir,

Pgina150
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 17/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Anlogamente,

LaeficienciarelativadelaregresindeYsobreX,esdecir,elporcentajedeladependenciaestadsticadeY
respectodeX(Y/X)querecogelafuncinderegresindetipoIIelegida,vienedadaporlaexpresin

interpretndosecomoloefectivaqueeslacurvaofuncinajustadaalahoraderecogerladependenciaestadstica
deYrespectodeX.Endefinitiva,comoyaseindicanteriormente,representaelporcentajedeY/Xquerecogela
funcinderegresindetipoIIelegida.

EnelcasodelaregresindeXsobreYsetiene

LafuncinderegresindetipoIImscomnmenteutilizadapararelacionarestadsticamenteYconXeslarecta,ya
queesdefcilmanejoy,conciertafrecuencia,seajustabastantebienalarealidad.Porestarazn,elsiguiente
apartadoestdedicadoalaregresinlineal.

Pgina151

5.4.Regresinlineal

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 18/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Antesdecomenzarconesteapartadoresultaesencialentenderquseentiendeporlineal,yaquehaydosposibles
interpretaciones:linealidadenlasvariablesylinealidadenlosparmetros.

Unafunciny=f(x)sedicequeeslinealenXsilavariableXaparececonpotenciaunitaria(portanto,seexcluyen
trminoscomox2,x3,1/x,x,porejemplo)ynoestmultiplicadanidivididaporotravariable.Porejemplo,yj=a+
bxi+cxi2noesunafuncinlinealenlasvariablespuestoquelavariableXapareceelevadaalcuadrado.

Sedicequeunafuncineslinealenlosparmetrossistosaparecenconfrecuenciaunitariaynoestn
multiplicadosnidivididosporcualquierotroparmetro.Amododeejemplo,yj=a+bxinoesunafuncinlinealen
losparmetros.Sinembargo,yj=a+bxi+cxi2sloes.

Delasdosinterpretacionesdelinealidad,lalinealidadenlosparmetroseslamsrelevanteenelcontextodela
teoradelaregresinydelacorrelacin.Sinembargo,enloquesigue,seexigirtantolalinealidadenlos
parmetroscomoenlasvariablesparaquelaregresinseacalificadadelineal12.

5.4.1.ESTIMACINDELOSPARMETROSDELAREGRESINLINEAL
EnelcasoenquesepresumaquelarelacindedependenciadeYsobreXesdecarcterlineal,yj=a+bxi+eij,
dondeeijrepresentaelerrorquesecometecomoconsecuenciadequepudierahaberotrasvariablesqueinfluyesen
enelcomportamientodelavariableY,lacuestines:Cmoestimarlosparmetrosaybdelamisma?

Grfico5.4.

Pgina152

ComoenestatesituralafuncinderegresindetipoIIelegidasera

representandoelvalordeYqueseestimaatravsdetalfuncinlinealparaX=xienbasealainformacin
disponible,obviamentelasestimacionesdedichosparmetros,y

,sernaquellasqueminimicenSCE:

Derivandoparcialmenterespectoay

eigualandoacero,setieneque

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 19/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

yoperando:

sistemadenominadodeecuacionesnormales.

DividiendoambasecuacionesporNseobtiene

yrestandodelasegundalaprimeramultiplicadapora10sellegaa

dedonde

ydespejandodelaprimeradelasecuacionesdelsistemasetieneque

conloquelarectaderegresinsepuedeescribirenformaexplcitacomo

obien,enformapuntopendiente,como

Pgina153

Obviamente,aybsondosparmetros(novaran),mientrasquey

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 20/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

sonestimacionesobtenidasapartirdeunconjuntofinitodeobservaciones.Sienlugardelasobservaciones
disponiblessetuviesenotras,losvaloresdey

diferirandelosestimadospreviamente.

Alosvaloresy

selesdenominacoeficientesdelaregresinlinealdeYsobreXo,simplemente,coeficientesderegresin.El
coeficiente

,cuyosignoeseldelacovarianzaentrelasvariables,eslapendientedelarectaderegresindeYsobre

,eindicalavariacindeYanteunincrementounitariodeX.Eltrminoindependienteuordenadaenelorigen,desde
unenfoquegeomtrico,eselpuntodecorteentrelarectaderegresinyelejedeordenadas.Analticamentepuede
interpretarsecomoelvalorestimadoparaYcuandoX=0,aunqueestainterpretatinanalticapuedenotener
sentidoalgunoenlarealidad.

DividiendoporSYenambosladosdelaecuacinderegresinlinealseobtiene

esdecir,enlaregresinlineal,dadoque

esmenoroigualquelaunidadenvalorabsoluto,elvalorestimadodeYparaunvalordeXdeterminadoesmenos
raroenladistribucindeYquetalvalordeXenladistribucindeX(enelsentidodeque,entrminosrelativosa
sudesviacintpica,estmscercanoalamedia),yaque

Laexpresin

puededenominarse,deformaintroductoria,covarianzarelativa.Noobstante,enelapartado5.4.2recibirel
nombredecoeficientedecorrelacinlinealentreXeY,denominacinporlaqueesconocida,ysedenotarporr.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 21/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Enlaestimacindeloscoeficientesayb(odelarectaderegresin)esindiferentetrabajarconlosvalores
observadosdelavariableYoconsusmediascondicionadasrepetidasni.veces13puestoquecomo

Pgina154

entonces

ysumandoparatodaslasobservaciones

ycomoeltercertrminodelladoderechodelaecuacinseanula(vasenotaapiedepgina134),setieneque

Obsrveseelsegundotrminodelladoderechodelaanteriorecuacin.Porlasegundapropiedaddelamedia
aritmtica,paracadavalorxiladiferenciacuadrticaseminimizacuandoelsustraendodeyjesprecisamente

/xi.Comoestoocurrecualquieraqueseaelvalorxi,resultarquelasumaparatodoidedichasdiferencias
cuadrticasserlamnimaposibley,enconsecuencia:

Adems,analticamente,alderivarSCErespectodey

,comoelsegundotrminodeladerechanolosincluye,noinfluyeparanadaenlosresultadosqueseobtengan,
puessuderivadarespectodecualquieradeellosesnula.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 22/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Evidentemente,loexpuestoesvlidoparacualquierfuncinqueseajustealosdatos(omedias),noteniendopor
quserexclusivodelcasolineal.

DeformaanlogaacomoseharealizadolaregresinlinealdeYsobreXsellevaraacabolaregresindeXsobre
Y,

,con

Pgina155

Ambasregresioneslineales,ladeYsobreXyladeXsobreY,pasanporelpunto(

),quesedenominacentrodegravedaddeladistribucindefrecuencias.

EJEMPLO5.5
SuponiendoquesehaoptadoporunarectacomolamejorfuncinquepuedeajustarlanubedepuntosdelEjemplo
5.1,obtngaselaestimacindeloscoeficientesdelarectaderegresineinterprtense.Utilicedicharectapara
estimarlasventasdeuncomercialcon17aosdeantigedadenelsector.

Solucin:

Paraelclculodeloscoeficientesderegresin,seconstruyelasiguientetabla,enlaqueseincorporanlasmarcas
declasedelosintervalosdeantigedad:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 23/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Deellasededucenelvalormediodelaantigedaddeloscomercialesenelsector:

Pgina156

Grfico5.5.

suvarianza

Pgina157

ylacovarianzaentrelaantigedadcomocomercialesenelsectorylasventasdelosmismos,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 24/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

necesariasparaelclculodeloscoeficientesderegresin:

Finalmente,larectaderegresindelavariableYsobrelavariableXvienedadapor

Encuantoalainterpretacindeloscoeficientesderegresin,dedicharectasededuceque,cuandolaantigedad
deuncomercialenelsectoraumentaunao,susventasseincrementanen46.488,89.Sinembargo,respectoala
interpretacindelcoeficiente,steseraunodeloscasosenlosquecarecedesentidotalinterpretacin,yaque
resultaquelasventasgeneradasporuncomercialsinantigedadenelsectorserande62.508,57,locuales
absurdoyaquelasventasnopuedensernegativas.

Estarectaderegresin,adiferenciadelaregresindetipoI,permiteestimarvaloresdeYcorrespondientesa
valoresdeXquenoseencuentranenladistribucin.Porejemplo,sepuedenestimarlasventasquele
corresponderanauncomercialcon17aosdeantigedadenelsectorcomo

5.4.2.COEFICIENTEDEDETERMINACINLINEAL
UnavezelegidalafuncinrectilneapararepresentarlarelacindedependenciadeYsobreXyestimadossus
parmetrosayb,acontinuacinseprocedealcmputodelcoeficientededeterminacinlinealconobjetodemedir
elgradodedependenciadeYsobreXbajolafuncinderegresinlinealestimada.

Enelcasolineal,

,elcoeficientededeterminacinadoptalasiguienteexpresin:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 25/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina158

Dichaexpresinsedenomina,lgicamente,coeficientededeterminacinlinealsimple,r2,porseruna
particularizacindelarazndecorrelacin,ymsconcretamentedelcoeficientededeterminacin14.

Sucampodevariacines[01],interpretndosecomosigue:

r2=0significaquelarelacinlinealentreYyXnoreduceenabsolutalaSCEquetienelugaralahora
deprocederalaestimacindelosvaloresdeYsinconocimientodelosvaloresdeX(i=

)y,porconsiguiente,laregresinlinealnoaportanadaalahorademejorarlasestimacionesdeY
(seguirsiendolarectai=

).
r2=1indicaquelaestimacindelosvaloresdeYatravsdelarectaderegresinesperfecta,por
cuantoescapazdehacernulaSCE.Enotrostrminos:YdependefuncionalmentedeXatravsdela
rectaestimada.
Cuantomsseacerqueaceror2,menorserlacapacidaddelarectaestimadaalahoradeexplicarla
relacindedependenciadeYsobreX.Lgicamente,cuantomsseacerquealaunidad,mayorser
sucapacidaddeexplicartalrelacin.

EnelcasodelaregresinlinealdeXsobreYelcoeficientededeterminacinseraelmismo,sinqueelloimplique
quelavarianzadeloserroresdeestimacinPgina159sealamismaqueenlaregresindeYsobreX,locual
nicamenteocurriraenelcasodequestafuesenula.Loquescoincideeslaraznentrelavarianzadelos
erroresdeestimacinenlaregresindeYsobreXylavarianzadeYconlarazndeloserroresdeestimacinenla
regresindeXsobreYylavarianzadeX.Efectivamente,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 26/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

dedondesededuceque

Dadoqueenamboscasos,enlaregresindeYsobreXyenladeXsobreY,elcoeficientededeterminacinlineal
eselmismo,stevieneaindicarelgradodedependenciamutuadelasvariablesatravsdeunarecta.

Esfcilcomprobarque

=r2.

LaeficienciarelativadelaregresinlinealdeYsobreXsemideatravsdelaexpresin

yseinterpretacomolacapacidadquetienelaregresinlinealalahoraderecogerladependenciadelavariablea
explicarrespectodelaexplicativa.

EnelcasodelaregresindeXsobreYsetieneque

Larazcuadradadelcoeficientededeterminacinlinealseconocecomocoeficientedecorrelacinlinealsimple(en
elCaptulo4,ascomoenelepgrafePgina160precedente,sedenomincovarianzarelativaamodointroductorio)
ytambincoincideenlaregresindeYsobreXyenladeXsobreY.

Dadoquer2varaentre0y1,rvariarentre1y1,noexistiendoproblemaalgunoconelsigno,puestoqueesel
mismoqueeldelacovarianzaentreambasvariables.Porconsiguiente,obviandolacuestindelaambigedaddel
signo,setieneque

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 27/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Losvaloresderseinterpretancomosigue:

r=1:enestecasolasvariablespresentanunarelacinfuncionalypositiva(lapendientedelarectade
regresinespositiva).Enotrostrminos,todoslosvaloresestimadoscoincidenconlosobservados,por
locualSCEesnula.Enestecaso,adems,lasrectasderegresindeYsobreXydeXsobreY
coinciden.

r=1:enestatesituralasvariablespresentanunarelacinfuncionalynegativa.Tambinenestecaso
todoslosvaloresestimadoscoincidenconlosobservados,porlocualSCEesnula,ylasdosrectasde
regresincoinciden,sibiensondecrecientes.

r=0:enestecasonoexistecorrelacinlinealentrelasvariablesylasrectasderegresinson
perpendiculares.Enconcreto,larectaderegresindeYsobreXesunaparalelaalejeXtrazadaporel
punto

delejedeordenadasyladeXsobreYunaparalelaalejeYtrazadaporelpunto

delejedeabscisas.

Pgina161

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 28/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Grfico5.6.

EsimportanteresaltarquelaausenciadecorrelacinlinealseidentificaconlaincapacidaddelavariableXpara
explicarmejor(conmenorSCE)losvaloresdelavariableYatravsdeunarectaqueenlasituacinenlaquenose
disponedeinformacinsobreXyseestimanlosvaloresdeYatravsdesumediaaritmtica(j=

).

Portanto,loquesignificarealmenteuncoeficientedecorrelacinlinealr=0esquelaintroduccindeXenforma
linealnoreducelavariabilidaddeYrespectodecuandonoseconocaXyseestimabanlosvaloresdeYmediantela
mediadeestavariable.

1<r<0:lacorrelacinlinealentrelasvariablesesnegativaytantomscuantomsseacerquera
1.Ambasrectasderegresintienenpendientenegativa,sibiensondistintas.
0<r<1:lacorrelacinlinealentrelasvariablesespositivaytantomscuantomsseacerquera1.
Ambasrectasderegresintienenpendientepositiva,sibiensondistintas.

Otrascaractersticasderatenerencuentasonlassiguientes:

1.Esinvariantealoscambiosdeorigen,yaquetantolacovarianzacomolavarianzaloson.
2.Esinvariantealoscambiosdeescalaencuantoasuvalorabsoluto.Si

entonces

Pgina162

Sinembargo,noloesencuantoalsigno.Sielcambiodeescalaserealizaenunasoladelasvariablescambiarde
signocuandok1ok2(dependedelavariableenlacualseopereelcambiodeescala)seanegativoynolohar
cuandoseapositivoSielcambiodeescalasellevaacaboenlasdosvariables,cambiardesignocuandok1yk2
tengansignodistintoynoloharcuandosusignoseaelmismo.

Apesardelaligaznexistenteentreloscoeficientesdedeterminacinycorrelacinlineal,enlaprctica,la
utilizacindeambossueleserdiferente:elprimeroesmsutilizadoparamedirlavariabilidaddelavariablea
explicarquesedebealavariabilidaddelavariableexplicativaatravsdeunarelacinlineal,mientrasqueel
segundosueleemplearseparamedirelgradoderelacinlinealentredosvariables,yaseaporquelatengande
formadirectaodebidoalainfluenciasobreambasdeunaterceravariable.

EJEMPLO5.6
EstdieselabondaddelaregresinllevadaacaboenelEjemplo5.5.

Solutin:

LaregresinllevadaacaboenelEjemplo5.5sertantomsfiablecuantomayorseaelcoeficientededeterminacin
lineal.Portanto,bastaprocederasuclculo

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 29/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

paraconcluirquelaregresinlineal(oajuste)realizadaesmuysatisfactoria,yaqueelvalordedichocoeficienteest
muycercanoalaunidad.ElloindicaquelaSCEenausenciadeinformacinacercadelaantigedaddelcomercial
enelsectoresrebajadaenun92,52%cuandosedisponedetalinformacinyseincorporaenunarectade
regresinparaestimarlosvaloresdelavariableY.

5.4.3.VARIANZADEBIDAALAREGRESINLINEALYVARIANZARESIDUAL
Delapartado5.2.3sesabeque

dondeelprimertrminodelladoderechodelaigualdadeslavarianzadebidaalaregresinyelsegundolavarianza
residual.

Pgina163

EnelcasodelaregresindetipoII,laexpresinanteriorsetransformaen15

ysidicharegresinesdetipolineal,esdecir,

,setieneque

Ahorabien,enelcasolineallasumadelosresiduos(y,portanto,sumedia)esnula,igualqueocurraenla
regresindetipoI,yaque

y,porconsiguiente,elsegundotrminodeladerechaenlaexpresin

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 30/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

quenoessinoelmomentodeorden2deloserroresdeestimacin(oresiduos),coincideconlavarianzadelos
mismos,pudindoseconcluirquelavarianzadelavariableYsepuededescomponerendospartes:lavarianza
debidaalaregresin,opartedelavariabilidaddeYqueseexplicaporlainclusindeXenelanlisis,ylavarianza
deloserroresdeestimacinovarianzaresidual.

EJEMPLO5.7
DescompngaselavarianzadelasventasdeloscomercialesdelsectorfarmacuticodelEjemplo5.1envarianza
debidaalaregresinlinealyvarianzadeloserroresdeestimacin.

Solucin:

ComopudoverseenelEjemplo5.3,S2y=271.460.888.888,89.Ahora,apartirdelasiguientetabla:

Pgina164

sededuceelvalordelavarianzadebidaalaregresin

yelvalordelavarianzadeloserrores

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 31/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

pudiendocomprobarsefcilmenteque

Pgina165

5.4.4.CORRELACINLINEALEINDEPENDENCIAESTADSTICA
Enelapartado5.4.2sehavistoque

dondeSXSYnoessinoelvalorabsolutodelmximovalordelacovarianzaentredosvariables(Captulo4,apartado
4.4.4),porloqueelcoeficientedecorrelacinlinealnohacesinoredimensionarelcampodevariacindela
covarianzaentre1y1.Dichoesto,ahorasepuedeentenderporqulacovarianzaentredosvariablesindicasu
gradodecorrelacinlinealatravsdelarecta

.Laventajadelcoeficientedecorrelacinlinealrespectodelacovarianza,alahorademedirlacorrelacinlineal
entreXeY,esque,mientraselcampodevariacindelacovarianza[SXSY+SXSY]dependedecadadistribucin
bidimensional,eldelcoeficientedecorrelacinlineales[11]paratodaslasdistribuciones.

Enelapartado4.4.4tambinsepusodemanifiestoqueenelcasodequedosvariablesXeYfuesen
estadsticamenteindependientessucovarianzaeranula.Obviamente,enelcasodeindependencia,alserla
covarianzanula,elcoeficientedecorrelacinrtambinsernulo:silasvariablessonindependientes,tambinlo
sernlinealmente.Ahorabien,elrecproconotieneporquserciertonecesariamente:lacorrelacinlinealentrelas
variablesXeYpuedesernula(r=0)ysinembargonoserindependientes.

SilasvariablesXeYsonestadsticamenteindependientes,entoncestambinlosernlinealmenteySXY=r=0.Sin
embargo,puedeocurrirqueSXY=r=0ylasvariablesnoseanindependientes,yaquelacovarianzasepuede
anularsinquesecumplalacondicindeindependencia.Veseconunejemplo.

EJEMPLO5.8

Sealasiguientedistribucindefrecuencias:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 32/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina166

dondelasvariablesXeYestnrelacionadascomosigue:Y=X2.

Grfico5.7.

Enladistribucinanteriorsetieneque

conloqueSXY=0,r=0ylasvariablesestnincorrelacionadaslinealmente.Sinembargo,lasvariablesson
dependientesbajounaformaparablica.

SisellevaraacabounaregresinlinealdeYsobreX,larectaserai=2,5=

,esdecir,seestimaraYporsumediaaritmticafuesecualfueseelvalordeX,igualqueseharaenlatesituraen
quelosvaloresdeXqueacompaanalosdeYfuesendesconocidos.Laregresinlinealnohareducidoniunpice
laSCE=S2YquesetenaalestimarlosvaloresdeYsinayudadelosdeX.Ellosedebeaquenoexisterelacin
linealalgunaentreYyX.

Porconsiguiente,dosvariablespuedenestarincorrelacionadaslinealmenteyserdependientesbajocualquierotro
tipodefuncin.Elhechodequer=0lonicoqueimplicaeslainexistenciadedependenciaestadsticaentreXeY
decarcterlineal,perosloesolasvariablespuedendependersegnotrotipodefuncin.

5.5RegresinYcorrelacinnolineal
5.5.1.INTRODUCCIN

LaregresinsimpledetipoIInolinealesunaregresinentredosvariablespero,comosupropionombreindica,la
funciny=f(x)notienecarcterlineal,pornoserloenlosparmetroso/yenlasvariables.

EjemplosdefuncionesderegresindetipoIInolinealessonlossiguientes:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 33/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina167

Enloquesigue,seabordarelcasodelaregresinpolinmicaydealgunasfuncionesquesonsusceptiblesdeser
reducidasalineales(lasmsrelevantessonlasexpuestascomoejemplos,aexcepcindelaltima).

5.5.2.REGRESINPOLINMICAYCOEFICIENTEDEDETERMINACIN
16

5.5.2.1.Regresinpolinmica

Comosehaindicadoanteriormente,enestecasolafuncinderegresindetipoIIes

Elerrordeestimacinseobtienecomosigue:

siendolasumadecuadradosdelerrordeestimacin

Paraobtenerelvalorestimadodelosparmetrosa,b,c,queminimizanSCEmediantelafuncinencuestin,se
derivaparcialmenterespectode

,igualandoposteriormentedichasderivadasaceroyresolviendofinalmenteelsistemadeecuaciones:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 34/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Comoyaesconocido,estasecuacionessedenominanecuacionesnormales,ydesusolucinseobtienen

Pgina168

DenominandoijaladiferenciaentreelvalorestimadoyelvalorobservadodeYenelisimopar(xiyj),las
ecuacionesanterioressepuedenreescribircomo:

LaregresinpolinmicadeXsobreYsellevaraacabodeformaanloga.

5.5.2.2.Coeficientededeterminacinpolinmico

Apartirdelaexpresindelcoeficientededeterminacingeneral

elcoeficientededeterminacinpolinmicoseobtienesinmsquehacer

Sucampodevariacin,evidentemente,es[01]conlainterpretacinyaconocida.

EJEMPLO5.9

ApartirdelosdatosdelEjemplo5.1,llveseacabounajusteparablicoycomprubesesiescapazdemejoraral
ajustelinealanteriormenterealizadoenelEjemplo5.5.

Solucin:

Enelcasoconcretodeunpolinomiodeorden2,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 35/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

lasecuacionesnormales,resultadodeminimizarlaSCE,sonlassiguientes

Pgina169

dedonde

DividiendoentreNaambosladosdelaigualdadenlastresecuacionesdelsistemaseobtiene:

queexpresadoenformamatricialequivalea

Elclculodeloselementosdelamatrizdecoeficientesdelsistemaseobtieneapartirdelasiguientetabla,que
incluyelasmarcasdeclasedelosintervalosdeantigedad:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 36/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina170

Deellasededucenlosvaloresde

yrecordandodelosEjemplos5.3y5.5elrestodevaloresnecesarios:

=9,02,

=356.666,67,a11=8.618.333,33,a20=197,51ya02=398.672.000.000,seobtieneelsistema:

Susolucinvienedadapor

dedondesededucequelaparbolaquemejorajustalanubedepuntoses

Apartirdelatablaqueseexponeenlapginasiguiente,seprocedealclculodelcoeficientededeterminacin
parablicoconlafinalidaddedeterminarlabondaddelajusterealizado.

DeellasededucequeSCE=44.785.676.397,82y,portanto,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 37/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Comoelcoeficientededeterminacinlinealsimpleesr2=0,9252(vaseEjemplo5.6),seconcluyequeelmodelo
parablicoestimadoajustamejorquelarecta(i=62.508,5754+46.488,89xi)losdatosrelativosalasventasde
loscomercialesysuantigedadenelsector.

Pgina171

Grfico5.8.

Pgina172

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 38/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Adems,comoy/X=0,9957(vaseEjemplo5.3),laregresinparablicallevadaacaboescapazderecogerla
prcticatotalidaddeladependenciadeYrespectodeX,yaquelaeficienciarelativadelamismaes

5.5.3.ALGUNASREGRESIONESDETIPOIINOLINEALESSUSCEPTIBLESDEREDUCCINA
LINEALES
AlgunasfuncionesderegresindetipoIInolinealespuedenreducirsealinealeshaciendounatransformacin
adecuada.Algunosejemplossonlossiguientes:

Funcinexponencial:i=

xi

Loprimeroqueesnecesarioponerdemanifiestoesqueelerrortericodebeintervenirdeformamultiplicativa,esto
es,

conlocual,tomandologaritmos17,lafuncinexponencialsetransformaenunalineal.

Ntesequesieltrminodeerrorinterviniesesumandolalinealizacinnoseraposible.

Unavezrealizadalatransformacinlogartmicaseestimaelmodelotransformado(lineal),obtenindoselarectade
regresin

,dondelaregresinlinealdeInYsobreXproporcionalosvaloresde

.Evidentemente,nosequiereestimarInayInb,sinoaybsinembargo,lasestimacionesdeaybseobtienen
fcilmentesinmsquedeshacerlatransformacinlogartmica.

Puedeapreciarseque,suponiendodosobservacionescontiguas(x1y1)y(x2y2),conx2=x1+1,yprescindiendo
deltrminodeerror,setieneque

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 39/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina173

conloque

esdecir,(

1)100estimaelincrementoporcentual(constante)queexperimentalavariableYanteincrementosunitariosenel
valordeX.

Como

elcoeficientedelapendientedelmodeloenlogaritmos,estoes,

,estima,aproximadamente,elincrementoentantosporunodeYanteunaumentodeXenunaunidad.Obviamente,
100

esunaestimacinaproximadadelavariacinporcentualdeYanteunaumentodeXenunaunidad.

LosmodelosdeltipoInYj=a+bxi+eijlinealesenlosparmetrosaybyenlasvariablesXyInY,sedenominan,
comoconsecuenciadedichalinealidad,modelosloglin,debidoaqueYseencuentraenformalogartmica(sifuese
Xlavariablequeseencontraseenformalogartmica,elmodelosedenominaralinlog)ysucaracterstica
fundamentalesqueelcoeficientedelapendiente(b)mide,aproximadamente,lavariacinrelativaconstanteenY,
entantosporuno,anteuncambiounitarioenelvalordeX18.Porello,losmodelosloglinresultanespecialmente
tilesensituacionesenlasqueXesunavariabledetendenciaeneltiempo,puestoqueenesecaso100b
proporcionalatasaporcentualdecrecimientoodecrecimientoconstanteenlavariableYantevariacionesunitarias
enelvalordelavariableX.Porellotambinesdenominadomodelodecrecimiento(constante).

Obviamente,elmodelotransformadoInyj=Ina+xiInb+Ineijesuncasoparticulardelosmodelosloglinenelque
elcoeficientedelapendienteesInb.

Funcinpotencial:i=x

Igualqueenelcasoexponencial,paraquelafuncinpotencialsealinealizableeltrminodeerrordebeentraren
formamultiplicativa,

yaquesientraaditivamentelalinealizacinnoesfactible.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 40/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina174

Elmodelotransformadoadoptalaforma

porloquelaregresinlinealquesellevaacaboinicialmentees

,regresindeInYsobreInX,queproporciona

.Posteriormente,laregresini=x

iseobtienesinmsquecalcularmedianteelantilogaritmoneperianode.

ElmodeloInyj=Ina+bInxi+Ineij,linealenlosparmetrosInaybylinealenloslogaritmosneperianosdelas
variablesXeY,sedenomina,debidoadichalinealidad,modelologlog,doblelogologlineal.Unacaracterstica
atractivadeestetipodemodelos,porlacualsehanhechobastantepopulares,esqueelcoeficientebmidela
elasticidaddeYrespectoaX.Porotraparte,elmodelologlogasumequeelcoeficientedeelasticidadbpermanece
constante,porloquetambinsehadadoendenominarmodelodeelasticidadconstante.

Efectivamente,

dedonde

Tambinsepuedecomprobarque,suponiendodosobservacionescontiguas(x1:y1)y(x2y2),yprescindiendodel
trminodeerror,setieneque

conloque

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 41/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

ycomo

Pgina175

esdecir,queparacambiosinfinitesimalesenXelcambioabsolutoenelInXesigualalavariacinrelativaenX,se
tieneque,paracambiospequeos(noinfinitesimales):

porloque

estima,aproximadamente,lavariacinporcentualdeYanteunavariacindeun1%enX.

ComomuestraelGrfico5.9,elcambioenelInYporunidaddecambioenelInX,esdecir,laelasticidadb,
permanececonstanteindependientementedelInXdondesemidalaelasticidad.

Grfico5.9.

UnmodelodeelasticidadconstanteproporcionauncambioporcentualconstanteenYanteuncambioporcentual
dadoenX,independientementedelnivelabsolutadeste.Aefectosdelasoportunascomparaciones,lafuncinde
regresinlineal=+

xproporcionalavariacinabsolutaenYporunidad(absoluta)decambioenX.

Amododeejemplo,enelmodeloi=5x2isilosvaloresdeXseincrementansucesivamenteenun1%,losdeY
aumentanenun2,01%,y,silosvaloresdeXseincrementansucesivamenteenun10%,losdeYaumentanenun
21%.

Enelmodelodedosvariables,lamaneramssencilladedecidirsielmodelologlinealajustabienlosdatosconsiste
enrealizarungrficodeldiagramadedispersindelInXyInXyversilospuntosdelanubeseencuentran
aproximadamentesobreunalnearecta(comoenelgrficodeladerecha).
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 42/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina176

Funcinhiperblicaequilteraorecproca:

Haciendo

,laregresinlinealdeYsobreZproporcionay

ElmodelorecproconoeslinealenlavariableX(estexpresadaenformainversaorecproca),perosenlos
parmetros.Elmodelotransformado

eslinealtantoenlosparmetroscomoenlasvariablesYyZ.

Unejemploclsicodeestemodeloeslarelacindelcostefijomedioconelniveldeproduccin,puesamedidaque
aumentaesteltimoelprimerodeclinacontinuamente(debidoaqueelcostetotalfijosereparteentreungran
nmerodeunidadesdeproducto)yfinalmentesevuelveasintticoconelejedeproduccinalnivela.Otradesus
aplicacionesmspopulareseslaconocidacurvadePhillips.Amododeejemplo,conbaseenlainformacin
suministradaenlatablaqueseexponeacontinuacin,relativaalosincrementosinteranualesdelatasadesalarios
(Y)ylatasadeparo(X)paraelReinoUnidoduranteelperiodo19501966,cuandoseajustelmodelorecprocose
obtuvoelsiguienteresultado:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 43/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Pgina177

Salvoenesteltimocaso(elrecproco),enelque

enlosotrosdos(exponencialypotencial)nosedebeutilizarlaexpresindelcoeficientededeterminacinlinealcon
lasvariablestransformadas(enelcasoexponencialXnosetransforma)paramedirelgradodedependencialineal
deYsobreX,yaqueloqueseobtendra,realmente,seraelgradodedependencialinealdeInYsobreX,enelcaso
exponencial,ydeInYsobreInX,enelcasopotencial.Adems,en

con

enelcasoexponencialy

enelcasopotencial,sepuedeapreciarque

norepresentaelporcentajedevarianzadeYnoexplicadaporlaregresinllevadaacabo.Loqueexpresaesel
porcentajedevarianzadeInYnoexplicadapordicharegresin.

Lgicamente,estacircunstanciasuponeunproblemaalahoradecompararlabondaddedosregresiones,enbasea
lamismadistribucinbidimensionaldefrecuencias,cuandounadeellashasufridoalgntipodetransformacin.En
laliteratureestadsticasepuedenencontrarvariassolucionesprcticasaesteproblema.Noobstante,existeprctica
unanimidadenqueunasolucintilysencillaconsisteencompararlasumadelasdiferenciascuadrticasentrelos
valoresobservadosdelavariableaexplicarysusvaloresestimados,eligiendoaquellaconmenorresultado(criterio
delamnimaSCE,considerando,encualquiercaso,ij=yji).

EJEMPLO5.10
AlavistadelanubedepuntosdelEjemplo5.1,sepodraelegirunafuncinexponencialobienunapotencialpara
intentarcaracterizarelcomportamientogeneraldelasventasdeloscomercialesdelsectorfarmactico.Portanto,en
esteejemploseprocedeinicialmentealaestimacindelosparmetrosderegresinenambostiposdemodelo.
Posteriormente,secomparalabondaddelaregresinexponencial,laregresinpotencialylasdemsregresiones
realizadasconlosdatosdelEjemplo5.1(laregresindetipoI,laregresinlinealylaregresinparablica)alahora
deajustarlanubedepuntos.

Pgina178

Solucin:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 44/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Funcinexponencial:

Dadoquesepretendeobtenerk=

xi,parafacilitarlaobtencindelasestimacionesdelosparmetrosaybdelmodeloexponencialseconsidera,como
pasoprevio,latransformationlogartmicadedichomodelo,queconducealasiguienteregresinlineal:

Portanto,alavistadelarectaderegresinanterior,paraestimarlosparmetrosInayInbseprocedeala
construccindelasiguientetabla,cuyaprimeracolumnahacereferenciaalasmarcasdeclasedelosintervalosde
antigedad:

DeellasedesprendenlosvaloresdelamediadeZ=InY

ydelacovarianzaentreXyZ=InY

Pgina179

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 45/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

porloquelarectaderegresindeZsobreXsera

esdecir,enformaexplcita:

Deaqusededuceque

,dedondeseobtienenlasestimacionesdelosparmetrosdelmodeloexponencial:

Finalmente,lafuncinexponencialestimadaes

donde(

1)100=11,15%estimaelincrementoporcentual(constante)queexperimentalavariableYanteincrementos
unitariosenelvalorde

=10,57%esunaestimacinaproximadadelavariacinporcentualdeYanteunaumentodeXenunaunidad.

Funcinpotencial:

Procediendodeformaanlogaconlafuncinpotential,dadoquesepretendeobteneri=x

i,parafacilitarlaobtencindelasestimacionesdelosparmetrosaybdelmodelopotencialseconsidera,como
pasointermedio,latransformacinlogartmicadedichomodelo,queconducealasiguienteregresinlineal:

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 46/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

ParaobtenerlasestimacionesdelosparmetrosInaybdelaregresinlinealdeInYsobreInXseconstruyela
siguientetabla,dondetambinlaprimeracolumnaincorporalasmarcasdeclasedelosestratosdeantigedad
considerados:

Pgina180

apartirdelacualseobtienenlosvaloresdelamediadeW=InX:

delavarianzadeW=InX

ydelacovarianzaentreW=InXyZ=InY

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 47/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

porloquelarectaderegresindelInYsobreelInXadoptalaexpresin

Despejando

setiene

Delaexpresinanteriorsededuceque

yque

=0,7215,porloquelaestimacindeasera

Finalmente,lafuncinpotencialestimadaes

Pgina181

donde

=0,72estimalaelasticidaddeYrespectoaXeindica,aproximadamente,lavariacinporcentualdeYanteuna
variacindeun1%enX.

Unavezobtenidaslasestimacionesdelasfuncionesexponentialypotencial,paradilucidarculdeellasesmejor,en
trminosdelabondaddelajuste,ydadoqueenambosmodeloslasestimacionesyloserroresdeestimacinse
relacionanenformamultiplicativa,seprocedealclculodelaSCEderivadadecadaunadeellas.Aestosefectos,
recurdesequeelerrordeestimacinsetomacomo

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 48/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Funcinexponencial:

Paraelclculodelasumadeloscuadradosdeloserroresdeestimacin,SCE,seconstruyelasiguientetabla:

dedondeSCE=3.669.078.152.200,63.

Funcinpotencial:

Igualqueenelcasoexponencial,seprocedeinicialmentealclculodelasestimacionesobtenidasmediantela
regresinpotencialparalosdistintosintervalosdeantigedad,deloserrorescometidosenlaestimacinydela
sumadesuscuadrados:

Pgina182

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 49/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

obtenindosequeSCE=2.784.042.217.387,24.

Apartirdelosclculosrealizados,ydadoqueSCEpotencial<SCEexponencial,pareceintuitivoquelafuncinpotencial
ajustamejorlanubedepuntosquelafuncinexponencial.

LareduccinproporcionalenlaSCEobtenidacuandoseestimasininformacinalgunasobreXqueproporcionanlos
modelosexponencialypotenciales,respectivamente:

Sinembargo,adichasreduccionesproporcionalesenelerrorcometidocuandonosedisponadeinformacinalguna
sobreX,RPSCEpotencialyRPSCEexponencial,nocabedenominarlascoeficientesdedeterminaciny,adems,su
interpretacinesconfusa,porcuantoeltrminodeerrorentramultiplicandoenambosmodelosy,como
consecuencia,lamediadelasobservacionesdeYnocoincideconlamediadesusestimaciones,motivoporelcual
lavarianzadelasobservacionesnopuededescomponerseenvarianzadebidaalaregresinyvarianzaresidual,y
porelcualRPSCEpotencialyRPSCEexponencialnopuedenentendersecomolavarianzadebidaalaregresindividida
porlavarianzadelavariableY.

Pgina183

Porltimo,comparandotodoslosajustesrealizados,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 50/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

seconcluyeque:

1.LamenorSCElaproporcionalaregresindetipoI,queeslamejorregresinaunquenoseauna
funcincontinuay,portanto,nosirvaparaestimarencualquierpunto.
2.SCEparbola>SCErecta>SCEpotencial>SCEexponencial,dedondeseintuyeque,entrelasfunciones
continuasplanteadas,elmejorajuste,entrminosdeSCE,eselparablico,seguidodellineal,del
potencialy,porltimo,delexponencial.

Grficamente,

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 51/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Grfico5.10.

Pgina184

5.6Algunasconsideracionesfinalessobrelaregresin
Antesdeprocederallevaracabounaregresinentredosvariablessehadereflexionarsobrelaposiblerelacinreal
entreellas,puesprocederdirectamentearegresarunavariablesobreotrapuedeconducirasituacionesabsurdas.
Porejemplo:sepuederegresarlaantigedaddelostrabajadoresdeunaempresasobreelsalariodelosmismosy
estimarlafuncinderegresin,peronotienesentidoeconmicoalgunoquelaantigedaddependadelsalarioes
justoalrevs.

Tambinpuededarselacircunstanciadequedosvariablesestnrelacionadasestadsticamenteperonotengan
ningntipoderelacinterica.Porejemplo,pudierasucederqueexistaunarelacinestadsticaintensaentrelas
toneladasdecarbnproducidasanualmenteenelReinoUnidoyelnmerodeaccidenteslaboralesanualesen
Espaaenelsectordelaconstruccin.Sinembargo,talrelacinestadsticasedeberaalazar,noexistiendo
ningunafundamentacintericalatente.

Igualmente,pudieraocurrirquehubieseunacorrelacinlinealfuerteentrelossalariosanualesyelnmerode
accidenteslaborales,tambinanualmente,enelsectordelaconstruccinenEspaa.Denuevo,noexisteninguna
relacintericaentreambasvariables,perosisellevaseacabounaregresinlinealseobtendraunacorrelacin
positivadeciertaintensidadentreambas.Ellolonicoquesignificaraesqueunaterceravariable,laactividaddel
sectordelaconstruccin,estinfluenciandotantolossalariosdelsector(quesemuevenenfuncindelnivelde
actividad)comoelnmerodeaccidenteslaboralesqueseproducenenelmismo(quetambinestnenrelacin
directaconlaactividaddelsector),peronadams.

Portanto,unpasoprevioalaregresinentredosvariableseslareflexinpreviaylaconstatacindequeexiste
fundamentotericoparallevaracabotalregresin.

Porotraparte,unadelaslaboresmssolicitadasaloseconomistaseslalabordeprediccin(pronsticoafuturo)y
saesunatareaquesehaencomendadodurantemuchotiempo,ysesigueencomendando,alosmodelosde
regresin.Amododeejemplo,sepuedellevaracabounaregresindelsalariomedioenEspaaenfuncindel
tiempoyutilizarlafuncinderegresinestimadaparapredecirelsalariomedioenEspaaenunaovenidero.Sin
embargo,comoapuntanCroxtonyCowdenquenosotrossepamos,nohayfrmulasmgicasparapredecirlos
acontecimientosCualquierprocedimientodeprediccinqueimpliquesimplementelaprolongacindeunacurvao
laaplicacinautomticadeunafrmula,sinhaceralmismotiempounestudiominuciosodeloselementos
http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 52/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

modificadoresdemayorinfluencia,merecepocaconfianza,sobretodosilascondicioneseconmicasson
inestables.

Pgina185

Estacircunstanciaeliminalavalidezdelaregresinocualquierotromodelocomoinstrumentodeprediccin?
Evidentementeno,sobretodosilabondaddelajustellevadoacaboessatisfactoria,perohayquetenerencuenta
quelafuncinderegresin,ocualquierotraexpresin,constituyenicamenteunmuro,importanteperoslouno,del
complicadoedificiodelaprediccin.Comoapuntanlosautoresanteriormentecitados,tratardepreverloque
sucederenelfuturorequiereunacomprensinperfectadelfenmenoapredecir,unconocimientominuciosodelos
ltimosacontecimientosenlasactividadesafinesyelreconocimientodelaslimitacionesdecualquierartificio
mecnicoparapredecir.

Enelmundoreal,sinembargo,noesinusualestimarfuncionesderegresinconnimodeprediccinsinteneren
cuentalosconsejosdelosautoresanteriormentecitados,utilizndose,ennopocasocasiones,losartificiosde
prediccinparajustificardeterminadashiptesisdeconveniencia.Noobstante,conestonosepretendeinvalidarlas
tcnicasestadsticasquesedestinanalaprediccinpuestoque,porlomenos,estnbasadasenlaobservacinde
larealidad.Loquesepretendeponerdemanifiestoesquehayquemanejarlasconcuidadoyserconscientesdesus
limitacionespues,parafraseandounavezmsaCroxtonyCowden,laprediccinesinciertaypeligrosa.

Finalmente,cabesealarquelasestimacionesdelasfuncionesderegresinnecesitandatosyquedelaexactitud
y/overacidaddelosmismosdependerelxitodelalaborderegresin.Silosdatosapartirdeloscualesseestima
lafuncinderegresinsonmalos,laregresinysusestimacionesnovalendenada.Enconsecuencia,otropaso
previoalaestimacindelafuncinderegresineselanlisisdelacalidaddelainformacindisponible.

Pgina186

APNDICE.Origendeltrminoregresin

Considreselasiguientedistribucindealturasmediasdepadres(mediaentreladelpadreylamadre)ehijos
adultos(hijosdedichospadres)(enpulgadas)19:

Delasimpleobservacindelatablaanteriorsedesprendequeexisteunaciertarelacinestadsticaentrelaestatura
mediapaternalylaestaturamediafilial:padresaltostienen,porlogeneral,hijosaltosypadresbajos,hijosbajos.

AnalceseelGrfico5.11,dondelalneagrisdiscontinuamarcalaalturamediadeloshijosencasodequefuese
igualalamediadeladelospadreslalneanegracontinuaeslacurvademedianas20filialescondicionadasalas
alturaspromediodelospadreslalneanegradiscontinuaeslaregresinlinealdelasalturasmediasdeloshijos
sobrelasdelospadresylalneagriscontinuaeslaalturamedianadelaPgina187poblacin.Laalturamediana
delapoblacin(padresehijos)sesitaenelcorteentrelalneanegradiscontinuaylalneagrisdiscontinua(68,25
pulgadas68,25pulgadas).

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 53/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Grfico5.11.

Quseobserva?:Quelasalturaspromediodeloshijosseacercanmsalamedianapoblacionalquelasdelos
padres.Galtondeterminquelaproporcinencualquierpunto(cualquieraquesealaalturapromediopaternal)entre
lasdistanciasdelalneanegradiscontinuaalagriscontinuaydelalneagrisdiscontinuaalagriscontinuaerade
2/3esdecir,ladesviacinfilialalpromediopoblacionalesdosterciosdeladesviacinpaternaadichopromedio.
Yollamoaestaproporcinde2a3laproporcinderegresinfilial.Eslaproporcinenlacualelhijoes,en
promedio,menosexcepcionalqueelpadre,sealaGalton.

Yprosiguemsadelante:Estevalordedosterciosseaceptar,porlotanto,comolacantidadderegresin,a
partirdelamediademuchoscasos,delaestaturamediapaternalhacialamediafilial,cualquieraquesealaestatura
mediapaternal()Portanto,depadrespromedioaltossaldrnhijospromedioaltos,peronotanaltoscomoellos
puesrevertirnhacialamediapoblacionaligualmente,depadrespromediobajossaldrnhijospromediosbajos,
peronotantocomoellosporquelaalturadeloshijosrevertiralamediageneral.Lomismopasaconotrosmuchos
dones.

Otroejemploclsico

OtroejemploclsicoeselqueproporcionaK.PearsonensuGramticadelaCiencia,concretamenteenlapgina
414.

Pgina188

Pearsonproponetrabajarcon5.513plantasdeadormiderasilvestrerecogidasenlacumbredeChilterns.Decada
plantaarrancadoshojasyenlacajaocpsuladecadaunadeellascuentaelnmerodebandasestigmticas.Los
resultadosobtenidosfueronlossiguientes:

Comopuedeapreciarse,eltotalnosonlos5.513paresdeadormiderasinojustamenteeldoble.Laraznesque
Pearsoncuentacualquieradelasdoscajascomolaprimera(poresolatabladecorrelacinessimtricarespectode
ladiagonalprincipal).Peroestonoafectaalrazonamiento.Podrasuponersequeexisten11.026paresdecajassin
problemaalguno.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 54/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

Delatablaexpuesta,sinningntipodeanlisisestadstico,sepuedeextraerlasiguienteconclusin:amedidaque
aumentaelnmerodebandasestigmticasenunmiembrodelparaumentatambinlamediadelnmerodebandas
estigmticasdelotromiembrodelpar.Enotrostrminos,lamediadelsegundomiembrodelpardependedelnmero
debandasestigmticasdelprimero.Difieredel(delnmerodebandasestigmticasdelprimero)enladireccinde
lamediadelapoblacingeneral(deadormideras),quees10,4.As,para5lamediaes6,33,para6lamediaes
7,11,,para11es10,73,para12es10,96,etc.

Pgina189

steeselfenmenoderegresin,asaber,queenparesasociadosycorrelativossiseseleccionaunmiembrocon
unvalordadodelcarcter,elsegundotiene,portrminomedio,unvalormenor(omayor)queregresaalgohaciala
mediadelapoblacingeneral.Porejemplo,paraunaplantaenlaqueunodesusmiembrostiene9bandas
estigmticas,lamediadebandasdelotromiembronoes9ni10,04sino9,51,esdecir,regresadesde9haciala
mediageneraldelapoblacin.

Lafilademediasdemuestraqueestaleyesuniversal:elpromediodecpsulasasociadastiendealamediageneral.

1Engeneral,seutilizaeltrminoexplicarsloensentidoestadstico,sinqueelloimpliquerelacincausaefecto,
puestoquenoexisteningunatcnicaestadsticaquepuedadeterminardemaneraestrictalaexistenciade
causalidadentrelasvariables,correspondiendodichalaboralosexpertosenlamateriaobjetodeestudio.Ahora
bien,comolasrelacionesdeinterssonlasdecarctercausal,sedeterminarnlasvariablesexplicaday
explicativa(s)detalmaneraquelaregresinrealizadatengasentidoterico,puestoqueelfundamentotericodela
relacinestablecidapermitirdarelpasoderelacinestadsticaarelacindecausalidad.

2VanselosprimerosprrafosdelApartado5.4paramayorabundamientoenlacuestin.

3Obviamente,tambinpodraconsiderarseYcomovariableexplicativayXcomovariableaexplicaryplantearla
cuestinrelativaaquvalordeXselehacecorresponderacadavalordeY.Sistefueseelcaso,enloquesigue
nohabramsquecambiarlasXporYylasYporX.

4Inicialmente,podrapensarseenminimizarlasumadeloserroresdeestimacin(yi/xi)peroestecriterio,
ademsdeotrosinconvenientes,podraprovocarlacompensacindegrandeserrorespositivosynegativos.Para
evitardichosinconvenientes,otraopcinpodraconsistirenminimizarlasumadelosvaloresabsolutosdelos
erroresdeestimacin|yi/xi|,peroestecriterionoseprestaamanipulacionesalgebraicas.Porello,lasolucinque
seadoptafinalmenteesminimizarlasumadeloscuadradosdeloserroresdeestimacin(yj/xi)2,yaqueevitala
compensacindeloserroresnegativosypositivos,esunaexpresinmanipulablealgebraicamenteyresultaun
criterioptimofrenteaotrosalternativoscuandosecumplenciertascondiciones.

5Elprocedimientosedenominaestimacinmnimocuadrticaporcuantosetratadeobtenerlosvaloresique
hacenmnimalasumadecuadradosdelerrordeestimacin.

6Enrealidad,enestecaso,estformadaporparesdeintervalosyvalores.

7Enrealidad,loquesehadenominadovarianzadelerrordeestimacineselmomentodeorden2respectodel
origendelerrordeestimacin,perodadoquelamediadelerrordeestimacinesnulaenlaregresindetipoI,
puededenominarsetambinvarianzadeloserroresdeestimacin.Acontinuacinsecompruebaque,
efectivamente,lamediadeloserroresdeestimacinenlaregresindetipoIesnula:

8Noobstante,enelcasoenqueelnmerodeelementosdelatablabidimensionalseaescasoy,sinembargo,el
nmerodeceldasdedichatablaseaelevado,Pearsonproporcionunacorreccindelarazndecorrelacin.Pero
estacuestinsobrepasaelmbitodeestemanual.Obviamente,cuantomayoresseanlasfrecuenciasconjuntas
contenidasenlatablabidimensionaldefrecuencias,msrepresentativoserelvalorobtenidodelaraznde
correlacin.

9Tngaseencuentaque,alconsiderarqueeltrminodeerrorsesumaalaestimacinproporcionadaporla
regresindetipoI,lamediadelasestimacionescoincideconlamediadelasobservaciones.

10Recurdeseque,salvoquesedigalocontrario,sesuponequeloserroresylasestimacionestienenunarelacin
aditivayquenoexistenrestriccionessobreloscoeficientesoparmetrosdelaregresin.

11Enlosapartados5.4.1y5.5.1puedeverseelprocedimientodeestimacindedichosparmetrosenelcasolineal
yalgunoscasosnolineales,respectivamente.

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 55/56
25/4/2017 GaleVirtualReferenceLibraryDocumentoRegresinyCorrelacinSimple

12Algunosautoresconsideranquebastalalinealidadenlosparmetrosparaquelaregresinseaconsiderada
lineal.

13Siemprequeeltrminodeerrorentreenformaaditiva.

14Dadalasencillezdesuexpresin,enlaprcticapudieraserrecomendablesuclculoantesdeprocederala
estimacindelarectaderegresin,puesnotendrasentidolaestimacindestasielvalorder2noes
razonablementeelevado.Noobstante,losclculosnecesariosparalaestimacindelosparmetrosaybson
prcticamentelosmismosqueparaelcmputoder2.

15Conelerrorylasestimacionesrelacionadosenformaaditivaysinrestriccionesenlosparmetrosocoeficientes
delaregresin.

16Aunquelaregresinpolinmicapodratratarsecomouncasoparticulardelaregresinmltiple,sehapreferido
incluirlaenestecaptulodadoquesloexisteunavariableexplicativa.

17Sehaoptadoportomarlogaritmosneperianosporseraquellosconlosqueestmsfamiliarizadoelalumno,si
bien,puedeutilizarsecualquierotrabase.

18Enelcasodelmodelolinlog,yj=a+bInxi+eij,elcoeficientedelapendiente(b)mide,aproximadamente,la
variacinconstanteenYanteuncambiorelativounitarioenelvalordeX.Estoes,

19TomadodeGalton,F.(1988):HerenciayEugenesia.Reimpresin.AlianzaUniversidad.Madrid.Pag.157.

20Galtontrabajabaconmedianasperopuedeutilizarselamediasinprdidadegeneralidad.

Citadefuente(MLA8thEdition)
MonteroLorenzo,JseMaria."RegresinyCorrelacinSimple."Estadsticadescriptiva,Paraninfo,2007,pp.129
189.GaleVirtualReferenceLibrary,go.galegroup.com/ps/i.do?
p=GVRL&sw=w&u=unad&v=2.1&id=GALE%7CCX4052100011&it=r&asid=b82c81e98fcc1361e1929abe203c8219.
Accessed25Apr.2017.

NmerodedocumentodeGale:GALE|CX4052100011

http://go.galegroup.com/ps/i.do?id=GALE%7CCX4052100011&v=2.1&u=unad&it=r&p=GVRL&sw=w&asid=b82c81e98fcc1361e1929abe203c8219 56/56

S-ar putea să vă placă și