0 evaluări0% au considerat acest document util (0 voturi)
81 vizualizări0 pagini
Este documento discute los errores comunes en la interpretación del coeficiente de determinación lineal (R2) como única medida de la bondad del ajuste de un modelo de regresión lineal. Señala que R2 solo mide la proporción de variación en la variable dependiente explicada por el modelo, pero no detecta otras estructuras en los datos que pueden afectar la validez del modelo. También advierte que R2 debe considerarse junto con otras medidas y que buscar valores altos de R2 no garantiza un mejor modelo. El autor ilustra estos puntos con ej
Este documento discute los errores comunes en la interpretación del coeficiente de determinación lineal (R2) como única medida de la bondad del ajuste de un modelo de regresión lineal. Señala que R2 solo mide la proporción de variación en la variable dependiente explicada por el modelo, pero no detecta otras estructuras en los datos que pueden afectar la validez del modelo. También advierte que R2 debe considerarse junto con otras medidas y que buscar valores altos de R2 no garantiza un mejor modelo. El autor ilustra estos puntos con ej
Drepturi de autor:
Attribution Non-Commercial (BY-NC)
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd
Este documento discute los errores comunes en la interpretación del coeficiente de determinación lineal (R2) como única medida de la bondad del ajuste de un modelo de regresión lineal. Señala que R2 solo mide la proporción de variación en la variable dependiente explicada por el modelo, pero no detecta otras estructuras en los datos que pueden afectar la validez del modelo. También advierte que R2 debe considerarse junto con otras medidas y que buscar valores altos de R2 no garantiza un mejor modelo. El autor ilustra estos puntos con ej
Drepturi de autor:
Attribution Non-Commercial (BY-NC)
Formate disponibile
Descărcați ca PDF, TXT sau citiți online pe Scribd
Elena MARTNEZ RODRGUEZ Real Centro Universitario Escorial-Mara Cristina San Lorenzo del Escorial Resumen: El objetivo de este trabajo es evidenciar, de forma sencilla a travs de ejemplos numricos, algunos de los graves errores que se cometen en el anlisis de regresin, al abusar de la interpretacin del coeficiente de determinacin como nica medida de la bondad del ajuste del modelo line- al estimado a un conjunto de datos. Abstract: The aim of this project is to show, in an easy way and using numerical examples, some of the important mistakes committed in the interpretation of the regression analysis, due to the overuse of the determi- nation coefficient as the one an only tool to measure the goodness fit of linear model estimated for a set of data values. Palabras clave: Coeficiente de determinacin lineal, Regresin, Bon- dad del ajuste, Error de Interpretacin. Keywords: linear determination coefficient, linear, Regression, Measu- re the goodness, Misunderstanding errors. Sumario: I. Introduccin. II. Coeficiente de determinacin: definicin e interpretacin. III. Estructura de la informacin muestral. IV. Grados de libertad del modelo. V. Maximizacin del valor de R 2 . VI. Conclusiones. Anuario Jurdico y Econmico Escurialense, XXXVIII (2005) 315-332 / I S S N: 11 3 3 - 3 6 7 7 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 315 I. INTRODUCCIN Una de las caractersticas de la realidad, sobre todo de la econ- mica, es la relacin que existe entre las distintas magnitudes que la definen. El anlisis de la covariacin entre variables, una Y, variable dependiente o endgena, y una o varias variables X, independientes o exgenas, supone obtener, en el caso de la regresin lineal, una ecuacin lineal (o conjunto de ecuaciones lineales) que exprese la relacin entre la variable endgena Y y las variables exgenas X. Se trata de encontrar la lnea media que resuma o sintetice la dependen- cia entre la variable Y y las X, con la doble finalidad prctica de explicacin o descripcin causal de la variable dependiente y previ- sin de los valores futuros de Y para valores dados de X. Como lnea media o medida de posicin, debe acompaarse siempre de alguna medida de dispersin, que demuestre el grado en el que el promedio puede sustituir a las observaciones individuales de las que se obtuvo, esto es, que permita medir la bondad del ajuste realizado. El desarrollo de la informtica, la accesibilidad a ordenadores de gran potencia y a programas estadsticos y economtricos que facili- tan los clculos complejos han propiciado la generalizacin de los estudios de correlacin y de regresin, incluso fuera del propio mbito de la economa. De hecho, podemos encontrar Tesis Doctora- les en las que el doctorando propone modelos de regresin para ava- lar las conclusiones de sus investigaciones, trabajos en los que los autores se valen de modelos de regresin para expresar la preferen- cia de los votantes o estudios clnicos en los que se intenta explicar la variacin en la calidad de vida de los pacientes en funcin de las dosis tomadas de ciertos medicamentos. El inconveniente de este uso generalizado lo encontramos cuando el investigador hace (generalmente por falta de un conocimiento ms profundo) un mal uso de las medidas y tcnicas de regresin. En este artculo pretendo poner de manifiesto de una manera sencilla, a travs de ejemplos numricos, algunos de los errores graves en el anlisis de regresin a los que conduce la sola consideracin del coeficiente de 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 317 1. NOVALES, A., Econometra, Mc Graw-Hill, Madrid 1998. determinacin, denominado R 2 , como medida del grado de fiabilidad o bondad del ajuste del modelo ajustado a un conjunto de datos. En el captulo segundo se har una breve presentacin de este coeficiente y de cul es su interpretacin. En los captulos siguientes se abordan distintas situaciones en las que claramente una inadecua- da interpretacin de R 2 puede llevarnos a situaciones como mnimo paradjicas. En concreto, en el captulo 3 se analizan los efectos que estructuras determinadas del conjunto de observaciones, no detecta- das por R 2 , pueden tener sobre las aplicaciones empricas de las tc- nicas de regresin. El captulo 4 recoge la importancia que tiene tra- bajar con un nmero adecuado de grados de libertad del modelo ajustado, separando los problemas derivados del tamao muestral de los derivados del nmero de variables exgenas incluidas en el modelo. El objetivo del captulo 5 es poner de manifiesto la incon- sistencia de una prctica cada vez ms generalizada: buscar modelos de regresin con valores de R 2 elevados. Por ltimo, el captulo 6 se dedica a conclusiones. II. COEFICIENTE DE DETERMINACIN: DEFINICIN E INTERPRETACIN Si establecemos la hiptesis de que la mejor forma de describir la relacin entre X e Y es mediante una lnea recta, esto es: el problema inmediato que surge es el obtener los valores numricos de los parmetros b 1 y b 2 , que determinan la ecuacin lineal concre- ta que expresa la relacin de Y con X: Para ello acudimos a mtodos de ajuste, bsicamente el mtodo de mnimos cuadrados 1 , obteniendo un sistema de dos ecuaciones 318 ELENAMARTNEZ RODRGUEZ 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 318 2. LPEZ URQUA, J., y CASA ARUTA, E., Estadstica intermedia, Vicens-Vives, Madrid 1969. que permiten estimar los parmetros de la relacin. Ahora bien, el carcter de lnea media, que discurre entre las observaciones y que trata de sintetizarlas, que adquiere esta ecuacin de regresin, obliga a que se acompae, como cualquier promedio, de medidas de dispersin que permitan conocer el grado en que la misma puede sustituir a las observaciones de las que se obtuvo. As, podemos definir una primera medida de la dispersin de las Y i observadas respecto a las medias Y i calculada como la suma media de desviaciones cuadrticas entre ambas variables: expresin que recibe el nombre de varianza residual, ya que la dife- rencia mide el error (e i ) que cometemos al sustituir el valor observado por el valor estimado o ajustado mediante la regresin. A este error se le denomina tambin residuo. Valores elevados de esta varianza indican que los residuos son gran- des, lo que significa que la lnea de regresin estimada se aleja mucho de los valores observados y, por tanto, la ecuacin es poco representati- va. Cuando es pequea, dicha representatividad es elevada. Por definicin, se trata de una cantidad positiva (como cualquier varianza) acotada superiormente por el valor de la varianza de la variable observada Y, esto es: La cota superior es fcil de demostrar 2 , ya que en el modelo de regresin lineal con ordenada se verifica la siguiente relacin entre varianzas: 319 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 319 siendo S 2 R la varianza explicada por la regresin, y cuya expresin matemtica es: A partir de esta varianza podemos definir una medida de disper- sin relativa para la ecuacin de regresin, comparando la misma con la varianza total de Y. As lo que conocemos como coeficiente de determinacin lineal se define por la expresin: Tambin podemos definir las relaciones anteriores mediante sumas de cuadrados, de forma que representa la variacin total de los valores reales de Y respecto de su media muestral, recibiendo el nombre de suma total de cuadrados. es la variacin de los valores estimados de Y alrededor de su media, que se denomina suma de cuadrados debida a la regresin o explica- da por la regresin. Y, por ltimo, es la variacin residual o no explicada de los valores de Y alrededor de la recta de regresin, y que se conoce como suma de residuos al cuadrado. As el coeficiente R 2 se puede definir como Cualquiera de estas dos expresiones permiten interpretar el coefi- ciente de determinacin como la proporcin o porcentaje de varia- cin total en Y respecto a su media, que es explicada por el modelo de regresin. Es usual expresar esta medida en tanto por ciento, mul- tiplicndola por cien. 320 ELENAMARTNEZ RODRGUEZ 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 320 3. Ejemplo basado en un ejemplo propuesto por Anscombe. Por su definicin, es una medida acotada, siendo sus lmites 0 R 2 1 Un R 2 igual a 1 significa un ajuste lineal perfecto, ya que STC=SEC, esto es, la variacin total de la variable Y es explicada por el modelo de regresin. El valor cero indica la no representatividad del modelo lineal, ya que SEC = 0, lo que supone que el modelo no explica nada de la variacin total de la variable Y. De las dos medidas de la bondad del ajuste del modelo lineal pre- sentadas, la varianza residual y el coeficiente de determinacin, es preferible este coeficiente. ya que la primera es una medida de carc- ter absoluto, por lo que su cuanta depende de la propia magnitud de la variable endgena. En cambio, R 2 es una medida adimensional, de fcil clculo e interpretacin, debido a su recorrido acotado entre cero y uno, lo que conduce a una profusa utilizacin de la misma, con interpretaciones abusivas en unos casos y errneas en otros. Sin tratar de mermar la importancia de este coeficiente, R 2 debe tomarse, como veremos a lo largo de este artculo, como una primera medida, a completar con otras, para evaluar el modelo lineal de regresin ajustado y obtener conclusiones vlidas sobre su grado de ajuste al conjunto de observaciones. Su exclusiva consideracin puede, en muchas ocasiones, conducirnos a errores importantes en los anlisis de regresin. III. ESTRUCTURA DE LOS DATOS Supongamos que deseamos conocer la relacin que existe entre dos variables X e Y, que creemos es lineal, basndonos en la infor- macin proporcionada por una muestra de once observaciones con- juntas. Pero en lugar de trabajar con una nica muestra, vamos a rea- lizar, para valores prefijados de la variable exgena X, tres medicio- nes de la respuesta de la variable endgena Y, es decir, vamos a generar tres muestras diferentes 3 . La tabla I muestra los valores pre- fijados de X, as como los valores obtenidos de Y, en cada muestra. 321 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 321 Realizando el ajuste lineal por el mtodo de los mnimos cuadra- dos, para cada una de las tres muestras obtenemos la misma ecuacin y el mismo valor para el coeficiente de determinacin: A la vista del resultado analtica podemos afirmar que el ajuste del modelo es bueno, ya que el valor de R 2 = 0,8998 es cercano a 1, en concreto, el 89,98% de la variabilidad de la variable Y a su pro- medio es explicado por el modelo de regresin ajustado. Podemos concluir que el modelo lineal es adecuado para describir la relacin que existe entre estas variables. Sin embargo, si aadimos a esta informacin cuantitativa sobre la que basamos nuestro anlisis, la representacin grfica de los datos y la recta de regresin estimada para cada muestra veremos que la rea- lidad es bien distinta. Dato Variable X Variable Y Variable Y Variable Y (valor prefijado) (muestra 1) (muestra 2) (muestra 3) 1 4 4,84 3,96 5,28 2 5 5,99 5,21 5,73 3 6 6,67 6,28 6,19 4 7 5,92 7,21 6,68 5 8 7,88 7,93 7,17 6 9 6,84 8,55 7,67 7 10 8,26 9,03 8,17 8 11 8,95 9,39 8,62 9 12 10,71 9,62 9,11 10 13 9,83 9,73 11,9 11 14 10,52 9,76 10,13 322 ELENAMARTNEZ RODRGUEZ TABLA I 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 322 La figura I muestra la representacin grfica de la nube de puntos correspondiente a la primera muestra. Resulta evidente que en este caso el modelo lineal ajustado describe de forma satisfactoria la rela- cin entre ambas variables: todos los puntos se localizan de forma relativamente homognea alrededor de la ecuacin de regresin. En el caso de trabajar con la segunda muestra, la representacin grfica de la nube de puntos (fig. II) pone en evidencia que el mode- lo lineal no es el ms adecuado. Hemos cometido un error en la espe- cificacin del modelo, ya que sera ms acertado proponer una ecua- cin parablica y no una lineal. Asimismo, en el caso de la tercera muestra, el grfico (fig. III) revela la existencia de un dato anmalo que se aleja de la pauta seguida por el resto de las observaciones y que condiciona el resulta- do de la estimacin. Es probable que el origen de esta anomala est en un simple error de medicin, lo que debera ser comprobado. 323 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . FIGURA I FIGURA II 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 323 Como vemos en este sencillo ejemplo, la estructura particular del conjunto de observaciones en las que nos basamos para estimar el modelo de regresin lineal condiciona el resultado de la estimacin, de forma que tres situaciones bien diferentes nos han proporcionado las mismas estimaciones mnimas cuadrticas y el mismo valor de R 2 . La nica consideracin del coeficiente de determinacin como medida de la bondad del ajuste nos lleva, en dos de las tres situacio- nes planteadas, a elaborar conclusiones equivocadas y a la afirma- cin de que es necesario contar con medidas adicionales a R 2 que completen el anlisis. IV. GRADOS DE LIBERTAD DEL MODELO Un error que se comete frecuentemente en la interpretacin de R 2 es el de no reparar en el tamao muestral. El coeficiente de determi- nacin lineal y el nmero de datos suelen variar de forma inversa, de tal manera que bastara con considerar un nmero pequeo de obser- vaciones para que R 2 alcance un valor prximo a la unidad, sin que ello evidencie la existencia de una marcada relacin lineal entre dos variables. Para resaltar esta idea recurro de nuevo a un sencillo ejemplo numrico, en el que queremos analizar la relacin entre la variable exgena X y la endgena Y, aunque en este caso sabemos a priori que se encuentran relacionadas, casi exactamente, por una funcin parablica. La tabla II recoge quince valores observados de la varia- ble (X, Y). 324 ELENAMARTNEZ RODRGUEZ FIGURA III 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 324 TABLA II Vamos a empezar trabajando slo con los seis primeros datos, para los que estimamos el modelo lineal a travs del mtodo de mni- mos cuadrados. La figura IV recoge la representacin grfica del conjunto de observaciones y la recta ajustada. Podemos observar que el valor de R 2 igual a un 99% nos permite afirmar, apoyados en este caso por la grfica, que el modelo lineal es adecuado. Dato Variable X Variable Y 1 40 12 2 50 25,5 3 60 47,8 4 70 64,8 5 80 80,0 6 90 90,5 7 100 99,1 8 110 106,2 9 120 111,4 10 130 116,5 11 140 119,3 12 150 121,5 13 160 121,9 14 170 119,5 15 180 114,9 325 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . FIGURA IV 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 325 Igual conclusin podemos obtener (fig. V) si trabajamos en lugar de con seis datos con las doce primeras observaciones recogidas en la tabla II. Por ltimo, repetimos el trabajo para las 15 observaciones mues- trales. Slo en este caso (fig. VI) el valor de R 2 , que empieza a ale- jarse de 1 y la grfica, nos permite dudar que el ajuste lineal sea ade- cuado. FIGURA VI La consideracin nicamente de R 2 para medir el grado de ajuste cuando trabajamos con muestras pequeas nos conduce, de nuevo, a errores graves al aceptar la dependencia lineal entre las variables X e Y, cuando realmente mantienen una relacin bien distinta. 326 ELENAMARTNEZ RODRGUEZ FIGURA V 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 326 Ahora bien, el tamao muestral no es la nica magnitud que influye en el valor de R 2 . El nmero de variables explicativas consi- deradas en el modelo tambin condiciona el valor de este coeficien- te, ya que R 2 es una funcin no decreciente del nmero de variables exgenas o regresoras presentes en el modelo, de forma que a medi- da que aumenta el nmero de variables regresoras R 2 aumenta. Su justificacin es inmediata con tan slo recordar su definicin. Segn esto, R 2 mide la capacidad explicativa de la variable X sobre la variable Y. Al introducir en el modelo otra variable regreso- ra el nivel explicativo ser mayor entre las dos que slo con la pri- mera o, en todo caso, no disminuir, pues la primera variable conti- na como explicativa. As pues, en la interpretacin de R 2 no slo es preciso considerar el tamao de la muestra, sino tambin el nmero de variables expli- cativas incluidas en el modelo de regresin. En una palabra, hay que tener en cuenta los grados de libertad del modelo, definidos como la diferencia entre el nmero de datos y el nmero de coeficientes de la ecuacin. En la literatura economtrica podemos encontrar varias solucio- nes al problema del incremento artificial del valor de R 2 . Una de ellas es proponer un coeficiente de determinacin corregido o ajusta- do, denotado por R 2 , y definido como donde k es el nmero de parmetros en el modelo, incluyendo el tr- mino independiente. Es fcil comprobar la relacin que mantienen R 2 y R 2 Observemos que para k > 1, R 2 < R 2 , lo cual implica que a medida que el nmero de variables exgenas aumenta, R 2 ajustado aumenta menos que R 2 no ajustado. Observemos que, en este caso, (k > 1), si 327 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 327 4 . TH E I L, H., I n t roduction to Econometrics, Prentice-Hall, Englewood Cliff s , New York 1978. 5. GOLDBERGER, A. S., A Course in Econometrics.Harvard , University Press, Cambridge 1991. R 2 = 0 R 2 puede ser negativa, a pesar de que R 2 sea una magnitud no negativa. Si esto ocurre R 2 , se interpreta como si su valor fuese 0. Establecida esta relacin entre los dos coeficientes, podemos afir- mar que R 2 corregido tiene la propiedad de ser neutral frente a la introduccin de variables adicionales. En opinin de algunos auto- res 4 , es mejor utilizar R 2 en lugar de R 2 , porque R 2 tiende a dar una imagen demasiado optimista del ajuste de la regresin, particular- mente cuando el nmero de variables explicativas no es muy pequeo comparado con el nmero de observaciones, lo que po- dramos considerar como un grado de libertad del modelo inade- cuado. No obstante, esta opinin no es compartida totalmente, ya que se pueden proponer otras formas de corregir el aumento inde- seado de R 2 , como, por ejemplo, el coeficiente modificado que define Goldberg e r 5 : Ahora bien, debemos tener en cuenta que la utilizacin de cual- quiera de los coeficientes alternativos propuestos, R 2 ajustado o R 2 corregido tiene problemas propios de interpretacin y no resuelve siempre las deficiencias de R 2 . V. MAXIMIZACIN DE R 2 En ocasiones los investigadores tratan de maximizar R 2 , es decir, escogen el modelo para el cual la R 2 es ms elevada. Pero esto puede ser peligroso por varios motivos. En primer lugar, en el anlisis de regresin el objetivo no es obtener un valor elevado de R 2 , sino obte- ner estimadores precisos de los verdaderos coeficientes de regresin poblacional. En el anlisis emprico no es raro encontrarnos con valores altos de R 2 , pero tampoco que encontremos que alguno de los coeficientes de regresin no son estadsticamente significativos o muestran signos contrarios a los esperados a priori. El investigador 328 ELENAMARTNEZ RODRGUEZ 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 328 debe preocuparse por la relevancia lgica o terica que tienen las variables explicativas para la variable endgena y por su significa- cin estadstica. Si en este proceso se obtiene un valor de R 2 elevado, muy bien, aunque ello no es evidencia a favor del modelo, y si este valor es pequeo, esto no significa que el modelo sea necesariamen- te malo. Respecto a esta cuestin, sealar, sin entrar en ms detalles, que la prctica de seleccionar un modelo con base en R 2 ms elevada puede tener como consecuencia la introduccin en el modelo de lo que se conoce como sesgo preprueba, que puede destruir algunas de las propiedades de los estimadores mnimos cuadrados del modelo de regresin lineal. En segundo lugar, es importante sealar, al comparar modelos de regresin sobre la base del coeficiente de determinacin, el tamao muestral, y la variable dependiente deben ser los mismos. Por ejem- plo, para los modelos los coeficientes R 2 no son comparables. La razn la encontramos en la propia definicin de R 2 , que mide la proporcin de variacin en la variable dependiente explicada por las variables exgenas. En el primer modelo considerado R 2 mide la proporcin de la variacin en Y explicada por X, mientras que en el segundo modelo mide la pro- porcin de la variacin de lnY. Pero incluso cuando la variable endgena es la misma, podemos encontrarnos con problemas al comparar los valores de R 2 si, por ejemplo, el nmero de regresores es distinto. Pude probarse que cuando se aade una variable al modelo la suma residual siempre disminuye. Por tanto, si uno de los dos modelos tiene las mismas variables que el otro y alguna ms (modelos anidados), como, por ejemplo, los modelos: el modelo amplio tendr siempre un valor mayor de R 2 , siendo por ello ms preferido. El problema se vuelve ms delicado en el caso en el que los modelos no sean anidados, siendo necesario recurrir a 329 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 329 otros criterios y extremar la precaucin en la interpretacin que vamos a dar sobre cul de los modelos es, en este caso, preferido. Como vemos, son muchos los aspectos que debemos considerar cuando tratamos de comparar los valores de los coeficientes de determinacin de distintos modelos: que traten de explicar la misma variable endgena, que ambos tengan o no ordenada en el origen, que el tamao muestral sea el mismo, que compartan el mismo nmero de regresores, cuestiones que, en ocasiones, no son tenidas en cuenta por el investigador, quien basndose exclusivamente en el valor de R 2 como nica medida del grado de bondad del ajuste reali- zado y, por tanto, en una interpretacin errnea de este coeficiente decide trabajar con el modelo que proporciona un mximo valor de R 2 . De nuevo un mal uso de este coeficiente puede conducir a con- clusiones no acertadas. V. CONCLUSIONES Atravs de ejemplos numricos sencillos y de las representacio- nes grficas de sus ajustes se ha tratado de transmitir la idea de que R 2 no es la medida mgica que resuelve, en todos los casos, el problema de la medicin del grado de bondad del ajuste realizado. La propia estructura de los datos, desconocida a priori, y unos gra- dos de libertad del modelo inadecuados (nmero reducido de obser- vaciones y/o un nmero elevado de variables exgenas en el mode- lo) son algunas de las situaciones que nos han permitido poner de manifiesto las deficiencias y limitaciones mostradas por R 2 en cuan- to a medida de la bondad del ajuste, al tiempo que se evidencia la necesidad de profundizar en el anlisis economtrico, proponiendo medidas complementarias al coeficiente de determinacin, de forma que su utilizacin conjunta garantice una mayor confianza en las conclusiones obtenidas. De hecho, varios autores comparten la idea de reducir el nfasis en el uso de R 2 como medida de bondad del ajuste al igual que su uso para comparar dos o ms valores de este coeficiente con el objetivo de decidir qu modelo de regresin es p r e f e r i d o . Las consideraciones destacadas en los distintos apartados no invalidan la utilizacin de R 2 como medida de la bondad del ajuste, si nos atenemos a interpretarlo de acuerdo con su definicin: medida 330 ELENAMARTNEZ RODRGUEZ 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 330 que recoge cmo en trminos generales la recta de regresin ajusta- da resume o describe los datos. Los problemas de interpretacin surgen cuando intentamos que el coeficiente de determinacin avale la dependencia entre variables y, a partir de ella, predecir o extrapolar, en el tiempo o en el espacio, la recta de regresin. En este sentido, si R 2 es alto se considera que el ajuste es vlido y que la ecuacin obtenida representa adecuadamen- te la relacin cuantitativa entre las variables, pudiendo, por tanto, aplicarse para determinar los valores de una de ellas, conocidas las dems. Este razonamiento es el que desvirta el uso y la interpretacin del coeficiente de determinacin lineal. Medida que, a pesar de las deficiencias que presenta, no debe ser desechada como medida de evaluacin complementaria. Por otra parte, siempre que su interpre- tacin se ajuste a su definicin, su utilizacin ser correcta. VI. BIBLIOGRAFA AC H E N, C. H., I n t e r p reting and Using Regre s s i o n., Dage Publicaciones, California 1982, pp. 56-67. ASCOMBE, T. W., Graphs in Statistical Analisys, en The American Statis - tician, 27 (1973) 17-21. GOLDBERGER, A. S., A Course in Econometrics. Harvard, University Press, Cambridge 1991. GRANGER, C., y NEWBOLD, P., R 2 and the Transformation of the Regression Variables, en Journal of Econometrics, vol. 4 (1976) 205-210. GUJARATI, D. N., Econometra, Mc Graw-Hill, Mxico 2003. HERNNDEZ ALONSO, J., Uso y abuso del coeficiente de determinacin, en ESIC Market, 79 (1993) 77-92. L P E Z UR Q U A, J., y CA S A AR U TA , E., Estadstica Intermedia, Vi c e n s - Vives, Madrid 1969. NOVALES, A., Econometra, Mc Graw-Hill, Madrid 1998. Estadstica y Econometra, Mc Graw-Hill. Madrid. 1996. RAYMOND, J. L.; ANGULO, J., y REPILADO, A., Relaciones de causalidad en economa y criterios estadsticos para detectar su existencia, Instituto de Estudios Fiscales, 16 (1982). THEIL, H., Introduction to Econometrics, Prentice-Hall, Englewood Cliffs, New York 1978. 331 ERRORES FRECUENTES EN LAI N T E R P R E TACIN DELC O E F I C I E N T E . . . 11 ELENA MARTINEZ 28/3/05 18:00 Pgina 331