Sunteți pe pagina 1din 7

6 Coeficiente de Determinación

La bondad de la predicción depende de la relación entre las variables. Si dos


variables no covarían, no podremos hacer predicciones válidas, y si la
intensidad de la covariación es moderada, las predicciones no serán
demasiado buenas. En consecuencia, hay que disponer de alguna medida de
la capacidad de la ecuación de Regresión para obtener predicciones buenas
(en el sentido de que sean lo menos erróneas posible).

Esta medida es el Coeficiente de Determinación, que es el cuadrado del


coeficiente de correlación de Pearson, y da la proporción de variación de la
variable Y que es explicada por la variable X (variable predictora o explicativa).
Si la proporción es igual a 0, significa que la variable predictora no tiene NULA
capacidad predictiva de la variable a predecir (Y). Cuanto mayor sea la
proporción, mejor será la predicción. Si llegara a ser igual a 1 la variable
predictora explicaría TODA la variación de Y, y las predicciones NO tendrían
error.

Ejemplo

En el siguiente cuadro puedes comprobar:

a) que la Varianza total de la variable Y (0.76) es igual a la suma de las


Varianzas de las puntuaciones estimadas (Y') y de los errores de predicción (Y-
Y').

b) Que el coeficiente de determinación (r2xy) es igual a la proporción de la


Varianza explicada (s2y') respeto de la Varianza total (s2y)

 
4.2.4 Coeficiente de determinación

El objetivo principal del análisis de regresión es proyectar el valor de la variable


dependiente conociendo o suponiendo valores para la variable independiente.
La confiabilidad de las proyecciones está dada por la confiabilidad de la
ecuación, la cual se mide a través del coeficiente de determinación y de los
errores de los coeficientes de regresión. El coeficiente de determinación (R2 )
nos dice qué tanto se ajusta la línea de regresión a los datos.

Figura 4.2 Descomposición de la variación de Y


Para deducir este coeficiente se tiene en cuenta la figura 4.2 en donde se tiene
la ecuación ajustada a unos datos. Para un valor dado de X se ha tomado el
correspondiente valor de Y. La distancia que hay entre el valor observado y la

media   , puede descomponerse en dos partes que son: la distancia


entre el valor observado y el estimado con la ecuación de regresión   

y la distancia entre el valor estimado y el promedio   , es decir:

Siendo:

: Distancia Total.

: Distancia de una observación a la regresión o residuo

: Distancia de la línea de regresión a la media o distancia de la


regresión

Como se tienen n observaciones, para cada caso se presenta la misma


situación, por lo tanto se toma la suma de estas distancias al cuadrado:

En el anexo B se presenta la demostración de que:

Es decir: SCT = SCR + SCE    (4.4)

Lo cual indica que la SCT puede descomponerse en dos partes, una describe
la variación de los residuos (SCR) y representa aquella parte de la SCT que no
ha sido explicada por la ayuda de X y la otra parte describe los valores
ajustados de Y, es decir, representa aquella porción de la SCT que ha sido
explicada por la regresión de Y sobre X.

Dividiendo la ecuación 4.4 por SCT se obtiene:


El segundo término es el coeficiente de determinación, así que:

Donde:

Como puede observarse, el coeficiente de determinación es la proporción de la


variable dependiente explicada por la variable independiente y por lo tanto está
entre 0 y 1. Es decir: 0 £ R 2 £ 1.

A medida que el R 2 se acerca a 1, la ecuación de regresión es más confiable,


ya que de la expresión 4.5 se deduce que la SCR tiende a cero y entre más
cercano esté el R 2 de cero, la ecuación es menos confiable ya que la SCE
tiende a cero.

Una medida estrechamente relacionada a R 2 pero conceptualmente diferente


es el coeficiente de correlación (R) que es una medida del grado de
asociación entre dos

variables. Puede calcularse como:

Donde: Sx y Sy son las desviaciones estándar de X y Y respectivamente.

A continuación se presentan algunas propiedades del coeficiente de correlación


(R):

- -1   R   1
- El signo de R depende del signo de la covarianza o de la pendiente (   )

- R es de naturaleza simétrica; lo anterior implica que el coeficiente de


correlación entre X y Y (Rxy ) es igual al coeficiente de correlación entre Y y X
(Rxy ).

- Si X y Y son estadísticamente independientes, el coeficiente de correlación


entre ellos es cero, pero si R=0, no se puede inferir que las dos variables sean
independientes. En otras palabras, una correlación igual a cero no implica
necesariamente independencia.

- Es una medida de asociación lineal o dependencia lineal únicamente; por


consiguiente no tiene sentido, utilizarlo para describir relaciones no lineales.

En el contexto del análisis de regresión, R2 es una medida más significativa que
R, debido a que el primero muestra la proporción de la varianza en la variable
dependiente explicada por la(s) variable(s) explicativa(s) y, por tanto,
proporciona una medida global de la magnitud del efecto que ejerce la
variación existente en una variable sobre la variabilidad de la otra. De otro lado
R no nos permite realizar inferencias de este género. Además, la interpretación
de R en un modelo de regresión múltiple es de un valor dudoso"1

El coeficiente de determinación (R2) es útil para evaluar la ecuación de


regresión integralmente, pero es necesario evaluar la confiabilidad de cada uno
de los coeficientes de regresión, lo cual se hace con los errores de estos
coeficientes y más específicamente con las pruebas de hipótesis para cada uno
de ellos.

_____________________________________________________________
1
Gujarati, Damodar. Econometría , Segunda edición. Pág 71-72. Editorial Mc
Graw Hill. Bogotá, 1990.
COEFICIENTE DE
CORRELACIÓN
Frecuentemente denominado correlación. Una medida estadística ampliamente utilizada que

mide el grado de relación lineal entre dos variables aleatorias.

Elcoeficiente de correlación debe situarse en la banda de -1 a +1.

El coeficientede correlación se calcula dividiendo la covarianza de las dos variables aleatorias

por el producto de las desviaciones típicas individuales de las dos variables aleatorias. Las

correlaciones desempeñan un papel vital en la creación decarteras y la gestión de riesgos

. En realidad, la eficacia de unacobertura puede valorarse a partir del grado

de correlaciónentre el precio al contado de unaposición en efectivo que se va acubrir y

el precio del instrumento de cobertura. Cuanto mayor sea la correlación, más eficaz será

lacobertura. 

Mide la interdependencia o grado de asociación entre dos variables. Se define como

la relación por cociente entre la covarianza de las dos variables y el producto de sus

desviaciones típicas. Su valor puede oscilar entre 0 y 1 y 0 y -1, según que la correlación sea

positiva o negativa. Un coeficiente decorrelación igual a cero significa ausencia

de correlación. 

El que representa el grado en el cual dos variables están relacionadas li-nealmente entre sí.

Correlation coefficient. 

(En inglés: correlation coefficient )

Medida estadística que analiza el grado de dependencia entre dos variables, es decir, cómo

se verá afectada una variable determinada, conociendo la variaciónde una segunda variable.

Este coeficiente toma valores entre -1 y 1, indicando si existe una dependencia directa

(coeficiente positivo) o inversa (coeficientenegativo) siendo el 0 la independencia total. Es la

raíz cuadrada del coeficiente de determinación. 

Medida de la relación estadística entre dos o más variables.


COEFICIENTE DE
DETERMINACIÓN
Una importante medida estadística igual al cuadrado del coeficiente de correlación. Se utiliza

a menudo como medida de la eficacia de la cobertura en cuyo caso se mide el porcentaje de

la variación en el precio de una posición al contado explicada por la variación en el precio del

instrumento de cobertura. Se puede obtener como R2 a partir de

una regresión lineal sencilla. 

Medida del grado de dependencia entre variables. Determination coefficient. 

(En inglés: determination coefficient )

Coeficiente que mide el grado de dependencia entre variables, tomando el valor0 en caso

de correlación nula o el valor 1 en caso de correlación total. Equivale al cuadrado

del coeficiente de correlación.

S-ar putea să vă placă și