Sunteți pe pagina 1din 36

CORRELACIÓN Y

REGRESIÓN
Análisis de regresión
◦ El denominado modelo lineal de la regresión, es un método
estadístico basado en el estudio de la correlación entre dos
conjuntos de variables, la naturaleza o nivel de medida de los
cuales ha de ser cuantitativo
◦ Vamos a ver primero a qué nos referimos con correlación, para
luego entender el modelo de regresión simple.
Trabajamos las medidas de asociación, que nos dice
cómo se distribuyen las unidades de análisis en los
espacios de propiedades independientemente del
sistema de categorías.
◦ Correlación: Nos dice acerca de cómo se distribuyen las
unidades de análisis y de qué valores de variable asumen.(lo
mediremos a través de un coeficiente que se llama r de Pearson)
◦ En la idea de correlación subyace el principio de co-variación.
◦ Si hay co-variación decimos que existe la dependencia
estadística ,si no hay estamos frente a la independencia
estadística.
Co-variación
◦ Al hablar de co-variación entre dos variables de nivel intervalar
vamos a hablar de correlación entre dos variables, también
vamos a poder hablar de su intensidad, dirección o sentido
Conjunto de puntos: diagrama
de dispersión
Porque indica cómo se dispersan las unidades de análisis según
los valores que asumen para cada una de las dos variables.
◦ También es una representación gráfica de un espacio de
propiedades de dos variables cuantitativas.
◦ Este coeficiente sólo sirve para relaciones lineales, no
curvilineales.
◦ Es decir queremos probar hipótesis lineales:
◦ ”A mayor X mayor Y” ó
◦ A “ mayor X menor Y”
SPSS
◦ Menú Analizar
>correlacione
s>bivariadas
◦ Vamos añadiendo del listado las variables que vamos a correlacionar.
◦ Pearson: para variables que tienen como mínimo nivel de medición
intervalar
◦ Tau-b de Kendall y Spearman para variables que son ordinales.

Prueba de significación:
Bilateral: cuando no creemos
que una variable incida sobre la
otra.
Unilateral: Cuando nuestra
hipótesis dice que una variable Y
varía cuando lo hace X.
◦ Estamos hablando de correlaciones lineales simples porque mide
la relación entre solo dos variables. Los datos deben estar
presentados sin agrupar.
◦ El coeficiente de correlación “r” de pearson varía entre 1 y -
1.esto es entre la máxima relación posible en sentido positivo y la
máxima relación posible en sentido negativo.
◦ Recuerden que el sentido indica de qué modo se influyen las
variables.
◦ Si ambas aumentan o disminuyen: sentido positivo
◦ Si una aumenta y otra disminuye: sentido negativo
Prueba de significación
¿Qué significa que tenga la máxima
relación?

◦ Significa que el comportamiento de la variable dependiente


está determinado en forma absoluta por el comportamiento de
la variable independiente. Es decir nada de las variaciones de la
variable dependiente se debe al azar o al comportamiento de
otras variables.
◦ Cuando el coeficiente alcanza el valor “0”,estamos en el caso
de independencia estadística. Nada de las variaciones de la
variable dependiente se debe a la variable independiente, el
azar u otras variables dan cuenta de ello.
Veamos un ejemplo de aplicación de la
fórmula ,en el que se quiere establecer la
correlación entre el cociente intelectual de
los alumnos y el puntaje obtenido en una
prueba de matemáticas.
En el que se espera que a mayor cociente
intelectual mayor puntaje obtenido en una
prueba de matemáticas.
CI Puntaje (x-¯x) (y-¯y) (x-¯x)(y- (x-¯x)2 (y-¯y) 2
(x) (y) ¯y)
105 7 -8 0 0 64 0
109 7 -4 0 0 16 0
110 8 -3 1 -3 9 1
114 8 1 1 1 1 1
115 7 2 0 0 4 0
118 9 5 2 10 25 4
120 8 7 1 7 49 1
Media Media 7 ∑ 15 ∑ 168 ∑7
113
◦ R=15/√168∙7 = 15/34.29= 0,43

Para interpretar este valor se ha


establecido un criterio referencial que es
aplicar el coeficiente de determinación :
r cuadrado, indica el grado de
determinación del comportamiento de y
a partir de x.
◦ Además se complementa con el
coeficiente de indeterminación
Kcuadrado.Expresa el grado de
desconocimiento , incertidumbre acerca
de y.
◦ K cuadrado = 1-r cuadrado
◦ En ejemplo anterior
r cuadrado = 0,43 x 0,43=0,18 (es lo que
determina el coeficiente intelectual sobre el
rendimiento de la prueba de matemática)

K cuadrado=1-r cuadrado= 1-0,18=0.82,este


es el desconocimiento o incertidumbre. Nos
permite en pensar en la necesidad de
nuevas hipótesis
◦ k=√1-r cuadrado (aleatoriedad)
REGRESIÓN
LINEAL SIMPLE
Regresión lineal simple
◦ Otro tema vinculado con la correlación
es la estimación del comportamiento de
la variable dependiente desde el
conocimiento de la independiente. Esta
estimación se efectúa con el análisis de la
regresión lineal simple.
◦ Pero para poder efectuar la estimación
deben darse ciertas condiciones:
◦ La relación de dependencia entre las
variables debe ser suficientemente fuerte,
de manera que pueda minimizarse la
probabilidad del error de la estimación.
◦ La elección de la variable independiente
es de carácter teórico, es la estimadora
teóricamente más apropiada.
◦ Ver ejemplo de dos ejes correspondientes a
◦ La estimación de ingresos según años de escolaridad.
◦ Para estimar el valor de y ,se parte del
supuesto de una relación lineal y por lo tanto
se maneja con la ecuación de una recta.

◦ Y=a+b x

◦ Donde a y b son dos valores constantes , a


partir de los cuales se construye la recta que
representa mejor la correlación entre las
variables.
◦ Tal recta es aquella respecto de la cual
todos los puntos del diagrama de
dispersión se encuentran desviados con
la mínima distancia posible (denominada
recta de los mínimos cuadrados)

◦ a: punto de origen en y (ordenada)


◦ b:ángulo de inclinación o pendiente
◦ Ver fórmula
◦ Supongamos que tenemos la distribución de dos variables y
debemos calcular los términos constantes de a y b, para poder
estimar un valor de y.
Años de Ingresos (x-¯x) (y-¯y) (x-¯x )2 (x-¯x) (y-¯y)
escolarida (y)
d(x)◦

1 2 -2 -3 4 6
2 5 -1 0 1 0

3 4 0 -1 0 0

5 6 2 1 4 2

5 8 2 3 4 6
∑x 15 ∑y 25 ∑ 13 ∑ 14
Media 3 Media 5
◦ b=14/13=1,1
◦ a= ¯y-b.¯x
◦ a= 5-1,1∙3
◦ a= 1,7

◦ La ecuación de regresión queda


y= 1,7+1,1 x
◦ A partir de allí se pueden predecir los
ingresos para los diferentes años de
educación .
◦ Así para el año de educación x=9 ,el nivel de
ingresos será el siguiente
◦ Y(calculado)=1,7 +1,1∙9=11,6
◦ De este modo al disponer de la información
sobre la variable independiente podemos
lograr una predicción de la variable
dependiente.
◦ Pero como toda estimación tiene un error, que se denomina error
standard de la estimación.

S-ar putea să vă placă și