Documente Academic
Documente Profesional
Documente Cultură
Introduccin:
Es parte de la Estadstica corresponde a la Estadstica Inferencial y dentro de ella
los captulos de correlacin y regresin son muy usados en la Investigacin
Cientfica, una herramienta muy til cuando se trata de relacionar 2 o ms variables,
relacionadas entre s, como por ejemplo. nivel de hemoglobina y embarazo en el
mbito de las Ciencias de la Salud, la Correlacin implica el grado de dependencia
de una variable respecto a otra y la Regresin es otra tcnica que ayuda en la
investigacin de la salud Psicologa costos de una Empresa etc.
Objetivos:
Es el anlisis de regresin lineal es estimar el valor de una variable aleatoria (la
variable dependiente) dado que el valor de una variable asociada (la variable
independiente) es conocido. La variable dependiente tambin se llama variable de
respuesta, mientras que la variable independiente tambin se llama variable de
prediccin. La ecuacin de regresin es la frmula algebraica por la cual se
determina el valor estimado de la variable dependiente o de respuesta.
El termino anlisis de regresin simple indica que el valor de una variable
dependiente se estima con base de una variable independiente. El anlisis de
regresin mltiple, se ocupa de la estimacin del valor de una variable dependiente
con base en dos o ms variables independientes.
Y as como el anlisis de regresin permite obtener una frmula que expresa la
relacin entre dos o ms variables, el anlisis de correlacin obtiene un ndice que
muestra el grado de relacin entre dos o ms variables.
El coeficiente de correlacin lineal, desarrollado por el matemtico ingles Karl
Pearson (1857-1936) y conocido con la letra r, puede tomar valores desde -1 hasta
+1. Son estos extremos que manifiestan una relacin lineal perfecta (negativa o
positiva).
+2 SD (98%)
Media (50%)
-2 SD (2%)
Para obtener un modelo de regresin es suficiente establecer la regresin para eso
se hace uso del coeficiente de correlacin: R.
R = Coeficiente de correlacin, este mtodo mide el grado de relacin existente
entre dos variables, el valor de R vara de -1 a 1, pero en la prctica se traba con un
valor absoluto de R.
El valor del coeficiente de relacin se interpreta de modo que a media que R se
aproxima a 1, es ms grande la relacin entre los datos, por lo tanto R (coeficiente
de correlacin) mide la aproximacin entre las variables.
El coeficiente de correlacin se puede clasificar de la siguiente manera:
CORRELACIN VALOR O RANGO
1) Perfecta 1) R = 1
2) Excelente 2) R = 0.9 < = R < 1
3) Buena 3) R = 0.8 < = R < 0.9
4) Regular 4) R = 0.5 < = R < 0.8
5) Mala 5) R < 0.5
Distribucin divariante
La distribucin divariante es cuando se estudia en una poblacin dos variables, que
forman pares correspondientes a cada individuo, como por Eje:
Las notas de 10 alumnos en biologa y lenguaje
BIOLOGIA 2
4
5
5
6
6
7
7
8
9
LENGUAJE 2
10
Los pares de valores son: ( 2, 2) (4,2) (5,5)(8,7) (9,10) forman una distribucin
divriate.
La correlacin, mtodo por el cual se relacionan dos variables se pude graficar con
un diagrama de dispersin de puntos, a la cual muchos autores le llaman nubes de
puntos, encuadrado dentro de un grfico de coordenadas X Y en la cual se pude
trazar una recta y cuyos puntos ms cercanos de una recta hablaran de una
correlacin ms fuerte, ha esta recta se le denomina recta de regresin, que puede
ser positiva o negativa, la primera contundencia a aumentar y la segunda en
descenso o decreciente.
Tambin se puede describir un diagrama de dispersin en coordenadas cartesianas
valores como en la distribucin divrciate, en donde la nube de puntos representa
los pares de valores.
GRAFICOS DE RECTA DE REGRESIN
Por ltimo se pueden graficar las lneas de tendencia, herramienta muy til para
el mercadeo porque es utilizada para evaluar la resistencia que proyectan
los precios. Cuando una lnea de tendencia central se rompe ya sea con tendencia
al alza o en la baja es porque ocurre un cambio en los precios, por lo tanto las lneas
de tendencia pueden ser alcista cuando se unen los puntos sucesivos y bajista
cuando se unen los puntos mximos.
Relacin Exponencial:
Sin Relacin
Ajuste Exponencial: Y = AC BX
En el modelo de regresin lineal simple se utiliza la tcnica de estimacin de los
mnimos cuadrados, este modelo tiene solo una variable de prediccin y se supone
una ecuacin de regresin lineal.
En el siguiente ejemplo la relacin entre la calificacin y salario la variable repuesta
es el salario inicial y la variable predictiva o de prediccin es la calificacin promedia,
si se desea determinar una ecuacin de regresin para el salario inicial promedio
como una funcin de la calificacin promedio se podr graficar y procesar los datos
en una computadora, estos datos son:
CP = Calificacin Promedio
SI = Salario Inicial
De este grupo de datos se obtiene el siguiente grfico de dispersin
Regresin simple y correlacin
La Regresin y la correlacin son dos tcnicas estadsticas que se pueden utilizar
para solucionar problemas comunes en los negocios.
Muchos estudios se basan en la creencia de que es posible identificar y cuantificar
alguna Relacin Funcional entre dos o ms variables, donde una variable depende
de la otra variable.
Se puede decir que Y depende de X, en donde Y y X son dos variables cualquiera
en un modelo de Regresin Simple.
"Y es una funcin de X" Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
En el Modelo de Regresin es muy importante identificar cul es la variable
dependiente y cul es la variable independiente.
En el Modelo de Regresin Simple se establece que Y es una funcin de slo una
variable independiente, razn por la cual se le denomina tambin Regresin
Divariada porque slo hay dos variables, una dependiente y otra independiente y se
representa as: Y = f (X) "Y est regresando por X"
La variable dependiente es la variable que se desea explicar, predecir. Tambin se
le llama regresando o variable de respuesta.
La variable Independiente X se le denomina variable explicativa regresor y se le
utiliza para explicar y.
ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE
En el estudio de la relacin funcional entre dos variables poblacionales, una variable
X, llamada independiente, explicativa o de prediccin y una variable Y, llamada
dependiente o variable respuesta, presenta la siguiente notacin:
Y=a+bX+e
Donde:
a es el valor de la ordenada donde la lnea de regresin se intercepta con el eje Y.
b es el coeficiente de regresin poblacional (pendiente de la lnea recta) e es el error
Slo se maneja una Variable independiente, por lo que slo cuenta con dos
parmetros. Son de la forma:6
2) Anlisis
Dado el modelo de regresin simple, si se calcula la Peraza valor esperado) del
valorm>Y, se obtiene
Rectas de Regresin
Las rectas de regresin son mejor se ajustan a la nube de puntos (o tambin llamado
pentagrama de dispersin) generada por una distribucin binomial.
Matemticamente, son posibles dos rectas de mximo ajuste:9
La recta de regresin dem>Yem>sobrem>X:
2rrelacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra
disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta
decreciente.
3rrelacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre las
variables.
En este caso se dice que las variables son incorreladas y la nube de puntos tiene
una forma redondeada.
GRADO DE CORRELACIN
El grado de correlacindica la proximidad que hay entre los puntos de la nube de
puntos. Se pueden dar tres tipos:
1.rrelacin fuerte
La correlacin ser fuerte cuanto ms cerca est los puntos de la recta.
2.rrelacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
3.rrelacin nula
El eficiente de correlacin lineal el cociente entre la varianza el producto de las
aviaciones tpicas ambas variables.
El eficiente de correlacin lineal expresa mediante la letra
10
16
16
16
16
20
25
16
24
36
16
36
36
36
28
49
16
42
49
36
56
64
49
10 9
90
100 81
10 10 100
100 100
3
2
5
0
Determinar el eficiente de correlacin.
Convertimos la tabla de doble entrada en tabla simple.
xi
Yi
fi xifi xi2fi yifi yi2fi xiyifi
0
18
16
16
16
10
20
15
45
30
12
48
12
32
16
120
41
97
76
font> font> 20 40
Ejemplo: Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas
2 3 4 4 5 6 6 7 7 8 10 10
Fsica
1 3 2 4 4 4 6
Hallar las rectas de regresin representarlas.
xi Yi xii xi2 yi2
2
16
16
16
16
20
25
16
24
36
16
36
36
36
28
49
16
42
49
36
56
64
49
10 9
90
100 81
10 10 100
100 100
3lculamos lasrianzas.
10
Xi
Yi
xi2
yi2
xi . yi
font> 1
15
25
225
75
font> 1
18
49
324
126
font> 1
10
100
20
font> 1
64
font> 1
20
81
400
180
24
71
160
1113
409
font>
3. Asigna los coeficientes de correlacin lineal r = 0,4, r = 0,85 y r = 0,7, a las nubes
del problema anterior.
[sol] a) Respectivamente: (c), (b), (a). b) Respectivamente: (a), (b), (c)
Tipo II. Clculo de la correlacin y regresin
4. [S] a) Calcula la recta de regresin de Y sobre X en la distribucin siguiente
realizando todos los clculos intermedios.
X 10 7 5 3 0
Y 2 4 6 8 10
b) Cul es el valor que correspondera segn dicha recta a X = 7?
[sol] a) y = 0,8276x +10,138; b) 4,3448.
5. [S] El nmero de bacterias por unidad de volumen, presentes en un cultivo
despus de un cierto nmero de horas, viene expresado en la siguiente tabla:
X: N de horas 0 1 2 3 4 5
Y:
N
de
12 19 23 34 56 62
bacterias
Calcula:
a) Las medias y desviaciones tpicas de las variables, nmero de horas y nmero
de bacterias.
b) La covarianza de la variable bidimensional.
c) El coeficiente de correlacin e interpretacin.
d) La recta de regresin de Y sobre X.
6. La tabla siguiente muestra las notas obtenidas por 8 alumnos en un examen, las
horas de estudio dedicadas a su preparacin y las horas que vieron la televisin los
das previos al examen.
Nota
5 6 7 3 5 8 4 9
Horas
estudio
de
10 9
10 5
14
Horas de TV 7 6 2 11 9 3 9 5
a) Representa grficamente los diagramas correspondientes a nota-estudio y notaTV.
b) Se observa correlacin entre las variables estudiadas? De qu tipo? En qu
caso estimas que es ms fuerte?
[sol] b) S. Directa; inversa.
7. Con los datos del problema anterior, halla el coeficiente de correlacin de notaestudio y nota-TV. Qu puede deducirse con ms precisin conociendo la nota
que obtuvo una persona en el examen: el tiempo que dedic al estudio o el que
dedic a ver la televisin?
[sol] 0,943382 y (0,846283. El tiempo que dedic al estudio.
8. Con los mismos datos, halla las rectas de regresin correspondientes y estima
para un alumno que sac un 2 en el examen:
a) Las horas que estudi.
b) Las horas que vio la TV.
[sol] a) Est = (0,246753 + 1,46753 ota; 2,7 h. b) TV = 14,1299 ( 1,2987 ota; 11,5
h.
Tipo III. Estimacin a partir del a recta de regresin
9. La altura, en cm, de 8 padres y del mayor de sus hijos varones, son:
Padre
170 173 178 167 171 169 184 175
Hijo
172 177 175 170 178 169 180 187
a) Calcula la recta de regresin que permita estimar la altura de los hijos
dependiendo de la del padre; y la del padre conociendo la del hijo.
b) Qu altura cabra esperar para un hijo si su padre mide 174? Y para un padre,
si su hijo mide 190 cm?
[sol] a) H = 68,1853 + 0,621859 ; P = 77,4406 + 0,545082 . b) 176,4 cm; 181
cm.
10. [S] Durante su primer ao de vida han pesado a Marta cada mes. En la tabla
siguiente se dan sus pesos:
x 1
2
3
4
5
6
7
8
9
10 11 12
y 3,2 3,7 4,2 5,3 5,7 6,5 6,8 7,2 7,9 7,7 8 8,5
En esta tabla, x representa la edad en meses e y el peso en kilogramos.
a) Calcula la media y la desviacin tpica de los pesos.
b) Determina la ecuacin de la recta de regresin de y sobre x, explicando
detalladamente los clculos que haces y las frmulas que utilizas.
[sol] a) 6,225; 1,7181 b) y = 0,48706x + 3,05909
11. [S] Utilizando la recta de regresin de x sobre y correspondiente a la distribucin
siguiente:
x = altura sobre el nivel del
0 184 231 481 911
mar
y = temperatura media en
20 18 17 12 10
C
Calcula la altitud de una ciudad en la que la temperatura media es de 15.
[sol] 392,7 m.
Conclusin:
Regresin y correlacin lineal son dos herramientas para investigar la dependencia
de una variable dependiente y en funcin de una variable independiente x. y = f(x)
y = variable dependiente que se desea explicar o predecir, tambin se llama
regresor o respuesta
x = variable independiente, tambin se llama variable explicativa, regresor o
predictor
Regresin lineal - la relacin entre x y y se representa por medio de una lnea recta
Regresin curvilnea - la relacin entre x y y se representa por medio de una curva.
Las tcnicas de regresin y correlacin cuantifican la asociacin estadstica entre
dos o ms variables. La regresin lineal simple expresa la relacin entre una
variable dependiente Y y una variable independiente X, en trminos de la pendiente
y la interseccin de la lnea que mejor se ajuste a las variables.
La correlacin simple expresa el grado o la cercana de la relacin entre las dos
variables en trminos de un coeficiente de correlacin que proporciona una medida
indirecta de la variabilidad de los puntos alrededor de la mejor lnea de ajuste- Ni la
regresin ni la correlacin dan pruebas de relaciones causa efecto.