Documente Academic
Documente Profesional
Documente Cultură
Estadística bivariada
Estadística Bivariada
El análisis de regresión sirve para predecir una medida Y en función de otra medida X
(o varias).
Y = variable dependiente.
X = variable independiente, explicativa o predictora.
Diagrama de dispersión
Variable dependiente
Una representación gráfica útil para
describir el comportamiento conjunto de dos
variables es el diagrama de dispersión o
nube de puntos, donde cada caso aparece
representado como un punto en el plano
definido por las variables X e Y.
Esta representación gráfica permite Variable independiente
visualizar la relación entre dos variables o predictora.
cuantitativas.
Pero ojo, un diagrama o gráfico de dispersión aportará información solo en la medida que
conozcamos y seamos capaces de distinguir entre las distintas curvas de tales funciones.
Por esta razón, es importante conocer y distinguir las gráficas de algunas funciones recurrentes en
esta materia:
30 10
140 150 160 170 180 190 200 0
140 150 160 170 180 190 200
Relación directa o creciente Relación inversa o decreciente
330
280
Incorrelación
230
180
130
80
30
140 150 160 170 180 190 200
Incorrelación
Coeficiente de correlación lineal de
Covarianza
Pearson
S xy xy x y
Una medida estandarizada para poder
determinar la relación lineal se conoce como
coeficiente de correlación lineal. Desviación estándar de x
S S x2 x 2
xy
Rxy x
S *S
x y
Desviación estándar de x
S y2 y2
y
¿Para qué sirve el Rxy? El coeficiente de correlación lineal entre dos
variables (Rxy) indica si los puntos tienen una
El coeficiente de correlación lineal de Pearson tendencia lineal (excluyendo rectas horizontales y
verticales), pero no servirá para otro tipo de
de dos variables, Rxy es útil para determinar si
relaciones, como, por ejemplo, exponencial o
hay relación lineal entre dos variables, pero no logarítmica. Por lo que:
servirá para otro tipo de relaciones
(cuadrática, logarítmica u otra).
• Si Rxy ≈ 1; la relación entre la variable X e Y es
lineal con pendiente positiva.
-1 0 1
Entrenando el ojo: correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
80 50
r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
110 100
100 90
90 80
80
70
70
60
60
50 50
40 r=0,6 40 r=0,8
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Entrenando el ojo: correlaciones casi perfectas y
positivas
100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,9 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200
100
90
80
70
60
50
40 r=1
30
140 150 160 170 180 190 200
Entrenando el ojo: correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200
Coeficiente de correlación lineal Ejemplo 2: En este caso, Rxy ≈ -1.
Y La nube de puntos puede
de Pearson en Excel aproximarse por una recta
1° Fórmula en Excel del coeficiente de correlación decreciente. Por ejemplo, el
peso de una carga (X) y el
lineal:
rendimiento de combustible
=COEF.DE.CORREL(matriz1; matriz2) (Y) de un camión, ya que un
X camión con mayor carga
tiene menor rendimiento de
2° Ejemplos de representaciones gráficas del Rxy.
combustible.
Ejemplo 1: Ejemplo 3:
En este caso, Rxy ≈ 1. Y
Y
En este caso, Rxy ≈ 0.
La nube de puntos puede
aproximarse por una recta La nube de puntos
creciente. Por ejemplo, la indica que no hay
altura (X) y el peso (Y) de los correlación lineal.
alumnos, ya que los alumnos
X más altos suelen pesar más.
X
Ejercicio:
Rendimiento
Peso de la carga
combustible
7,9 5,3 El dueño de una flota de camiones desea estudiar si hay
0,2 9 relación lineal entre el peso de la carga y el rendimiento
6,5 6,6 del combustible, para ello consideró una muestra de 20
2,5 7,7 viajes, de los cuales se registró el peso de la carga (en
8,8 4,9 toneladas) y el rendimiento del combustible (en km/litro).
4,5 6,6
12 4,2
5 6,8
11,9 3,4
Utilizando la información, realiza lo siguiente:
0,5 8,7
2,8 7,9
3,7 6,9
8,3 4,1
4,4 5,9
3,8 7,7
9,4 4
3,6 7,5
11,6 2,3
10,9 3,5
11 3,6
1) Determina la variable dependiente e
independiente, y construye un gráfico de
dispersión que relacione las variables peso de la Relación entre el peso de la carga y el
carga y rendimiento del combustible. rendimiento del combustible
10
9
Rendim iento, en km /l
8
Respuesta: 7
6
5
4
Y = rendimiento del combustible, en km/l (variable 3
dependiente). 2
1
0
X = peso de la carga, en tn (variable independiente). 0 2 4 6 8 10 12 14
Respuesta:
yˆ m x n S xy
Pendiente m
Donde m y n son los parámetros del modelo lineal. Sx 2
n = coeficiente de posición.
m = pendiente.
Coef .dePosición n y m x
Ŷ = variable dependiente.
X = variable independiente, explicativa o predictora.
Ejemplo:
Considerando el ejercicio anterior, cuyas variables eran el peso de la carga (en toneladas) y el
rendimiento del combustible (en km/litro) de una muestra de 20 viajes.
Rendimiento, en km/l
7 y = -0,494x + 9,0236
Modelo de regresión 6
y = -0,494x + 9,0236
lineal 5
4
3
2
1
0
0 2 4 6 8 10 12 14
Peso carga, en toneladas
2) Interpreta la pendiente del modelo de regresión lineal.
Respuesta:
Fórmula Valor Interpretación
Por cada tonelada que aumenta el peso de la
Pendiente =PENDIENTE(conocido_y; conocido_x) -0,494 carga, el rendimiento del combustible
disminuye en 0,494 km/l.
d) 83 horas.
Modelo de regresión exponencial
simple
Al tratar de explicar (o predecir) la variable dependiente (Y) a través de una variable independiente (X),
puede ocurrir que la relación no sea lineal. La regresión exponencial se utiliza cuando podemos asumir
que la relación entre ambas variables es del tipo:
b x
yˆ a e Ŷ = variable dependiente.
X = variable independiente, explicativa o predictora.
18
16 Modelo Lineal
14 y = -0,9705x + 11,527
R² = 0,8277
12
10
Modelo Exponencial
8 y = 15,704e-0,251x
R² = 0,9328
6
0
0 2 4 6 8 10 12 14
Años de experiencia
Respuesta:
Respuesta:
Utilizando el modelo de regresión lineal para estimar el Utilizando el modelo de regresión lineal se despeja la
valor de la variable dependiente: variable independiente:
X= 8 X= 9,3
Y = 3,8 Y = 2,5
Respuesta: Respuesta:
Se estima que el 3,8% de artículos son Se estima que el operario tiene 9,3 años de experiencia.
defectuosos.
6) Determina el modelo que mejor se ajusta a los datos. Justifica tu respuesta.
Respuesta:
Respuesta: Respuesta:
Se estima que el 1,3% de artículos son Se estima que el operario tiene 5,4 años de experiencia.
defectuosos.
(9) ¡Felicidades, has finalizado la revisión del material!
Es momento de explorar el aula y poner en práctica todos los consejos revisados.