Sunteți pe pagina 1din 6
UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.1/6

UNIDAD 4: CORRELACIÓN Y REGRESIÓN OTROS MODELOS DE REGRESIÓN

2. MODELO LOGARÍTMICO

OTROS MODELOS DE REGRESIÓN 2. MODELO LOGARÍTMICO Es un modelo de regresión, que se emplea cuando

Es un modelo de regresión, que se emplea cuando la dependencia entre las variables (variable dependiente) y (variable independiente) es de forma logarítmica, en cuyo caso se ajusta a la nube de puntos del diagrama de dispersión una función del tipo:

= + ln()

Donde y son los parámetros o coeficientes del modelo de regresión logarítmico y ln es la función logaritmo natural.

Ejemplo: Se quiere identificar la relación que puede existir entre el tiempo de duración en horas de las pruebas de estado y el nivel de agotamiento en la prueba (0: Sin agotamiento y 10: Agotamiento extremo), para esto se tomó una muestra aleatoria de los evaluados donde se observaron los siguientes resultados:

Tiempo

0.5

0.9

1.2

1.7

2.2

2.7

3.2

3.6

3.9

Agotamiento

1.9

3.4

4.4

5.2

5.7

5.4

6.1

7.2

6.8

Regresión lineal

8.0 7.0 6.0 5.0 4.0 y = 1.2807x + 2.2904 R² = 0.8745 3.0 2.0
8.0
7.0
6.0
5.0
4.0
y = 1.2807x + 2.2904
R² = 0.8745
3.0
2.0
1.0
0.0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
Tiempo de duración
Nivel de agotamiento

Regresión logarítmica

8.0 7.0 6.0 5.0 4.0 y = 2.3444ln(x) + 3.6892 R² = 0.9574 3.0 2.0
8.0
7.0
6.0
5.0
4.0
y = 2.3444ln(x) + 3.6892
R² = 0.9574
3.0
2.0
1.0
0.0
0.0
0.5
1.0
1.5
2.0
2.5
3.0
3.5
4.0
Tiempo de duración
Nivel de agotamiento

Figura 1: Diagramas de dispersión entre las variables nivel de agotamiento () y tiempo de duración (), con dos modelos diferentes ajustados.

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.2/6

En la figura 1 se observa que el modelo de regresión logarítmico presenta un mejor ajuste para este conjunto de datos puesto que el valor del coeficiente de determinación 2 es mayor. Las estimaciones de los coeficientes son las siguientes:

 

Regresión lineal

Regresión logarítmica

2.2904

3.6892

1.2807

2.3444

A partir de estos resultados se pueden obtener predicciones, por ejemplo: ¿Cuánto sería el nivel de agotamiento si el tiempo de duración de la prueba es de 2 horas?

Con el modelo de regresión lineal se tiene que: = 2.2904 + 1.2807 Por lo tanto, si = 2, entonces: = 2.2904 + 1.2807 ∗ (2) = 4.8518 Es decir, aproximadamente 4.9.

Con el modelo de regresión logarítmico se tiene que: = 3.6892 + 2.3444ln() Por lo tanto, si = 2, entonces: = 3.6892 + 2.3444 ∗ ln() = 5.3142 Es decir, aproximadamente 5.3. Como se puede apreciar la información obtenida por el modelo logarítmico parece más confiable de acuerdo con lo observado en los gráficos de la figura 1.

2.1. ¿CÓMO OBTENER EL MODELO DE REGRESIÓN LOGARÍTMICO?

Las fórmulas para encontrar las estimaciones de los coeficientes y el procedimiento empleado pueden resultar complejos para realizarlos manualmente, por tal motivo es recomendable apoyarse en las herramientas computacionales como Excel para hacer esta labor. Los pasos empleados se explicarán por medio del siguiente ejemplo.

Ejemplo: Se realizo un estudio cuyo objetivo fue evaluar el consumo de oxígeno (en mg.kg.hr) de cachama blanca (Piaractus brachypomus) durante diferentes etapas de desarrollo (peso corporal en gramos), los datos obtenidos a partir de una muestra aleatoria son los siguientes:

Peso corporal

10

50

100

200

300

500

Consumo de oxigeno

578

380

294

271

192

191

Se requiere calcular el modelo de regresión logarítmico del consumo de oxígeno a partir del peso corporal. Y utilizar ese modelo para predecir el consumo de oxigeno si el peso corporal de la cachama blanca es de 400 gramos.

Lo primero es ingresar los datos en un archivo de Excel, en una primera columna se ingresa la información de la variable (Peso) y en una segunda columna la información de la variable (Oxígeno), para luego hacer un diagrama de dispersión.

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.3/6

DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I Pág.3/6 En el gráfico obtenido el eje horizontal corresponde a
DE ESTADÍSTICA – ESTADÍSTICA BÁSICA I Pág.3/6 En el gráfico obtenido el eje horizontal corresponde a

En el gráfico obtenido el eje horizontal corresponde a los valores de la variable y el eje vertical corresponde a los valores de la variable . Para garantizar que los valores de la variable queden en el eje horizontal y los valores de la variable queden en el eje vertical, se deben ingresar en Excel los datos de la variable siempre en una columna antes a la columna donde se ingresan los datos de la variable .

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.4/6

Se da clic derecho en cualquiera de los puntos del gráfico y se da un clic en la ventana emergente en la opción: Agregar línea de tendencia…

emergente en la opción: Agregar línea de tendencia… Inmediatamente el Excel traza la línea de regresión

Inmediatamente el Excel traza la línea de regresión (línea punteada) y muestra una información importante en una ventana al lado derecho de la pantalla.

de regresión (línea punteada) y muestra una información importante en una ventana al lado derecho de
UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.5/6

Se seleccionan algunas de las opciones de la ventana del lado derecho, por ejemplo: Logarítmica, la cual genera el modelo de regresión logarítmico en lugar del modelo de regresión lineal, Presentar ecuación en el gráfico, la cual muestra la ecuación del modelo de regresión. Otra opción es: Presentar el valor R cuadrado en el gráfico, la cual muestra el valor del coeficiente de determinación. Para esto se da un clic en las casillas en blanco al lado izquierdo de cada una de las opciones.

en blanco al lado izquierdo de cada una de las opciones. Si la ecuación se sobrepone

Si la ecuación se sobrepone a los puntos en el gráfico esta se puede seleccionar y desplazarla a otro lugar dentro del gráfico, además se puede aumentar el tamaño de la letra para apreciarla mejor.

Como se puede apreciar en la ventana del lado derecho de la figura anterior, en las opciones de línea de tendencia se pueden elegir diferentes modelos de regresión, un criterio de selección de modelos seria elegir aquel que tenga el mayor valor de , pues esto indicaría que se ajusta mejor a ese conjunto de datos.

Finalmente, para predecir el consumo de oxigeno si el peso corporal de la cachama blanca es de 400 gramos, se reemplaza este valor en la variable , de la ecuación obtenida en la figura anterior:

El modelo de regresión logarítmico es: = 791.3 − 101.4ln() Por lo tanto, si = 400, entonces: = 791.3 − 101.4 ∗ ln() = 183.7655 Es decir, aproximadamente 184.

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA

UNIVERSIDAD SANTIAGO DE CALI FACULTAD DE CIENCIAS BÁSICAS DEPARTAMENTO DE CIENCIAS NATURALES, EXACTAS Y ESTADÍSTICA ÁREA DE ESTADÍSTICA ESTADÍSTICA BÁSICA I

Pág.6/6

A continuación, se presenta el anterior cálculo por medio de Excel.

se presenta el anterior cálculo por medio de Excel. La función logaritmo natural se obtiene en

La función logaritmo natural se obtiene en Excel por medio de la formula =ln(número), donde número es el valor al cual se va a calcular su logaritmo natural.

Excel por medio de la formula =ln( número ) , donde número es el valor al