Sunteți pe pagina 1din 22

Universidad Nacional Autnoma de Nicaragua - Len

Escuela de Ciencias Agrarias y Veterinarias


Depto. Acucola.
Estadstica.
UNIDAD II: Distribuciones de frecuencias bidimencionales.

Tema: Regresin lineal simple.

Lic. Noelia Erlinda Cea


Navas.
Estadstica

Contenido

Recta de Regresin Lineal Simple


Coeficiente de Correlacin
Coeficiente de Determinacin.

Dependencia funcional y dependencia


estadstica

Introduccin

Cuando se estudian conjuntamente dos


caractersticas o variables, es frecuente que
exista una relacin de dependencia entre ella
Esta dependencia tiene dos naturalezas:

- Dependencia funcional que es cuando


existe una relacin matemtica exacta entre
las dos variables

- Dependencia estadstica que se caracteriza


por una relacin aproximada entre los dos
fenmenos.

La variable que vamos a llamar dependiente


o endgena est influida por otra que acta
como independiente o exgena.
La casualidad o el azar ha hecho que ambas
variables
estn
relacionadas
estadsticamente (por ejemplo, el nmero de
accidentes de automvil y la produccin de
queso fresco), puede existir una relacin
causa-efecto (por ejemplo de que los niveles
de
consumo
estn
determinados
fundamentalmente por la renta disponible).

En los estudios estadsticos de los fenmenos


socioeconmicos slo nos deben preocupar las
relaciones de causa-efecto que son las que
tienen una base terica.

La Teora de la Regresin nos permite pasar


de la dependencia estadstica representada en
una nube de puntos a la dependencia
funcional dada por una lnea de regresin
(hablar del origen del nombre Regresin con
ejemplo de Dalton: la altura de los hijos
regresan a las alturas medias de los padres).

Diagrama
de
dispersin.

La forma de obtener la lnea de regresin es a


travs de los ajustes mnimo cuadrticos. Una
forma de detectar la posible relacin entre las
variables es grficamente;
Diagrama de dispersin

Se construye representando los pares de


valores observados en un eje cartesiano.
Proporciona una buena descripcin de la
relacin existente entre las variables.

Ejemplos de casos que pueden darse:


a) Hay ausencia de relacin (independencia).
b) Existe asociacin lineal positiva (varan en
general en el mismo sentido).
c) Existe asociacin lineal negativa (varan en
sentido contrario).
d) Existe fuerte asociacin, pero no lineal
(quizs curvilnea).

La regresin lineal simple nos permitir


pasar de la dependencia estadstica a la
funcional con las siguientes caracterstica:

Regresin
lineal
simple.

a) La funcin a estimar es lineal es decir una


recta.
b) Existe una sola variable explicativa o
exgena y por ello recibe el nombre de
simple.
c) En la exposicin vamos a referirnos a una
tabla de correlacin de frecuencia unitaria
del siguiente tipo:

d) Se empleara el ajuste mnimo cuadrtico


para estimar la ecuacin de la recta
= + . De modo que llamamos = + (
) a la recta de regresin mnimo cuadrtica
de y sobre x
El coeficiente de regresin lineal simple
b es la pendiente angular de la recta de
regresin, nos determina en cuanto varia la
variable dependiente o endgena cuando la
independiente o exgena varia en una
unidad.

Si la recta que sea ajusta es una funcin


de consumo en relacin con la renta, el
coeficiente b seria lo que se conoce en teora
econmica como la propensin marginal a
consumir. El significado del a, que es la
ordenada en el origen de la recta, a veces
puede tener sentido econmico y a veces no.

El coeficiente de correlacin se usa para


determinar el grado de dependencia lineal de
la variable endgena ante los valores de la
exgena. Se define como:

Algunas observaciones y propiedades:


Su signo viene determinado por el de la
Covarianza. Indicar si la asociacin es
positiva o negativa, y vale cero cuando la
Covarianza vale cero (ausencia de asociacin
lineal).

1 1 Valores prximos a -1 indican


fuerte asociacin lineal negativa, valores
prximos a 1 indican fuerte asociacin lineal
positiva, y valores prximos a 0 indican
ausencia de asociacin lineal. No se debe
interpretar el coeficiente sin haber visto
previamente el diagrama de dispersin (podra
por ejemplo haber algn dato atpico).
Un coeficiente de correlacin alto (en valor
absoluto) indica que las variables toman
valores relacionados entre s entre los
elementos observados, pero no permite concluir
la existencia de ninguna relacin de causalidad
entre
las
variables.

Por ejemplo, suponga que se estudian


conjuntamente las variables X= Nmero de
matrimonios mensuales (en una ciudad) y Y
="Temperatura del mes", obtenindose un
coeficiente de correlacin de 0.7.

Eso significa que, en efecto, suele haber


ms matrimonios a medida que mejoran las
temperaturas, pero esto no implica que un
aumento
de
matrimonios
aumente
la
temperatura del mes, ni que una ola de calor
cause un aumento de matrimonios.

Un coeficiente de correlacin de 0.88 puede


interpretarse como muy fuerte en otro
problema la relacin podra considerarse
dbil. Los trminos dbil, moderado y fuerte
no tienen significado preciso.

Coeficiente de
determinacin
2

Una medida que tiene un significado ms


exacto es el coeficiente de determinacin
denotado por ( 2 ) Se calcula al elevar al
cuadrado el coeficiente de correlacin para el
ejemplo de r=0.88 el 2 = 0.77 . Esta es una
proporcin o porcentaje puede decirse que 77%
de la variacin total en la variable dependiente
Y que se explica por, o se debe a la variacin en
la
variable
independiente
X.

El significado del coeficiente de determinacin


es que nos proporciona el porcentaje de
causas comunes que tiene las dos variables
relacionadas para explicar su variabilidad o
evolucin si se expresa en tantos por 100.
El campo de variacin del coeficiente de
determinacin es 0 2 1 cuando las causas
comunes a x e y llegan al 0.75 expresadas en
tantos por uno, o el 75% en tanto por cien, el
modelo ajustado suele aceptarse. Si el
porcentaje es inferior se llega a la conclusin
de que la relacin elegida no es buena.

Prediccin.

Uno de los objetivos que persigue la


regresin y correlacin es hacer predicciones de
la variable dependiente o endgena en funcin
de los que toma la independiente o exgeno.
Las predicciones se efectan utilizando la recta
estimada = + , obtenemos valores de
que son promedios de los observados, mediante
valores dados de Xi y la actuacin de los
coeficientes de regresin a y b estimados. La
prediccin ser ms fiable cuantos mayores
sean los coeficientes de determinacin o de
correlacin.

En 10 familias se han observado sus


ingresos (Xi) y sus gasto (Yi) anuales
expresados en millones de crdobas dando
lugar a las siguientes cantidades.

Ejemplo.

Xi: 2, 3, 4, 5, 6, 7, 8, 8, 9, 10
Yi: 2, 3, 3 4, 4, 5, 6, 5, 7, 9).
Obtener la recta de regresin del gasto en
funcin de los ingresos e interpretar los
valores estimados de los coeficientes de
regresin.

El significado de b igual a 0.45 es que cuando


los ingresos aumentan en una unidad el gasto
aumenta en 0.745 unidades. El significado del
trmino independiente es que cuando el
ingreso es cero existe un consumo autnomo de
179.000 crdobas aunque esta interpretacin
carece de sentido econmico ya que sin ingreso
no puede existir gasto si no existe un
endeudamiento paralelo.

Se puede decir que 90% de la variacin total en la


variable dependiente gasto (Yi) se explica por, o se debe a
la variacin en la variable independiente ingresos (Xi)
Utilizando la recta estimada = 0.179 +0.745xi
obtenemos valores de Yti que son promedios de los
observados, para valores dados de Xi como se presentan
en la tabla anterior. La prediccin es bastante fiable ya
que los valores de los coeficientes de determinacin o de
correlacin son altos.)

Se observa a menudo que mientras ms embarcaciones


participen en una pesquera menos captura habr por
embarcacin. Esto no es sorprendente cuando se
considera que el stock de peces es un recurso limitado
que tienen que compartir todas las embarcaciones. Los
datos que se presentan ms abajo, se derivan de la
pesquera del camarn en Pakistn.

Ejercicio.

Construir la recta de regresin. Interpretar los parmetros


obtenidos

S-ar putea să vă placă și