Sunteți pe pagina 1din 13

SECCIN I

CENTRO DE INVESTIGACIONES DE INGENIERA


FACULTAD DE INGENIERA
ESCUELA DE CIENCIAS
CURSO: TCNICAS DE INVESTIGACIN
CAT: Inga. Pamela Vega

EJERCICIOS DE REGRESIN LINEAL Y CONCEPTOS


FRMULAS:
En el orden que aparecen las ecuaciones, as debe aplicarlas, esto es
para facilitar el procedimiento que debe seguir en el clculo del
coeficiente de Pearson y la recta de regresin
MEDIA
VARIANZA de
X
VARIANZA de
Y
DESVIACIN
ESTNDAR
de X y de Y
COVARIANZA
COEFICIENTE
DE PEARSON
o
de
correlacin
Recta
de
regresin de
X sobre Y
Recta
de
regresin de
Y sobre X

2
i

(y

2
i

2
x

2
y

= , =
xy

(x y ) x * y
i

xy
x y

xx

xy
y y
y2

yy

xy
x x
x2

ES FUNDAMENTAL LA INTERPRETACIN DE SUS RESULTADOS

COVARIANZA

COVARIANZA

Coeficiente de
Pearson o de
correlacin

Coeficiente de
Pearson o de
correlacin

Coeficiente de
Pearson o de
correlacin

La relacin entre
variables
es
Si el valor es positivo DIRECTA.
En
la
grfica
pendiente
positiva.
La relacin entre
variables
es
INDIRECTA
O
Si el valor es negativo
INVERSA.
En
la
grfica
pendiente
negativa.
Existe una relacin
DIRECTA ENTRE LAS
r>0
VARIABLES. Si es
fuerte o dbil ver
diagrama.
NO EXISTE RELACIN
ENTRE
LAS
VARIABLES,
pero
r=0
puede
haber
relaciones de algn
otro tipo, donde se
requieren
otros
anlisis estadsticos
Existe una relacin
INDIRECTA
O
r<0
INVERSA ENTRE LAS
VARIABLES. Si es
fuerte o dbil ver
diagrama.

Ejemplo de INTERPRETACIN 01:


Considere la siguiente grfica:

X
Para evaluar el GRADO DE DEPENDENCIA DE DOS VARIABLES se hace
uso del COEFICIENTE DE PEARSON. En la grfica se trata de relacionar el
PESO con la INTELIGENCIA.
Se quiere saber si el peso influye en la inteligencia.
CUL ES LA VAR. INDEPENDIENTE Y CUAL LA DEPENDIENTE?
VAR INDEPENDIENTE = PESO
VAR DEPENDIENTE = INTELIGENCIA
Si un sujeto pesa ms se esperara que fuera ms inteligente, que sera
una relacin directa, o bien, que si pesa menos, se esperara que fuera
ms inteligente, lo que sera una relacin indirecta.
PERO, OBSERVE LA GRFICA, LA DISPERSIN DE LOS PUNTOS NO
FORMAN UNA LNEA RECTA, POR LO MENOS LOS PUNTOS NO SE
ACERCAN A FORMAR UNA LINEA RECTA CON PENDIENTE POSITIVA O
NEGATIVA, por lo tanto se concluye que NO HAY RELACIN ENTRE
LAS DOS VARIBLES, NO HAY RELACIN ENTRE EL PESO Y LA
INTELIGENCIA.

QUE UNA PERSONA SEA MS O MENOS GORDA, MS O MENOS FLACA,


NO SIGNIFICA QUE SEA MS O MENOS INTELIGENTE
Ejemplo de INTERPRETACIN 02:
En una investigacin se trata de establecer si existe relacin entre el
consumo de lea y el grado de deforestacin en dos regiones de
Guatemala.
La primera regin a evaluar es el departamento de Petn, donde los
primeros anlisis de los datos arrojaron un coeficiente de Pearson
r = 0.23, qu puede decir de este resultado?
En primer lugar identificar las variables:
VAR INDEP = CONSUMO DE LEA
VAR DEPEN = GRADO DE DEFORESTACIN
Un coeficiente de correlacin de 0.23 indica que existe una RELACIN
DIRECTA PERO DBIL ENTRE EL CONSUMO DE LEA Y EL GRADO DE
DEFORESTACIN que se da en el Depto. de Petn. Es decir, la gente del
lugar hace uso de la lea para suplir sus necesidades energticas, pero su
uso no incide, en la deforestacin que se sufre en Petn. Con ese valor NO
SE PUEDE AFIRMAR QUE SEA LA GENTE QUE CONSUME LEA LA QUE
HA DEFORESTADO PETN. Entonces se deben considerar otros factores,
quiz la tala ilegal por ejemplo.
La segunda regin es Cobn, donde el coeficiente de Pearson resulto ser
r = 0.87 qu se puede decir de este otro valor, si se siguen evaluando las
misma variables?
En Cobn la situacin se muestra diferente, existe una RELACIN
DIRECTA Y FUERTE ENTRE EL CONSUMO DE LEA Y LA
DEFORESTACIN, por lo tanto, s es muy probable que la gente de Cobn
que utiliza la lea para suplir sus necesidades energticas sea en parte
responsable de la deforestacin de Cobn. Si bien se pueden considerar
otros factores, en este caso el CONSUMO DE LEA si afecta directamente
en la DEFORESTACIN DE COBN.

Note que el estudio de las mismas variables en diferentes lugares


arrojaron valores distintos, en otros lugares es posible que no exista
relacin alguna.
Ejemplo de CLCULO E INTERPRETACIN 03:
Se obtuvieron datos sobre RENDIEMIENTO ACADMICO e INTELIGENCIA
de 10 estudiantes de nivel de diversificado de un instituto de la zona 18
de la Ciudad Capital, que se muestran en la siguiente tabla:
INTELIGENCIA
105
116
103
124
137
126
112
129
118
105

RENDIMIENTO
4
8
2
7
9
9
3
10
7
6

a) Identifique quin es la variable dependiente y cul la independiente


b) cul es el tipo de relacin entre estas variables?
c) cul podra ser el rendimiento de un estudiante si su nivel de

inteligencia es de 140? puede calcularse? SI / NO y por qu

SOLUCIN:
a) Identificar variables
El rendimiento depende de la inteligencia
VAR INDEPENDIENTE: INTELIGENCIA
VAR DEPENDIENTE: RENDIMIENTO
Recuerde la ecuacin: y = mx + b
Rendimiento = m ( inteligencia ) + b segn los niveles de inteligencia de
los estudiantes as ser su rendimiento. Se quiere saber si en realidad se da
alguna relacin entre estas dos variables.

b) Cul es el tipo de relacin entre las variables?


Se pide que se encuentre si el rendimiento realmente depende de la
inteligencia, para saber esto qu se necesita?, se necesita calcular el
coeficiente de Pearson, y cmo se calcula?
PASO 1: hacer una tabla con los valores de las variables y TRES
COLUMNAS MS.

No.

INTELIGENCIA RENDIMIENTO
Y
X

105

116

103

124

137

126

112

129

118

10

105

4
8
2
7
9
9
3
10
7
6

1175

65

sumatoria

X2

Y2

XY

11025

16

420

13456

64

928

10609

206

15376

49

868

18769

81

1233

15876

81

1134

12544

336

16641

100

1290

13924

49

826

11025

36

630

139245

489

7871

Usted debe calcular:


X al cuadrado
Y al cuadrado
X por Y
LUEGO SUME CADA COLUMNA
Tambin sume la columna X y la columna Y
PASO 2: CALCULAR MEDIAS ARITMTICAS PARA LAS DOS VARIABLES
Media de X: se usa la frmula
=

Sustituyendo valores:

1175
=
= 117.5

10

Media de Y: se usa la misma frmula pero con lo valores de la columna de


la variable Y
=

65
=
= 6.5

10

PASO 3: calcular las VARIANZAS DE LAS DOS VARIABLES


Varianza de X
Usando la frmula

2
x

2
i

Sustituyendo valores:
2
2 =

2
2

139245
117.52
10

2 = 13924.5 13806.25
2 = 118.25
Note que la varianza debe salir positiva, PORQUE SI SALE NEGATIVA NO
PODRA CALCULAR LA DESVIACIN ESTNDAR. (raz de un nmero
negativo)
NO OLVIDE ELEVAR AL CUADRADO LA MEDIA, DE LO CONTRARIO NO
OBTENDRA DATOS CORRECTOS.

Varianza de Y, con la misma frmula pero para la columna de Y

2
2

2 =

489
6.52
10

2 = 48.9 42.25
2 = 6.65
PASO 4: ya tiene la varianza ahora sacando la raz a las mismas obtiene la
DESVIACIN ESTANDAR PARA CADA VARIABLE
DESVIACIN ESTNDAR para X:
=

2 = 118.25

= 10.8743
DESVIACIN ESTNDAR para Y:
=

2 = 6.65

= 2.5788
Recuerde que se quiere encontrar la relacin entre el rendimiento y la
inteligencia, por lo que falta realizar algunos clculos ms

PASO 5: Calcular COVARIANZA


Se usa la frmula:
xy

(x y ) x * y
i

Sustituyendo valores
=
=

7871
117.5 6.5
10

= 787.1 763.75
= 23.35
TABLA RESUMEN DE DATOS OBTENIDOS
MEDIA DE X
117.5
MEDIA DE Y
6.5
VARIANZA DE X
118.25
VARIANZA DE Y
6.65
DESVIACIN ESTNDAR DE X
10.8743
DESVIACIN ESTNDAR DE Y
2.5788
COVARIANZA
23.35
LA COVARIANZA ES POSITIVA por lo tanto la CORRELACIN ES DIRECTA
o POSITIVA pero no se sabe si es fuerte, dbil o nula. Para eso se tiene que
calcular ahora el COEFICIENTE DE PEARSON
PASO 6: calculo de coeficiente de PEARSON O DE CORRELACIN
Con la frmula
r

xy
x y

Sustituyendo los valores de la covarianza y las desviaciones estndar


de x y de y
=

23.35
10.8743 2.5788
= 0.8323

SI LA COVARIANZA ES POSITIVA EL COEFICIENTE SER POSITIVO


Del diagrama

r = 0.83
la relacin entre el RENDIMIENTO y la INTELIGENCIA es una relacin
DIRECTA
POSITIVA y
FUERTE
YA QUE EL COEFICIENTE TIENE UN VALOR DE 0.83,
Esta es la respuesta al inciso b) donde se le pide que encuentre la
relacin entre las mismas.

Calcule ahora cul sera el rendimiento de un estudiante si tiene un


valor de inteligencia (CI) de 140?
Recuerde la ecuacin: y = mx + b
Rendimiento = m (inteligencia) + b
Ahora, se tiene que encontrar una ecuacin para sustituir el valor de
inteligencia de 140
Y = rendimiento, es lo que se quiere calcular, NO SE CONOCE
X = inteligencia, este valor SE CONOCE es 140
Empleando la frmula:
yy

xy
x x
x2

Sustituyendo valores
qu valores necesita para sustituir en la frmula?
COVARIANZA
VARIANZA DE X
MEDIA DE Y
MEDIA DE X
=
. =

MULTIPLICANDO

.
.
.

. = . .
. = . .

SIMPLIFICANDO

= . .

ESTA YA ES LA ECUACIN,
Cuando se le pide encontrar la ecuacin de la recta de Y sobre X as es
como debe dejar la respuesta
AHORA
Cuando le piden hacer un clculo sustituye el valor que le piden como:
x = 140
el rendimiento entonces ser
= . .
= . .
= .
ADVERTENCIA!! SI LA RESPUESTA LA DEJA SLO CON 10.95 NO
SIGNIFICA NADA, DEBE SABER QU SIGNIFICA
Para un estudiante con 140 de CI se espera que tenga un rendimiento
de 10.95, aprox 11 puntos.

S-ar putea să vă placă și