Sunteți pe pagina 1din 21

r

L e e e

o n

5.2 Regresin
Las tcnicas de regresin es un proceso que permite hacer predicciones sobre los
valores de cierta variable Y (dependiente), a partir de los de otra X (independiente),
entre las que se intuye que existe una relacin.
Para ilustrar mejor al lector por ejemplo si se compara la estatura media en centmetros
en el eje X y la estatura media en metros en el eje Y al observar a un grupo de personas, no
es necesario hacer grandes esfuerzos para saber que la relacin que hay entre ambas es:
y = X / 100
En cambio esta relacin sencilla puede ser ms compleja, si por ejemplo se comparan
estas mismas personas colocando en el eje X a la estatura media en centmetros y en
el eje Y el peso en kilogramos. Esta relacin requiere de un anlisis y solo despus del
mismo se puede concluir:
y = X - 110 error
La razn es que no es cierto que conocida la altura de un individuo, no puede determinar su peso exacto, si dos personas que miden 170 cm pueden tener pesos de 60 y
65 kilos. Sin embargo, alguna relacin entre ellas debe existir, pues parece mucho ms

1203111

ESTADSTICA

11

probable que un individuo de 200 cm pese ms que otro que mida 120 cm. Es ms, de
acuerdo a lo mencionado, la conclusin Y = X - 110 error, parece acertada.
A la relacin entre dos o ms variable a partir de una serie de datos, se le denomina
Regresin.
Cuando la relacin esta dada por:

Y = f(x)

Se le denomina Relacin Funcional y el criterio para construir Y, es que la diferencia


entre Y e Y sea pequea; es decir, que el error de estimacin sea pequeo.
y = f(x),

y-y

= error

La Relacin Funcional puede tambin ser a la inversa, es decir que X estn en funcin
de Y; pero este tipo de relacin no se ver en este Manual Auto Instructivo.
Cuando se utilizan solamente dos variables, la Regresin es denominada SIMPLE; en
cambio, cuando se utilizan ms de dos variables, la Regresin es MULTIPLE.

5.2.1 Ajuste en una funcin de regresin simple


Significa buscar o definir la funcin que exprese con mayor precisin la relacin entre
variables. Grficamente ser aquella funcin que mejor se adecu a la nube de puntos. En
este sentido, es recomendable como primer paso construir el "diagrama o nube de puntos",
luego analizar su forma y decidir el tipo de funcin matemtica para la lnea de regresin.
Analticamente, la relacin Y = f(x). permite obtener valores estimados Y a partir de
los valores reales de X, entonces el problema del ajuste de una funcin es que la diferencia o sesgo (e.) entre los valores reales de Y y los estimados Y sea mnimo, para cada
valor se tendra: ~ = Y-Y. Entonces se trata de un problema de minimizacin, el mismo
que se resuelve con el Mtodo de los Mnimos Cuadrados.
El ajuste de funciones de regresin simple, se pueden utilizar diversas funciones
matemticas conocidas, tales como:

La Lnea Recta
La Parbola
La Curva Potencial
La Curva Exponencial
La Hiprbola Equiltera :
La Curva Logstica
La Curva Gompertz

Y= a + bX
Y= a + bX + CX2
Y = exY= abX
Y = a/X
l/y = a + bcx
Y = ab=

Cada una de estas funciones tiene una forma particular para un conjunto determinado
de valores (X, Y), Y definido por el valor de los parmetros o coeficientes de la respectiva ecuacin. Por una nube de puntos pueden pesar una infinidad de lneas o funciones,
de esta familia habr una que es la funcin que mejor se ajusta a la nube de puntos.
12041

W A L TE R

e sPE D ES

RA M R E Z

La operacin para determinar la funcin de regresin ptima, se conoce como "Ajuste de una funcin de regresin", En este Manual se tratar solamente de Regresin
simple para la recta y para la parbola, que son las ms usadas por tener mayor aplicacin estadstica en los negocios,
El problema de ajuste de una funcin de regresin a un conjunto de n valores (X, Y),
comprende tres pasos:
1 Graficar el diagrama de esparcimiento o una nube de puntos (X, Y).
2 Definir la forma de la funcin de regresin (recta, parbola, exporiencial, etc.).
3 Determinar el valor numrico de los parmetros de la funcin elegida. Los
parmetros de la funcin de regresin se obtienen a partir de las Ecuaciones Normales
obtenidas por el Mtodo de los Mnimos Cuadrados.

5.2.2 El mtodo de Los mnimos cuadrados


Establece que la mejor recta o curva posible es aquella que minimiza la suma de los
cuadra~os de las desviaciones entre los puntos dados V y los correspondientes a dicha
curva Y.

e2

= I (V -\IV

Error Mnimo

Donde Y = f(X), es la ecuacin elegida para la funcin de regresin; sin embargo, no


es suficiente con elegir la funcin de regresin, por que en la nube de datos se pueden
trazar en diferentes formas la misma funcin con el mismo error de clculo. Por esta
razn se busca a aquel trazo de la funcin que al ser elevado el error al cuadrado, d el
mnimo error.
Con el mtodo de Mnimos cuadrados se logra calcular los parmetros de la ecuacin
elegida (Recta, Parbola, etc.). Tambin con los mismos parmetros, se pueden hallar
los coeficientes de correlacin respectivos.

5.2.3 Regresin lineal simple


A la regresin lineal se le conoce como Regresin de la Recta, la que se define de la
siguiente manera:

v =a +b

(X) e

A partir de esta definicin; se puede estimar el valor de "Y", no considerando el


error:

= a + b (X)
a20S.

ESTADSTICA

En la ecuacin, los parmetros


a

Origen (Es el valor de

Y,

11

son:
cuando X

O)

b = Pendiente (Es la variacin constante positiva o negativa de


que cambie X)

Y,

por cada valor

Tales parmetros, como ya se ha mencionado en el tem anterior, se calcularn utilizando el mtodo por Mnimos Cuadrados, que se define basado en la ecuacin de la
recta, de la siguiente manera:
I Y

= a (n) + b IX

IXY

a IX + b IX2

Para hallar los parmetros respectivos (a y b), basados en el mtodo de clculo por
Mnimos Cuadrados, el alumno puede utilizar cualquiera de las siguientes soluciones:
a) Solucin por eliminacin de uno de los parmetros para encontrar el otro:
Para este caso utilizan las ecuaciones simultaneas, en donde con un valor artificial
negativo se iguala el coeficiente de una de las incgnitas de la ecuacin para eliminarlo.
Operacin que se repite hasta quedarse con una incgnita, que es fcil de despejar en
una ecuacin.
b) Solucin a travs de matrices y determinantes,

L: y;x2

- L:XYL:X_

nL:X -L:XL:X

b =

que concluyen en:

nL:XY - L:XL:Y
nL:X 2 - L:XL:X

e) Solucin a travs de las medias, que concluye en:

= y -

b X

b = [ (:XY -

12061

n X Y ) / (X

n X 2) ]

WAL TER

CSPED

ES RAM REZ

Ejercicios resueltos
1) Hallar la ecuacin de la recta con las variables: X (nmero de vendedores)
(valor de ventas realizadas al mes en miles).

e Y

La informacin que se tiene es la siguiente:


Nmero de vendedores (X)

[1

Ventas en miles (Y)

10

12

15

16

6,4

8,5

9,3

16,4

18,6

20,2

25,2

Solucin:
Con el mtodo por Mnimos cuadrados, se primero
correspondientes a la ecuacin de la recta:
X

11:

XV

se calculan las sumatorias


X2

6,4

12,8

8,5

34,0

16

9,3

46,S

25

10

16,4

164,0

100

12

18,6

223,2

144

15

20,2

303,0

225

16

25,2

64

104,6

403,2

256

1186,7

770

Con estos datos para hallar los parmetros "a" y "b", el alumno puede escoger
cualquiera de las soluciones planteadas por el mtodo por Mnimos Cuadrados:
a) Solucin por eliminacin:
1o Se reemplazan las sumatorias halladas en las ecuaciones simultneas definidas
por el mtodo Mnimos Cuadrados:
1: V

a(n)

+ b 1:X

1:XV = a 1:X + b 1:X2

7a

+ 64b

(1)

64a

+ 770b

(2)

104,6 =
1186

20 Se elimina "a" multiplicando la ecuacin (1) por - 64 Y la ecuacin (2) por 7


( 104,6
(1186,7

=
=

Entonces:

+ 64b) - 64
7
64a + 770b)
7a

1612,S / 1294

- 6694,4

(3)

8306,9

= ~-4096b
= .448 +

5390b

1612,S

1294b

1,25

12071

(4)

ESTADSTICA

11

3 Hallado "b" se reemplaza este valor en la ecuacin (1):


104,6 = 7a + 64 (1,25)
Entonces:
a = 24,6 /7

104,6
3,5

4 La ecuacin de la recta ser:

7a

+ 80

104,6

80 = 7a

3,5 + 1,25X

b) Solucin por determinantes:


Aqu se reemplazan las sumatorias en las frmulas siguientes halladas formando matrices con las ecuaciones por mnimos cuadrados y resueltas por determinantes:
104,6(770) -1186,7(64)

:TI:X2_~

= n2:Xl' - 2:X2:Y

n2:X -2:XLX

n2:X

2 -

4593,2

7(770) - 64(64)

b = 7(1186,7)-64(104,6)

__1612,5
1294,0

7(770)-64(64)

2:XLX

Y =

La ecuacin de la recta ser:

3,5

1294,0

3,5

= 1,25

+ 1,25X

e) Solucin por promedios:

x =
b
b

LX / n

= [ (LXY
=

[(1186,7

b = [(1186,7
a

= y - bX

64/7

9,14

n X Y ) / (LX2 -

LY / n = 104,6/

n X 2) ]

- (7 x 9,14 x 14(94))

/ (770

- (7 x 9(142))]

- 955(86) / (770 - 584(78)]

14,94

La ecuacin de la recta ser:

7 = 14,94

1,25(9,14)

3,5

b = [230,84/
14,94

- 11,43

185,22]

1,25

3,5

+ 1,25X

El alumno puede ver que por cualquiera de los mtodos de solucin expuestos, la
respuesta es la misma; pues puede escoger el mtodo que sea ms fcil para usted o
el que ms le agrade.
2) Hallar la ecuacin de la recta con las variables: X (nmero de gastos por inversin)
e y (utilidades anuales en miles).
La informacin

que se tiene es la siguiente:

Nmero de gastos por inversin (X)


Utilidades anuales en miles (Y)

111208&

11

31

40

30

34

25

20

WALTER

CSPEDES

RAMREZ

Solucin:
Con el mtodo por Mnimos cuadrados,
correspondientes a la ecuacin de la recta:

I~

se primero

XV

se calculan

las sumatorias

X2

31

155

25

11

40

440

121

30

120

16

34

170

25

25

75

20

40

30

180

1000

200

Para hallar los parmetros "a" y "b", se ha escogido la solucin por determinantes.

a = L:YL:X2

a =180(200)-1000(30)

-~

nL:X -L:XLX"
b

6(200) - 30(30)

nL:XY - L:XL Y
n:L:X 2

b = 6(1000)-30(180)
6(200) - 30(30)

L:XLX

La ecuacin de la recta ser:

6000
300

Y =

20 + 2X

12091

600=
300

20

ESTADSTICA

11

Resolver los siguientes ejercicios propuestos sobre Regresin Lineal Simple:


1) Hallar la ecuacin de la recta con las variables: X (nmero de desaprobados) e Y
(nmero de matriculados). La informacin que se tiene es la siguiente:
Nmero de desaprobados (X)

10

Nmero de matriculados (Y)

16

20

25

26

30

32

33

33

Resp:

8,94 + 2,71X

2) Hallar la ecuacin de la recta con las variables: X (nmero de gastos por inversin)
e Y (utilidades anuales en miles). La informacin que se tiene es la siguiente:
Nmero de gastos por inversin (X)
Utilidades anuales en miles (Y)

10

48,S

95,2

88,3

110,4

115,6

Resp:

43,33 + 8,04X

5.2.4 Regresin de la parbola


Se conoce a la regresin de la parbola como Regresin Parablica,
de la siguiente manera:
y

=a +

b (X)

e (X2)

la que se define

A partir de esta definicin; se puede estimar el valor de "Y", no considerando el


error:

y=a +b

(X)

e (X2)

En la ecuacin, los parmetros son:


a

Origen (Es el valor de

Y, cuando

O)

b = Pendiente (Es la variacin constante positiva (hacia arriba) o negativa (hacia


abajo) de Y, por cada valor que cambie X)
e = Curvatura (es el arco que determina la curva; si es negativo, la curva es convexa,

y si es positivo, la curva es cncava.


Tales parmetros, se calcularn utilizando el mtodo por Mnimos Cuadrados, que se
define basado en la ecuacin de la parbola, de la siguiente manera:
:E Y

:E XV
:E X2Y

a (n)
a:EX
a :EX2

+
+
+

b:EX
b :EX2
b :EX3

12101

+ e :EX2
+ e :EX3
+ e :EX4

WAL TER

CSPED

ES RAMfREZ

Para hallar los parmetros respectivos (a, b y c)), basados en el mtodo de clculo
por Mnimos Cuadrados, el alumno puede encontrar la solucin por eliminacin de los
parmetros en las ecuaciones simultaneas.
Ejercicios resueltos
1) Hallar la ecuacin de la parbola con las variables: X (nmero de vendedores) e Y
(valor de ventas realizadas al mes en miles).
La informacin que se tiene es la siguiente:
Nmero de vendedores (X)
Valor de ventas realizadas al mes en
miles (Y)

10

12

15

16

6,4

8,5

9,3

16,4

18,6

20,2

25,2

Solucin:
Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatorias
correspondientes a la ecuacin de la recta, de la siguiente manera:

11:

XY

X2

X2y

X4

X3

6,4

12,8

16

25,6

8,5

34,0

16

64

256

136,0

9,3

46,5

25

125

625

232,5

10

16,4

164,0

100

1000

10000

1640,0

12

18,6

223,2

144

1728

20736

2678,4

15

20,2

303,0

225

3375

50625

4545,0

16

25,2

403,2

256

4096

65536

6451,2

64

104,6

1186,7

770

10396

147794

15708,7

Con estos datos para hallar los parmetros "a", "b" y "c", por el mtodo por Mnimos
Cuadrados, se reemplazan las sumatorias respectiva en las frmulas:
1: Y
1:XY
1: X2Y

= a (n) + b 1:X + e 1:X2


= a 1:X + b 1:X2 + e 1:X3
= a 1:X2 + b 1:X3 + e 1:X4

104,6 =
7a +
64b +
770c (1)
1186,7 = 64a +
770b + 10396c (2)
1 5708,7 = 770a + 10396b + 147794c (3)

121 11

ESTADSTICA

11

1 Se elimina "a" de las ecuaciones (1) y (2)


104,6 = 7a + 64b + 770c (- 64)
1186,7 = 64a + 770b + 10396c (7)

- 6694,4 = -448a
8306,9 = 448a
1612,5

- 4096b

- 49280c

+ 5390b + 72772c
1294b + 23492c (4)

2 Se elimina "a" de las ecuaciones (1) y (3)

+ 64b + 770c (- 64)


1186,7 = 64a + 770b + 10396c (7)

- 6694,4

104,6 = 7a

=~8a
= 44

8306,9

- 4096b

- 49280c

+ 5390b ,+ 72772c

612,5

1294b

+ 23492c (4)

3 Se elimina "b" de las ecuaciones (4) Y (5)


1612,5 =
4202,7 =

1294b

+ 23492c (-3356)

-5411550,0

+ 63094c ( 1294)

3356b

= -~664b

5438293,8 =

4342~

26743,8 =

e
4

26743,8

/ 2804484

- 78839152c

+ 81643636c
2804484c

= 0,0095

Se reemplaza "c" en la ecuacin (4)


1612,5 = 1294b + 223,174
1294b = 1389,326

1612,5 = 1294b + 23492 (0,0095)


1294b = 1612,5 - 223,174
b

1389,326 / 1294

1,07

5 Se reemplaza "b" y "c" en la ecuacin (1)


104,6 = 7a + 64(1,07) + 770(0,0095)
7a = 104,6 - 68,48 - 7,315 = 28,805

28,805/

104,6 = 7a

+ 38,48 + 7,315

= 4,115

La ecuacin de la parbola ser:

= 4,115

+ 1,07X + 0,0095X2

Resolver los siguientes ejercicios propuestos sobre Regresin de la Parbola:


1) Hallar la ecuacin de la parbola con las variables: X (nmero de desaprobados) e
y (nmero de matriculados).

==

La informacin que se tiene es la siguiente:


Nmero de desaprobados (X)

12121

WAL TER

Nmero de matriculados

CSPED

ES RAMREZ

(Y)

2) Hallar la ecuacin de la parbola con las variables:


inversin) e Y (utilidades anuales en miles).
La informacin

X (nmero

de gastos por

que se tiene es la siguiente:

Nmero de gastos por inversin


Utilidades anuales en miles (Y)

(X)

10

48,S

95,2

88,3

110,4

115,6

Resp:

12131

= 9,28

+ 22,15X - 1,16X2

e e e

o n

5.3 Correlacin
"

Es la relacin existente entre las variables que se investigan. Cuando se utilizan solamente dos variables, la Correlacin de Pearson es denominada SIMPLE; en cambio,
cuando se utilizan ms de dos variables, la Correlacin es MULTIPLE.
El valor del ndice de correlacin vara en el intervalo [-1, +1]:
1 Si r = O, no existe relacin entre las variables. Pero esto no necesariamente implica
una independencia total entre las dos variables, es decir, que la variacin de una de ellas
puede influir en el valor que pueda tomar la otra.
2 Si r = 1, existe una correlacin positiva perfecta. El ndice indica una dependencia
total entre las dos variables denominada relacin directa; cuando una de ellas aumenta,
la otra tambin lo hace en idntica proporcin. Si
< r < 1, existe una correlacin
positiva.

3 Si r = -1, existe una correlacin negativa perfecta. El ndice indica una dependencia
total entre las dos variables llamada relacin inversa; cuando una de ellas aumenta, la
otra disminuye en idntica proporcin. Si -1 < r < O, existe una correlacin negativa.

12151

ESTADSTICA

11

El signo de la correlacin depende del signo de la pendiente "b": es decir, si la pendiente


es positiva, la correlacin es positiva; y si la pendiente es negativa, la correlacin es
negativa.
Suponiendo que se esta investigando dos variables mediante la ecuacin de la recta,
pero no se esta conforme con los resultados, entonces decide utilizar la funcin de la
parbola. Para determinar cual de las dos funciones matemtica se ajusta mejor a los
datos que se investiga, se calcula el ndice de correlacin para ambas ecuaciones y el
valor ms cercano a 1, determina cual de las dos ecuaciones se ajusta mejor a los datos.

5.3.1 Esquema de una correlacin de Pearson


y
y

~
y

r-------~--------------------y

L--------------+------------_x
L (Y - Y)2

L (Y _y)2

+ L (Y - y

)2

Donde:
L (Y - Y)2
L (Y -y )2

(y

-Y)2

Al correlacionar

: Variacin total
: Variacin no explicada
: Variacin explicada

dos o ms variable, se generan dos tipos de coeficientes que son:

5.3.1.1 Coeficiente de determinacin (r2)


r2

= Variacin Explicada _ (Y - y)2


Variacin Total
- (Y - Y)2

O tambin:

r2

= 1- Variacin No Explicada = 1- (Y - y)2


Variacin Total
(Y - Y)2

12161

WAL TER

CSP ED ES RAM REZ

El coeficiente de determinacin es un indicador que nos seala en que proporcin la


variacin de la variable dependiente (Y), puede explicarse por la variacin de la variable
independiente eX).
Por ejemplo:

Y = Ventas

X = Publicidad

r2

82,16%;

Significa que el 82,16% de las ventas se deben a la publicidad

5.3.1.2 Coeficiente de correlacin (r)


Variacin Explicada

Variacin Total
r

1-

Variacin

No Explicada

Variacin

= 1-

L:(Y - ~)2
L:(Y _ y)2

Total

Como habr observado, el coeficiente de correlacin es la raz cuadrada del coeficiente


de determinacin y es un indicador que nos seala:
10 En que proporcin se asemejan los valores reales que se investigan con los valores
calculados por la funcin matemtica empleando la misma variable independiente.
20 Cuando se utilizan las funciones de la recta y de la parbola a la vez, nos dice que
funcin tiene mejor ajuste a los datos.
Por ejemplo:

Y = Ventas

X = Publicidad

r = 94,64%;

Significa que existe una relacin directa del 94,64% entre las ventas y la publicidad

5.3.2 Correlacin simple


Se refiere a la correlacin existente solamente entre dos variables. En esta unidad,
nicamente se ver la correlacin lineal y la correlacin de la parbola tal como se hiciera con la regresin.

5.3.2.1 Correlacin lineal simple


Los coeficientes de la correlacin lineal simple con el mtodo por Mnimos Cuadrados,
se definen en forma abreviada de la siguiente manera:

al

Coeficientes de determinacin de la recta

r2

= aL:Y + bL:XY -

ny2

L:y2 _ ny2

12171

ESTADSTICA

11

Coeficientes de correlacin de la recta

b)

aY + bLXY y2 _ny2

ny2

Ejercicios resueltos
1) Hallar los coeficientes de determinacin y de correlacin de la recta, con las
variables: X (nmero de vendedores) e Y (valor de ventas realizadas al mes en miles).
La informacin que se tiene es la siguiente:
Nmero de vendedores (X)

10

12

15

16

Valor de venta en miles (Y)

6,4

8,5

9,3

16,4

18,6

20,2

25,2

Solucin:
Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatorias
correspondientes a la ecuacin de la recta:

I~

XV

X2

V2

6,4

12,8

41,0

8,5

34,0

16

72,3

9,3

46,5

25

86,5

10

16,4

164,0

100

269,0

12

18,6

223,2

144

346,0

15

20,2

303,0

225

408,0

16

25,2

403,2

256

635,0

64

104,6

1186,7

770

1857,8

Con las sumatorias se hallan los parmetros "a" y "b" (solucin por determinantes).

a = lLX2 -LXYLX
nU2-LX'LX

n:LXY - LXLY
nX2 -LXLX

104,6(770)-1186,7(64)
7(770) - 64(64)

4593,2=
1294,0

3,5

b = 7(1186,7)- 64(104,6) _ 1612,5 = 1,25


7(770)-64(64)
1294,0

12181

WALTER

CSPEDES

RAMREZ

a) Clculo del coeficiente de determinacin:

r2

= a2:Y + bLXY -

ny2

= 3,5(104,6) + 1,25(1186,7) -7(104,6/7)2

2:y2 _ ny2

= 291,68

0,9898

294,68

1857,8 -7(104,6/7)2

b) Clculo del coeficiente de correlacin:

~O,9898

= 0,9949

2) Hallar los coeficientes de determinacin y de correlacin de la recta, con las variables: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).
La informacin que se tiene es la siguiente:
Nmero de gastos por inversin (X)
Utilidades anuales en miles

(Y)

11

31

40

30

34

25

20

Solucin:
Con el mtodo por Mnimos cuadrados, se primero se calculan las sumatorias
correspondientes a la ecuacin de la recta:

I~

XV

X2

V2

31

155

25

961

11

40

440

121

1600

30

120

16

900

34

170

25

1156

25

75

625

20

40

400

30

180

1000

200

5642

Con las sumatorias se hallan los parmetros "a" y "b" (se utilizar la solucin por
determinantes).
2
a = LITX - LXYLX
nLX2-LXLX

b = nLXY -LXLY
nLX2 -LXLX

180(200) -1000 (30)


6(200) - 30(30)

6(1000) - 30(180)
6(200) - 30(30)

1219;

6000= 20
300
600 = 2
300

ESTADSTICA

11

a) Clculo del coeficiente de determinacin


r2 _aLY

+bLXY
_ny2
2
Ly
- ny2

_20(180)+2(1000)-6(180/6)2
5642 - 6(180/6)2

200 =: 0,8264
242

b) Clculo del coeficiente de correlacin


r =: .J0,8264

=: 0,9091

Resolver los siguientes ejercicios propuestos sobre correlacin lineal simple:


1) Hallar los coeficientes de determinacin y de correlacin de la recta, con las
variables: X (nmero de desaprobados) e Y (nmero de matriculados).
La informacin que se tiene es la siguiente:
Nmero de desaprobados (X)

10

Nmero de matriculados

16

20

25

26

30

32

33

33

(Y)

Resp: r2 =: 0,5849,

r =: 0,7648

2) Hallar los coeficientes de determinacin y de correlacin de la recta, con las variables: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).
La informacin que se tiene es la siguiente:
Nmero de gastos por inversin (X)
Utilidades anuales en miles (Y)

10

48,5

95,2

88,3

110,4

115,6

Resp: r2 =: 0,8695,

r =: 0,9325

5.3.2.2 Correlacin de la parbola


Los coeficientes de la correlacin de la parbola con el mtodo por Mnimos Cuadrados, se definen en forma abreviada de la siguiente manera:
a) Coeficientes de determinacin

r2

+ bLXY + cX2y

- ny2
Ly2 _ ny2
b) Coeficientes de correlacin de la parbola

=: aLY

de la parbola

aLY +bLXY +cX2y


Ly2 _ ny2

_ny2

12201

e s PED

WA.L TER

ES RAM REZ

Ejercicio resuelto
Hallar la ecuacin de la parbola con las variables: X (nmero de vendedores)
(valor de ventas realizadas al mes en miles).
Nmero de vendedores (X)

10

12

15

16

Valor de ventas en miles (Y)

6,4

8,5

9,3

16,4

18,6

20,2

25,2

eY

Solucin:
Con el mtodo por Mnimos cuadrados, se primero se calculan 'las sumatorias
correspondientes a la ecuacin de la recta:

x
2

Il:

XV

6,4

X2

12,8

X4

X3

V2

X2V

16

25,6

41,0

8,5

34,0

16

64

256

136,0

72,3

9,3

46,S

25

125

625

232,5

86,5
269,0

10

16,4

164,0

100

1000

10000

1640,0

12

18,6

223,2

144

1728

20736

2678,4

346,0

15

20,2

303,0

225

3375

50625

4545,0

408,0

16

25,2

64

104,6

403,2

256

4096

65536

6451,2

635,0

1186,7

770

10396

147794

15708,7

1857,8

Los parmetros "a", "b" y ":c:", fueron hallados en el ejercicio 1 del tem 5.2.4
correspondiente a la regresin de la parbola y estos son: a = 4,l15;b
= 1,07 Y
c = 0,0095.
a) Coeficientes de determinacin

r2

(r2):

aL:Y + bLXY + cX2y - ny2


L:y2

ny2

r2 _4,115(104,6) + 1,07(1186,7) + 0,0095(15708) -7(104,6/7)2


1857,8 - 7(104,6/7)2

b) Clculo del coeficiente de, correlacin:


r =

~O,9719 = 0,9858

~221.

_ 286,41 = 0,9719
294,68

ESTADSTICA

I1

Resolver los siguientes ejercicios propuestos sobre correlacin de la parbola:


1) Hallar los coeficientes de determinacin y de correlacin de la parbola, con las
variables: X (nmero de desaprobados) e Y (nmero de matriculados).
Nmero de desaprobados (X)
Nmero de matriculados

(Y)

10

16

20

25

26

30

32

33

33

Resp: r2

0,7462,

r ~ 0,8638

2) Hallar los coeficientes de determinacin y de correlacin de la parbola, con las


variables: X (nmero de gastos por inversin) e Y (utilidades anuales en miles).
Nmero de gastos por inversin
Utilidades anuales en miles (Y)

(X)

10

48,5

95,2

88,3

110,4

115,6

Resp: r2

0,9904,

0,9952

5.3.3 Correlacin de Spearman (p)


.Este modelo de correlacin asocia dos variables, es un modelo No Paramtrico que no
trabaja con la informacin directa, sino que la trasforma en orden creciente a partir del 1
En estadstica, el coeficiente de correlacin de Spearman, p (rho), es una medida
de la correlacin (la asociacin o interdependencia) entre dos variables aleatorias continuas. La interpretacin de coeficiente de Spearman es igual que la del coeficiente de
correlacin de Pearson. Oscila entre -1 y +1, indicndonos asociaciones negativas o
positivas respectivamente. O (cero), significa que no hay correlacin pero no necesariamente que no hay independencia.
Para calcular p, los datos son ordenados y reemplazados por su respectivo orden. El
estadstico p viene dado por la expresin:

61:,d2
1----n (n2 -1)
Donde:
d: es la diferencia de comparar el ordenen que quedaron ambas variables
n: es el nmero de parejas entre las dos variables.
En caso de existencia de datos iguales, se les da el orden que les corresponde ignorando que son iguales; es decir, como si fueran datos diferentes, luego se saca el
promedio del orden asignado a todos los datos iguales y se les reasigna este promedio
a todos ellos.

E2221

WALTER

CSPEDES

RAMREZ

Ejercicio resuelto
Se tiene el Coeficiente de Inteligencia (C.I.) de 10 nios y el nmero de horas que
ven televisin a la semana (Tv.), mediante la correlacin de Spearman, determine si hay
influencia de la televisin en la inteligencia de los nios:
Coeficiente de
Inteligencia

106

86

100

100

99

103

97

113

113

110

Nmero de horas
de Tv.

28

50

28

28

20

12

17

Solucin:

Se ordenan los datos de la primera columna generalmente en forma creciente.

2 Se crean dos columnas ms donde se cambia el valor respectivo por el nmero


de orden que les toc.
i

~
~

3 Finalmente se diferencia el orden de ambas columnas dando lugar a "d", la misma


que es elevada al cuadrado. Ntese que al c.I. = 100 le toca el orden 4 y tambin el 5;
como este dato est repetido, se le reasigna el promedio de ambos (4 + 5) / 2 = 4,5.

C.I.

Tv.

Orden C.I

Orden Tv.

d2

86

97

20

16

99

28

25

100

28

4,5

3,5

12,25

100

50

4,5

10

5,5

30,25

103

28

106

2,5

4,5

9
49
30,25

110

17

113

9,5

2,5

113

12

9,5

5,5

I:

6'L.d
= 1- 6 (196)
1----n (n2 -1)
10 (100 -1)

4
20,25

196,00

12231

1 - 1,1879

= - 0,1879

ESTADSTICA

Interpretacin

11

de los resultados:

Existe una correlacin no significativa inversa (-18,79%) entre el coeficiente de


inteligencia de los nios y las horas que le dedican a la televisin; es decir que ms
horas de televisin puede afectar la Inteligencia de los nios.
Resolver los siguientes ejercicios propuestos sobre Correlacin de Spearman:
1) Hallar el coeficiente de de Spearman comparando las edades con ~valuacin:
Edades

25

16

30

33

45

18

Evaluacin

45

82

56

62

80

65

Resp:

- 0,2

2) Hallar el coeficiente de de Spearman comparando el nmero de vendedores con el


volumen de ventas, que se da a continuacin:
Nmero de vendedores

18

10

Volumen de ventas (miles)

45

82

16

26

20

650

240

Resp:

0,9375.

3) Hallar el coeficiente de de Spearman comparando las tallas con pesos:


Tallas (cm)

125

145

198

180

174

152

166

182

180

173

162

171

Peso (kg)

38

52

77

89

88

45

58

74

70

86

70

70

Resp:

12241

0,7850