Sunteți pe pagina 1din 11

Anlisis de Regresin Cuadrtica

UNIVERSIDAD DE SAN CARLOS


FACULTAD DE INGENIERIA

ANALISIS DE REGRESION CUADRATICA


Ing. Agr. Luis Manfredo Reyes Chvez
Profesor Titular Departamento de Estadstica
1. INTRODUCCION:
El modelo de regresin cuadrtica es una alternativa cuando el modelo lineal no logra un
coeficiente de determinacin apropiado, o cuando el fenmeno en estudio tiene un comportamiento
que puede considerarse como parablico. La forma ms simple de tratar de establecer la
tendencia es a travs de un diagrama de dispersin o nube de puntos, tal como la siguiente:

Este modelo tambin es conocido como parablico, y es el caso ms simple de modelos de


regresin polinomiales, siendo su grado igual a 2.
2. Ecuacin caracterstica
La funcin que define el modelo es la siguiente:

Yi=A+Bxi+Cxi2+E
En la cual:

Xi :

Yi :
Variable dependiente, isima observacin
A, B, C:
Parmetros de la ecuacin, que generalmente son desconocidos
E:
Error asociado al modelo
Valor de la -esima observacin de la variable independiente

Al sustituir los parmetros por estimadores, el modelo adopta la siguiente forma:

yi=a+bxi+cxi2
3. Tabla de datos
Para el ajuste de un conjunto de datos al modelo cuadrtico de regresin, se construye la siguiente
tabla de datos:

X2

X3

X4

X* y

X2*y

y2

..
x

..
y

..
x2

..
x3

..
x4

..
x*y

..
x2y

..
y2

4. Estimadores del modelo


los estimadores para el ajuste del modelo se calculan de la siguiente manera:

5. Anlisis de varianza para la regresin


Con el objeto de determinar si el modelo explica o no el fenmeno en estudio, se realiza el anlisis
de varianza, que se calcula de la siguiente manera

Fuente de
Variacin
Regresin

Grados
de
libertad
2

Error

n-3

Total

n-1

Suma de cuadrados

Cuadrado
medio
2

b* (xy-x*y/n)+c*(x y- S.C. Reg/2


2
x * y/n)
S.C. Total- S.C. Regresin S.C. Error/(n3)
2
2
(y) -(y) /n

F calculada

F
tabulada

C.M.Reg/C.M.Error

Ho: El modelo no explica el fenmeno en estudio


Ha: El modelo s explica el fenmeno en estudio

Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de


regresin y en el denominador, de acuerdo al nivel de significancia escogido (los ms usuales son
al 5% y al 1%)

Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario


se acepta
6. Grado de ajuste del modelo
Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinacin, de la
siguiente manera:

7. Clculo de estimadores, coeficiente de determinacin y anlisis de varianza mediante el uso de


matrices
Un mtodo alternativo para realizar los clculos, es el uso de matrices. En este caso, el
procedimiento es el siguiente:
i)

formar la matriz x: (matriz de variable independiente), agregando la primera columna formada por
unos y una tercera columna formada por los valores de x elevados al cuadrado:

1
1
...
1
ii)

x1
x2
.....
xn

X12
X22
.....
Xn2

Formar el vector de valores de y

y1
y2
.....
yn
iii) Formar la matriz x transpuesta ( x)

1
1
...
x1 x2 ...
X12 X22 ...

1
xn
Xn2

iv) Calcular el producto matricial xx


-1
v) Calcular la inversa del producto xx (o sea [xx]
vi) Calcular el producto xy
-1
vii) Calcular el producto (xx) *(xy)=D
El resultado de esta operacin es el vector de coeficientes de regresin en el orden a,b,c
viii) Para el clculo del anlisis de varianza, se tienen las siguientes operaciones
matriciales:
Fuente de
Variacin
Regresin
Error
Total

Grados de
libertad
2
n-3
n-1

Suma de cuadrados
D( x )(y)-nym
yy-D( x )(y)
yy- nym

Cuadrado
medio
S.C. Reg/2
S.C. Error/(n3)

F calculada

F
tabulada
C.M.Reg/C.M.Error *

El valor de ym que se usa en los clculos es el promedio de valores de y (y/n)


ix) Finalmente, el coeficiente de determinacin por matrices se obtiene de la
siguiente manera:

r2= [D(x)(y)- nym2]/[(yy)- nym2 ]


8. Pruebas de Hiptesis para el modelo
Para el planteo y prueba de hiptesis, es necesario definir el trmino multiplicadores de Gauss
Los multiplicadores de Gauss son los elementos de la matriz inversa xx:

7.1 Para el coeficiente b


Para probar la hiptesis de que el coeficiente b es igual a un valor b, se procede de la siguiente
manera:
i) Se plantea la hiptesis Ho: b= b y la alternativa Ha: b b
ii) Se calcula el estadstico :

Sb es conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anlisis de varianza.


iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-3 grados de libertad y un nivel /2
iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso
contrario, se acepta .
7.2 Para el coeficiente c
Para probar la hiptesis de que el coeficiente c es igual a un valor c, se procede de la siguiente
manera:
i) Se plantea la hiptesis Ho: c= c y la alternativa Ha: c c
ii) Se calcula el estadstico :

Sb es conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anlisis de varianza.


iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-3 grados de libertad y un nivel /2
iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso
contrario, se acepta .
7.3 Para el coeficiente a
Se puede probar la hiptesis de que el coeficiente a es igual a un valor a, para lo
cual se sigue el siguiente procedimiento:
i)
ii)

Se define la hiptesis: Ho: a=a y la alternativa Ha: aa


Se calcula el error standard para a con la siguiente frmula:

iii)

Se calcula el estadstico de prueba:

iv)

Se obtiene en la tabla de t de student el estadstico comparador, con los siguientes datos: n-3
grados de libertad y nivel /2
Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la
hiptesis se acepta

v)

8. Intervalos de confianza
8.1 Para el coeficiente b
El intervalo de confianza para el coeficiente b se calcula as:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2
8.2 Para el coeficiente c
El intervalo de confianza para el coeficiente b se calcula as:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2

8.3 Para el coeficiente a


El intervalo de confianza para el coeficiente a se calcula as:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2
8.5 para la respuesta media de y, con valores de x fijos
Un intervalo de confianza para la respuesta media de y, dado x 0 sera:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2
El vector x0 contiene los valores de x para los que se calcula el valor de y. Para obtener el valor
de y que se usa en sta frmula, se sustituye en la ecuacin de regresin obtenida los valores de x
y x al cuadrado.
8.4 para la estimacin de y
El intervalo de confianza para la estimacin de y, dado un valor de x 0 se obtiene de la siguiente
manera:

El cuadrado medio del error se obtiene del anlisis de varianza


El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2
10. Por fin un ejemplo!
Se realiza una prueba de frenado de un automvil nuevo, midiendo la distancia de parada de
acuerdo a la rapidez del vehculo al momento de aplicar los frenos, obtenindose los siguientes
resultados:

RAPIDEZ DISTANCIA
Km/h
Metros
35
16
50
26
65
41
80
62
95
88
110
119
En base a los datos anteriores:
a) Construya un diagrama de dispersin
b) Efecte la estimacin del modelo cuadrtico
c) Determine el grado de ajuste e interprtelo

d) Elabore el anlisis de varianza y disctalo


e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene?
f) Pruebe la hiptesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b
h) Efecte la estimacin del modelo, el andeva y obtenga el coeficiente de determinacin por medio
de matrices.
a)

Diagrama de Dispersin

b) Estimadores del modelo


i)

Tabla de Datos:

x2

x3

x4

xy

x2y

y2

35
50
65
80
95
110
=435

16
26
41
62
88
119
=352

1,225
2,500
4,225
6,400
9,025
12,100
=35,475

42,875
125,000
274,625
512,000
857,375
1,331,000
=3,142,875

1,500,625
6,250,000
17,850,625
40,960,000
81,450,625
146,410,000
=294,421,875

560
1,300
2,665
4,960
8,360
13,090
=30,935

19,600
65,000
173,225
396,800
794,200
1,439,900
=2,888,725

256
676
1,681
3,844
7,744
14,161
=28,362

ii)

Estimadores del modelo

Ecuacin Final:

Yi=13.3587-.3394xi+0.01182xi2
c)

Grado de ajuste del modelo


El coeficiente de determinacin se calcula as:

Se puede concluir que el grado de ajuste del modelo es alto (casi perfecto!), por lo que el modelo
es confiable para hacer predicciones.
d)

Anlisis de varianza del modelo


i) Suma de cuadrados de regresin:

ii) Suma de cuadrados Total

=7711.3333

iii)
iv)
v)
vi)
vii)
viii)
ix)
x)
xi)

Suma de cuadrados del error : 7711.3333-7711.2119=0.12143


Grados de libertad de regresion=2
Grados de libertad totales= 6-1=5
Grados de libertad del error=6-3=3
Cuadrado medio de regresin= 7711.2119/2=3855.5069
Cuadrado medio del error= 0.1243/3=0.04048
F Calculada=3855.5069/0.04048=95256.147
F Tabulada (2,3,0.01)=30.82
Tabla de Andeva:
Fuente de
Variacin
Regresin
Error
Total

Grados de
libertad
2
3
5

Suma de cuadrados

Cuadrado medio

7711.2119
0.12143
7711.33333

3855.60595
0.04048

F calculada F
tabulada
95256.14
30.82**

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo cual
se concluye que el modelo s explica el fenmeno en estudio y que los resultados obtenidos no se
deben a la casualidad.
e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene?
Para esto, simplemente se utiliza la ecuacin anteriormente encontrada por estimacin,
sustituyendo el valor de x por 100
y=

13.3587-.3394(100)+0.01182(100)2=97.618 m

f) Pruebe la hiptesis de que b=1 con un 99% de confianza


Inicialmente se plantea Ho: b=1 y su alterna Ha: b1
A continuacin se obtiene el error standard de b:

El valor de t de student de calcula de la siguiente manera:

El valor de t se obtiene en la tabla de t de student, con 6-3 grados de libertad y (1-.99)/2=0.005 de


, siendo el valor igual a 5.840
Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente
b no es igual a 1.
g) Calcule intervalos de confianza al 95% para a y b
El valor de t de student al 95% (/2=0.05/2=0.025) con 3 grados de libertad es= 3.182
Intervalo de confianza para b:

El intervalo final ser entonces el siguiente: -0.40766<B<-0.27114


Intervalo de confianza para a:

El intervalo final para a sera: 11.0775<A<15.6399


i)

Ajuste del modelo y anlisis de varianza mediante matrices:


Matriz x:

1
1
1
1
1
1

35
50
65
80
95
110

1225
2500
4225
6400
9025
12100

Matriz x transpuesta ( x )

1
1
1
35
50
65
1225 2500 4225

1
80
6400
Vector y:

16
26

1
95
9025

1
110
12100

41
62
88
119
Producto xx:

6
435
35475

435
35475
35475
3142875
3142875 294421875

Matriz inversa de xx:

12.6973
-0.3713
0.002433

-0.3713
0.002433
0.01137
-0.00007671
-0.00007671 0.0000005291
Producto x y

352
30935
2888725
-1

Producto Final b=(xx) * (x y)

13.3587
-0.3394
0.01182
Anlisis de varianza
ym=352/6=58.666
2
Suma de cuadrados de regresin= bxy-nym =

Suma de cuadrados total= yy- nym =

Suma de cuadrados del error : 7711.3333-7711.2119=0.12143


Grados de libertad de regresion=2
Grados de libertad totales= 6-1=5
Grados de libertad del error=6-3=3
Cuadrado medio de regresin= 7711.2119/2=3855.5069
Cuadrado medio del error= 0.1243/3=0.04048

F Calculada=3855.5069/0.04048=95256.147
F Tabulada (2,3,0.01)=30.82

Anlisis de Varianza Final:


Fuente de
Variacin
Regresin
Error
Total

Grados de
libertad
2
3
5

Suma de cuadrados

Cuadrado medio

7711.2119
0.12143
7711.33333

3855.60595
0.04048

F calculada F
tabulada
95256.14
30.82**

S-ar putea să vă placă și