Sunteți pe pagina 1din 12

Alirrosai Reyes Torres

Anlisis de Regresin Cuadrtica


UNIVERSIDAD DE SAN CARLOS
FACULTAD DE INGENIERIA

ANALISIS DE REGRESION CUADRATICA
Ing. Agr. Luis Manfredo Reyes Chvez
Profesor Titular Departamento de Estadstica

1. INTRODUCCION:
El modelo de regresin cuadrtica es una alternativa cuando el modelo lineal no logra un
coeficiente de determinacin apropiado, o cuando el fenmeno en estudio tiene un comportamiento
que puede considerarse como parablico. La forma ms simple de tratar de establecer la
tendencia es a travs de un diagrama de dispersin o nube de puntos, tal como la siguiente:



Este modelo tambin es conocido como parablico, y es el caso ms simple de modelos de
regresin polinomiales, siendo su grado igual a 2.

2. Ecuacin caracterstica
La funcin que define el modelo es la siguiente:

Y
i
=A+Bx
i
+Cx
i
2
+E

En la cual:
Y
i
: Variable dependiente, isima observacin
A, B, C: Parmetros de la ecuacin, que generalmente son desconocidos
E: Error asociado al modelo
X
i :
Valor de la -esima observacin de la variable independiente

Al sustituir los parmetros por estimadores, el modelo adopta la siguiente forma:

y
i
=a+bx
i
+cx
i
2




Alirrosai Reyes Torres


3. Tabla de datos
Para el ajuste de un conjunto de datos al modelo cuadrtico de regresin, se construye la siguiente
tabla de datos:

X y X
2
X
3
X
4
X* y X
2
*y y
2

.. .. .. .. .. .. .. ..
x y x
2
x
3
x
4
x*y x
2
y y
2



4. Estimadores del modelo
los estimadores para el ajuste del modelo se calculan de la siguiente manera:




















Alirrosai Reyes Torres








5. Anlisis de varianza para la regresin
Con el objeto de determinar si el modelo explica o no el fenmeno en estudio, se realiza el anlisis
de varianza, que se calcula de la siguiente manera


Fuente de
Variacin
Grados
de
libertad
Suma de cuadrados Cuadrado
medio
F calculada F
tabulada
Regresin 2 b* (xy-x*y/n)+c*(x
2
y-
x
2
* y/n)
S.C. Reg/2 C.M.Reg/C.M.Error
Error n-3 S.C. Total- S.C. Regresin S.C. Error/(n-
3)

Total n-1 (y)
2
-(y)
2
/n


Ho: El modelo no explica el fenmeno en estudio
Ha: El modelo s explica el fenmeno en estudio

Para buscar en la tabla la F tabulada, se usan el el numerador los grados de libertad de
regresin y en el denominador, de acuerdo al nivel de significancia escogido (los ms usuales son
al 5% y al 1%)
Si el valor de F calculada es mayor que el de F tabulada, se rechaza Ho, en caso contrario
se acepta

6. Grado de ajuste del modelo
Para determinar el grado de ajuste del modelo, se calcula el coeficiente de determinacin, de la
siguiente manera:



7. Clculo de estimadores, coeficiente de determinacin y anlisis de varianza mediante el uso de
matrices
Un mtodo alternativo para realizar los clculos, es el uso de matrices. En este caso, el
procedimiento es el siguiente:

i) formar la matriz x: (matriz de variable independiente), agregando la primera columna formada por
unos y una tercera columna formada por los valores de x elevados al cuadrado:

1 x
1
X
1
2

1 x
2
X
2
2

... ..... .....
1 x
n
X
n
2

Alirrosai Reyes Torres


ii) Formar el vector de valores de y

y
1

y
2

.....
y
n


iii) Formar la matriz x transpuesta ( x)

1 1 ... 1
x
1
x
2
... xn
X
1
2
X
2
2
... X
n
2


iv) Calcular el producto matricial xx
v) Calcular la inversa del producto xx (o sea [xx]
-1

vi) Calcular el producto xy
vii) Calcular el producto (xx)
-1
*(xy)=D
El resultado de esta operacin es el vector de coeficientes de regresin en el orden a,b,c
viii) Para el clculo del anlisis de varianza, se tienen las siguientes operaciones
matriciales:

Fuente de
Variacin
Grados de
libertad
Suma de cuadrados Cuadrado
medio
F calculada F
tabulada
Regresin 2 D( x )(y)-ny
m
2
S.C. Reg/2 C.M.Reg/C.M.Error *
Error n-3 yy-D( x )(y) S.C. Error/(n-
3)

Total n-1 yy- ny
m
2


El valor de y
m
que se usa

en los clculos es el promedio de valores de y (y/n)

ix) Finalmente, el coeficiente de determinacin por matrices se obtiene de la
siguiente manera:

r
2
= [D(x)(y)- ny
m
2
]/[(yy)-ny
m
2
]

8. Pruebas de Hiptesis para el modelo
Para el planteo y prueba de hiptesis, es necesario definir el trmino multiplicadores de Gauss
Los multiplicadores de Gauss son los elementos de la matriz inversa xx:




Alirrosai Reyes Torres

7.1 Para el coeficiente b
Para probar la hiptesis de que el coeficiente b es igual a un valor b, se procede de la siguiente
manera:

i) Se plantea la hiptesis Ho: b= b y la alternativa Ha: b b
ii) Se calcula el estadstico :



S
b
es conocido como el error standard de b y se calcula de la siguiente manera:

El cuadrado medio del error se obtiene del anlisis de varianza.

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-3 grados de libertad y un nivel /2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso
contrario, se acepta .

7.2 Para el coeficiente c
Para probar la hiptesis de que el coeficiente c es igual a un valor c, se procede de la siguiente
manera:

i) Se plantea la hiptesis Ho: c= c y la alternativa Ha: c c
ii) Se calcula el estadstico :


S
b
es conocido como el error standard de b y se calcula de la siguiente manera:


El cuadrado medio del error se obtiene del anlisis de varianza.

iii) Se busca en la tabla de t de student el valor tabulado para los siguientes datos:
n-3 grados de libertad y un nivel /2

iv) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso
contrario, se acepta .

7.3 Para el coeficiente a
Alirrosai Reyes Torres

Se puede probar la hiptesis de que el coeficiente a es igual a un valor a, para lo
cual se sigue el siguiente procedimiento:

i) Se define la hiptesis: Ho: a=a y la alternativa Ha: aa
ii) Se calcula el error standard para a con la siguiente frmula:


iii) Se calcula el estadstico de prueba:



iv) Se obtiene en la tabla de t de student el estadstico comparador, con los siguientes datos: n-3
grados de libertad y nivel /2
v) Si el valor de t calculado es mayor que el tabulado, se rechaza la Ho, en caso contrario, la
hiptesis se acepta

8. Intervalos de confianza

8.1 Para el coeficiente b
El intervalo de confianza para el coeficiente b se calcula as:


El cuadrado medio del error se obtiene del anlisis de varianza
El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2

8.2 Para el coeficiente c
El intervalo de confianza para el coeficiente b se calcula as:



El cuadrado medio del error se obtiene del anlisis de varianza
El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2

8.3 Para el coeficiente a
El intervalo de confianza para el coeficiente a se calcula as:

Alirrosai Reyes Torres


El cuadrado medio del error se obtiene del anlisis de varianza
El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2

8.5 para la respuesta media de y, con valores de x fijos
Un intervalo de confianza para la respuesta media de y, dado x
0
sera:



El cuadrado medio del error se obtiene del anlisis de varianza
El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2
El vector x
0
contiene los valores de x para los que se calcula el valor de y. Para obtener el valor
de y que se usa en sta frmula, se sustituye en la ecuacin de regresin obtenida los valores de x
y x al cuadrado.

8.4 para la estimacin de y
El intervalo de confianza para la estimacin de y, dado un valor de x
0
se obtiene de la siguiente
manera:



El cuadrado medio del error se obtiene del anlisis de varianza
El valor de t se obtiene de la tabla de t de student con n-3 grados de libertad y un
nivel /2

10. Por fin un ejemplo!
Se realiza una prueba de frenado de un automvil nuevo, midiendo la distancia de parada de
acuerdo a la rapidez del vehculo al momento de aplicar los frenos, obtenindose los siguientes
resultados:

RAPIDEZ
Km/h
DISTANCIA
Metros
35 16
50 26
65 41
80 62
95 88
110 119

En base a los datos anteriores:
a) Construya un diagrama de dispersin
b) Efecte la estimacin del modelo cuadrtico
c) Determine el grado de ajuste e interprtelo
d) Elabore el anlisis de varianza y disctalo
e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene?
f) Pruebe la hiptesis que b=1 con un 99% de confianza
g) Calcule intervalo de confianza al 95% para a y b
h) Efecte la estimacin del modelo, el andeva y obtenga el coeficiente de determinacin por medio
de matrices.
Alirrosai Reyes Torres


a) Diagrama de Dispersin


b) Estimadores del modelo

i) Tabla de Datos:
x y x
2
x
3
x
4
xy x
2
y y
2

35 16
1,225 42,875 1,500,625 560 19,600 256
50 26
2,500 125,000 6,250,000 1,300 65,000 676
65 41
4,225 274,625 17,850,625 2,665 173,225 1,681
80 62
6,400 512,000 40,960,000 4,960 396,800 3,844
95 88
9,025 857,375 81,450,625 8,360 794,200 7,744
110 119
12,100 1,331,000 146,410,000 13,090 1,439,900 14,161
=435 =352 =35,475 =3,142,875 =294,421,875 =30,935 =2,888,725 =28,362


ii) Estimadores del modelo






Ecuacin Final:
Yi=13.3587-.3394x
i
+0.01182x
i
2



c) Grado de ajuste del modelo
El coeficiente de determinacin se calcula as:
Alirrosai Reyes Torres




Se puede concluir que el grado de ajuste del modelo es alto (casi perfecto!), por lo que el modelo
es confiable para hacer predicciones.

d) Anlisis de varianza del modelo

i) Suma de cuadrados de regresin:


ii) Suma de cuadrados Total


=7711.3333


iii) Suma de cuadrados del error : 7711.3333-7711.2119=0.12143
iv) Grados de libertad de regresion=2
v) Grados de libertad totales= 6-1=5
vi) Grados de libertad del error=6-3=3
vii) Cuadrado medio de regresin= 7711.2119/2=3855.5069
viii) Cuadrado medio del error= 0.1243/3=0.04048
ix) F Calculada=3855.5069/0.04048=95256.147
x) F Tabulada (2,3,0.01)=30.82
xi) Tabla de Andeva:

Fuente de
Variacin
Grados de
libertad
Suma de cuadrados Cuadrado medio F calculada F
tabulada
Regresin 2 7711.2119 3855.60595 95256.14 30.82**
Error 3 0.12143 0.04048
Total 5 7711.33333

Debido a que F calculada es mayor que F tabulada, se rechaza la Ho y se acepta la Ha, con lo cual
se concluye que el modelo s explica el fenmeno en estudio y que los resultados obtenidos no se
deben a la casualidad.

e) Si el vehculo viaja a 100 km/h, en qu distancia se detiene?

Para esto, simplemente se utiliza la ecuacin anteriormente encontrada por estimacin,
sustituyendo el valor de x por 100

y= 13.3587-.3394(100)+0.01182(100)
2
=97.618 m


Alirrosai Reyes Torres

f) Pruebe la hiptesis de que b=1 con un 99% de confianza
Inicialmente se plantea Ho: b=1 y su alterna Ha: b1
A continuacin se obtiene el error standard de b:


El valor de t de student de calcula de la siguiente manera:


El valor de t se obtiene en la tabla de t de student, con 6-3 grados de libertad y (1-.99)/2=0.005 de
, siendo el valor igual a 5.840

Finalmente, dado que t calculada es mayor que la tabulada, se concluye al 99% que el coeficiente
b no es igual a 1.

g) Calcule intervalos de confianza al 95% para a y b
El valor de t de student al 95% (/2=0.05/2=0.025) con 3 grados de libertad es= 3.182
Intervalo de confianza para b:




El intervalo final ser entonces el siguiente: -0.40766<B<-0.27114

Intervalo de confianza para a:




El intervalo final para a sera: 11.0775<A<15.6399

i) Ajuste del modelo y anlisis de varianza mediante matrices:

Matriz x:
1 35 1225
1 50 2500
1 65 4225
1 80 6400
1 95 9025
1 110 12100

Matriz x transpuesta ( x )
1 1 1 1 1 1
35 50 65 80 95 110
1225 2500 4225 6400 9025 12100


Alirrosai Reyes Torres

Vector y:

16
26
41
62
88
119


Producto xx:

6 435 35475
435 35475 3142875
35475 3142875 294421875

Matriz inversa de xx:
12.6973 -0.3713 0.002433
-0.3713 0.01137 -0.00007671
0.002433 -0.00007671 0.0000005291

Producto x y

352
30935
2888725

Producto Final b=(xx)
-1
*

(x y)
13.3587
-0.3394
0.01182

Anlisis de varianza
y
m
=352/6=58.666
Suma de cuadrados de regresin= bxy-ny
m
2
=



Suma de cuadrados total= yy- ny
m
2
=





Suma de cuadrados del error : 7711.3333-7711.2119=0.12143
Grados de libertad de regresion=2
Alirrosai Reyes Torres

Grados de libertad totales= 6-1=5
Grados de libertad del error=6-3=3
Cuadrado medio de regresin= 7711.2119/2=3855.5069
Cuadrado medio del error= 0.1243/3=0.04048
F Calculada=3855.5069/0.04048=95256.147
F Tabulada (2,3,0.01)=30.82


Anlisis de Varianza Final:

Fuente de
Variacin
Grados de
libertad
Suma de cuadrados Cuadrado medio F calculada F
tabulada
Regresin 2 7711.2119 3855.60595 95256.14 30.82**
Error 3 0.12143 0.04048
Total 5 7711.33333

S-ar putea să vă placă și