Sunteți pe pagina 1din 15

Universidad Nacional De San Luis

Facultad de Ingeniera y Ciencias Agropecuarias

Trabajo Prctico 2
Gestin de la calidad

Alumnos:
Gigena, Fernando Jos
Ogalde, Franco
Bertola, Martn Augusto
Persa, Francisco Daniel

En principio daremos a conocer ciertos conocimientos tericos que nos


van a ayudar a comprender de manera efectiva el desarrollo del trabajo
estadstico que se ha realizado.
Anlisis de correlacin: Emplea mtodos para medir la significacin
del grado o intensidad de asociacin entre dos o ms variables.

Regresin estadstica o regresin a la media: Es la tendencia de una


medicin extrema a presentarse.

-Correlacin lineal:

Se conoce como anlisis de correlacin lineal entre dos variables aleatorias a la


relacin existente que puede haber entre esas variables, es decir, si representamos
esas variables en forma de ecuacin se parecera a .

A continuacin se muestra los tipos de regresin lineal:

En el trabajo a realizar se trabajara con el modelo de regresin lineal del grafico


numero 1 (buen ajuste) cuando x crece y crece.

De los dems grficos podemos decir que puede existir un modelo no lineal tanto
cuando x crece y decrece o viceversa o no existir regresin lineal, es decir, los pares
de puntos representados en el grafico no pueden ser representados por ninguna
funcin.

Para determinar el grado de intensidad que relaciona a las variables afectadas se

utiliza el coeficiente de correlacin lineal que se encuentra entre -1 y 1 es decir:

El coeficiente de correlacin:
Este coeficiente se obtiene dividiendo la covarianza que se calcula de la siguiente
manera: en cada par de valores (x, y) se multiplica la "x" menos su media, por la "y"
menos su media. Se suma el resultado obtenido de todos los pares de valores y este
resultado se divide por el tamao de la muestra, dicha covarianza se eleva al cuadrado
y se divide por el producto de las varianzas de "x" y de "y", y a este producto se le
calcula la raz cuadrada.

Si "R" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de
la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.

Si "R" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye
el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a
-1.

Si "R" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro
tipo de correlacin (parablica, exponencial, etc.).

Otra herramienta usada para saber si realizamos un buen ajuste de regresin lineal
existe el coeficiente de regresin el cual indica el grado de bondad del ajuste

Si dicho coeficiente da cero se dice (cero ajuste), y si da 1 (ajuste perfecto).

Otro concepto a tener muy en cuenta es la regresin lineal, esta es una tcnica
estadstica para investigar la relacin funcional entre dos o ms variables, ajustando
algn modelo matemtico.

La regresin lineal simple utiliza una sola variable de regresin y el caso ms sencillo
es el modelo de lnea recta. Supngase que se tiene un conjunto de n pares de
observaciones (xi,yi), se busca encontrar una recta que describa de la mejor manera
cada uno de esos pares observados.
Un ejemplo puede ser el siguiente:

Este grafico se denomina grafico de dispersin.

El analisis de regresion lineal busca aproximar esta nube de puntos que tienen una
tendencia lineal por medio de una recta como, por ejemplo:

Para poder realizar dicho ajuste por medio de una recta se aplican las expresiones
antes mencionadas como el coeficiente de correlacin, y dems.

Sabemos que una recta viene dada por la forma y=ax+b.


Debemos determinar los coeficientes a y b.

El coeficiente b viene dado por:

b=

Y l a es:

a=

Donde xi e yi son las muestras; x(raya) e y(raya) son las medias y b es el valor
calculado anteriormente.

El p-valor:

Es el nivel de significacin ms pequeo para el que la muestra obtenida obligara a


rechazar la hiptesis nula, es decir que para niveles de significatividad mas chicos que
el valor P, la hiptesis nula no se rechaza; y para valores mayores que el valor P, la
hiptesis se rechaza.

En el caso que el p-valor sea menor igual al nivel de significacin que se establece por
lo general entre 0.05 y 0.01, la hiptesis nula se rechaza. Y si tenemos valores altos
del p-valor que oscilan entre 0 y 1 no se rechaza dicha hiptesis.

Suposiciones de regresin lineal:

-Normalidad: los valores de y estn distribuidos normalmente para cada valor de x.

-Homoscedasticidad: esta suposicin requiere que la variacin alrededor de la lnea


de regresin sea constante para todos los valores de X. Esto significa que Y vara la
misma cantidad ya sea que X tenga un valor alto o bajo.

-Independencia del error: requiere que la diferencia residual entre un valor


observado y uno predicho de Y sea independiente de valor de X.

-Linealidad: la relacin entre las variables es lineal.


Grficos de residuos

Los grficos de residuos sirven para ver si verifican las hiptesis en el modelo de
regresin. Cuando tenemos un valor amplio indica que la observacin est lejos del
modelo estimado, por ende, es mala la prediccin de esta observacin.

El grafico muestra un buen ajuste de los datos aleatorios.


En este grafico se observa que la relacin lineal no se ajusta bien.

En este grafico se observa que hay un dato atpico ya que hay un residuo muy alto.

En este grafico se ve que cuando el valor de y decrece los residuos decrecen.


En este grafico se observa que hay un dato muy influyente en la muestra que altera los
residuos.

En un modelo de regresin lineal que sea adecuado los residuos deben seguir una
distribucin normal con media 0 y varianza constante, por lo que un posible
diagnstico puede ser comprobar esa situacin. Se puede efectuar de manera formal o
mediante una grfica en la que se representa el valor de los residuos frente al valor
estimado.

Auto correlacin
El mtodo de Durbin Watson busca rechazar la hiptesis nula de inexistencia de
auto correlacin mediante el estadstico h para pruebas de muestras grandes. Si el
estadstico de la regresin efectuada est distribuido en forma asintticamente normal
con media cero y varianza unitaria y adems se encuentra entre (-1,96, +1,96), con un
95% de confianza se puede rechazar la hiptesis nula de que no hay correlacin de
primer orden (positiva o negativa). El valor de h para nuestro modelo es de -0,0206,
por lo que podemos aceptar la hiptesis nula de ausencia de auto correlacin con un
95%. La inclusin del AR(1) corrige el problema de auto correlacin propio de este
modelo, adems de contribuir en la explicacin del comportamiento de la variable
dependiente.

Donde T es el nmero de observaciones. Puesto que d es aproximadamente igual a 2 (1 - r ),


donde r es la auto correlacin de la muestra de los residuos, d = 2 indica que no hay auto
correlacin. El valor de d siempre est entre 0 y 4. Si la estadstica de Durbin-Watson es
sustancialmente menor que 2, hay evidencia de correlacin serial positiva. Como regla general,
si Durbin-Watson es inferior a 1,0, puede ser causa de alarma. Los valores pequeos
de d indican los trminos de error sucesivos son, en promedio, cerca del valor de los otros, o
correlacionados positivamente. Si d > 2, los trminos de error sucesivas son, en promedio,
muy diferente en valor el uno del otro, es decir, correlacionada negativamente.

Error absoluto medio


Cuando estimamos un parmetro, en este caso la media (), a partir de los resultados
obtenidos en muestras de un determinado tamao (n) los valores que toma el
estadstico, aqu , en las diferentes muestras vara. A la desviacin tpica de los
valores que toma el estadstico se la denomina error tpico del estadstico en cuestin.

En este caso el error tpico de la media es igual a:

Error estndar de estimacin

Es la medida de la variabilidad alrededor de la lnea de regresin. Esto se debe a que


la recta de regresin obtenida por el mtodo de mnimos cuadrados solo sirve como
pronosticador aproximado de un valor de Y para un valor dado de X.

Donde x son las muestras y x(raya) es la media, y N es el tamao de la muestra

e ms cercana a la media en una segunda medicin. La regresin se


utiliza para predecir una medida basndonos en el conocimiento de otra.
Desarrollo del proyecto:
Proponemos hacer una estadstica entre la relacin Peso-Aceleracion entre
autos con motor 1,6L con una potencia entre 101HP y 115HP. Entre los autos
analizados estn marcas como VW, Fiat, Peugeot, Renault, Citroen y Ford.
Para realizar el trabajo buscamos los valores de las fichas tcnicas de las
pginas oficiales de las distintas marcas:
PESO [Kg]
ACELERACION de 0-100 km/h [seg]

Peso Tiempo de Aceleracion 0-100


MODELO
(kg) Km/h (seg)
Gol
944 9.7
Trend
Fox 1006 10.5
Voyage 989 9.8
CrossFo
1030 11.3
x
Saveiro 1037 10.9
Suran 1140 12.6
Sandero 1040 10.8
Fiesta 1300 13
Focus 1391 13.4
207 1187 11.5
Partner 1369 12.9
C4 1248 11.8

Regresin Simple - Tiempo de Aceleracion 0-100 Km/h vs. Peso


(kg)
Variable dependiente: Tiempo de Aceleracion 0-100 Km/h
Variable independiente: Peso (kg)
Lineal: Y = a + b*X

Coeficientes

Mnimos Cuadrados Estndar Estadstico


Parmetro Estimado Error T Valor-P
Intercepto 3.11045 1.14201 2.72367 0.0214
Pendiente 0.00737334 0.000993229 7.4236 0.0000

Anlisis de Varianza

Fuente Suma de Gl Cuadrado Razn-F Valor-P


Cuadrados Medio
Modelo 14.5047 1 14.5047 55.11 0.0000
Residuo 2.63196 10 0.263196
Total (Corr.) 17.1367 11

Coeficiente de Correlacin = 0.920007


R-cuadrada = 84.6413 porciento
R-cuadrado (ajustado para g.l.) = 83.1055 porciento
Error estndar del est. = 0.513027
Error absoluto medio = 0.363517
Estadstico Durbin-Watson = 1.69334 (P=0.2000)
Autocorrelacin de residuos en retraso 1 = 0.0773254
Aqu se distingue en azul la recta que se asemeja a todos los datos y que
representa el modelo de regresin lineal de dichos datos, en verde la recta que
presenta el lmite de confianza y en gris el lmite de prediccin.

Residuos:

En el contexto de la regresin lineal, llamamos residuos a las diferencias entre


los valores de la variable dependiente observados y los valores que
predecimos a partir de nuestra recta de regresin.

La normalidad de los residuos:

Uno de los supuestos del modelo generalmente aceptado es que los errores o
residuos, se distribuyen alrededor de la recta de regresin, en forma normal,
con una media de cero. Por supuesto no reproduce exactamente la curva
normal, pero podemos atribuir esas desviaciones, con razonabilidad, al nmero
no demasiado grande de residuos. Si la muestra fuera mayor, tendramos
derecho a esperar mejor ajuste.
En este ultimo grfico, los residuos parecen aleatorios. Es una buena
indicacin que el modelo de regresin se ajusta bien.

Residuos Atpicos

Predicciones Residuos
Fila X Y Y Residuos Studentizados
6 1140.0 12.6 11.5161 1.08395 2.92

La tabla de residuos atpicos enlista todas las observaciones que tienen


residuos Estudentizados mayores a 2, en valor absoluto. Los residuos
Estudentizados miden cuntas desviaciones estndar se desva cada valor
observado de Tiempo de Aceleracion 0-100 Km/h del modelo ajustado,
utilizando todos los datos excepto esa observacin. En este caso, hay un
residuo Estudentizado mayor que 2, pero ninguno mayor que 3.
Conclucion
La salida muestra los resultados de ajustar un modelo lineal para describir la
relacin entre Tiempo de Aceleracion 0-100 Km/h y Peso (kg). La ecuacin del
modelo ajustado es

Tiempo de Aceleracion 0-100 Km/h = 3.11045 +


0.00737334*Peso (kg)
Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una
relacin estadsticamente significativa entre Tiempo de Aceleracion 0-100 Km/h
y Peso (kg) con un nivel de confianza del 95.0%.

El estadstico R-Cuadrada indica que el modelo ajustado explica 84.6413% de


la variabilidad en Tiempo de Aceleracion 0-100 Km/h. El coeficiente de
correlacin es igual a 0.920007, indicando una relacin relativamente fuerte
entre las variables. El error estndar del estimado indica que la desviacin
estndar de los residuos es 0.513027. Este valor puede usarse para construir
lmites de prediccin para nuevas observaciones, seleccionando la opcin de
Pronsticos del men de texto.

El error absoluto medio (MAE) de 0.363517 es el valor promedio de los


residuos. El estadstico de Durbin-Watson (DW) examina los residuos para
determinar si hay alguna correlacin significativa basada en el orden en el que
se presentan en el archivo de datos. Puesto que el valor-P es mayor que 0.05,
no hay indicacin de una autocorrelacin serial en los residuos con un nivel de
confianza del 95.0%.
Bibliografa:

http://www.renault.com.ar/

http://www.ford.com.ar/

http://www.citroen.com.ar/

http://www.volkswagen.com.ar/

http://www.cars.com.ar/

http://www.uoc.edu/in3/emath/docs/RegresionLineal.pdf

http://es.wikipedia.org/wiki/Coeficiente_de_determinaci
%C3%B3n_corregido

http://es.wikipedia.org/wiki/Coeficiente_de_determinaci%C3%B3n

http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

http://halweb.uc3m.es/esp/Personal/personas/mwiper/docencia/Spanish/
Introduction_to_Statistics/intro_regress2.pdf

http://es.wikipedia.org/wiki/Error_est%C3%A1ndar

S-ar putea să vă placă și