Sunteți pe pagina 1din 70

Calculo del Coeficiente de Correlacin

Se nos da la tabla siguiente con los datos que corresponden a:

X = Gastos de Publicidad de un Producto Y = Ventas Logradas

Para calcular el Coeficiente de Correlacin, utilizamos la formula:

El coeficiente de correlacin es igual a la COOVARIANZA entre el producto de las desviaciones tpicas

En donde:

Por lo tanto, tenemos que calcular la Covarianza:

De igual forma necesitamos calcular las desviaciones tpicas:

Completamos la tabla calculando los datos necesarios:

Que valores necesitamos?


Xi2, Yi2, Xi . Yi, Medias de X y Y

Completamos la tabla calculando los valores necesarios:

Que datos nos faltan?

Completamos la tabla calculando los valores necesarios:

Totales

Ahora si, con estos datos podemos calcular las?...

Medias

Calculamos la desviacin tpica de Y:

Calculamos la desviacin tpica de X:

Por lo tanto, tenemos que calcular la Covarianza:

Ya que tenemos todos los valores necesarios, calculamos el coeficiente de correlacin:

El coeficiente de correlacin es muy fuerte, ya que esta cerca del 1

Que significa que el coeficiente de correlacin es muy fuerte? 1. El coeficiente de correlacin tiene una amplitud de -1 a 1, esto es: -1 p 1 (El coeficiente de Correlacin es mayor o igual a 1 pero es menor o igual a 1) 2. p=1 significa que la Correlacin que existe entre las variables es muy fuerte positivamente 3. p=-1 significa que la Correlacin que existe entre las variables es muy fuerte negativamente 4. p=0 significa que no existe Correlacin entre las variables de estudio.

Ejemplos: Correlacin Fuerte Positiva p=1 Correlacin Fuerte Negativa p=-1

No hay Correlacin

Calculo del Coeficiente de Determinacin

El Coeficiente de Determinacin mide la eficiencia del modelo de Regresin


El coeficiente de Determinacin, se obtiene elevando al cuadrado el Coeficiente de Correlacin:

2 R
datos reales

2 (r)
a los

R2 = 1 La Regresin Lineal se ajusta adecuadamente

R2 = 0 La Regresin Lineal NO se ajusta adecuadamente


datos reales

a los

Ejercicio

Las calificaciones de 12 alumnos en las materias de Estadstica y Probabilidad son las siguientes:

Hallar el Coeficiente de Correlacin e interpretarlo

Estadstica Probabilidad

Hallamos las medias aritmticas.

Calculamos la covarianza.

Calculamos las desviaciones tpicas.

Aplicamos la frmula del coeficiente de correlacin lineal.

Al ser el coeficiente de correlacin positivo, la correlacin es directa.

Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy fuerte.

En una empresa trabajan cuatro ensambladores. Los aos de antigedad y numero de accidentes ocurridos en el ltimo ao por cada uno de ellos son los siguientes:

Calcular el coeficiente de correlacin lineal e interpretarlo. Media de X= 4.5 Media de Y= 2.5 DT x= 1.25 DTy= 1.25 Covarianza= -1.25 r= -1 La correlacin es perfecta e inversa

Propiedades del coeficiente de correlacin


1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es decir, si expresamos la altura en metros o en centmetros el coeficiente de correlacin no vara. 2. El signo del coeficiente de correlacin es el mismo que el de la covarianza. Si la covarianza es positiva, la correlacin es directa. Si la covarianza es negativa, la correlacin es inversa. Si la covarianza es nula, no existe correlacin.

Propiedades del coeficiente de correlacin


3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y 1. 1 r 1 4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1. 5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.

Propiedades del coeficiente de correlacin


6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin es dbil.

7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o decreciente. Entre ambas variables hay dependencia funcional.

Ejercicio: Las cantidades de un compuesto qumico (en g), que se disuelven en 100g de H2O a diferentes temperaturas (en 0C) se registran como sigue.

Ejercicio:

a) Elaborar diagrama de dispersin

b) Determinar la ecuacin de la lnea de regresin

c) Estimar la cantidad de compuesto qumico que se disolver en 100g de H2O a 50 0C

Primero vamos a calcular la Media

a) Elaborar diagrama de dispersin

b) Determinar la ecuacin de la lnea de regresin

c) Estimar la cantidad de compuesto qumico que se disolver en 100g de H2O a 50 0C

Y = 0.5676x + 5.8254 Y = (0.5676)(50) + 5.8254 Y = 28.38 + 5.8254 Y = 34.20


R. Se disolvern 34.20g de compuesto qumico en 100g de agua a 50oC

Demostrar la Confiabilidad de la Determinacin (R2)

R2 = 0.99049 x 100 R2 = 99.04% El coeficiente de determinacin es de 99.04% de confiabilidad de la relacin muy fuerte positiva entre la temperatura y la cantidad del componente qumico disuelto. Lo que indica que a mayor temperatura, mayor la cantidad de qumico disuelto.

Anlisis de Residuales

Un residual ri es la diferencia entre el valor observado Yi y el valor estimado por la lnea de regresin Yi , es decir, ri = Yi-Yi . El residual puede ser considerado como el error aleatorio ei observado.

El anlisis de residuales permite cotejar si las suposiciones del modelo de regresin se cumplen.
Se puede detectar: a) Si efectivamente la relacin entre las variables X e Y es lineal. b) Si hay normalidad de los errores. c) Si hay valores anormales en la distribucin de errores d) Si hay varianza constante (propiedad de Homocedasticidad) y e) Si hay independencia de los errores.

Se ha visto anteriormente que la correlacin entre dos variables puede ser alta a pesar de que la relacin entre las dos sea fuertemente no lineal.

Se pueden utilizar los residuos para ver si el modelo de regresin lineal es adecuado.
El anlisis de residuales se puede llevar a cabo grficamente o en forma analtica.

Ejemplo La recta de regresin para los cinco siguientes conjuntos de datos es la misma:

Si trazamos las graficas, observaremos lo siguiente:

Este primer caso parece una regresin normal.

Vemos que los residuos parecen aleatorios. Es una buena indicacin que el modelo de regresin se ajusta bien.

En este segundo caso, hay una relacin no lineal.

Aqu se ve una relacin entre y y los residuos. El modelo lineal no se ajusta bien.

En este tercer grfico, se ve la influencia de un dato atpico.

Cuando haya un dato atpico, se ve un residuo muy alto.

En este cuarto grfico parece que la recta est ms cerca a los datos cuando x es ms pequeo.

Los residuos son ms pequeos cuando y es pequeo.

En este ltimo caso, se ve el efecto de un punto influyente.

Se ve el efecto del dato influyente.

Vamos a calcular el siguiente Ejemplo: El modelo de regresin para los datos de la pureza del Oxigeno en un experimento es:

y = 74.20+14.97x
En la tabla siguiente se presentan los valores observados y los valores predichos de y para cada valor de x de este conjunto de datos, junto con el residual correspondiente.

Que dato tenemos que calcular?

Y ahora cual otro dato tenemos que calcular?

En la grafica se muestran los valores predichos ^y contra los residuales

En la grafica se muestran los valores predichos x contra los residuales

Resumen Los residuales de un modelo de regresin son:

ei = yi - ^yi
Donde

yi es una observacin real ^yi es el valor ajustado correspondiente con el


modelo de regresin.

El anlisis de los residuales resulta de utilidad para verificar el supuesto de que los errores siguen una distribucin normal aproximada con varianza constante. As como para determinar si seria conveniente incluir trminos adicionales en el modelo. En la estandarizacin de los residuales, estos siguen una distribucin normal, en donde el 95% debern estar incluidos en el intervalo (-2, +2) Los residuales que se aparten considerablemente de este intervalo pueden indicar la presencia de un punto atpico, es decir, una observacin que no es tpica del resto de los datos.

Inferencias acerca de la Pendiente


Uno de los objetivos de la regresin es el decidir si el efecto de la variable independiente es o no significativo para la variable dependiente.

Con todos los ejercicios, podemos inferir que:


El valor de la pendiente indica cuanto aumenta

y por cada unidad que aumenta x

Inferencias acerca de la Pendiente


Una lnea de tendencia representa una tendencia en una serie de datos obtenidos a travs de un largo perodo. Este tipo de lneas puede decirnos si un conjunto de datos en particular (como por ejemplo, el PIB, el precio del petrleo o el valor de las acciones) han aumentado o decrementado en un determinado perodo.

Inferencias acerca de la Pendiente


Se puede dibujar una lnea de tendencia a simple vista fcilmente a partir de un grupo de puntos, pero su posicin y pendiente se calcula de manera ms precisa utilizando tcnicas estadsticas como las regresiones lineales. Las lneas de tendencia son generalmente lneas rectas, aunque algunas variaciones utilizan polinomios de mayor grado dependiendo de la curvatura deseada en la lnea.

El modelo de regresin lineal es aplicado en un gran nmero de campos, desde el mbito cientfico hasta el mbito social, pasando por aplicaciones industriales ya que en multitud de situaciones se encuentran comportamientos lineales. Estos son algunos ejemplos aplicados a diversos campos:

Aplicaciones de la Regresin Lineal


Medicina En medicina, las primeras evidencias relacionando la mortalidad con el fumar tabaco vinieron de estudios que utilizaban la regresin lineal. Los investigadores incluyen una gran cantidad de variables en su anlisis de regresin en un esfuerzo por eliminar factores que pudieran producir correlaciones espurias.

Medicina
En el caso del tabaquismo, los investigadores incluyeron el estado socio-econmico para asegurarse que los efectos de mortalidad por tabaquismo no sean un efecto de su educacin o posicin econmica. No obstante, es imposible incluir todas las variables posibles en un estudio de regresin. En el ejemplo del tabaquismo, un hipottico gen podra aumentar la mortalidad y aumentar la propensin a adquirir enfermedades relacionadas con el consumo de tabaco. Por esta razn, en la actualidad las pruebas controladas aleatorias son consideradas mucho ms confiables que los anlisis de regresin.

La regresin lineal es una tcnica estadstica para modelar e investigar la relacin entre dos o ms variables.

Industria
Tiene aplicacin en la industria para investigar la relacin entre el rendimiento de la produccin y uno o ms factores del (o de los) que depende, como la temperatura, la humedad ambiental, la presin, la cantidad de insumos, etc.; con base en este anlisis se puede pronosticar el comportamiento de una variable que se desea estimar

Qumica

La concentracin de un elemento es uno de los parmetros de mayor importancia en los procesos qumicos aplicados en la industria. Esta cuantificacin se puede obtener mediante un espectrofotmetro, dispositivo que requiere se calibrado. Para ello se elabora una recta de calibracin que se obtiene a partir de la correlacin entre la observancia de un patrn y la concentracin de la sustancia a controlar.

Mecnica
En esta rama se utiliza la Regresin Lineal entre otros para ajustar la recta de Paris , una ecuacin que sirve para estudiar elementos sometidos a fatiga en funcin del nmero de ciclos a los que se somete un material. La bondad del ajuste se comprueba representando el conjunto de valores discretos a-Nm obtenidos experimentalmente, frente a la curva correspondiente a la recta de Paris definida por los valores C y m.

Electricidad En electricidad se puede obtener el valor de una resistencia en un circuito y su error mediante un ajuste de regresin lineal de pares de datos experimentales de voltaje e intensidad obtenidos mediante un voltmetro y un ampermetro. Sensores Calibracin de un sensor de temperatura (termopar) en funcin de la cada de tensin y la temperatura. Se estudia la forma en que vara la temperatura de un lquido al calentarlo. Se calibra el sensor y simultneamente se mide la variacin de temperaturas en un lquido para representar los datos obtenidos posteriormente mediante Regresin Lineal.

Fsica Determinacin del coeficiente de rozamiento esttico de forma experimental a partir de la medicin del ngulo de inclinacin de una rampa. Se realiza un montaje ajustando un circuito para medir el ngulo de inclinacin, y se realizan mediciones variando dicho circuito. Mediante la regresin lineal de los datos obtenidos, se obtiene la ecuacin y el ndice de correlacin a fin de saber el error.

Fabricacin

Dos de los parmetros ms importantes de una soldadura es la intensidad aplicada al hilo y la velocidad de alimentacin del mismo. Mediante tcnicas de regresin lineal se elaboran las rectas que relacionan estos parmetros con la separacin entre el hilo y la zona a soldar.

Diseo de experimentos Con la metodologa 2k es posible mejorar un proceso mediante la realizacin de experimentos, determinando qu variables tienen un efecto significativo. A partir de esas variables se obtiene una recta de regresin que modeliza el efecto. Por ejemplo se podra obtener la relacin entre la temperatura y la presin en un proceso industrial.

Construccin
Mediante tcnicas de regresin lineal se caracterizarn diversas cualidades del hormign. A partir del mdulo de elasticidad es posible predecir la resistencia a la compresin de una determinada composicin de un hormign. Tambin se puede determinar la succin capilar a partir del volumen absorbido por una muestra y el tiempo que ha durado la succin.

Aplicacin de regresin lineal simple en el proceso de pigmentacin de una empresa del sector de la automocin.
En la prctica, con mucha frecuencia es necesario resolver problemas que implican conjuntos de variables, cuando se sabe que existe alguna relacin inherente entre ellas. Por ejemplo, en un caso industrial se puede saber que la pintura para partes automotrices est relacionada con cantidad de pigmentacin con la que se lleva a cabo.

Aplicacin de regresin lineal simple en el proceso de pigmentacin de una empresa del sector de la automocin.
Puede ser interesante desarrollar un mtodo de prediccin, esto es, un procedimiento para estimar el contenido de pigmentacin que deben de tener las pinturas para cumplir con las especificaciones de las armadoras. De tal manera que el problema consiste en lograr la mejor estimacin de la relacin entre las variables.

Del ejemplo citado anteriormente:

Los gramos de pigmentacin son la variable independiente y,


La resolucin de pintura es la respuesta Y El trmino regresin lineal implica Y esta linealmente relacionado con X por la ecuacin de la recta:

Y=b+mX

De acuerdo con las especificaciones dadas, podramos notar son muy justas y cualquier ajuste equivoco de pigmentacin en la pintura ocasionar, material en condiciones no adecuadas, proporcionando indicadores negativos a la empresa como prdida de tiempo, dinero, aumento de scrap as como sus indicadores de PPMS internos y con su cliente. Haciendo una corrida amplia y manipulando el pigmento blanco se toma lecturas de las condiciones de la pintura. Estas son conforme a la Tabla siguiente:

Datos obtenidos de la pintura ajustada con pigmento blanco.

Obteniendo los valores de la pendiente 1 y el valor 0, se tiene que:

La pendiente es: 1 = -0,468


El valor de 0 es: 0 = -25,44567

De tal manera que la formula de la recta para el ejemplo de la pintura es:

Y = -25,445-0,468. X
Y la grfica representativa es:

De esta manera, la funcin de la recta funciona e interacta para generar una ayuda en el mbito industrial y generar un valor probabilstico en beneficio de obtencin de una similitud de operaciones.
Este mtodo ayudara a las empresas a: Reduccin de tiempos en decisiones de procesos Reduccin de inversin de materiales en los procesos Generar un valor mnimo de incertidumbre en los procesos Estandariza procesos.

S-ar putea să vă placă și