Documente Academic
Documente Profesional
Documente Cultură
Materia
Probabilidad y Estadistica
Profesor
Tonatiuh Sosme Sanchez
Tema
Regresión y Correlación
Alumnos
Miguel Isidro Martínez Maciel
Grupo
202-A
Carrera
Ing. Electromecánica
Índice
5.1 Control de calidad. 3, 9
determinación. 16
correlación. 21
Bibliografía. 23
INTRODUCCION
* Mejoramiento de procesos
Las 7 herramientas
Definición
Las hojas de control o también llamadas hojas de registro o recogida de datos son
formas estructuradas que facilitan la recopilación de información, previamente
Objetivos principales
* Organizar automáticamente los datos de manera que puedan usarse con facilidad
más adelante.
HISTOGRAMA
Definición
1. Determinar el rango de los datos. Rango es igual al dato mayor menos el dato
menor.
2. Obtener todos los números de clases, existen varios criterios para determinar el
número de clases (o barras). Por ejemplo, la regla de Sturgess. Sin embargo, ninguno
de ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cómo estén los datos y cuántos sean. Un criterio usado
frecuentemente es que el número de clases debe ser aproximadamente a la raíz
cuadrada del número de datos. Por ejemplo, la raíz cuadrada de 30 (número de
artículos) es mayor que cinco, por lo que se seleccionan seis clases.
4. Construir los intervalos de clases: Los intervalos resultan de dividir el rango de los
datos en relación al resultado del PASO 2 en intervalos iguales.
DIAGRAMA DE PARETO
Definición
"El 80% de los problemas se pueden solucionar, si se eliminan el 20% de las causas
que los originan".
En otras palabras: un 20% de los errores vitales, causan el 80% de los problemas, o lo
que es lo mismo: en el origen de un problema, siempre se encuentran un 20% de
causas vitales y un 80% de triviales. Es por lo enunciado en los párrafos anteriores que
al Diagrama de Pareto también se le conoce también como regla 80 - 20 o también por"
muchos triviales y pocos vitales" o por la curva C-A-B.
Usos
11. Dar un título al gráfico, agregar las fechas de cuando los datos fueron reunidos y
citar la fuente de los datos.
Definición
Características
* Impacto visual: Muestra las interrelaciones entre un efecto y sus posibles causas
de forma ordenada, clara, precisa y de un solo golpe de vista.
Para crear y organizar las espinas de un diagrama, hay que considerar lo siguiente:
ESTRATIFICACIÓN
Definición
* Personal
* Materiales
* Maquinaria y equipo
* Áreas de gestión
* Tiempo
* Entorno
* Localización geográfica
* Otros
Características
GRAFICA DE CONTROL
Definición
La lectura se hace en base al tipo de relación entre los datos; lo fuerte o débil de la
relación, la forma de la relación y la posible presencia de punto anómalos.
La relación entre los datos se denomina “correlación positiva” cuando a un aumento en
el valor de la variable X le acompaña un aumento en la otra variable.
El caso inverso da lugar a la llamada “correlación negativa”.
Pero se ganará conocimiento de este último al estudiar las causas por las que se
presentaron los puntos.
El valor del Coeficiente de Correlación lineal de Pearson (r) proporciona una medida del
grado de relación entre dos variables y se calcula mediante la expresión:
Dónde:
Si sabemos que existe una relación entre una variable denominada dependiente y otras
denominadas independientes (como por ejemplo las existentes entre: la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la producción agraria y la cantidad de fertilizantes utilizados, etc.), puede
darse el problema de que la dependiente asuma múltiples valores para una
combinación de valores de las independientes.
ASPECTOS TEÓRICOS
La Regresión y la correlación son dos técnicas estadísticas que se pueden utilizar para
solucionar problemas comunes en los negocios.
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
X es la variable independiente.
La ecuación de Regresión Lineal estimada para las variables estatura y peso muestran,
de acuerdo a la prueba F, relación.
Esta relación se ha estimado en un R = 93.7, que indica una fuerte relación positiva.
La relación entre dos super variables cuantitativas queda representada mediante la línea de
mejor ajuste, trazada a partir de la nube de puntos. Los principales componentes elementales
de una línea de ajuste y, por lo tanto, de una correlación, son la fuerza, el sentido y la forma:
Interpretación geométrica
e .
El coseno del ángulo alfa entre estos vectores es dada por la fórmula siguiente:
Más generalmente: .
Si las dos variables aleatorias que trata de relacionarse proceden de una distribución
gaussiana bivariante entonces el coeficiente de correlación r sigue una distribución de
probabilidad dada por:
donde:
es la distribución gamma
es la función gaussiana hipergeométrica.
for
Aunque, la solucón:
, i.e.
No obstante, puede que exista una relación que no sea lineal, sino exponencial,
parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal la
intensidad de la relación las variables, por lo que convendría utilizar otro tipo de
coeficiente más apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo mejor es
representar los pares de valores en un gráfico y ver que forma describen.
Si “r” > 0, la correlación lineal es positiva (si sube el valor de una variable sube el de la
otra). La correlación es tanto más fuerte cuanto más se aproxime a 1. Por ejemplo:
altura y peso: los alumnos más altos suelen pesar más. Si “r” < 0, la correlación lineal
es negativa (si sube el valor de una variable disminuye el de la otra). La correlación
negativa es tanto más fuerte cuanto más se aproxime a −1.
Por ejemplo: peso y velocidad: los alumnos más gordos suelen correr menos. Si “r” = 0,
no existe correlación lineal entre las variables. Aunque podría existir otro tipo de
correlación (parabólica, exponencial, etc.) De todos modos, aunque el valor de “r” fuera
próximo a 1 o −1, tampoco esto quiere decir obligatoriamente que existe una relación
de causa-efecto entre las dos variables, ya que este resultado podría haberse debido al
puro azar.
La función de densidad de una variable n-dimensional normal X=(X1, X2, ..., Xn) de
parámetros m y S es
con
con y .
Propiedades:
X=AZ+m
parámetros y .
Sea X=(X1,...,Xn) una variable aleatoria con distribución normal n-dimensional
Nn(m,S). Sus n variables componentes X1, X2,..,Xn son independientes si, y
sólo si, están incorrelacionadas.
Sea X=(X1,...,Xn) una variable aleatoria con distribución normal n-dimensional
Normal bidimensional:
Así bien, la función de densidad de una variable aleatoria (X,Y) normal bidimensional
es
Propiedades:
bidimensional , donde
Tras
calcular los intervalos de confianza con el valor z debemos volver a realizar el proceso
inverso para calcular los intervalos del coeficiente r
Puede calcularse en cualquier grupo de datos, sin embargo la validez del test de
hipótesis sobre la correlación entre las variables requiere en sentido estricto:
que las dos variables procedan de una muestra aleatoria de individuos.
que al menos una de las variables tenga una distribución normal en la población
de la cual la muestra procede.
(2da edición ). Administración por calidad . En S. Pulido, Administración por calidad . México
D.F : UMUSA .
http://www2.eco.uva.es/estadmed/probvar/d_multivar/dnvar7.htm