Sunteți pe pagina 1din 17

INSTITUTO TECNOLGICO DE PACHUCA

Diagrama de Dispersin
M. en C. Jaime Gonzles Nava.

Olgun Len Crhistian Gabino

Rodrguez Cruz Martn

Pachuca Hgo a 13 de septiembre de 2012

Control Estadstico de Calidad

Diagramas de Dispersin
La manera ms sencilla de definir si existe una relacin causa y efecto entre dos variables es dibujando un diagrama de dispersin. Es una herramienta grfica que permite demostrar la relacin existente entre dos clases de datos y cuantificar la intensidad de dicha relacin. Se utiliza para conocer si efectivamente existe una correlacin entre dos magnitudes o parmetros de un problema y, en caso positivo, de qu tipo es la correlacin. Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posicin en el eje horizontal y el valor de la otra variable determinado por la posicin en el eje vertical. Un diagrama de dispersin se llama tambin grfico de dispersin. Se emplea cuando una variable est bajo el control del experimentador. Si existe un parmetro que se incrementa o disminuye de forma sistemtica por el experimentador, se le denomina parmetro de control o variable independiente (eje x) y habitualmente se representa a lo largo del eje horizontal. La variable medida o dependiente (eje y) usualmente se representa a lo largo del eje vertical.

Control Estadstico de Calidad

La secuencia a seguir para realizar un diagrama de dispersin es la siguiente:

1.- Recoger y ordenar los datos que se cree que tienen una posible correlacin. Los datos son recogidos en una tabla, indicando el nmero de muestras y los valores de las caractersticas que se quiere investigar. Es conveniente que el nmero de mediciones sea de al menos 30. EJEMPLO: Una empresa se plantea cambiar la composicin de uno de sus productos utilizando un nuevo material. Antes de tomar una decisin, la empresa decide realizar un ensayo para estudiar la posible relacin entre la utilizacin de dicho material y el nmero de defectos. Para ello analiza lotes con diferentes porcentajes del nuevo material y toma los siguientes datos:

Control Estadstico de Calidad

2.-Representar grficamente los datos. Dibujar, en un diagrama cartesiano, los ejes vertical y horizontal de la misma longitud. Observar los valores mximo y mnimo de los grupos de datos, para escoger la escala de representacin adecuada a los mismos y evitar as errores de interpretacin. Representar en el diagrama mediante puntos cada par de datos, reflejando los valores de la clase de datos que se considera dependiente (causa) sobre el eje horizontal X y los valores de la clase de datos que se considera independiente (efecto) sobre el eje vertical Y. Si dos o ms pares de datos caen en el mismo punto, dibujar crculos concntricos alrededor del punto individualizado.

EJEMPLO: La figura siguiente muestra la representacin grfica de los datos:

Control Estadstico de Calidad

3.- Una vez construido el diagrama se analiza la forma que tiene la nube de puntos obtenida, para as determinar las relaciones entre los dos tipos de datos. Este anlisis puede efectuarse por tcnicas estadsticas que permitan determinar si existe o no relacin, y el grado de existencia en su caso.

Observamos que existe una clara correlacin entre los datos.

Control Estadstico de Calidad

Cmo se interpreta?
Correlacin positiva: A un crecimiento de X (causa) corresponde un crecimiento de Y (efecto). Controlando la evolucin de los valores de X, quedan controlados los valores de Y, Figura siguiente.

Correlacin positiva dbil: A un crecimiento de X se observa una tendencia a crecer de Y, pero se presume que existen otras causas de dependencia, Figura siguiente.

Control Estadstico de Calidad

Correlacin negativa: A un crecimiento de X se observa una tendencia a disminuir de Y, Figura siguiente.

Correlacin negativa dbil: A un crecimiento de X se observa una tendencia a disminuir de Y, pero se presume que existen otras causas de dependencia, Figura siguiente.

Control Estadstico de Calidad

No existe una correlacin evidente en la Figura siguiente:

Un diagrama de dispersin ofrece una idea bastante aproximada sobre el tipo de relacin existente entre dos variables. Pero adems un diagrama de dispersin tambin puede utilizarse como una forma de cuantificar el grado de relacin lineal existente entre dos variables; basta con observar el grado en el que la nube de puntos se ajusta a la lnea recta.

Regresin lineal
El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin entre variables. En el caso de la regresin lineal simple solo intervienen dos variables Variable X (variable independiente) Variable Y (variable dependiente)

La ecuacin de la regresin es la siguiente:

Para el clculo de b utilizamos:

Control Estadstico de Calidad

Y para calcular a usamos:

Coeficiente de correlacin
El coeficiente de correlacin mide la relacin que hay entre las variables, es decir que tanta relacin o dependencia existe entre ellas.

Se calcula de la siguiente manera:

Para saber como es la correlacin se puede usar el siguiente grafico:

Control Estadstico de Calidad

Caso Prctico
Para poner en prctica el tema de diagrama de dispersin se asisti a la inmobiliaria LPM dedicada a la venta de bienes races. Inmobiliaria LPM se localiza en la avenida Hidalgo nmero 213. En Santiago Tlapacoya Hidalgo. Su principal funcin es la venta de terrenos rsticos cuenta con un total de 8 desarrollos campestres con aproximadamente 400 lotes cada desarrollo ubicados en diferentes partes de Pachuca. Despus de solicitarlo y esperar respuesta se nos otorgaron los precios de venta de una lotificacin ubicada en el ejido de Santiago Tlapacoya. CASO 1.-Los precios de los terrenos ah ubicados varan dependiendo de los metros cuadrados. Nosotros analizamos 16 pares de datos para posteriormente realizar el diagrama de dispersin y as saber si existe buena relacin entre los metros cuadrados y el precio. El precio de venta fue dividido entre 1000 para un mejor manejo de datos

Control Estadstico de Calidad

Precio venta Y 80 85 88 90 94.5 100 100.5 105.3 108 112 122.5 130 138 145 150 173 MEDIA SUMA 113.86 1821.8

m X 60 63 68 70 75 80 86 90 93 100 110 115 120 130 134 150 96.50 1544 186775.5 160344 218199.84 X.Y 4800 5355 5984 6300 7087.5 8000 8643 9477 10044 11200 13475 14950 16560 18850 20100 25950 X 3600 3969 4624 4900 5625 6400 7396 8100 8649 10000 12100 13225 14400 16900 17956 22500 Y 6400 7225 7744 8100 8930.25 10000 10100.25 11088.09 11664 12544 15006.25 16900 19044 21025 22500 29929

El diagrama de dispersin que se muestra a continuacin:


180 160 140 120 100 80 60 40 20 0 0 50 100 150 200 Series1 Linear (Series1)

10

Control Estadstico de Calidad

Podemos observar que existe una correlacin positiva entre las variables, es decir el precio depende de los metros cuadrados y mientras ms metros cuadrados tenga el terreno mayor ser su costo.

En este caso apreciamos que sus precios son adecuados en base a la superficie que se vende al cliente. Lo cual habla muy bien de la inmobiliaria.

Podemos usar una regresin lineal para saber la ecuacin que nos proporcione el precio de algn terreno en cualquier momento, con el hecho de saber solamente los metros cuadrados del terreno a vender.

0.96684878

20.5615924

Como un extra se propone a la inmobiliaria que cuando deseen saber el precio de algn lote se sustituya a X por la cantidad de los metros cuadrados de la siguiente ecuacin:

11

Control Estadstico de Calidad

Entonces por ejemplo si se desea saber cul es el precio de un lote de 160 m, se debe hacer lo siguiente:

175.25 (1000)= 175 250

El precio del terreno sera entonces de $175 250.

El coeficiente de correlacin lo calculamos:

0.992678071

El coeficiente de correlacin es de 0.992678071 es decir es de 99.26%. Por lo que concluimos que la correlacin cae entre muy buena y excelente.

12

Control Estadstico de Calidad

CASO 2.- En la elaboracin de sta investigacin nos percatamos que los lotes que se encuentran en la glorieta principal de la lotificacin son ms caros debido a su gran accesibilidad y el poder instalar algn negocio comercial. Los lotes que se encuentran en la glorieta tambin varan dependiendo de los metros cuadrados que tengan. As que decidimos analizar la relacin del precio en base a los metros del terreno para saber si hay buena correlacin o no. Los metros y precio de dichos terrenos se muestran a continuacin. El precio de venta fue dividido entre 1000 para un mejor manejo de datos.

13

Control Estadstico de Calidad

Precio venta Y 110 115 120 128.5 136 142.6 160 174.5 174.7 181 MEDIA= SUMA= 144.23 1442.3

m X 103 105 107 110 125 130 155 170 170 184 135.9 1359 203386 193389 214399.35 X.Y 11330 12075 12840 14135 17000 18538 24800 29665 29699 33304 X 10609 11025 11449 12100 15625 16900 24025 28900 28900 33856 Y 12100 13225 14400 16512.25 18496 20334.76 25600 30450.25 30520.09 32761

El diagrama de dispersin que se muestra a continuacin:

200 180 160 140 120 100 80 60 40 20 0 50 100 150 200 Series1 Linear (Series1)

Podemos observar que existe una correlacin positiva entre las variables, es decir el precio depende de los metros cuadrados y mientras ms metros cuadrados tenga el terreno mayor ser su costo.
14

Control Estadstico de Calidad

1.079478956

-2.471190152

La ecuacin queda de la siguiente manera:

Y=-2.47119015 + 1.07947896X
Entonces por ejemplo si se desea saber cul es el precio de un lote de 250 m en la zona de la glorieta, se debe hacer lo siguiente:

Y=-2.47119015 + 1.07947896 (250)

267.3985

267.3985 (1000)= 267398.5

El precio del terreno sera entonces de $267,398.5

15

Control Estadstico de Calidad

El coeficiente de correlacin lo calculamos:

0.993276132

El coeficiente de correlacin es de 0.993276132 es decir es de 99.32%. Por lo que concluimos que la correlacin cae entre muy buena y excelente.

16

S-ar putea să vă placă și