Sunteți pe pagina 1din 19

Control Estadisticos de calidad

Introduccin. Distribucin de frecuencias. Nmero de intervalos. Mtodos cuantitativos de resumen de datos, la media, la moda, la mediana. Medidas de dispersin o de variabilidad, rango, desviacin estndar muestral y de la poblacin. Relacin entre Xm y S. Limites. Histograma y tabla de frecuencia. Tipos, limitaciones y forma de histogramas. Distribuciones estadsticas ms frecuentes, binomial, de Poisson, exponencial, normal. Concepto de muestreo. Poblacin. Muestra estadstica. Usos, ventajas y limitaciones del muestreo. Clases de muestreo. Distribucin del muestreo. Consideraciones acerca del tamao de la muestra. Teorema del lmite central. Muestreo de aceptacin. Ventajas y desventajas del muestreo de aceptacin. Tipos de planes de muestreo. Estimacin puntual y por intervalos. Prueba de hiptesis. Hiptesis nula y alternativa. Errores y Tipos. Pasos para diseo y anlisis de una prueba de hiptesis. Pruebas estadsticas. Tamao de las muestras en las pruebas estadsticas. Tipos de planes de muestreo. Pruebas de hiptesis. Chi Cuadrado. Prueba Z. Prueba t.

Introduccin. La competitividad de una empresa cualquiera est relacionada con su buen desempeo y a su vez, el buen desempeo, est vinculado con la calidad del producto o bien que elabora, el precio y la calidad del servicio que ofrece. Ahora bien, cmo podemos conocer el desempeo, la marcha de una organizacin?, las mediciones son un medio para conocer como marcha una organizacin, ya que permite transformar la ideas en actividades. En la bsqueda de conocer y mejorar la competitividad de una empresa, es necesario cuantificar el funcionamiento de los procesos y sus resultados. Se dice que medir es comprender, comprender es conocer y conocer es poder, es decir, podemos observar, medir, analizar, y utilizar la informacin obtenida para generar cambios, por ejemplo, la vida se mide en aos, das, horas, el mdico cuantifican la presin sangunea, la frecuencia cardiaca, los profesores califican el desempeo del aprendizaje, etc. Las organizaciones tambin miden su desempeo. A continuacin, veremos las principales tcnicas y herramientas con las cuales las organizaciones miden y analizan el desempeo de sus procesos, la manera de monitorear ese desempeo y las medidas de rendimiento. Distribucin de frecuencias. Se llama frecuencia, al nmero de datos que estn en un intervalo determinado. La frecuencia puede ser simple absoluta, que es la ms conocida y es el nmero de veces que un mismo dato est en un intervalo, por ejemplo, 35 alumnos cuya altura est comprendida entre 1.70 y 175 mts. o simple relativa cuando est referida al valor porcentual, por ejemplo, en el caso anterior, si existen 100 alumnos, tendramos 0.35 %. La frecuencia de un intervalo ser acumulada absoluta, cuando es la suma de todas las frecuencias de los intervalos anteriores y acumulada relativa cuando es la suma de las frecuencias relativas. Nmero de intervalos. En funcin de las caractersticas de los datos, se fija el nmero de intervalos de clases o la amplitud de los intervalos. Se sugiere que el nmero de intervalos debe estar comprendido entre 5 y 20, que su nmero sea impar. N de datos. menos de 50 50 a 100 100 a 250 ms de 250 N de intervalos 5 a 7 6 a 10 7 10 a 20 a 12

Mtodos cuantitativos de resumen de datos. Con las mediciones de unas caractersticas de calidad, el primer aspecto que generalmente se investiga para determinar si el proceso cumple con las especificaciones fijadas, es conocer la tendencia central de los datos, determinar si el proceso est centrado, es decir, conocer si la tendencia central de las variables de salida es igual o muy prxima al valor nominal predeterminado. Los datos se

pueden analizar calculando un valor de la tendencia central, para indicar donde se centra la mayora de ellos y un valor de dispersin, para indicar el grado de variacin de los mismos. Generalmente, estas medidas dan un resumen preliminar adecuado. Medida fundamental de la tendencia central. (la media). La tendencia central es el valor al que tienden a concentrarse los datos de una muestra o de un proceso. Cuando efectuamos mediciones relacionadas con calidad, el primer aspecto que investigamos es si el proceso o actividad cumple con el valor deseado o especificado, para lo cual buscamos cual es la tendencia central de los datos obtenidos, es decir, averiguamos si la tendencia central de los datos de salida, son iguales o muy prximos al valor nominal especificado. Para calcular la media aplicamos: Media = Sumatoria de observaciones individuales / nmero de observaciones. X m = Xi / N Donde Xm = media de la muestra. Xi = observaciones individuales. N = nmero de observaciones Otras frmulas para calcular medias aritmticas son: - Cuando se agrupan los valores individuales: Xm = ( X * f) / N Donde f = frecuencia de ocurrencia de cada valor individual.

N = nmero de observaciones. Cuando los datos se agrupan en intervalos de clases: Xm = ( Xi * f) / N Donde f = frecuencia de cada intervalo, i Xi = punto medio del intervalo. Si para calcular la media se utilizan todos los elementos de la poblacin, es decir, el universo sobre el cual se quiere tomar decisiones, por ejemplo, el grosor de todos los tornillos producidos en la ltima semana o mes, entonces el promedio calculado es la media del proceso o media poblacional, que se denota con la letra . Conviene aclarar que la media es igual a cierto valor, que casi nunca se conoce de manera exacta. El valor de Xm se conoce para cada muestra, pero difiere de muestra a muestra, por tanto es diferente a Xm. En general, lo que se puede deducir de los estadsticos muestrales es vlido para la muestra y si la muestra es representativa, tambin tendr cierto grado de aproximacin para todo el proceso. Una forma tpica de estimar , es tomar por lo menos 20 30 muestras de entre 5 a 10 piezas cada una, durante un lapso de 2 o ms das, calcular la media de cada muestra y con estas calcular la media de las medias maestrales. Por ejemplo, si de un grupo de piezas resulta que Xm = 1.179, eso significa que el promedio de los datos es 1.179. No quiere decir que todos o la mayora de los datos tengan un grosor de 1.179. Como el valor medio es 1.20, el valor obtenido lo que nos indica es si el proceso esta descentrado o no. Otras medidas de la tendencia central de los datos son: Moda. Es el dato al que le corresponde la frecuencia mayor, el dato que ocurre ms nmero de veces. Si los datos estn agrupados en clases se toma el punto medio del intervalo de clase que tiene la mayor frecuencia, por ejemplo, entre 2,3,3,3,4,5, la moda es 3.. Mediana. Es el dato que ocupa la posicin central de toda la serie de datos, una vez que estos han sido ordenados de menor a mayor. Si el nmero de datos es impar, la mediana es el valor medio. Ejemplo. 3,4,6,9,20, la mediana es 6. Si el nmero es par, la mediana ser el promedio de los valores centrales. Ejemplo. 1,5,8,10,12,18, la mediana ser 8+10 / 2 = 9

Medidas de dispersin o de variabilidad. Las medidas de tendencia central antes vistas, son insuficientes como criterio de calidad, por ejemplo, si las especificaciones de calidad de un producto sealan que las dimensiones deben ser 800 5 y en una muestra encontramos que la media es 801, la mediana 801 y la moda 800, podramos pensar que se cumplen las especificaciones , pero esto no es necesariamente cierto pues podran haber datos entre 750 y 850 y el rango de variacin sea entre 797 y 803, con lo cual se cumpliran las especificaciones. Por tanto, es necesario conocer cuan dispersos estn los datos. Para evaluar la capacidad de un proceso para cumplir especificaciones, es necesario medir la variabilidad de la caracterstica de calidad que estamos estudiando y luego compararla con la variacin que toleran las especificaciones correspondientes. Para esto, se usan los siguientes estadsticos: Rango, recorrido o amplitud. Corrientemente se emplean dos medidas de dispersin. Cuando la cantidad de datos es pequea: 6 o menos observaciones, el recorrido o rango es una medida til de dispersin. El recorrido es la diferencia entre el valor mximo y el valor mnimo en los datos. Como el recorrido se basa solo en dos valores, no es muy til cuando el nmero de observaciones es grande, porque se desaprovecha la informacin. Rango = Valor mximo Valor Mnimo Desviacin estndar muestral ( S ). Es la medida de dispersin ms usual y mide el grado de dispersin de un conjunto de datos respecto a su media. Se calcula mediante la frmula: S = (X Xm) / (N 1) = varianza muestral S = desviacin estndar muestral. Cuando uno o mas valores extremos estn lejos del resto de datos, se desechan estos valores para el clculo pero no para la grfica. Cuando el nmero de observaciones es superior a 30, se usa N, en vez de N-1 Existen otras frmulas para calcular la desviacin estndar. Cuando los valores individuales o los intervalos de clase estn agrupados, se usa: S = individuales. S = (f * X / N) - Xm Desviacin estndar del proceso o poblacin. (). Si calculamos la desviacin estndar con todos los elementos de la poblacin o del proceso, la desviacin es poblacional y se deferencia utilizando la letra . = (Xm ) / N = varianza poblacional . = desviacin estndar muestral. Coeficiente de variacin. Es una medida de dispersin relativa que permite comparar la variabilidad entre series. de datos. Viene expresada por la relacin existente entre una medida de dispersin absoluta y una medida de tendencia central. Esta medida es independiente de las unidades en que se expresen los datos. CV = ( / Xm) * 100 % Se considera que el promedio aritmtico Xm es representativo de un conjunto de datos cuando el coeficiente de variacin es menor de 10. Este es un valor referencial que depende de la naturaleza del proceso. Relacin entre Xm y S (X Xm) * f / (N 1)

Cuando el nmero de observaciones N es mayor de 30, se puede utilizar la siguiente frmula abreviada aplicada a datos

Una manera prctica de apreciar el significado de la desviacin estndar como medida de dispersin respecto a la media, es a travs de la llamada Desigualdad de Chebyshev, que seala que entre Xm2S y Xm+2S estn por lo menos el 75% de los datos de la muestrea y que entre Xm -3S y Xm - 3S estn por lo menos el 89%. Empricamente se han obtenido las siguientes relaciones: Entre Xm S y Xm + S, est el 68 % de los datos. Entre Xm 2S y Xm + 2S est el 95 %. Entre Xm - 3S y Xm + 3S est el 99.7 % Limites reales o naturales. Los limites reales o naturales de un proceso indican los puntos en donde varia la salida de un proceso. En sentido general se pueden estimar de la siguiente manera: Limite real superior (LRS ) = + 3 Limite real inferior ( LRI ) = -3 Estos lmites estn calculados segn las propiedades de la distribucin normal e indican la amplitud real de la variacin de salida del proceso. Para estudiar la capacidad de un proceso, se comparan estos limites con las especificaciones que fijamos para la caracterstica de calidad y se determina que si los limites caen dentro de las especificaciones. Si esto sucede, decimos que el proceso es capaz. Estimacin de los parmetros y . Para evaluar la capacidad de un proceso se requiere por lo menos conocer su media y la desviacin estndar. Cuando no conocemos estos parmetros, en proceso de alto volumen de produccin, podemos realizar lo siguiente: 1. 2. 3. 4. Tomamos en un periodo de tiempo ms o menos igual, media hora, de 20 a 30 muestras, de 5 a 10 datos, durante un periodo de 2 das. A cada muestra se le calcula la media y el rango muestral. Se calculan la media de las media y la media de los rangos. Los parmetros sern: = Xm d2 depende del tamao de la muestra. Para un tamao de 2, 3, 4, d2 = 1.128 d2 = 1.693 d2 = 2.059 = Rm / d2

Histograma y tabla de frecuencia. Un histograma es un grfico que permite visualizar la tendencia central, la dispersin y la forma de la distribucin de un conjunto de datos. Una tabla de frecuencias es un grfico que permite analizar la distribucin de los datos clasificndolos segn su magnitud. Se divide el rango de variacin en cierta cantidad de intervalos y despus se cuentan los datos que estn en cada intervalo. Son dos representaciones grficas de la distribucin de frecuencias. Un histograma es una serie de rectngulos que tienen: a) b) sus bases en el eje horizontal con longitud igual al tamao de los intervalos de clase. sus alturas proporcionales a las frecuencias de clase.

Un polgono de frecuencia es un grfico de lnea trazado sobre los puntos determinados por los puntos medios de cada intervalo de clase (la marca de clase) y su respectiva frecuencia. Se puede obtener uniendo los puntos medios de los techos de los rectngulos en el histograma. El polgono de frecuencia acumulado es llamado comnmente Ojiva.

Interpretacin del histograma 1. 2. 3. 4. Observar la tendencia central, las barras con ms frecuencias. Estudiar el centrado del proceso, observar la posicin central del histograma respecto a la calidad ptima y a las Examinar la variabilidad del proceso, comparando la amplitud de las especificaciones con el ancho del histograma. El Analizar la forma del histograma , en general podemos encontrar las siguientes formas tpicas de distribucin: sesgada,

especificaciones. ancho del histograma debe caber en forma holgada en las especificaciones. multimodal, plana y con acantilados. Tipos de histogramas. 4.1 Campana. Es la forma ms esperada (curva de distribucin normal). Cualquier desviacin debe ser investigada. 4.2 Doble Pico. Casi con seguridad representa dos procesos distintos funcionando al mismo tiempo. 4.3 Sesgada. Presenta una cola ms alargada que la otra. Si es hacia la derecha, se dice que el sesgo es positivo. Si es hacia la izquierda se dice que es negativo. Normalmente se presenta cuando existen lmites de orden prctico o especificaciones que se encuentran cerca del valor nominal. 4.4 Truncada. Son las distribuciones normales a las cuales se les ha eliminado una parte de la misma por medio de algn elemento externo al proceso (filtraje selectivo de datos). 4.5 Meseta. Es muy probable que sea el resultado de varias distribuciones normales pero con sus centros repartidos a lo largo del rango de la data. Debe revisarse el diagrama de flujo del proceso para identificar los diferentes procesos presentes. 4.6 Pas de Peine. Implica errores de medicin, recoleccin de la data, forma de agrupacin, aproximaciones. Puede conducir a una distribucin en meseta. 4.7 Pico aislado. Sugiere la existencia de dos procesos bien diferenciados en su funcionamiento. El segundo pico indica ms bien una anomala o algo que no ocurre frecuentemente de manera regular. 4.8 Pico Marginal. Suele ocurrir cuando lo que seria una cola alargada y suavemente normal se recorta y se agrupa en una sola categora al final de la data. 5. Datos raros. Las mediciones extremas o raras se identifican en el histograma. Un dato raro indica una situacin especial que debe investigarse y puede sealar, que el dato es incorrecto ya sea por medicin o registro equivocado, que el dato no pertenece al proceso en estudio, puede ser un evento raro o especial. 6. problemtico Limitaciones del histograma. Las principales limitaciones de los histogramas son las siguientes: 1. 2. 3. No considera el tiempo, por la cual es difcil detectar tendencias a travs del tiempo. Para esto se utilizan las grficas de control. No permite comparar varios procesos o grupos de datos. La cantidad de clases influye en la forma del histograma. Estratificar. Puede suceder que el histograma no tenga una forma particular, pero exista mucha variacin por o cual la capacidad del proceso baja. En estos caso es conveniente analizar por estratos y as ser posible encontrar la maquina o el proveedor

Forma del histogramas. La medida que nos indica la asimetra o no del conjunto de datos se llama sesgo. La medida que nos indica lo elevado o plano de la curva de distribucin de los datos se llama curtosis. Distribucin de probabilidades. Una distribucin de probabilidades de una variable es una distribucin del conjunto de valores posibles de esa variable con la probabilidad asociada a cada uno de los valores. Por ejemplo, la variable Xm dada por el estadstico muestral, al conocer su distribucin de probabilidades podemos conocer cuales son los valores de X y cuales son los ms probables. De esta manera la distribucin de probabilidades permite conocer mejor lo aleatorio, describe los posibles valores de un estadstico muestral, con lo cual al realizar una

observacin se puede confirmar o rechazar supuestos (prueba de hiptesis) o tener una ida de las caractersticas particulares de una poblacin, incluso estimar que posibles valores tiene algn parmetro de la poblacin. Las distribuciones de probabilidades que mas se usan para determinar intervalos de confianza y probar hiptesis son la distribucin binomial o de Bernoulli, exponencial, de Poisson, normal, la T de Student, Chi-cuadrado y la F. La distribucin normal y la t de Student son simtricas centradas en cero, mientras que las distribuciones Chi-cuadrado y F son sesgadas y toman valores positivos, pero las cuatro estn relacionadas entre si en trminos de la distribucin normal. Los parmetros que definen complementariamente las distribuciones T de Student, Chi- cuadrado y F, son los grados de libertad que tienen que ver con los tamaos maestrales involucrados. Cuando el tamao de la muestra crece la distribucin T de Student tiende a la distribucin normal Distribuciones estadsticas ms frecuentes. 1. Distribucin binomial. Es frecuente que en control de calidad se produzcan variables del tipo pasa o no pasa, una pieza resiste o no determinada fuerza, la lmpara prende o no. Cuando el resultado de cada ensayo, es xito o fracaso, se conoce como experimento Bernoulli. Si p es la probabilidad de ocurrencia de un suceso en un solo ensayo y q = 1 p es la probabilidad de que no ocurra en un solo ensayo, la probabilidad de que el suceso se presente exactamente x veces en n ensayos viene dada por: P(x) = n / x ( n x ) * ( p x. q nx ) donde x = 0,1,2,3,, n y n= n (n-1)(n-2)..1.

Esta Distribucin se llama binomial o de Bernoulli. Una poblacin se dice que sigue una distribucin binomial, cuando existen dos categoras de eventos que son mutuamente excluyentes, por lo que, todos los eventos que constituyen la poblacin caen dentro de las dos categora y no existe evento alguno que no caiga dentro de esta clasificacin dual. Las propiedades ms importantes de esta distribucin son: Media. = np Varianza. = npq. Desviacin Tpica. 2. Distribucin de Poisson. Es frecuente en control de calidad evaluar varias variables tales como: nmero de defectos por artculos, nmero de defectos por metros cuadrados de tela, nmero de impurezas en un lquido, nmero de errores cometidos por un trabajador, en fin, nmero de eventos que ocurren por unidad. Este tipo de variable sigue una distribucin de Poisson. Cuando en una Distribucin binomial, n es un nmero muy grande y la probabilidad p de ocurrencia del suceso est cerca de cero, de manera que q = 1 - p est cerca de 1, es til usar como aproximacin a la binomial, a la distribucin discreta de Poisson. p( x) = * e / x donde e = 2,71828 X= 0,1,2, = constante

x= nmero de ocurrencias del evento p (x) = probabilidad que ocurra x Algunas propiedades de la Distribucin de Poisson son: media . = varianza = desviacin estndar.. la distribucin binomial se aproxima a la Poisson, cuando n es mayor de 50. 3. Distribucin exponencial. Cuando una poblacin est exponencialmente distribuida, el 36,8 % de los valores ser superior a la media y el 63,2 % inferior. Esto contrasta con la idea que la media es siempre el 50 %.

La distribucin exponencial es til para describir la distribucin de los tiempos entre fallas en los equipos. Est completamente definida cuando se conoce su media aritmtica, ya que su desviacin estndar es igual a ese valor medio. Solamente el 5 % de los valores superan a la media mas de dos veces la desviacin estndar y el 13,5 % de los valores superan a la media ms una desviacin. 4. Distribucin normal. La distribucin normal o De Gauss presenta las siguientes caractersticas: - El 68 % del rea est comprendida en el intervalo - El 95 % del rea est comprendida en el intervalo =1 = 2

- El 99, 7% del rea est comprendida en el intervalo = 3 En aquellas distribuciones que se aproximan a una curva normal, alrededor de dos tercios de los sucesos caen dentro del intervalo de una desviacin estndar a ambos lados de la media, todos excepto casi un 5% caen en un intervalo de dos desviaciones estndar y prcticamente todos estn comprendidos en un intervalo de tres desviaciones estndar. La normalizacin o ajuste de una distribucin observada a una distribucin normal, se realiza de la siguiente manera: Se agrupan los datos en una distribucin de frecuencias y se determinan los puntos medios de cada clase. Se calcula la media y la desviacin tpica de la distribucin. Se calculan los desvos reducidos de cada clase, a travs de la frmula: Z = X Xm / - Se busca en la tabla de las ordenadas el valor correspondiente (y) para cada valor reducido. - Se obtiene las frecuencias tericas (ft), multiplicando cada ordenada (y) por el valor que resulta de la relacin: Rel. = f / * Ax0 La distribucin binomial se aproxima a la normal, cuando n es grande y ni p, ni q estn prximas a cero. En la prctica la aproximacin se considera muy buena si ambos np y nq son superiores a cinco. np > 5 nq > 5 Si una variable aleatoria X se distribuye en forma normal con media y desviacin estndar y se quiere encontrar la probabilidad de que esta variable tome valores entre dos nmeros, a y b, lo que se hace es calcular el rea bajo la curva entre a y b, lo cual se hace por mtodos numricos, ya que la integral de la funcin de distribucin no tiene solucin analtica. Cuando en una distribucin normal = 0 y = 1, entonces a la distribucin se le conoce como distribucin normal estndar. Conceptos de muestro. Los problemas ms frecuentes que se presentan en la prctica cuando se investiga las caractersticas de un proceso son: imposibilidad de realizar el examen de todos los resultados del proceso o de investigar cada una de las causas que originan a cada uno de los resultados. En estos casos, resulta ms conveniente por razones de tiempo y eficiencia, analizar un nmero determinado de resultados y suponer que se puede ver en ellos con cierto grado de confianza, lo que se quiere conocer acerca del proceso de donde provienen. Estos aspectos lo estudia la Inferencia estadstica o Estadstica inductiva, la cual tiene como objetivo hacer afirmaciones validas acerca de la poblacin o proceso con base en la informacin contenida en una muestra. Estas afirmaciones sirven para ayudar a la toma de decisiones para mejorar el desempeo de los procesos. La teora de muestras, estudia la relacin existente entre una poblacin estadstica y una o ms muestras extradas de esa poblacin, con el objeto de inducir o inferir las caractersticas de la poblacin total, partiendo de las obtenidas de las muestras procedentes de la misma. El establecimiento de una inferencia estadstica se basa en teoremas del clculo de probabilidades y cualquier induccin se expresa solamente en trminos de probabilidades. Poblacin. En Estadstica tiene una acepcin ms amplia y diferente de lo comn. Se entiende por poblacin a un conjunto finito o infinito de personas, casos, resultados, o elementos que presentan caractersticas comunes. Algunos establecen una diferencia ente universo y poblacin estadstica, definiendo el primer trmino como un conjunto de elementos y al segundo como una serie de nmeros que miden o cuentan ciertas caractersticas de los mismos.

Una poblacin estadstica segn el nmero de elementos (resultados, casos, etc) que lo constituyen puede ser clasificada en dos tipos: poblacin finita o poblacin infinita. Cuando el nmero de elementos que integran una poblacin es muy grande se puede considerar a esta como una poblacin infinita. Una poblacin finita es aquella que est constituida por un nmero limitado de elementos. Muestra estadstica. La muestra estadstica es una parte de la poblacin, es decir, un nmero seleccionado cientficamente que pertenecen a una poblacin. El objetivo de extraer una muestra es obtener a partir del estudio de sus elementos, las propiedades de la poblacin, es decir, obtener estimaciones de valores de la poblacin a partir de las medidas obtenidas de la muestra. Para lograr esto, la muestra debe ser representativa de la poblacin de la que forma parte y debe ser aleatoria, lo cual se refiere ms a la manera de seleccionar los elementos de la muestra que a la muestra en particular. Generalmente se considera que la muestra mas eficiente es la que proporciona mayor informacin til por el menor costo. La muestra debe ser bastante reducida para evitar gastos innecesarios y bastante amplios para que el error de muestreo sea admisible. Usos, ventajas y limitaciones del muestreo. El uso del muestreo es aconsejable en los siguientes casos: Cuando la poblacin sea infinita o tan grande que resulte imprctico o costoso el estudio completo de cada uno de sus elementos. Cuando la poblacin es homognea. Cuando el proceso de medidas o investigacin de las caractersticas de cada elemento resulte destructivo. Economa de tiempo y dinero. Mejor entrenamiento, formacin y control del personal que participa en la investigacin. Mayor rapidez en el procesamiento y anlisis de los datos. Menor demanda de recursos. Mayor confiabilidad y precisin de los datos obtenidos. Creencia que todos los elementos de la poblacin ofrecen un margen ms slido y eficiente de exactitud que los resultados con base a muestras. El muestreo no permite hacer clculos, proyecciones o tabulaciones con respecto a sectores pequeos de una poblacin. El clculo de los resultados est sujeto a los errores del muestreo en si, adems de los errores que pueden contener los datos. Clases de muestreo. Existe el muestro sin normas, errtico o circunstancial, el cual consiste en tomar la muestra de cualquier manera, a la aventura, por razones de comodidad o capricho. Si la poblacin es homognea, la representatividad de tal muestra puede ser representativa. En el muestreo al azar, o probabilstica, puede calcularse con anterioridad, cual es la probabilidad de obtener cada una de las muestras que sea posible seleccionar y la probabilidad de elegir un elemento es independiente de las caractersticas de la poblacin, permaneciendo constante, de una a otra eleccin, la probabilidad de obtener un nmero especifico. Hay diferentes clases de muestreo probabilstica, entre ellas tenemos, no todos: * Muestreo aleatorio con reemplazamiento, todos los elementos de las poblacin tiene la misma probabilidad de ser seleccionados. Tericamente coincide con el muestro de poblaciones infinitas. * Muestro aleatorio sin reemplazo. Si la poblacin es infinita todos los elementos tiene la misma probabilidad de ser extrados. Si la poblacin es finita, la probabilidad de que salga un elemento depender de los que fueron separados anteriormente para formas parte de la muestra y dejaron por lo tanto de pertenece a los seleccionables. * Muestreo estratificado. En este tipo de muestreo se divide la poblacin en estratos, dentro de los cuales se hace una seleccin aleatoria simple como en los casos anteriores. El reparto de la muestra entre los diferentes estratos puede consistir en: - repartir por igual la muestra entre todos los estratos - distribuir la muestra proporcionalmente al nmero de elementos de cada estrato.

Las ventajas del uso del muestreo, entre otras, son las siguientes:

Las limitaciones ms importantes son:

- hacer el reparto proporcionalmente al nmero de elementos y a la desviacin estndar de cada estrato, teniendo en cuenta de este modo la variabilidad o falta de homogeneidad de la subpoblacin. * Muestreo por conglomerados o reas. Consiste en sustituir los elementos a los cuales se refiere el estudio, por unidades de muestreo que comprendan un grupo de aquellos. Cada uno de estos conglomerados representan en lo posible a la poblacin y estn constituidos por unidades heterogneos. * Muestreo bietatpico, cuando no forman parte de la muestra todos los elementos o unidades de los conglomerados, ya que una vez seleccionados estos se efecta una nueva seleccin o submuestreo dentro de cada uno. * Muestreo sistemtico, es cuando se toman los elementos poblaciones que forman la muestra, de acuerdo a un cierto orden, a partir de uno de ellos elegido aleatoriamente. * Muestro doble, cundo se toma una muestra doble, en forma rpida y sencilla a fin de que su informacin sira de base para la seleccin de otra mas pequea, relativa a la caracterstica que constituye el objeto del estudio propiamente dicho. * Submuestras interpenetrantes, consiste en la divisin aleatoria de una muestra, generalmente tambin aleatoria, en un nmero de grupos del mismo nmero de unidades. Se emplea para medir la concordancia entre los resultados de muestras sucesivas. En la obtencin rpida de resultados provisionales y en la compasin de los resultados obtenidos por diferentes agentes o entrevistadores. Distribucin del muestreo. Las medidas estadsticas que describen la distribucin de una poblacin o universo se llaman parmetros y son las constantes que se estiman en base a las coordenadas medidas de una muestra. Los parmetros se simbolizan con letras griegas, por ejemplo, la media con y la desviacin estndar con . Las medidas que describen la distribucin de la muestra se designan como estadsticos y constituyen magnitudes variables de una a otra muestra, pero son constantes dentro de una muestra en particular. La media aritmtica se simboliza con Xm y la desviacin tpica con S. El tamao del universo se designa con N y el tamao de la muestra con n. Cualquier medida estadstica calculada a partir de la muestra, proporciona una idea del valor correspondiente de dicha medida en la poblacin. Si una segunda muestra de igual tamao es extrada del mismo universo, probablemente proporcionara un valor algo diferente para la medida en la primera muestra, una tercera muestra en iguales condiciones dar otro valor distinto y as sucesivamente. La mayora de los valores de estas medidas tendern a coincidir con su valor respectivo de la poblacin. Mientras que otro valores de estas medidas en menor proporcin propendrn a alejarse tanto por exceso como por defecto del verdadero valor de la medida en la poblacin. La distribucin de estas medidas muestrales alrededor de la medida poblacional se llama distribucin del muestreo. Una distribucin de muestreo puede describirse mediante la tendencia central, la dispersin y forma. La desviacin tpica de una distribucin de muestreo de cualquier medida estadstica, se conoce como error tpico o estndar de la muestra, ejemplo x es el error tpico de la distribucin muestral de la media aritmtica. La concentracin de las estimaciones muestrales alrededor del verdadero valor, es ejemplo de la propiedad de consistencia, una cualidad que poseen ciertos estimadores. Un estimador es consistente si la proporcin de las estimaciones muestrales que difieren del valor esperado en menos de una cantidad especfica, se aproxima al 100 % cuando crece el tamao de la muestra. Esto significa que si la muestra es suficientemente grande, no se corre ningn riesgo al usar las estimaciones muestrales. Consideraciones acerca del tamao de la muestra. Antes de determinar el tamao de la muestra, hay que realizar: Obtencin de informacin preliminar sobre la Poblacin. Decidir la exactitud que se desea alcanzar, es decir, cual es el error admisible (e). Fijar el grado o nivel de seguridad o de confianza. Conocer la desviacin estndar de la Poblacin. Existe una frmula para determinar el tamao recomendado de la muestra, cuando se desea obtener la media Xm. n = (Z * / E)

Ejemplo. El dueo de una tienda desea saber a cuanto alcanzar el promedio de compras de cada uno de sus clientes, aceptando que las ventas promedio del ltimo ao fueron 100 Mbs, con un nivel de confianza del 99,7 % = 3 y un margen de error de 20 Mbs. n = (3 * 100.000 / 20.000) = 225 Otra frmula nos permite obtener el tamao de la muestra proporcional a al poblacin. N = Z p q / E Ejemplo. Una empresa ferretera quiere obtener un inventario al muestreo, con las siguientes condiciones: error muestral no mayor de 2 %, nivel de confianza del 95, 45 %. Segn la experiencia, los registros de inventarios tienen una discrepancia del 40 %. N = ( 2* 0.4*0.6 ) / 0.4 = 600 Cuando no se conoce la proporcin de la poblacin, se usa p = 50% y q = 50%. Teorema del Limite Central. A medida que aumenta el tamao n de todas las posibles muestras que se pueden tomar de una Poblacin de tamao N , que tiene como media y como desviacin estndar , la distribucin de frecuencias de las medias de dichas muestras se aproxima a una distribucin normal, con media y con desviacin estndar x. Esta desviacin estndar es la que se denomina error estndar de la muestra. x = / n Del Teorema del Lmite central se pueden sacar las siguientes conclusiones: - Puesto que la distribucin de las medias de todas las posibles muestras del tamao n de la poblacin se aproxima a una distribucin normal, aun en los casos en que la poblacin de la que se toman las muestras no estn normalmente distribuidas, las propiedades de la curva normal son utilizadas en la inferencia de la media de la poblacin. Sin embargo, esto es ms factible, cuando el tamao de la muestra es mayor o igual a 30. Cuando el tamao N de la poblacin es pequeo, o cuando el tamao n de la muestra representa el 10 % o ms del tamao de la poblacin, es necesario introducir en la formula anterior un factor de correccin, quedando la frmula as: x = / n * N n / N 1 Ejemplos. Una empresa elabora un producto con un peso promedio de 100 gr. con una desviacin estndar de 16 gr. Le hacen un pedido de 3 docenas cuyo peso promedio sea 96 gr. Qu probabilidad tiene la empresa de cumplir con el pedido. x = 16 / 36 = 2.666 Tipificamos la variable. Z = X Xm / x = (96 - 100) / 2.666 = - 1.50 Para 1.5 0.4332 .0.5000 0.4332 = 0.0668 Buscamos en la tabla de los valores de Z 0.0668. Luego la probabilidad de cumplir es del 6.68 % Muestreo de aceptacin. El muestreo de aceptacin es el proceso de inspeccin de una muestra de unidades extradas de un lote con el propsito de aceptar o rechazar el lote. Se puede aplicar en cualquier relacin cliente-proveedor, en el interior de la empresa, entre diferentes empresas incluso como proteccin contra las amenazas contra la calidad, por ejemplo, una compaa recibe un lote de materia prima de su proveedor. Se selecciona una muestra del lote y se inspecciona algunas caractersticas de la calidad a los productos que integran la muestra. Con base en la informacin obtenida se acepta o se rechaza el lote. El muestro de aceptacin no mejora la calidad ni proporciona estimados de calidad. Cuando se analiza un lote de productos tenemos 3 alternativas: -Cero inspeccin, que es adecuada cuando el proceso de fabricacin cumple holgadamente los niveles de calidad o cuando el costo de muestreo es muy grande comparado con las perdidas causadas por la unidades defectuosas. -Inspeccin 100%. Esto se realiza cuando los productos son de alto riesgo y los defectuosos pueden causar grandes prdidas. - Muestreo de aceptacin, es decir, inspeccin por muestras. Es til cuando:

-la inspeccin se hace con pruebas destructivas. -la inspeccin 100% es muy costosas. -la inspeccin 100% no es tcnicamente posible o requiere mucho tiempo. -cuando la probabilidad de error es muy alta. -cuando requerimos confiabilidad - cuando el proveedor tiene record excelente. . Ventajas y desventajas del muestreo de aceptacin. Las ventajas son las siguientes: Tiene menor costo. Requiere menos personal. El producto sufre menor dao Se puede aplicar en pruebas destructivas. Reduce el error de inspeccin. Existe el riesgo de aceptar lotes malos y rechazar lotes buenos. Proporciona menos informacin sobre el nivel de calidad del producto o de su proceso de fabricacin. Requiere tiempo y conocimiento.

Las desventajas son:

Tipos de planes de muestreo. Los planes son de dos tipos: Por variables, en donde una muestra aleatoria del lote y a cada unidad de la muestra se le mide una caracterstica de calidad de tipo continuo, como longitud, peso, etc. Con las mediciones se calcula un estadstico que generalmente esta en funcin de la media, la desviacin estndar muestral y las especificaciones y segn el valor de este estadstico al compararlo con el valor permisible, se acepta o rechaza el lote. Por atributos, en donde se extrae una muestra aleatoria de un lote y cada pieza de la muestra es clasificada de acuerdo a ciertos atributos como aceptable o defectuoso. Si el nmero de piezas defectuosas es igual o menor que un cierto nmero establecido, el lote es aceptado, si no, es rechazado. Los planes ms usuales son los de atributos, a pesar de que con variables se requiere menor tamao de muestra. Esto se debe a que por atributos se pueden combinar varias caractersticas de calidad en un solo plan, lo cual no se puede por variables y son ms costosos. Muestreo por atributos: simple, doble y mltiple. El muestreo simple consiste en un tamao de muestra n y un nmero de aceptacin c fijados de antemano, si se encuentra ms de c artculos defectuosos se rechaza el lote. El muestreo doble consiste en tomar una primera muestra mas pequea que en el muestreo simple para detectar lotes buenos y malos. Si no se puede decidir se toma otra muestra para tomar la decisin. El muestreo mltiple es una extensin del doble, tomando otra muestra ms pequea. Los lotes deben ser homogneos, que sean fciles de tomar y tan grandes como sea posible. Estimacin puntual y por intervalos. Las distribuciones de probabilidades que tiene una variable que representa cierta caracterstica de una poblacin se definen cuando se conocen sus parmetros y si no se conocen hay que estimar esos parmetros basndose en los datos muestrales, para luego hacer inferencias de la poblacin. Hay dos tipos de estimacin: puntual y por intervalos. Un estimador puntual de un parmetro desconocido es un estadstico que genera un valor numrico simple que se utiliza para realizar una estimacin del parmetro desconocido. Por ejemplo, 3 parmetros relacionados con las caractersticas de calidad de un

proceso y que los utilizamos para realizar inferencias estadisticas son la media de la poblacin, , la varianza o la distribucin estndar y la proporcin de artculos defectuosos p. Los estimadores puntuales o estadsticos mas recomendados para estimar estos parmetros son la media muestral Xm, la varianza muestral S y la proporcin defectuosa en la muestra p. Como la estimacin puntual de un parmetro se genera a travs de un estadstico que tiene valor aleatorio pues depende de los valores seleccionados de la muestra, esta estimaron varia de una muestra a otra muestra. Una forma operativa de conocer que tan precisa es la estimacin es calculando un intervalo de confianza, que indique un rango en el cual puede estar el parmetro con cierto nivel de seguridad o de confianza. Pruebas. Cuando estudiamos el comportamiento de una caracterstica de calidad de un proceso, nos interesa la media, la desviacin estndar o y la varianza, ya sus valores tienen que ver con cumplimiento de los requerimientos, si la media es igual o mayor a cierto proceso, si es igual a la de la semana pasada. Esto se puede realizar con las pruebas de hiptesis. Prueba de Hiptesis. La prueba o comprobacin de hiptesis es un procedimiento formal que se emplea con frecuencia en el anlisis y/o en el control de los procesos. Una hiptesis puede servir para probar aspectos como: - La cantidad promedio de facturas procesadas en esta semana puede considerarse igual a la cantidad procesada en la semana anterior. - Un proceso mejorado requiere menos tiempo o menor empleo de recursos cuando se le compara con el mtodo anterior. - El nmero de resultados que produce cada unidad de trabajo depende de la materia prima que se emplea en el proceso. - Un proceso determinado produce menos de 3% de defectos. - Hemos logrado mejorado nuestro proceso en 5% respecto al mes anterior. - La edad de los operadores no influye en su rendimiento. - El contenido de los envases tiene demasiado variaciones. - Los instrumentos de medicin no arrojan el mismo resultado. Ahora bien, cmo asegurar que lo observado no se debe al azar y puede ser relevante en la mejora del proceso? La respuesta estn en las hiptesis. Una hiptesis estadstica es una afirmacin sobre los valores de los parmetros de una poblacin o proceso, susceptible de probarse a partir de la informacin contenida en una muestra representativa de la poblacin. Por ejemplo, si afirmamos que un proceso produce menos de 8% de defectos, esto se puede plantear estadsticamente, en trminos de proporcin p desconocida de artculos defectuosos que genera el proceso, tal como: Ho: p = 0.08, la proporcin de defectos es 0.08 Ha: p < 0.08, la proporcin es menor que 0.08 A la hiptesis Ho se le llama hiptesis nula y a la hiptesis Ha se le llama hiptesis alternativa Hiptesis nula y alternativa. El nombre de hiptesis nula se deriva del hecho de que generalmente se plantea como una igualdad, lo cual facilita el tener una distribucin de probabilidades de referencia especfica, suponiendo que Ho es verdadera. En general, la estrategia a seguir para probar una afirmacin es suponer que la hiptesis nula es verdadera, que en caso de ser rechazada por la evidencia que aportan los datos, se estar aceptando la hiptesis alternativa. Entendiendo como parmetro a una constante del modelo, como puede ser la media o la desviacin estndar, una hiptesis establecida sobre un cierto parmetro en la forma Ho se dice que es nula y Ha es la hiptesis alternativa sobre el mismo parmetro. La hiptesis Ho que los parmetros de la poblacin son correctos prevalecer cuando no se encuentren diferencias significativas entre los parmetros previamente dados o estimados y los inferidos de la muestra. Por ejemplo: cuando queremos comprobar que la cantidad promedio de facturas procesadas en la semana uno (X1) puede considerarse igual o diferente a la cantidad procesada en la semana dos (X2), la hiptesis nula es Ho = X1 = X2. La hiptesis alternativa es Ha: X1 # X2. Una prueba de estas hiptesis conducira a la conclusin de que las medias son iguales o diferentes. Las pruebas de hiptesis deben llena tres requisitos:

Validez, es decir, debe medir lo que se propone medir. Muchas veces o se mide directamente lo que se esta investigando, sino las manifestaciones del fenmeno registradas por algn instrumento, corriendo el riesgo de vulnerabilidades debido a interpretaciones errneas o instrumentos inadecuados. Confiabilidad, es decir, precisin de medidas. Estabilidad, la prueba no debe producir resultados diferentes a administrase a la muestra. Pruebas de una o de dos colas. La ubicacin de la regin de rechazo depende de si la hiptesis es bilateral o unilateral. Es bilateral cuando la hiptesis alternativa de del tipo no es igual y es unilateral cuando la alternativa es del tipo mayor que o menor que. Cuando es bilateral la regin de rechazo esta a ambos lados. Cuando es unilateral esta de un solo lado. Errores del Tipo I y del Tipo II. En funcin de la aceptacin o el rechazo de una hiptesis hay dos tipos de errores: Decisin Ho verdadera Ho falsa Aceptacin correcta error Tipo II Rechazo error Tipo I correcta

El error Tipo I que rechaza una hiptesis verdadera, lo controla la seleccin del nivel de significacin o probabilidad de rechazo llamado . El valor escogido define la probabilidad de rechazar la hiptesis cuando es verdadera, lo cual significa que si se pude permitir que una hiptesis verdadera sea rechazada solamente una vez en cien, se debe elegir un valor de de 0.01. Lo valores mas comunes de son 0.001 y 0.05. A diferentes niveles de significacin, los resultados de una prueba pueden cambiar radicalmente. es decir, a cierto nivel de significacin la hiptesis alternativa es rechazada, a otro nivel de significacin pude ser aceptada. Debido a esto es necesario ser cuidadoso en la escogencia de este valor. El error Tipo II se denota con la letra y es el error de aceptar como verdadera una hiptesis que es falsa. Existe un riesgo mayor de cometer este error en las muestras de tamao pequeo o cuando el nivel de significacin es demasiado pequeo. Para un tamao de muestra dado se desea controlar que el riesgo tenga un valor especificado y que el riesgo sea tan pequeo como se pueda. Regin de aceptacin de la Hiptesis Ho. Para un riesgo , existen tres regiones de aceptacin diferentes: El que corresponde a una prueba estadstica de dos colas o Bilateral. Esta prueba se aplica si no existe conocimiento previo de la verdadera media del proceso o si nos interesa detectar una verdadera media del proceso, tanto si es mayor o menor que el valor expresado en la hiptesis original. La regin de aceptacin est comprendida entre dos valores de Z. El que corresponde a una prueba estadstica de una sola cola con todo el riesgo en la cola derecha. Esta prueba se aplica si se sospecha que la verdadera media del proceso es superior a la media estipulada en la hiptesis original o si los valores de la media menores que la de la hiptesis son aceptables y solo nos interesa detectar una media mayor. La regin de aceptacin est situada a la izquierda de un valor de Z. - El que corresponde a una prueba estadstica de una sola cola con todo el riesgo en la cola izquierda. Esta prueba aplica si se sospecha que la verdadera media del proceso es menor que la media estipulada en la hiptesis original o sI los valores de la media mayores que la de la hiptesis son aceptables y solo nos interesa detectar una media menor. La regin de aceptacin est situada a la derecha de un valor de Z. Pasos para el diseo y anlisis de una prueba de Hiptesis. 1. 2. Enunciar Hiptesis nula y la alternativa. Definir los riesgos estadsticos aceptados. = nivel de significacin = riesgo de error tipo I = probabilidad de rechazar la hiptesis siendo verdadera. = riesgo de error tipo II = probabilidad de aceptar la hiptesis cuando es falsa.

3. Definir la prueba que se emplear. 4. Extraer una muestra aleatoria de n observaciones. 5. Calcular el valor del estadstico de prueba de la muestra. 6. Determinar la regin de aceptacin para la prueba, es decir, el conjunto de valores del estadstico de prueba que darn lugar a la decisin de aceptar la prueba. 7. Comparar el valor del estadstico de prueba con la regin de aceptacin y decidir la aceptacin o rechazo de la hiptesis. 8. Comprobar, en al caso de que sea posible, que el tamao de la muestra es lo suficientemente representativo para conseguir los niveles de riesgos antes definidos. Tamao de las muestras en las pruebas estadsticas. El tamao de la muestra que se requiere depende de, los riesgos de muestreos aceptados, el tamao de la mnima diferencia verdadera que se debe detectar y de la dispersin de la caracterstica que se mide. Grado de Libertad Se define como el nmero de observaciones independientes en la muestra menos el nmero de parmetros de la poblacin que deben estimarse a partir de las observaciones de la muestra. Pruebas estadsticas. 1. Prueba Chi-Cuadrado. Antes de iniciar una prueba es necesario asegurare que la distribucin estadstica supuesta es representativa de las condiciones reales que queremos probar. Una hiptesis en la que un conjunto de frecuencias muestrales tiene la misma distribucin que las frecuencias de una distribucin terica, se puede probar mediante la prueba Chi-Cuadrado, X. La decisin de aceptar o rechazar la hiptesis se basa en esa distribucin. La exactitud del ajuste entre una distribucin emprica y una terica se basa en la diferencia entre las frecuencias obtenidas por los datos y las frecuencias tabuladas para los mismos intervalos de cada una de las distribuciones tiles, sea normal, Poisson, Binomial, etc. La prueba estadstica se calcula a travs de la frmula: X = ( Foi - Fei ) / Fei Foi = Frecuencia observada en K intervalos Fei = Frecuencia esperada en K clases de la distribucin hipottica = Sumatoria de nmero de intervalos el arreglo de los datos para efectuar la prueba estadstica se puede tabular as: Intervalo 01 02 -K Foi F1 F2 -FK Fei f1 f2 -fk

Como una regla prctica, la prueba es ms confiable, respecto al nmero de observaciones, cuando el nmero de intervalos (K) es grande y el nmero de frecuencia (Fi) que se observa en cada intervalo es cinco o ms. El valor de X calculado con la frmula anterior se compara con el valor proporcionado por la tabla conocida. Valores pequeos de X estn asociados a una concordancia entre las frecuencias tericas y las observadas. Los valores grandes indican discrepancia. 2. La prueba Z. Se basa en una poblacin normal con una media y una desviacin estndar conocida. Puede emplearse para probar la hiptesis de que los valores de un proceso mejorado son mejores que los valores que proporciona el proceso antes de la mejora.

Se parte del hecho de que se conoce la media y la desviacin del proceso no mejorado y se toma una muestra de los valores del proceso mejorado, a fin e comprobar la hiptesis. Se usa la expresin. Z = Xm / / n donde Xm = media obtenida de la muestra = media del procesos antes de la mejora = desviacin estndar del proceso n = tamao de la muestra El valor obtenido mediante el uso de la frmula, se compara con el valor proporcionado por la tabla conocida, de acuerdo al nivel de significacin. Ejemplo. Un proceso de facturacin se caracteriza porque el tiempo que se tarda en procesar un lote de documentos sigue una distribucin normal, con desviacin estndar de 5 minutos, siendo su media 50 minutos. Por sugerencia de un empleado, se modifica el proceso. Se desea saber si el proceso modificado, respeto al valor medio, es mejor que el anterior. Se pide disear la prueba. -Enunciamos la hiptesis. Ho: = o La diferencia entre las medias no es significativa. Ha: # o. La diferencia es significativa. - Definimos los riesgos estadsticos aceptados. Error tipo I ( ) = 0.01 unilateral a la izquierda. Error tipo II ( ) = 0.1 Si la media ha cambiado a = 47, existe una probabilidad de 0.1 de aceptar la hiptesis nula y una probabilidad 0.9 de aceptarla. - Vamos a usar la prueba Z. - Obtener las observaciones necesarias para realizar la prueba estadstica Para esto existen tablas, para riesgos tipo I del 0.01 y 0.05. Determinamos el valor d . d = Valor absoluto ( o / ) Con este valor y el valor del riesgo tipo II, se entra en la tabla que interesa de acuerdo al nivel de significacin, y se determina el valor de n. En nuestro caso d = 47 50 / 5 = 0.6 La tabla indica que el tamao de la muestra debe ser 50. Supongamos que obtuvimos las 50 observaciones y que la media de ellas es 48. Encontramos el valor de Z y encontramos = - 2.82. determinacin de la regin de aceptacin de la prueba. Para un nivel de significacin de 0.01 a la izquierda, en la tabla Z = -2.326, es decir se acepta la hiptesis nula cuando el valor calculado de Z est comprendido entre los valores -2.326 y . Comparar los estadsticos. Z calculado: -2.82 Z crtico: -2.326 Luego rechazamos la hiptesis nula y el tiempo correspondiente al proceso mejorado es significativamente menor que el tiempo correspondiente al proceso antiguo. La prueba t

La Distribucin simtrica t" est definida por los grados de libertad. La prueba es parecida a la prueba Z, con la excepcin de que a la reemplaza S . Esta sustitucin permite determinar si la media de una distribucin normal tiene un determinado valor cuando su desviacin estndar es desconocida, pero se puede estimar mediante el valor de S. La media de la muestra se compara con una poblacin conocida por medio de la prueba estadstica: t = Xm o / ( S / n ) Esta prueba estadstica tiene ( n-1 ) grados de libertad. La prueba t se puede ampliar para incluir las estimaciones de dos muestras de poblaciones distribuidas normalmente. Donde las variancias son desconocidas pero se suponen iguales por la prueba estadstica: t = X1 X2 / Sp 1 / n1 + 1 / n2 Donde la estimacin conjunta de la desviacin estndar ( Sp ) est dada por: Sp = ( n-1 ) S1 + ( n- 2 ) S2 / ni + n2 2 Esta prueba estadstica tiene (n1 + n2 -2) grados de libertad y se denomina prueba t " para dos muestras independientes y son dos casos en los cuales se pueden presentar la necesidad de esta prueba: - Cuando se trata de comparar los resultados de dos procedimientos o tratamientos distintos, en dos muestras diferentes de la misma poblacin. -Cuando se trata de establecer que dos poblaciones diferentes constituyen una poblacin homognea con respecto a la variable criterio que es objeto de la prueba. Ejemplo. Una determinada operacin viene siendo efectuada por una cuadrilla de mantenimiento en 64 minutos. Se desea saber si una nueva cuadrilla puede efectuar la operacin en el tiempo indicado, permitiendo una diferencia de 5 minutos, tanto para el nivel inferior como para el superior. Se pide disear la prueba que permita determinar si la nueva cuadrilla tiene una media del tiempo de operacin igual a la otra cuadrilla. Hiptesis. Ho = 1 = 0 Ha = 1 # 0 Definir riesgos estadsticos. = 0.01. prueba bilateral. = 0.1 es decir, existe la probabilidad de 0.1 de aceptar una diferencia de 5.0 minutos en el tiempo medio y un 0.9 para rechazar esa diferencia. Definir la prueba que se empleara para la hiptesis. Se utilizar la prueba estadstica t, que permite determinar que la media de una distribucin normal tiene un valor definido cuando la desviacin estndar es desconocida. Esta prueba tiene (n 1) grados de libertad. Se aplicar la prueba bilateral o de dos colas. 61.0 Extraer una muestra aleatoria de n observaciones. Se tomaron 15 datos: 66.5 70.0 62.5 63.5 71.0 73.5 70.5 75.0 69.0 72.0 71.5 69.5 68.5 67.0 - Calcular el valor del estadstico de la prueba de la muestra. Xm = 68.733 S = 4.07 obtenida de los datos anteriores.

obtenida de los datos anteriores.

o = 64 minutos dato del ejemplo

obtenemos t = 4.5 Determinar la regin de aceptacin para la prueba. Para un nivel de significacin = 0.01. Vamos a la tabla y obtenemos 2.977. Es decir, la regin de aceptacin de la hiptesis nula va desde 2.977 a 2.977. Comparamos el valor del estadstico de prueba con la regin de aceptacin. t = 4.5 no esta dentro de la regin -2.977 2.977. Luego se rechaza la hiptesis nula y la nueva cuadrilla tiene un tiempo de operacin diferente a la tradicional Preguntas generales. 1. Cierto fabricante de equipos electrnicos recibe quejas de los usuarios debido al volumen menor del establecido en las especificaciones. Se piensa que esto se debe al amplificador colocado el cual debe suministrar una ganancia de 11 db, pero como es muy difcil fabricarlo, se acepta que una ganancia entre 10 y 13 db es suficiente. Se decidi hacer una medicin de la ganancia obtenida en una muestra de equipos porque se piensa que la causa del problema es otro componente, resultando lo siguiente: 9.1 9.2 10.0 9.3 11.4 9.8 9.9 10.1 9.4 10.7. . 8.8 10.9 12.7 9.0 8.9 10.5 11.9 8.9 8.5 . 10.6 12.1 11.1 10.4 10.2 prueba bilateral Nmero de grados de libertad (v = n -1) igual a 14.

- Cual es la tendencia central de los datos. - Cual es la variabilidad de los datos. - Dibujar un diagrama de frecuencias simples y de frecuencias agrupadas y con base en estos grficos qu se puede concluir. 2. Un grupo de 30 nios van de paseo junto con sus 3 maestras. La edad de los nios varia entre los 4 y los 8 aos la mitad tiene 5 aos o menos. La edad que se repite mas es 4. La edad de las maestras es aproximadamente 30 aos. Con base en lo anterior, incluyendo a las maestras, cual es el valor aproximado de la media, la moda y la mediana de la edad de los 33 paseantes. 3. En una empresa se lleva el registro semanal del nmero de empleados que acuden a la enfermera. Segn los datos de los primeros 6 meses del ao, el promedio semanal es 16 y la desviacin estndar es 3.5. Se pregunta, entre que cantidades se espera que varen usualmente el nmero de empleados que acuden a la enfermera semanal. Si en una semana se reporta que acudieron 25 personas, sucedi algo fuera de lo usual. 4. A un surtidor de gasolina de cada 20 litros se permite una diferencia de 02. litros. En 15 inspecciones de funcionamiento se determin que la media era 19,9 y la desviacin estndar era 0,1: se puede afirmar que la bomba cumple con la norma? 5. Dos mquinas son utilizadas para cortar tiras de hule de longitud 200 mm con una tolerancia de 3 mm. Se toman las siguientes muestras: 199.2 200,8 199.7 201.8 202,0 201,5 201,0 201,3 201,5 200,9 200,0 200,7 199,8 200,7 200,4 200,4 200,9 200,5 210,4 200,9

- Cual es la tendencia central de los datos. - Cual es la desviacin estndar y una aproximacin de los lmites reales. - Dibujar un histograma e interpretarlo (tendencia central, variabilidad, forma)

6. Una cuadrilla de trabajadores efecta sus actividades de mantenimiento en un tiempo de 55 minutos. Despus de recibir adiestramiento, se desea saber si otra cuadrilla puede realizar a menor tiempo las actividades, con una diferencia de 5 minutos, con un nivel de aceptacin = 0.001 y = 0.1. 7. Se desea comparar los bombillos que fabrican las empresas A y B. Se hicieron pruebas con 100 bombillos de A y la vida media til fue de 1.120 horas con una desviacin estndar de 75 horas, mientras que los de la empresa B tuvieron una vida til de 1.064 con una desviacin de 82 horas. Asumiendo un nivel de significacin = 0.05, es significativa la diferencia entre la vida til y con que tamao de muestra se aceptara que las marcas son iguales, con el mismo nivel de significacin. . 8. Con el fin de tomar acciones, se realiz una investigacin en una empresa sobre si las actividades mas exigentes fsicamente las deben realizar los hombres, para lo cual se efectu una serie de preguntas entre 1 a 5, en relacin si estn o no de acuerdo. Los resultados obtenidos fueron los siguientes: Acuerdo Mujeres. Hombres. Total. 2 5 3 12 2 3 13 26 25 36 4 10 10 26 Desacuerdo. 16 1 8 7 50 100 Total 50

Apoyndose en la prueba Chi Cuadrado, existe alguna diferencia significativa entre las respuestas de los hombres y las mujeres. 9. En una empresa de 1200 trabajadores el 40% son del interior del pas. Que probabilidad habr de que en un grupo de trabajo de 80 trabajadores, resulte el 20 % o menos sea tambin del interior. 10. En un cargamento de 500 sacos de arroz importado, se garantiza que la diferencia en peso para cada saco es de mas o menos 2.5 Kgs. Cual es la probabilidad que el peso promedio de una muestra de 100 sacos, sea de 800 gramos, en relacin al peso medio. 11. Para poder lograr la aprobacin de los gastos de publicidad, el Gerente correspondiente de una empresa debe predecir las Ventas esperadas en funcin de los gastos de publicidad efectuados. Anteriormente los cuales se mencionan a continuacin: Gastos de Publicidad anteriores. ( MMBs ) 6 7 4 5 6 7 A cuanto alcanzaran las Ventas en el ltimo ao. Bibliografa: Control de Calidad. Dale H. Besterfield. Editorial Prentice Hall. Herramientas Estadsticas Bsicas para el Mejoramiento Continuo de la Calidad. Hitoshi Kume. Grupo Editorial Norma. Control Total de la Calidad. Armand Feigenbaum. CECSA. Control de la Calidad y Estadstica Industrial. Achenson J. Duncan. Editorial Alfaomega. Nota. Para el planteamiento y solucin de problemas asociados al texto anterior se pueden usar los programas EXCEL, STATGRAPHICS y SPSS 12.0 Ventas. ( MMBs ) 3 5 2 6 8 X

S-ar putea să vă placă și