Documente Academic
Documente Profesional
Documente Cultură
1
mailxmail - Cursos para compartir lo que sabes
2
mailxmail - Cursos para compartir lo que sabes
TEMA: La Estadística
IMPORTANCIA DE LA TOMA DE DECISIONES
El que sabe tomar decisiones ocupa los mejores lugares en la dirección de una
empresa. Allí están las mejores remuneraciones.
Cuando en una empresa se busca a alguien para ocupar un puesto de dirección se
escoge de entre los que saben tomar decisiones correctas. Es decir, no los escogen
entre los que siempre esperan que les digan qué es lo que deben hacer; sino entre
los que deciden qué hacer cuando hay urgencia de hacer algo, coincidiendo con que
no está presente el responsable del departamento.
El mejor empleado no es el que más suda, sino que es el que mejor piensa y decide
hacer lo que considera que es racionalmente correcto.
Para tomar decisiones se debe estar en capacidad de llenar los vacíos de
información de la manera más racional posible.
Es aquí donde la Estadística puede ayudar a tomar decisiones racionalmente
correctas: ayuda a llenar los vacíos de información.
Este curso va dirigido a enseñar progresivamente el uso de la Estadística para
obtener un conocimiento más profundo, racionalmente aceptable, del
comportamiento de un proceso. Con la Estadística podemos ver más allá de lo ven
nuestros ojos.
3
mailxmail - Cursos para compartir lo que sabes
* Preferencias de candidatos * Anuncios en radio y TV
* Necesidades de escuelas * Ventas de productos
* Sabré buscar las causas que hacen cambiar los resultados de una actividad y
comprobarlo con datos experimentales.
Ejemplo: El cansancio incrementa del número de piezas defectuosas: este
incremento va ligado con la hora de la medición. La humedad del papel influye en la
calidad de la impresión.
POBLACIÓN:
* son todos los individuos que, por tener una característica común, forman un
grupo bien definido. Ejemplo: todos los que leen La Nación en Costa Rica.
* son todas las mediciones que he podido obtener de una actividad o
proceso. Ejemplo: ventas mensuales en un supermercado.
4
mailxmail - Cursos para compartir lo que sabes
OBSERVACIÓN:
- se aplica cuando la característica en estudio es CUALITATIVA. Ejemplo: el color
de una tinta.
- Interesa saber si se tiene o no se tiene una característica.
- El resultado se expresa en porcentaje. Ejemplo: el 38% de las piezas son de
color rojo.
NOTA: recuérdese que una muestra es tan solo una parte de la población, por
consiguiente, si se quiere extrapolar, o sea, aplicar los resultados de la muestra a
toda la Población, tienen que usarse los conocimientos que da la Estadística
Inferencial. Para ello se hace así:
5
mailxmail - Cursos para compartir lo que sabes
6
mailxmail - Cursos para compartir lo que sabes
EXACTITUD: Una medición es EXACTA si coincide con el valor que realmente tiene el
objeto. En general se dice que un instrumento da mediciones exactas cuando el
promedio de varias mediciones es igual al que dicen las especificaciones del objeto.
Ejemplo: si tomo diez bolsas de café que dicen "5 Kg.", el promedio de las diez
mediciones debe ser 5 Kg. Si no es 5 k.o., entonces, la balanza o la máquina
empacadora no tiene EXACTITUD.
7
mailxmail - Cursos para compartir lo que sabes
NOTA: RANGO = Peso Mayor - Peso menor. Es también una medida de precisión
Peso promedio 5 5
6 6
Peso Mayor 5.001 6
6.001 7
Peso menor 4.999 4
5.999 5
Rango 0.001 2
0.001 2
__________________________________________________________________________
EXACTITUD Exacta Exacta Inexacta
Inexacta
PRECISIÓN Precisa Imprecisa Precisa
Imprecisa
CAUSAS EVITABLES:
Error personal: debido a descuido del que ejecuta la medición
Error instrumental: debido a fallas del instrumento.
CAUSAS NO EVITABLES:
Variaciones naturales por causa del operador. Ejemplo: posición del ojo,
iluminación, cansancio del operario.
Variaciones naturales por causa del instrumento. Ejemplo: desgastes, suciedad,
defectos que no se pueden detectar fácilmente.
8
mailxmail - Cursos para compartir lo que sabes
9
mailxmail - Cursos para compartir lo que sabes
ORGANIZACIÓN DE LA INFORMACIÓN
Porque la cantidad de información que muchas veces se tiene, por las diferentes
mediciones que se hacen en un proceso, es demasiado grande y nuestra mente no
logra resumirlos en forma tal que le trasmitan un conocimiento exacto de ese
proceso. Una persona puede pasar, horas y horas, leyendo y releyendo la
información bruta sin que pueda llegar a conocer las características fundamentales
del proceso en estudio. Si los datos se ORGANIZAN, se hace fácil conocer el
comportamiento de un proceso.
Los gráficos son utilizados en Estadística porque un gráfico dice más que mil
palabras. Mediante un gráfico se puede observar visualmente el comportamiento de
un proceso.
Los gráficos más utilizados en Estadística son: 1) HISTOGRAMA, 2) POLÍGONO DE
FRECUENCIAS, 3) OJIVA.
10
mailxmail - Cursos para compartir lo que sabes
A. PARÁMETRO ESTADÍSTICOS.
11
mailxmail - Cursos para compartir lo que sabes
B. LA MEDIA ARITMÉTICA
C. LA DESVIACIÓN ESTÁNDAR
12
mailxmail - Cursos para compartir lo que sabes
Ninguno de los dos es el más importante, los dos son igualmente importantes. Para
poder describir adecuadamente una Distribución se deben dar los dos parámetros.
13
mailxmail - Cursos para compartir lo que sabes
Sí, hay varios tipos de Media, que se les denomina, en forma general, como
PROMEDIOS.
Ejemplo: Calcule la Media Simple de: 7.2, 5.8, 6.6, 5.9, 6.4, 7.1
X BARRA = (7.2 + 5.8 + 6.6 + 5.9 + 6.4 + 7.1) / 6 = 39.0/6 = 6.5
Ejemplo: La venta (millones de colones) de los últimos tres años son: 15.4, 16.8,
18.8. Calcule la media de estas ventas, de modo que la ponderación sea 1, 3, 4. Es
decir, se le quiere dar mayor peso a las ventas más recientes.
Los datos o mediciones de un estudio pueden ser la totalidad del estudio, que se
denomina POBLACIÓN, o bien, pueden ser una parte, que se denomina MUESTRA
tomada de la población. Por tanto hay dos tipos de Desviación Estándar:
14
mailxmail - Cursos para compartir lo que sabes
Desviación Estándar Poblacional: que se simboliza con la letra griega sigma.
Desviación Estándar Muestral: que se simboliza con la letra minúscula latina s.
Cuando son muchos datos, los cálculos de la Media y al Desviación Estándar son
muy laboriosos y se debe proceder a preparar una Tabla de Distribución de
Frecuencias. En el Apéndice No. 4 aparecen estos cálculos con los datos agrupados.
NOTA: cuando uno tiene a mano un computador, el Programa EXCELL ejecuta estos
cálculos en forma muy sencilla y rápida.
Sí, existe esta relación. Y esto es muy útil porque, utilizando esta relación, se puede
calcular, en forma aproximada, la Desviación Estándar de una muestra por medio del
RANGO. La ventaja que se tiene, es que el cálculo del Rango es sumamente sencillo,
mientras que el cálculo exacto de la Desviación Estándar es muy engorroso, sobre
cuando la muestra es muy grande.
Rango de la Muestra = R = Valor Mayor menor - valor menor
Hay Tablas que dan los factores d2 que, aplicados al Rango, permiten calcular, en
forma aproximada, la Desviación Estándar según el tamaño n de la Muestra.
15
mailxmail - Cursos para compartir lo que sabes
Ejemplo: Calcule, en forma aproximada, la Desviación Estándar de una muestra,
cuyas mediciones fueron: 26,40 ; 26,80 ; 27.10 ; 26.90
16
mailxmail - Cursos para compartir lo que sabes
17
mailxmail - Cursos para compartir lo que sabes
Estándar tienen las unidades propias de fenómeno correspondiente ( Ej. Peso en Kg.,
Longitud en cm.)
Una distribución que tenga un Histograma que se asemeje a una Campana de Gauss,
se
dice que corresponde a un Proceso NORMAL. En tal caso, la Teoría Estadística
señala que:
Ejemplo: si una distribución tiene Media = 23.4 cm. y Desviación Estándar = 6.7
cm. y su comportamiento es aproximadamente NORMAL, las mediciones se
encontrarán entre:
18
mailxmail - Cursos para compartir lo que sabes
Producto A: Ventas Abril: x (A) = 385 Media histórica= 374, Desv. Estándar =
8.4
Producto B: Ventas Abril: x (B)= 28.43 Media histórica= 27.16 , Desv. Estándar
= 0.86
Conclusión: en el mes de Abril, 2005, las ventas del Producto B han aumentado
más, respecto a su Media histórica que el aumento obtenido por el Producto A
respecto a su propia Media Histórica de ese mes.
Ejemplo: Un cliente acepta pollos que pesen entre 1450 gr. y 1850 gr. En esta
semana, en la granja, encuentran que en ese día el peso promedio del pollo es 1610
gr. con una Desviación Estándar de 145 gr., Determine el Porcentaje de pollos que
podrán ser enviados a ese cliente.
19
mailxmail - Cursos para compartir lo que sabes
de ese cliente.
20
mailxmail - Cursos para compartir lo que sabes
Para calcular con certeza la Media de una Población debería poder medir TODOS los
elementos de la Población. Resulta muy sencillo aplicar la fórmula para calcular la
Media.
Esto lo podemos hacer únicamente cuando la POBLACIÓN es FINITA. Pero, aunque
la Población fuese Finita, no siempre se pueden medir todos los elementos, ya sea
porque es muy costoso o muy tardado o porque al medir una pieza esta se
destruye.
En consecuencia, el MUESTREO es muy útil para determinar, no con Certeza, pero sí
con buen a aproximación la Media de una Población de datos.
21
mailxmail - Cursos para compartir lo que sabes
Para realizar un estudio de un proceso se deben definir cuales son los aspectos que
debemos considerar. Cada uno de estos aspectos va expresado mediante una
variable, porque si no hubiese variación no se necesitaría ningún estudio. Ejemplos:
la densidad de tinta en un impreso, la resistencia de un cable de acero, el número
de tubos PVC defectuosos, etc.
OBSERVABLES =
* solo se requiere determinar, por simple observación, si el aspecto considerado,
está presente o no, en la unidad sometida a estudio.
* solo tiene dos resultados. Tiene- No tiene, Pasa - No pasa,
22
mailxmail - Cursos para compartir lo que sabes
Acepto- Rechazo.
* el resultado se expresa como la fracción o Porcentaje % entre las unidades
examinada que tienen el aspecto que se está estudiando.
Ejemplo: si se examinan 40 tubos PVC y de ellos se observa que 31 cumplen con
todas las especificaciones, se dice que :
P = porcentaje de aceptables en esa muestra= 31/40 = 0.775= 77.5 %
Q = 1 - P = % no aceptable = 1 - 0.775 = 0.225 = 22.5%
* los porcentajes de Aceptables (o no Aceptables) en las muestras siguen una
Distribución BINOMIAL.
23
mailxmail - Cursos para compartir lo que sabes
B. DISTRIBUCIÓN NORMAL
Esta estimación se hace con base en que, según el Teorema del Límite Central, las
Medias muestrales se distribuyen en forma NORMAL, alrededor de la Media
Poblacional. Es decir, esta estimación se hace utilizando los conocimientos
estadísticos sobre la Curva Normal.
Limite Inferior del diámetro promedio= 7.69 - 1.96 * ( 0.12 / Raíz (36) ) = 7.67
cm.
Limite Superior del diámetro promedio= 7.69 + 1.96 * ( 0.12 / Raíz (36) ) = 7.71
cm
C. DISTRIBUCION BINOMIAL
24
mailxmail - Cursos para compartir lo que sabes
C. DISTRIBUCION BINOMIAL
Tomaremos los mismos datos del ejemplo anterior y queremos estimar, con ellos,
cuál es el Porcentaje histórico de Aprobados que se ha tenido en esa asignatura, en
ese colegio.
25
mailxmail - Cursos para compartir lo que sabes
LI p = 0.738 - 1.96 * (Raíz (0.738*0.262/42 ) = 0.871 = 87.1%
26
mailxmail - Cursos para compartir lo que sabes
El Muestreo es una de las varias herramientas que la Estadística ofrece para llenar
los vacíos de información, de manera rápida, económica, y suficientemente
confiable. Hay dos adjetivos que se pueden aplicar apropiadamente al Muestreo:
Si se quiere entender una ciencia, lo primero que se debe hacer es conocer los
términos propios que usa esa ciencia. Se les conoce como términos técnicos. A
continuación se presentan varios términos técnicos usados en el Muestreo:
27
mailxmail - Cursos para compartir lo que sabes
continuación se presentan varios términos técnicos usados en el Muestreo:
* Muestra aleatoria: es la que se escoge en modo tal que todos los elementos
iguales de la población tienen la misma probabilidad de ser escogidos.
28
mailxmail - Cursos para compartir lo que sabes
Tipo de Muestreo conveniente.
- Definir la UNIDAD MUESTRAL: es el elemento que puede dar directamente y con
exactitud la información solicitada. Ejemplo: el ama de casa es la Unidad Muestral
lógica para un muestreo que indague hábitos de consumo en las familias.
- Definir el ESPACIO del Muestreo (Quién, Cuándo y Dónde): para ubicar los
elementos que deben ser entrevistados o medidos. Estos elementos deben ser
escogidos en forma aleatoria, para asegurar que la muestra sea representativa.
- Especificar cómo obtener la información: * Medición u Observación, *
Entrevista, * Correo, * Registros en instituciones públicas, etc.
- Calcular el Tamaño de la Muestra: según la Confianza y la Precisión deseadas.
- Depuración de los resultados: eliminar los datos claramente inadmisibles.
- Cálculos estadísticos: según la teoría propia para cada tipo de parámetro.
29
mailxmail - Cursos para compartir lo que sabes
- Sesgo: es un resultado erróneo del muestro, causado por un mal diseño del
muestreo. Este tipo sí se puede evitar, y se debe evitar, aplicando correctamente las
técnicas de muestreo.
Ejemplo: en una muestra para estudiar los hábitos de aseo de los niños de escuela,
es escogieron solamente a los niños más desaliñados. El resultado, por supuesto,
tuvo SESGO.
- El Error del muestreo se da porque es imposible que todos los resultados del
muestreo coincidan con el verdadero valor del parámetro investigado. Los
resultados del muestreo son PROBABILÍSTICOS, por eso es natural exista siempre el
Error de Muestreo.
Este error, aunque no se puede evitar, podemos manejarlo dentro de los límites
aceptables.
30
mailxmail - Cursos para compartir lo que sabes
El investigador que hace el estudio o un experto que conoce los costos del proceso,
son los que pueden decidir el tamaño máximo permisible del error en la
estimación de un parámetro. Solamente el que conoce bien la característica que esta
sometiendo a estudio, es el que puede decir la MAGNITUD ACEPTABLE DEL ERROR.
Ejemplo: Si investigamos el comportamiento del Peso de las bolsas de cemento en
una Fábrica y para ello debemos realizar un muestreo. ¿Cuántos sacos debo pesar
para estimar el peso promedio?
Para responder a esta pregunta, antes debo saber qué error estoy dispuesto a
permitir. Si uno que conoce el negocio de la venta de sacos de cemento, nos dice
que un error de 50 g por saco, lo puede soportar la empresa, entonces puedo
partir de allí para determinar el tamaño de la muestra.
El error de la estimación se puede hacer tan pequeño como uno quiera, basta
aumentar el tamaño de la muestra. Si este tamaño crece hasta hacerse igual al
tamaño de la Población, el error muestral será nulo.
31
mailxmail - Cursos para compartir lo que sabes
B. EL TAMAÑO DE LA MUESTRA
Para calcular el tamaño de una muestra se deben determinar los siguientes datos:
- Mediante una muestra piloto de tamaño mayor que 30, se obtiene la desviación
estándar, sea s= 0. 35 Kg.
- Se aplican las fórmulas siguientes:
Factor de Reducción FR = n ( i ) / N
32
mailxmail - Cursos para compartir lo que sabes
Factor de Reducción FR = n ( i ) / N
El lote de vacunas que estoy recibiendo y del cual quiero estimar su efectividad son
N = 2500 Ya hemos determinado el tamaño, como si la población fuera infinita
n ( i ) = 707.
FR = 708 / 2500 = 0.28
33
mailxmail - Cursos para compartir lo que sabes
Ejemplo: 1) Si una encuesta sobre un nuevo detergente se hace solo por medio
del teléfono, dará resultados falsos porque la muestra no es aleatoria. Los
compradores que no tienen teléfono no tuvieron posibilidad de ser escogidos para
opinar sobre el detergente.
2) Las contestaciones a un formulario que sale en un periódico nacional, no forman
una muestra Representativa por que no es aleatoria. Hay mucha posibilidad de
Sesgo. Los fanáticos son los que más contestan los cuestionarios que salen en los
periódicos. Hay mucha gente a la que no le interesan esos cuestionarios. Su opinión
no cuenta., para los resultados de este muestreo.
- Sirve cuando la Población es FINITA y se tiene una lista de los N elementos que
la componen...
- Se numeran todos los elementos de la Población. Ej. Si son menos de 10,000
elementos, se numeran desde 0000 hasta 9999.
- Mediante una Tabla de Números Aleatorios (n.a.), o usando una calculadora con
la tecla RAND, se obtienen n números . El tamaño de la muestra es n.
- Leyendo en la lista numerada de los elementos de la Población, se sabe cuáles
son los n elementos que conforman la muestra. De esta forma se asegura que la
muestra es aleatoria.
* MUESTREO SISTEMÁTICO:
34
mailxmail - Cursos para compartir lo que sabes
- Si la Población es finita
Tamaño de la Población = N ; tamaño de la muestra = s n, se determina el
Factor de Recurrencia = k = N / n .
Ejemplo: Para una auditoría debo tomar, aleatoriamente, 50 facturas de entre el
legajo de las 1.000 facturas de un mes.
* Se calcula el Factor de Recurrencia.
k = 1.000 / 50 = 20 Debo tomar una factura de cada 20.
* Para iniciar, se numeran las 1000 facturas en orden sucesivo: desde 000
hasta 999.
* se escoge un , en forma aleatoria o semi aleatoria (arbitraria), la 1ª. Factura
que formará la muestra.
Ejemplo. Sea la factura No. 035 . (físicamente ocupa el lugar 34º, pues la
primera factura
tiene el n.a = 000).
* La siguiente factura seleccionada debe ser la ( 35 + k) = 35 + 20 = No. 055
* Así se sigue: 55 + 20 = No. 075; 75 + 20 = No. 095 etc.
* Al llegar a la última factura del legajo, se vuelve a comenzar contando con la 1ª.
Factura
La última factura escogida sería la que tiene el No. 015.
- Si la Población es Infinita
MUESTREO ESTRATIFICADO
Ejemplo: Una ONG debe escoger una muestra aleatoria de 120 Guarderías
Infantiles para hacer un estudio sobre la higiene con que se manejan
Los tipos de Guarderías Infantiles son: Públicas, Semipúblicas, Privadas. Las zonas
que van a ser estudiadas son: Central, Norte y Sur.
Procedimiento:
- En los Registros que tiene el IMAS aparecen las siguientes Guardería Infantiles,
en cada una de las tres zonas: (los datos son ficticios )
35
mailxmail - Cursos para compartir lo que sabes
36
mailxmail - Cursos para compartir lo que sabes
Se dice que un Proceso está controlado cuando se puede afirmar que los
resultados del proceso, es decir, el producto tiene las características esperadas y las
cumple, en la forma esperada. Cuando obtenemos, en forma inesperada o con
resultados sorpresivamente fuera de las especificaciones, se dice que el Proceso
está fuera de Control. Es lo peor que puede pasar en un proceso productivo, por
cuanto todo lo que ha sido esmeradamente planeado, no se sabe si se podrá llevar a
cabo.
Un Supervisor de Procesos, guiado por el CEP, podrá hacer tres cosas importantes:
Las técnicas usadas por el CEP son muchas y cada vez se encuentran nuevas
formas estadísticas para tener mejor control del proceso. Podemos citar algunas
técnicas:
* Gráficos de Control, varios tipos,
* Muestreos de Aceptación, varios tipos.
* Uso de las tablas Militares
* Criterios de 6 Sigmas. etc.
37
mailxmail - Cursos para compartir lo que sabes
estar fuera de control. Esto sucede cuando los resultados de repetidas muestras
están cayendo fuera de los Límites de Aceptación.
Las muestras usadas en los Gráficos de Control son relativamente pequeñas, porque
el tamaño de la muestra total de un día se divide entre el número de veces que se
repetirá el muestreo durante el día. Ejemplo: Supóngase que se ha calculado que
se requiere una muestra de tamaño 80 cada día. Para los gráficos de control, se
tomarán muestras de tamaño 10 cada hora, todos los días laborales.
38
mailxmail - Cursos para compartir lo que sabes
En el Gráfico, cada Media muestral (XBARRA) o cada Rango muestral (R) o cada
Proporción muestral (P), se representa con un punto.
Estos puntos se unen con una línea, para que se vea la tendencia del proceso, a lo
largo del tiempo
Se dibujan dos líneas, una arriba y otra debajo de la Media de las Medias
(XDOBLEBARRA) las cuales corresponden a los Límites de Control, Superiores e
Inferiores de Control (LCS, LCI)
Las muestras fuera de control son las que caen arriba del LCS o debajo del LCI.
Damos dos ejemplos, entre otros, de criterios que utiliza el Supervisores para saber
si el Proceso está fuera de control y proceder a tomar las medidas correctivas.
39
mailxmail - Cursos para compartir lo que sabes
CONCLUSIÓN
Rafael Kauffmann V.
Junio, 2005.
40
mailxmail - Cursos para compartir lo que sabes
Apéndice
2. Los Límites Reales son límites contínuos, es decir, el el Límite Real Superior
(LRS) de una clase es igual al Límite de Clase Inferior (LCI) de la siguiente clase.
Ejemplo: LRS de la 1ª.Clase = 57.25 porque ese el el valor del LCI de la 2ª. Clase.
Debe notar que los LRS están espaciados en 1.50 unidades, que es igual a la
amplitud de clases.
41
mailxmail - Cursos para compartir lo que sabes
7. Las Frecuencias Relativa Acumulada (Fr) se calculan dividiendo la F de cada
clase entre el total de datos (n). Si el resultado de la división se multiplica por 100
se expresa en %.
Ejemplo: La Fr de la 2ª. Clase es = (39 / 150) * 100 = 26.00 %
Nota : las Fr también se pueden obtener, acumulando en escalerilla las fr. En forma
similar a como se obtuvieron las F, sumando en escalerilla las f.
42
mailxmail - Cursos para compartir lo que sabes
43