Sunteți pe pagina 1din 156

UNIVERSIDAD TECNOLGICA DE

QUERTARO

MANUAL DE MTODOS ESTADSTICOS


PARA
TECNICO SUPERIOR UNIVERSITARIO
TECNOLOGA AMBIENTAL

Compilador: Joaqun Antonio Quiroz Carranza


1

CONTENIDO
INTRODUCCIN .................................................................................................... 3
CONCEPTOS GENERALES ................................................................................... 4
DATO, INFORMACIN Y CONOCIMIENTO ....................................................... 4
RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS ....................... 8
ESTADSTICA: CONCEPTOS GENERALES ......................................................... 9
TABLA DE FRECUENCIAS .................................................................................. 21
DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA DE LA
CALIDAD ........................................................................................................... 30
MEDIDAS DE TENDENCIA CENTRAL ................................................................. 39
TEORA DE CONJUNTOS .................................................................................... 58
TEORIA DE PROBABILIDAD................................................................................ 78
DISTRIBUCIN DE PROBABILIDAD ................................................................... 91
DISTRIBUCIN DE PROBABILIDAD BINOMIAL ................................................. 92
DISTRIBUCIN DE PROBABILIDAD CONTINUA .............................................. 104
ESTIMACIN DE INTERVALO DE CONFIANZA ............................................... 116
PRUEBA DE HIPOTESIS.................................................................................... 124
REGRESIN LINEAL SIMPLE .......................................................................... 133
GRFICOS DE CONTROL ................................................................................. 141

INTRODUCCIN

Todas las actividades cotidianas que realizan los seres humanos, implican la toma
de decisiones. Estas, para asumirse, requieren de informacin y conocimiento, los
cuales son resultado de la obtencin, organizacin, procesamiento y anlisis de
datos. Por ello se puede afirmar que de forma emprica o sistemtica todos los
seres humanos aplican mtodos estadsticos en su vida cotidiana, muchas de las
veces sin reconocer esta habilidad.
Este Manual de Mtodos Estadsticos tiene el objetivo de que el Tcnico Superior
Universitario reflexione diversos conceptos y ejercite habilidades en el manejo y
anlisis de datos mediante diversos mtodos estadsticos.
Lo ms relevante de estos apuntes es su orientacin hacia el autoaprendizaje o el
aprendizaje autnomo, por lo que cada apartado presenta una parte conceptual y
otra con ejercicios y repasos
Es necesario que como actividad transversal de la asignatura, los estudiantes
conformen equipos de trabajo, elijan un tema de inters relacionado con el plan de
estudios, busquen informacin bsica, elaboraren un cuestionario sobre el tema, lo
apliquen en el lugar correspondiente a un mnimo de 30 personas y procesen los
datos con las distintas tcnicas que se presentan a lo largo del curso como son
tablas de frecuencia, elaboracin de histogramas, calculo de medidas de
tendencia central y dispersin, entre otras.
Lo anterior, es con el fin de tener una aplicacin de los mtodos estadsticos,
sobre una porcin de la realidad de inters por parte de estudiantes, que
conformen cada uno de los equipos.
Este Manual de Mtodos estadsticos se complementa con procedimientos
detallados para realizar las aplicaciones o clculos en Excell, Word o Power point.

CONCEPTOS GENERALES
DATO, INFORMACIN Y CONOCIMIENTO

El dato es una representacin simblica (numrica, alfabtica, algortmica etc.), un


atributo o una caracterstica de una entidad (fenmeno, organismo, organizacin,
u objeto). El dato no tiene sentido en s mismo, pero s recibe un tratamiento o
procesamiento apropiado, se puede utilizar en la realizacin de clculos o toma de
decisiones o en la descripcin de sucesos y entidades.
Los datos son comunicados por varios tipos de smbolos tales como las letras del
alfabeto, nmeros, movimientos de

labios, puntos y rayas, seales con la

mano, dibujos, etc. Estos smbolos se pueden ordenar y reordenar de forma


utilizable para generar informacin.
Los datos son smbolos que describen condiciones, hechos, situaciones o valores
y se caracterizan por no contener ninguna informacin. Un dato puede significar
un nmero, una letra, un signo ortogrfico o cualquier smbolo que represente una
cantidad, una medida, una palabra o una descripcin.
La importancia de los datos est en su capacidad de asociarse dentro de un
contexto para convertirse en informacin. Por si mismos los datos no tienen
capacidad de comunicar un significado y por tanto no pueden afectar
el comportamiento de quien los recibe. Para ser tiles, los datos deben convertirse
en informacin para ofrecer un significado, conocimiento, ideas o conclusiones.
EL CONCEPTO DE INFORMACIN
La informacin no es un conjunto cualquiera de datos. Es una coleccin de hechos
significativos y pertinentes para el organismo u organizacin que los percibe ya
que describen sucesos o entidades.

Para ser significativos, los datos deben constar de smbolos reconocibles, estar
completos y expresar una idea no ambigua. Los smbolos de los datos son
reconocibles cuando pueden ser correctamente interpretados.
La integridad de los datos significa que todos los datos requeridos para responder
a una pregunta especfica estn disponibles. Los datos son inequvocos cuando el
contexto es claro. Tenemos que conocer el contexto de estos smbolos antes de
poder conocer su significado.
Los datos son pertinentes o relevantes cuando son utilizados para responder a
preguntas propuestas. Como se dispone de un considerable nmero de hechos en
nuestro entorno. Solo los hechos relacionados con las necesidades de informacin
son pertinentes.
DIFERENCIA ENTRE DATOS E INFORMACIN
Los datos a diferencia de la informacin son utilizados con diversos mtodos para
organizarlos

presentarlos

fin

de

permitir

una

transmisin

almacenamiento ms eficaces.
La cantidad de informacin de un mensaje puede ser entendida como el nmero
de smbolos posibles que representan el mensaje, los smbolos que representan el
mensaje no son ms que datos significativos.
En su concepto ms elemental, la informacin es un mensaje con un contenido
determinado emitido por una entidad hacia otra y, como tal, representa un papel
primordial en el proceso de la comunicacin, a la vez que posee una evidente
funcin social.
A diferencia de los datos, la informacin tiene significado para quien la recibe, por
eso, los seres humanos siempre han tenido la necesidad de cambiar entre s
informacin que luego transforman en acciones. La informacin es un conjunto de
datos procesados con significado, propsito y utilidad.

PRINCIPALES CARACTERSTICAS DE LA INFORMACIN


En general la informacin tiene una estructura interna y puede ser calificada segn
varios aspectos:

Significado: Qu quiere decir?, del significado de una informacin, cada


individuo evala las consecuencias posibles y adeca sus actitudes y acciones
de manera acorde a las consecuencias previsibles que se deducen del
significado de la informacin.

Importancia relativa al receptor: Trata sobre alguna cuestin importante? se


refiere al grado en que cambia la actitud o la conducta de los individuos.

Vigencia: Es actual o desfasada? En la prctica la vigencia de una


informacin es difcil de evaluar, ya que en general acceder a una informacin
no permite conocer de inmediato si dicha informacin tiene o no vigencia.

Validez: El emisor es fiable o puede proporcionar informacin falsa?

Valor: Qu tan til resulta la informacin para el destinatario?

USOS DE LA INFORMACIN
Se considera que la generacin y/o obtencin de informacin persigue estos
objetivos:

Aumentar o mejorar el conocimiento del usuario.

Reducir la incertidumbre existente sobre un conjunto de alternativas


lgicamente posibles.

Facilitar la gestin y toma decisiones

Proporcionar elementos parta la evaluacin y el control.

EL CONCEPTO DE CONOCIMIENTO
El conocimiento puede definirse como:

1. Hechos, informacin e ideas adquiridas por una persona a travs de la


experiencia o la educacin, la comprensin terica o prctica de un tema.
2. Lo que se conoce en un campo determinado o en su totalidad.
3. Conciencia o familiaridad adquirida por la experiencia de un hecho o
situacin.
La

adquisicin

de

cognitivos complejos: percepcin,

conocimiento

implica

aprendizaje, comunicacin,

procesos
asociacin

razonamiento.
Las ciencias constituyen uno de los principales tipos de conocimiento. Las ciencias
son el resultado de esfuerzos sistemticos y metdicos de investigacin en busca
de respuestas a problemas especficos, al funcionamiento y relacin de los
fenmenos, y cuya elucidacin procura ofrecernos una representacin adecuada
del universo.
Hay tambin, muchos tipos de conocimiento que, sin ser cientficos, no dejan de
estar perfectamente adaptados a sus propsitos: el saber hacer en la artesana, el
saber nadar, entre otros; el conocimiento de la lengua, de las tradiciones,
leyendas, costumbres o ideas de una cultura particular; el conocimiento que los
individuos tienen de su propia historia: su propio nombre, la historia de sus padres,
su pasado, etc., o an los conocimientos comunes a una sociedad dada, incluso a
la humanidad: saber para qu sirve un martillo, saber que el agua extingue el
fuego, etc.
Los conocimientos se

adquieren mediante

cognitivos: percepcin, memoria,

experiencia,

una

pluralidad de

razonamiento,

procesos

enseanza-

aprendizaje, testimonio de terceros, etc. Estos procesos son objeto de estudio de


la ciencia cognitiva. Por su parte, la observacin controlada, la experimentacin, la
modelizacin, la crtica de fuentes, las encuestas y otros procedimientos que son
especficamente empleados por las ciencias, pueden considerarse como un
refinamiento o una aplicacin sistemtica de los anteriores.

El conocimiento se deriva de la informacin, as como la informacin se deriva de


los datos. Para que la informacin se convierta en conocimiento es necesario
realizar acciones como:

Comparacin con otros elementos.

Prediccin de consecuencias.

Bsqueda de conexiones.

Conversacin con otros portadores de conocimiento.

RECOLECCIN, CLASIFICACIN Y ANLISIS DE DE DATOS


LA RECOLECCIN DE DATOS
La

recoleccin

de datos se

refiere

al

uso

de

una

gran

diversidad

de tcnicas y herramientas que pueden ser utilizadas por el acopio de datos, que
permitan desarrollar sistemas de informacin, los cuales pueden ser entrevistas,
encuestas, cuestionario, observaciones, diagramas de flujo, censos, registros,
entre otros.
Todos estos instrumentos se aplican en un momento determinado, con la finalidad
de buscar informacin que ser til a una investigacin particular.
CLASIFICACIN DE DATOS
Las caractersticas o propiedades de los organismos o entidades que son
recolectados en forma de datos, son el producto de las observaciones o
mediciones que se hace sobre ellos.
8

Los datos o caractersticas de fenmenos u objetos, los cuales una vez


organizados

analizados

dan

informacin

sobre

su

estado,

pueden

ser clasificados en cualitativos, cuantitativos, cronolgicos y geogrficos


Los datos cualitativos: representan caractersticas de clase o tipo

y no de

cantidad. Ejemplo: Si se desea clasificar a los estudiantes que cursan una


determinada asignatura por su estado civil, observamos que pueden existir
solteros, casados, divorciados, viudos, en unin libre o concubinato.
Los datos cuantitativos: son aquellos cuyo valor representa diferentes magnitudes.
Ejemplo: Se clasifican los estudiantes por sus notas y se observa que los valores
de los notas representan diferentes magnitudes, as mismo pueden clasificarse por
su estatura, peso, velocidad, entre otros.
Los datos cronolgicos: cuando los valores de los datos varan en diferentes
instantes o perodos de tiempo, los datos son reconocidos como cronolgicos.
Ejemplo: Al registrar los promedios de notas de los Alumnos en diferentes
semestres.
Los datos geogrficos: cuando los datos estn referidos a una localidad geogrfica
se dicen que son datos geogrficos. Ejemplo: El nmero de estudiantes de
educacin superior en las distintas regiones del pas.

ESTADSTICA: CONCEPTOS GENERALES


La estadstica es una disciplina utilizada para lograr el conocimiento o el estado de
un hecho o fenmeno, as como para inferir el comportamiento futuro del mismo.
Lo anterior permite la toma de decisiones.
POBLACIN
Una poblacin es un conjunto finito o infinito de individuos, hechos u objetos que
presentan caractersticas comunes o comportamientos afines. El tamao que tiene
una

poblacin

es

un

factor

de

suma

importancia

en
9

el proceso de investigacin estadstica, y este tamao vienen dado por el nmero


de elementos que constituyen la poblacin, segn el nmero de elementos la
poblacin puede ser finita o infinita.
Cuando el nmero de elementos que integra la poblacin es muy grande, se
puede considerar a esta como una poblacin infinita, Cuando la poblacin es muy
grande, es obvio que la observacin de todos los elementos se dificulta en cuanto
a esfuerzo, tiempo y costos necesario

para

hacerlo.

Para

solucionar

este

inconveniente se utiliza una muestra estadstica.


MUESTRA
Muestra a una parte de la poblacin que presenta las mismas caractersticas y que
la representa. Las conclusiones que se obtengan de dicha muestra solo podrn
referirse a la poblacin en referencia. Una muestra representativa contiene las
caractersticas relevantes de la poblacin en las mismas proporciones que estn
incluidas en tal poblacin.
A travs de la estadstica se analizan datos, previamente recolectados, de una
muestra. La informacin generada se utiliza para describir el estado actual de las
caractersticas de una poblacin (estadstica descriptiva) o para inferir y predecir
su comportamiento futuro (estadstica inferencial)
MUESTREO
El muestreo es el procedimiento o tcnica para obtener una o ms muestras de
una poblacin. Este se realiza una vez que se ha establecido un marco de
muestreo representativo de la poblacin. As se procede a la seleccin de los
elementos de la muestra. Al tomar varias muestras de una poblacin,
los estadsticos que

calculamos

para

cada

muestra

no

necesariamente

sern iguales, y lo ms probable es que variaran de una muestra a otra.


TIPOS DE MUESTREO
El muestreo no aleatorio o de juicio se basa, para la eleccin de la muestra, en la
experiencia de alguien con la poblacin. Algunas veces una muestra de juicio se
usa como gua o muestra tentativa para decidir como tomar una muestra aleatoria
10

ms adelante. Las muestras de juicio evitan el anlisis estadstico para hacer


muestras de probabilidad.
En el muestreo aleatorio o de probabilidad, todos los elementos de la poblacin
tienen la oportunidad de ser escogidos en la muestra.
VARIABLES Y ATRIBUTOS
Las variables, tambin suelen ser llamados caracteres cuantitativos, son aquellos
que pueden ser expresados mediante nmeros. Son caracteres susceptibles
de medicin. Como por ejemplo, la estatura, el peso, el salario, la edad, etc.
Una variable es un smbolo, tal como X, Y, Hx, que puede tomar
un valor cualquiera de un conjunto determinado de ellos. Si la variable puede
tomar solamente un valor, se llama constante.
Todos los elementos de la poblacin poseen los mismos tipos de caracteres, pero
generalmente estos no suelen presentarse con la misma intensidad, por lo que las
variables toman distintos valores. Los distintos nmeros o medidas que toman los
caracteres son los "valores de la variable". Todos ellos juntos constituyen una
variable.
Los atributos tambin llamados caracteres cualitativos, son aquellos que no son
susceptibles de medicin, es decir que no se pueden expresar mediante un
nmero, por ejemplo; profesin, estado civil, sexo, nacionalidad, etc.
Las variables, tambin llamadas caracteres cuantitativos, son aquellas cuyas
variaciones son susceptibles de ser medidas cuantitativamente, es decir, que
pueden expresar numricamente la magnitud de dichas variaciones. Por intuicin
y por experiencia sabemos que pueden distinguirse dos tipos de variables; las
continuas y las discretas
Las variables continuas se caracterizan por el hecho de que para todo tipo de
valores siempre se puede encontrar en valor intermedio, (el peso, la estatura, el
tiempo empleado para realizar un trabajo, etc.) Una variable es continua, cuando
puede tomar infinitos valores intermedios dentro de dos valores consecutivos. Por
ejemplo, la estatura, el peso, la temperatura.
11

Las variables discretas sern aquellas que pueden tomar solo un nmero limitado
de valores separados y no continuos; son aquellas que solo toman un determinado
nmeros de valores, porque entre dos valores consecutivos no pueden tomar
ningn otro; por ejemplo el nmero de estudiantes de una clase es una variable
discreta ya que solo tomar los valores 1, 2, 3, 4... no es posible encontrar valores
como 1.5 estudiantes
FORMAS DE OBSERVAR LA POBLACIN.
Observacin directa: cuando se tiene un contacto directo con los elementos o
caracteres en los cuales se presenta el fenmeno que se pretende investigar, y los
resultados obtenidos se consideran datos estadsticos originales.
Observacin Indirecta: cuando se hace uso de datos estadsticos ya conocidos en
una investigacin anterior, o de datos observados por un tercero (persona o
entidad). Con el fin de deducir otros hechos o fenmenos.
Observacin contina: cuando se lleva acabo de un modo permanente.
Observacin peridica: cuando se lleva a cabo a travs de perodos de tiempo
constantes (semanal, trimestral, semestral, anual, etc.).
Observacin circunstancial: cuando se efecta en forma ocasional o espordica.
Observacin Exhaustiva: cuando la observacin es efectuada sobre la totalidad de
los elementos de la poblacin se habla de una observacin exhaustiva.
Observacin Parcial: dados que las poblaciones en general son grandes, la
observacin de todos sus elementos se ve imposibilitada. La solucin para superar
este inconveniente es observar una parte de esta poblacin.
Observacin Mixta: en este tipo de observacin se combinan adecuadamente la
observacin exhaustiva con la observacin parcial. Por lo general, este tipo de
observaciones se lleva a cabo de tal manera que los caracteres que se consideran

12

bsicos se observan exhaustivamente y los otros mediante una muestra; o bien


cuando la poblacin es muy grande, parte de ella se observa parcialmente.
CENSO
Se entiende por censo aquella numeracin que se efecta a todos y cada uno de
los caracteres componentes de una poblacin.
ENCUESTA
Se entiende por encuesta las observaciones realizadas por muestreo, es decir son
observaciones parciales. Esta se efecta a travs de cuestionarios verbales o
escritos que son aplicados a un determinado nmero de personas.
ESTADSTICA DESCRIPTIVA
Tienen por objeto fundamental describir y analizar las caractersticas de un
conjunto de datos, obtenindose de esa manera conclusiones sobre las
caractersticas de dicho conjunto y sobre las relaciones existentes con otras
poblaciones, a fin de compararlas. No obstante puede no solo referirse a la
observacin de todos los elementos de una poblacin (observacin exhaustiva)
sino tambin a la descripcin de los elementos de una muestra (observacin
parcial).
ESTADSTICA INDUCTIVA O INFERENCIAL
Est fundamentada en los resultados obtenidos del anlisis de una muestra de
poblacin, con el fin de inducir o inferir el comportamiento o caracterstica de la
poblacin, de donde procede, por lo que recibe tambin el nombre de Inferencia
estadstica.
MEDICIN DE CARACTERES
MEDICIN
Existen diversas definiciones del trmino "medicin", pero estas dependen de los
diferentes puntos de vista que se puedan tener al abordar el problema de la

13

cuantificacin

el

proceso

mismo

de

la

construccin de

una escala o instrumento de medicin.


En general, se entiende por medicin la asignacin de nmeros a elementos u
objetos para representar o cuantificar una propiedad. El problema bsico est
dado por la asignacin

de un numeral que represente la magnitud de la

caracterstica que queremos medir y que dicho nmeros pueden analizarse por
manipulaciones de acuerdo a ciertas reglas.
Por medio de la medicin, los atributos de nuestras percepciones se transforman
en entidades conocidas y manejables llamadas "nmeros". Es evidente que
el mundo resultara catico si no pudiramos medir nada. En este caso cabra
preguntarse

de

que

le

servira

al

fsico saber

que

el hierro tiene

una

alta temperatura de fusin.


NIVELES O ESCALAS DE MEDICIONES
Escala Nominal o de clase: consiste en la asignacin, puramente arbitraria de
nmeros o smbolos a cada una de las diferentes categoras en las cuales
podemos dividir el carcter que observamos, sin que puedan establecerse
relaciones entre dichas categoras, a no ser el de que cada elemento pueda
pertenecer a una y solo una de estas categoras.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a
la misma sean equivalentes respecto del atributo o propiedad en estudio, despus
de lo cual se asignan nombres a tales clases, y el hecho de que a veces, en lugar
de denominaciones, se le atribuyan nmeros, puede ser una de las razones por
las cuales se le conoce como "medidas nominales".
Escala Ordinal: En caso de que puedan detectarse diversos grados de un atributo
o propiedad de un objeto, la medida ordinal es la indicada, puesto que entonces
puede recurrirse a la propiedad de "orden" de los nmeros asignndolo a los
objetos en estudio de modo que, si la cifra asignada al objeto A es mayor que la
de B, puede inferirse que A posee un mayor grado de atributo que B.

14

La asignacin de nmeros a las distintas categoras no puede ser completamente


arbitraria, debe hacerse atendiendo al orden existente entre stas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho
mismo de poder ordenar todas sus categoras, el clculo de las medidas
estadsticas de posicin, como por ejemplo la mediana.
Escalas de intervalos iguales: est caracterizada por una unidad de medida
comn y constante que asigna un nmero igual al nmero de unidades
equivalentes a la de la magnitud que posea el elemento observado. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta
escala, adems de poseer las caractersticas de la escala ordinal, encontramos
que la asignacin de los nmeros a los elemento es tan precisa que podemos
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. Sin lugar a dudas, podemos decir que la escala de intervalos es la primera
escala verdaderamente cuantitativa y a los caracteres que posean esta escala de
medida pueden calculrsele todas las medidas estadsticas a excepcin del
coeficiente de variacin.
Ejemplo:
El lapso transcurrido entre 1998-1999 es igual al que transcurri entre 2000-2001.
Escala de coeficientes o Razones: El nivel de medida ms elevado es el de
cocientes o razones, y se diferencia de las escalas de intervalos iguales
nicamente por poseer un punto cero propio como origen; es decir que el valor
cero de esta escala significa ausencia de la magnitud que estamos midiendo. Si se
observa una carencia total de propiedad, se dispone de una unidad de medida
para el efecto. A iguales diferencias entre los nmeros asignados corresponden
iguales diferencias en el grado de atributo presente en el objeto de estudio.
Adems, siendo que cero ya no es arbitrario, sino un valor absoluto, podemos
decir que A tiene dos, tres o cuatro veces la magnitud de la propiedad presente en
B.

15

Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observ que hay
familias que no tienen hijos, otras tienen 6 hijos que es exactamente el doble de
hijos que aquellas que tienen 3 hijos.
MTODO PARA LA RECOLECCIN DE DATOS:
En estadstica se emplean una variedad de mtodos distintos para obtener
informacin de los que se desea investigar.
La entrevista personal: los datos estadsticos necesarios para una investigacin,
se renen frecuentemente mediante un proceso que consiste en enviar un
entrevistador o agente, directamente a la persona investigada. El investigador
efectuar a esta persona una serie de preguntas previamente escritas en
un cuestionario o boleta, donde anotar las respuestas correspondientes. Este
procedimiento que se conoce con el nombre de entrevista personal, permite
obtener una informacin ms veraz y completa que la que proporcionan otros
mtodos, debido a que al tener contacto directo con la persona entrevistada, el
entrevistador podr aclarar cualquier duda que se presente sobre el cuestionario o
investigacin.
Desventajas:

si

el

entrevistador

no

obra

de

buena

fe

no

tiene

un entrenamiento adecuado, puede alterar las respuestas por las personas


entrevistadas. Alto costo, ya que resulta bastante oneroso el entrenamiento de los
agentes y los supervisores de estos, sobre todo si se trata de una investigacin
extensa.
Cuestionarios por correo: consiste en enviar por correo el cuestionario
acompaado por el instructivo necesario, dando en este no solo las instrucciones
pertinentes para cada una de las preguntas, sino tambin una breve explicacin
del objeto de la encuesta con el fin de evitar interpretaciones errneas.
Una de las ventajas es que tienen un costo muy inferior al anterior procedimiento,
puesto que no hay que incluir gastos de entrenamiento de personal, el nico gasto
sera el de franqueo postal.
16

Dentro de las desventajas de este procedimiento podemos sealar que solo un


porcentaje bastante bajo de estos es devuelto, en algunos casos no
estamos seguros de que los formularios hayan sido recibidos por sus destinatarios
y que hayan sido respondido por ellos mismos. Lo que trae como consecuencia
que la informacin se obtenga con una serie de errores difciles de precisar por el
investigador.
Entrevista por telfono: como lo indica su nombre, este mtodo consiste en
telefonear a la persona a entrevistar y hacerle una serie de preguntas. Este
mtodo es bastante simple y econmico, ya que el entrenamiento y supervisin de
las personas encargadas de efectuar las preguntas es siempre fcil.
Entre las limitaciones que presenta este mtodo podemos sealar el nmero de
preguntas que pueden formularse es relativamente limitado; adems las
investigaciones efectuadas por este mtodo tienen un carcter selectivo, debido a
que muchas de las personas que potencialmente podran ser investigadas no
posee servicio telefnico, por lo que quedan sin la posibilidad de ser entrevistados.
INSTRUMENTOS PARA LA RECOLECCIN DE DATOS:
Cuestionarios:
Cualquiera que sea el mtodo por el que se decida el investigador para recabar
informacin, es necesario elaborar un estudio de preguntas.
Los cuestionarios en general, constan de las siguientes partes:
a. La identificacin del cuestionario: nombre del patrocinador de la encuesta,
(oficial o privada), nombre de la encuesta, nmero del cuestionario, nombre
del encuestador, lugar y fecha de la entrevista.
b. Datos de identificacin y de carcter social del encuestado: apellidos,
nombres, cdula de identidad, nacionalidad, sexo, edad o fecha de
nacimiento, estado civil, grado de instruccin, ocupacin actual, ingresos, etc.
c. Datos propios de la investigacin, son los datos que interesa conocer para
construir el propsito de la investigacin.

17

Como es natural, estas partes, as como las preguntas, varan de acuerdo a la


finalidad de la encuesta. En algunos tipos de investigacin, la parte referente a los
datos personales es eliminada por no tener ningn tipo de inters para el estudio.
Consideraciones que debemos tomar en cuenta:

El cuestionario debe ser conciso; tratar en lo posible de que con el menor


nmero de preguntas, se obtenga la mejor informacin.

Claridad de la redaccin; evitar preguntas ambiguas o que sugieran respuestas


incorrectas, por lo que deben estar formuladas las preguntas de la forma ms
sencilla.

Discrecin: un cuestionario hecho a conciencia, no debe tener preguntas


indiscretas o curiosas, sobre datos personales que puedan ofender al
entrevistado.

Facilidad de contestacin: se deben evitar, en lo posible, las preguntas de


respuestas libres o abiertas y tambin la formulacin de preguntas que
requieran clculos numricos por parte del entrevistado.

Orden de las preguntas: estas deben tener una secuencia y un orden lgico,
agruparlas procurando que se relacionen unas con otras.

TIPOS DE MUESTREO

Muestreo probabilstico: consiste en elegir una muestra de una poblacin al


azar. Podemos distinguir varios tipos de muestreo:
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la poblacin y se
seleccionan al azar los n elementos que contiene la muestra.
Muestreo aleatorio sistemtico
Se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los
dems hasta completar la muestra.

Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos
extraer una muestra de 25 elementos, en primer lugar debemos establecer el
18

intervalo de seleccin que ser igual a 100/25 = 4. A continuacin elegimos el


elemento de arranque, tomando aleatoriamente un nmero entre el 1 y el 4, y a
partir de l obtenemos los restantes elementos de la muestra.
2, 6, 10, 14,..., 98
Muestreo aleatorio estratificado
Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un
nmero de individuos de cada estrato proporcional al nmero de componentes de
cada estrato. En una fbrica que consta de 600 trabajadores queremos tomar una
muestra de 20. Sabemos que hay 200 trabajadores en la seccin A, 150 en la B,
150 en la C y 100 en la D.

La operacin sealada es:


200 x 20 / 600= 6.6 7
150 x 20 / 150= 5
150 x 20 /150= 5
100 x 20 /100= 3.3 3
Un muestreo puede hacerse con o sin reposicin, y la poblacin de partida
puede ser infinita o finita.
En todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o
a muestreo con reposicin.
19

Si consideremos todas las posibles muestras de tamao n en una poblacin,


para cada muestra podemos calcular un estadstico (media, desviacin tpica,
proporcin) que variar de una a otra.
As obtenemos una distribucin del estadstico que se llama distribucin
muestral.
TABLA DE NMEROS ALEATORIOS

4251 5149 4751 4847 4249 4648 5047 4847 5156 8789

7227 0104 4141 1521 9104 5563 1392 8238 4882 2324

4849 5051 5046 4756 4738 5350 4746 4847 4846 2346

8506 6348 4612 8252 1062 1757 0964 2983 2244 7654

5692 9870 3583 8997 1533 6466 8830 7271 3809 4256

5086 0303 7423 3298 3979 2831 2257 1508 7642 1245

2080 3828 7880 0586 8482 7811 6807 3309 2729 2235

3690 2492 7171 7720 6509 7549 2330 5733 4730 4534

1039 3382 7600 1077 4455 8806 1822 1669 7501 8330

0813 6790 6858 1489 2669 3743 1901 4971 8280 0835

6477 5289 4092 4223 6454 7632 7577 2816 9002 2365

6905 7127 5933 1137 7583 6450 5658 7678 3444 3754

4554 6146 4846 4647 5034 4646 5139 5355 5249 2224

8387 5323 3753 1859 6043 0294 5110 6340 9137 6323

0772 2160 7236 0812 4195 5589 0830 8261 9232 0902

4094 4957 0163 9717 4118 4276 9465 8820 4127 0202

0092 1629 0377 3590 2209 4839 6332 1490 3092 2390

4951 3781 5101 1815 7068 6379 7252 1086 8919 2093

7315 3365 7203 1231 0546 6612 1038 1425 2709 3092

9047 0199 5068 7447 1664 9278 1708 3625 2864 0204

5775 7517 8974 3961 2183 5295 3096 8536 9442 2392

7274 9512 0074 6677 8676 0222 3335 1976 1645 3203

5500 2276 6307 2346 1285 7000 5306 0414 3383 2303

9192 4011 0255 5458 6942 8043 6201 1587 0972 0243

3251 8902 8843 2112 8567 8131 8116 5270 5994 9092

0554 1690 6333 1931 9433 2661 8690 2313 6999 3094

4675 1435 2192 0874 2897 0262 5092 5541 4014 2113

9231 5627 1815 7171 8036 1832 2031 6298 6073 9044

3543 6130 4247 4859 2660 7852 9096 0578 0097 1324

3995 9677 7765 3194 3222 4191 2734 4469 8617 3233

3521 8772 6612 0721 3899 2999 1263 7017 8057 3443

2402 6250 9362 7373 4757 1716 1942 0417 5921 5345

5573 9396 3464 1702 9204 3389 5678 2589 0288 6343

5295 7385 5474 2123 7035 9983 5192 1840 6176 5756

7478 7569 7551 3380 2152 5411 2647 7242 2800 3432

5177 1191 2106 3351 5057 0967 4538 1246 3374 0304

3339 2854 9691 9562 3252 9848 6030 8472 2266 3255

4344 4044 4549 4443 4249 4948 4151 5152 4240 4737

5505 8474 3167 8552 5409 1556 4247 4652 2953 9854

7343 4706 4440 4646 4548 4742 4746 5253 4749 4689

6381 2086 5457 7703 2758 2963 8167 6712 9820 5324
0935 5565 2315 8030 7651 5189 0075 9353 1921 0222
2605 3973 8204 4143 2677 0034 8601 3340 8383 3243
7277 9889 0390 5579 4620 5650 0210 2082 4664 5643
5484 3900 3485 0741 9069 5920 4326 7704 6525 1249

20

TABLA DE FRECUENCIAS
Definicin
Las tablas de frecuencias o tabla de relaciones es una herramienta estadstica que
se usa para ordenar o tabular datos o valores, que previamente fueron obtenidos
de una o ms variables de una muestra. Con ellas, un conjunto de datos
desordenados pasa a ser una coleccin ordenada e inteligible. Para construir
cualquier tipo de histograma o representacin grfica se necesita primero agrupar
los datos en una tabla la cual se conoce como tabla de frecuencias.
En el caso de datos numricos continuos (ejemplo: 9.5, 6.7, 8.4) los datos se
agrupan en intervalos. Un intervalo es un conjunto de nmeros que se
corresponden con los puntos de una recta o segmento, en el que se encuentra un
ordenamiento interno entre ellos. El intervalo es el espacio que se da de un punto
a otro en el cual se toman en cuenta todos los puntos intermedios.
Ejemplo: en una recta tenemos un intervalo: [-2,2] entre este espacio se
encuentran los nmeros (-2-1,0,1,2), esto es un intervalo.....ya que el espacio
abarca una serie de nmeros consecutivos que se corresponden entre s.

Los intervalos deben poseer las siguientes caractersticas:


1. Todos deben ser del mismo ancho.
2. No se deben solapar.
3. Todos los datos deben caer en uno de los intervalos.
4. Deben haber un total de entre 5 y 15 intervalos (en dependencia del
fenmeno de estudio)

21

La frecuencia indica el nmero de repeticiones de cualquier hecho, fenmeno o


suceso, la frecuencia de un intervalo es el nmero de datos que se encuentran en
l.
Construccin de una tabla de frecuencias
Las tablas de frecuencia sirven para preparar representaciones grficas como el
histograma de frecuencias:
Un histograma es una representacin grfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En este grfico en su eje vertical (Y) se representan las
frecuencias y en el eje horizontal (X) los valores de las variables, normalmente
sealando las marcas de clase, es decir, la mitad del intervalo en el que estn
agrupados los datos. Las representaciones grficas se usan para resaltar la
diferencia entre las clases en que se han agrupado los datos.
El histograma se utiliza cuando se estudia una variable continua, como franjas de
edades o altura de la muestra, y, por comodidad, sus valores se agrupan en
clases, es decir, valores continuos. Los histogramas son ms frecuentes en
ciencias sociales, humanas y econmicas que en ciencias naturales y exactas. Y
permite la comparacin de los resultados de un proceso.
Para preparar la tabla de frecuencia para un histograma se procede con los
siguientes pasos:
Primero, se establece el nmero de intervalos que se desea tener.
Segundo, se debe determinar el ancho comn de los intervalos. Para esto, se
calcula la diferencia del dato mayor y el dato menor, y se divide entre el nmero de
intervalos deseados. Este resultado se redondea al entero mayor ms cercano.
Por ejemplo, si se desea tener 10 intervalos y encontramos que el dato mayor es
35 y el menor es 12. El ancho comn se determina: 35-12= 23/10= 2.3 o 2
22

Tercero, se determina el lmite superior de cada intervalo. Este valor sirve como
demarcador y corresponde al valor mayor que se encontrar en el intervalo. Para
determinar el lmite superior de cada intervalo procedemos de la manera siguiente:
Ejemplo 1: Al preparar una tabla de frecuencia de cinco intervalos para el conjunto
de los siguientes 20 datos: 5, 7, 8, 3, 7, 7, 1, 9, 6, 8 5, 6, 7, 8, 7, 9, 6, 8, 6, 6
1. Definicin de ancho de intervalo: Dato mayor- dato menor / nmero de
intervalos deseados 9-1=8 / 5= 1.6 = 2
Como el dato menor es 1, seleccionaremos a 2 como lmite superior del primer
intervalo. Entonces, el lmite superior del segundo intervalo ser 2 + 2 = 4; el del
segundo ser 4+ 2 = 6 y as sucesivamente, obtenemos que los lmites superiores
para los restantes intervalos son: 8, 10, 12. Por tanto, la tabla de frecuencia es:

Datos

Intervalo

Frecuencia

0-2

2-4

4-6

6-8

8-10

Frecuencia
absoluta

Frecuencia
relativa %

1/20= 0.05

1/20 = 0.05

7/20= 0.35

35

9/20= 0.45

45

2/20= 0.1

10

6
6
6
6
7
7
7
7
7
8
8
8
8
9
9
100

23

Determinacin de la frecuencia en Excell


En Excel se puede calcular de manera automtica la tabla de frecuencia de un
conjunto de datos.
Paso 1: Ingresar los nmeros en la columna A, empezando en A1. Presione la
tecla "ENTER" despus de cada uno de los datos.
Paso 2: Calcule el ancho comn de los cinco intervalos y las lmites superiores de
cada uno:
Dato mayor = 9, Dato menor = 1, por tanto
Los lmites superiores son: 2, 4, 6, 8, 10.
Paso 3: En la columna B, empezando en B1 ingrese 2, 4, 6, 8.
No es necesario ingresar el lmite superior del ltimo intervalo 10. Esto se debe a
que en Excel, se entiende que el ltimo intervalo contendr a todos los valores
mayores que el lmite superior del intervalo anterior. De la misma forma Excel
sobre entiende que el primer intervalo incluye todos los valores menores que su
lmite inferior.
Paso 4: Como el histograma tendr 5 intervalos,

se seleccionan 5 celdas

contiguas: c3:c7.
Paso 5: En la barra men seleccione la opcin frmulas, seleccione el submen
ms funciones, posteriormente estadsticas y el botn de frecuencia:
=frequencia(a1:a20, b1:b4)
Observe que la primera parte contiene la lista de datos entre la a1 y la a20.
Despus se coloca una coma y un espacio. La segunda parte contiene la lista de
lmites superiores de cada intervalo b1:b4.

24

En la barra de datos se ingresan los valores de la columna a (a1:a20) y en la de


grupos los valores de la columna b (b1:b4), se presiona aceptar.
Paso 6: Presione simultneamente las teclas Control-Shift-Enter.
Ver que se desplegarn una lista de cinco nmeros. Estos corresponden a la
frecuencia de cada intervalo.
Ejercicios:
1. Para cada uno de los siguientes, se indica el nmero de intervalos deseados,
el dato mayor y el dato menor. Determine el ancho comn de los intervalos.
1. Nmero de intervalos deseados es 5; dato mayor = 20; dato menor = 4.
2. Nmero de intervalos deseados es 5; dato mayor = 30; dato menor = 8.
3. Nmero de intervalos deseados es 8; dato mayor = 20; dato menor = 4.
4. Nmero de intervalos deseados es 10; dato mayor = 100; dato menor = 8.
5. Nmero de intervalos deseados es 10; dato mayor = 50; dato menor = 20.

Histograma de frecuencias
En estadstica un histograma es una representacin grfica de una variable en
forma de barras, donde la superficie de cada barra es proporcional a la frecuencia
de los valores representados. En el eje vertical se representan las frecuencias, y
en el eje horizontal los valores de las variables.
Tipos de histograma
Diagramas de barras simples. Representa la frecuencia simple (absoluta o
relativa) mediante la altura de la barra la cual es proporcional a la frecuencia
simple de la categora que representa.

25

Polgono de frecuencias. Es un grfico de lneas que se usa para presentar las


frecuencias absolutas de los valores de una distribucin en el cual la altura del
punto asociado a un valor de las variables es proporcional a la frecuencia de dicho
valor.

Construccin de un histograma
Paso 1 Determinar el rango de los datos. Rango es igual al dato mayor
menos el dato menor.
Ejemplo: 9-1= 8
Paso 2 Obtener los nmeros de clases, existen varios criterios para
determinar el nmero de clases (o barras), sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de cmo estn los datos y cuntos sean. Un criterio usado
frecuentemente es que el nmero de clases debe ser aproximadamente a la
raz cuadrada del nmero de datos. Por ejemplo, la raz cuadrada de 30
(nmero de datos) es mayor que cinco, por lo que se seleccionan seis
clases. Ejemplo: 20 datos, raz de 20= 4.47 = 5 clases
Paso 3 Establecer la longitud de clase: es igual al rango dividido por el
nmero de clases. Ejemplo: 8/5= 1.6 =2
Paso 4 Construir los intervalos de clases: Los intervalos resultan de dividir
el rango de los datos en relacin al resultado del PASO 2 en intervalos
iguales. 2
Paso 5 Graficar el histograma: En caso de que las clases sean todas de la
misma amplitud, se hace un grfico de barras, las bases de las barras son
los intervalos de clases y altura son la frecuencia de las clases. Si se unen
los puntos medios de la base superior de los rectngulos se obtiene el
polgono de frecuencias.
26

Elaboracin de un histograma de frecuencias en Excell

Una vez que est disponible la tabla de frecuencias en el programa Excell, se


hace click en datos, opcin del men superior. En datos se busca la opcin
anlisis de datos, si no se encuentra disponible, se carga siguiendo las
indicaciones de ayuda.
Una vez instalado la opcin anlisis de datos, se hace click y se selecciona la
opcin histograma, colocando en la celda Rango de entrada el total de los
datos de la columna A1 y en la celda Rango de clases los datos de la columna B,
damos click en crear grfico y nos despliega una representacin como la
siguiente:

Histograma
Frecuencia

10
8
6
4
Frecuencia

2
0
2

y mayor...

Clase

Polgono de frecuencias

Un polgono de frecuencias es un grfico que se realiza a travs de la unin de los


puntos ms altos de las columnas de un histograma de frecuencia. Un polgono de
frecuencias permite representar, por ejemplo, las temperaturas mximas promedio
de un pas en un periodo de tiempo. En el eje X (horizontal), pueden sealarse los
meses del ao (enero, febrero, marzo, abril, etc.) En el eje Y (vertical), se indican
27

las temperaturas mximas promedio de cada mes (24, 25, 27, etc.). El polgono
de frecuencias se crea al unir, con una lnea, todas las temperaturas mximas
promedio.

Elaboracin de un Polgono de frecuencias en Excell

Una vez que disponemos del histograma de frecuencias, se coloca en cursor


sobre el grfico y se presiona el botn derecho del mouse. En el men que se
despliega se puede observar la opcin cambiar tipo de grfico, se hace click y se
selecciona el grfico deseado, el cual puede quedar como la siguiente imagen.

Frecuencia

Polgono de Frecuencia
10
5
Frecuencia

0
2

10

Clase

28

Tabla de frecuencia e histograma en Excell


A

29

DIAGRAMA DE PARETO: HERRAMIENTA BSICA PARA LA MEJORA


DE LA CALIDAD
Concepto de Diagrama de Pareto
El diagrama de Pareto es una herramienta que se utiliza para priorizar los
problemas o las causas que los generan. El nombre de Pareto fue dado por el Dr.
Juran en honor del economista italiano WILFREDO PARETO (1848-1923) quien
realiz un estudio sobre la distribucin de la riqueza, en el cual descubri que la
minora de la poblacin posea la mayor parte de la riqueza y la mayora de la
poblacin posea la menor parte de la riqueza.

El Dr. Juran aplic este concepto a la calidad, obtenindose lo que hoy se conoce
como la regla 80/20. Segn este concepto, si se tiene un problema con muchas
causas, podemos decir que el 20% de las causas resuelven el 80 % del problema
y el 80 % de las causas solo resuelven el 20 % del problema.
Se recomienda el uso del diagrama de Pareto para:

Identificar oportunidades para mejorar

Identificar un producto o servicio para el anlisis de mejora de la calidad.

Si se requiere llamar la atencin a los problemas o causas de una forma


sistemtica.

Analizar las diferentes agrupaciones de datos.

Al buscar las causas principales de los problemas y establecer la prioridad


de las soluciones

Evaluar los resultados de los cambios efectuados a un proceso


comparando sucesivos diagramas obtenidos en momentos diferentes,
(antes y despus)

Cuando los datos puedan clasificarse en categoras

Cuando el rango de cada categora es importante

Para comunicar fcilmente a otros miembros de la organizacin las


conclusiones sobre causas, efectos y costes de los errores.
30

Los propsitos generales del diagrama de Pareto son:

Analizar las causas

Estudiar los resultados

Planear una mejora continua

La Grfica de Pareto es una herramienta sencilla pero poderosa al permitir


identificar visualmente en una sola revisin las minoras de caractersticas
vitales a las que es importante prestar atencin y de esta manera utilizar
todos los recursos necesarios para llevar a cabo una accin de mejora sin
malgastar esfuerzos en problemas triviales.
Algunos ejemplos de tales minoras de caractersticas vitales seran:

La minora de clientes que representen la mayora de las ventas.

La minora de productos, procesos, o caractersticas de la calidad


causantes del grueso de desperdicio de los costos de re-trabajo.

La minora de rechazos que representa la mayora de quejas de los


clientes.

La minora de vendedores que est vinculada a la mayora de partes


rechazadas.

La minora de problemas causantes del grueso del retraso de un proceso.

La minora de productos que representan la mayora de las ganancias


obtenidas.

La minora de elementos que representan la mayor parte del costo de un


inventario etc.

Ejemplo de aplicacin del diagrama de Pareto:

Un fabricante de accesorios plsticos desea analizar cules son los defectos ms


frecuentes que aparecen en las unidades al salir de la lnea de produccin. Para
esto, empez por clasificar todos los defectos posibles en sus diversos tipos:

31

Tipo de defecto

Detalle del problema

Mal color

El color no se ajusta a lo requerido por el cliente

Fuera de medida

Ovalizacin mayor a la admitida

Mal terminacin

Aparicin de rebabas

Rotura

El accesorio se quiebra durante la instalacin

Desbalanceo

El accesorio requiere contrapesos adicionales

Aplastamiento

El accesorio se aplasta durante la instalacin

Incompleto

Falta alguno de los insertos metlicos

Mal alabeo

Nivel de alabeo no aceptable

Otros

Otros defectos

Posteriormente, un inspector revisa cada accesorio a medida que sale de la


produccin registrando sus defectos de acuerdo con dichos tipos. Al finalizar la
jornada, se obtuvo una tabla como esta.
Tipo
defecto

de Detalle del problema

Frec Frec.
rel %

Acum
%

Aplastamiento

El accesorio se aplasta durante la 40


instalacin

42.6

42.6

Rotura

El accesorio se quiebra durante la 35


instalacin

37.2

79.8

8.5

88.3

Fuera
medida

de Ovalizacin mayor a la admitida

Mal color

El color no se ajusta a lo requerido

3.2

91.5

Mal alabeo

Nivel de alabeo no aceptable

3.2

94.7

Mal
terminacin

Aparicin de rebabas

2.1

96.8

32

Incompleto

Falta alguno de los insertos metlicos

Desbalanceo

El accesorio
adicionales

Otros

Otros defectos

TOTAL

requiere

2.1

98.9

contrapesos 1

1.1

100

100

0
94

La tercera columna muestra el nmero de accesorios que presenta cada tipo de


defecto, es decir, la frecuencia con que se presenta cada defecto. En lugar de la
frecuencia numrica podemos utilizar la frecuencia porcentual, es decir, el
porcentaje de accesorios en cada tipo de defecto, lo cual se indica en la cuarta
columna. En la ltima columna vamos acumulando los porcentajes

Para hacer ms evidente los defectos que aparecen con mayor frecuencia hemos
ordenado los datos de la tabla en orden decreciente de frecuencia. Vemos que la
categora otros siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.

Podemos ahora representar los datos en un histograma como el siguiente:

33

Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos
observar que los 2 primeros tipos de defectos se presentan en el 79,8 % de los
accesorios con fallas. Por el Principio de Pareto, concluimos que: La mayor parte
de los defectos encontrados en el lote pertenece slo a 2 tipos de defectos (los
pocos vitales), de manera que si se eliminan las causas que los provocan
desaparecera la mayor parte de los defectos.

Otro anlisis complementario y sumamente til e interesante, es calcular los


costos de cada problema, con lo cual podramos construir un diagrama similar a
partir de ordenar las causas por sus costos.

Este anlisis combinado de causas y costos permite obtener la mayor efectividad


en la solucin de problemas, aplicando recursos en aquellos temas que son
relevantes y alcanzando una mejora significativa.

REPASO No. 1
Concepto

Breve descripcin

Dato

Representacin simblica de un atributo o caracterstica de un objeto


(ser o fenmeno)

Informacin

Conjunto de datos significativos y relevantes que describen hechos,


sucesos (eventos o fenmenos)

Conocimiento

Conjunto de informaciones e ideas adquiridas y ejercidas por cada


persona

Variable
cualitativa

Caracterstica o atributo de clase no numrica, ejemplos: estado civil,


color de piel, idioma, religin.

Variable
cuantitativa

Caracterstica o atributo descrito en magnitudes ejemplos: altura,


velocidad, temperatura, luminosidad, distancia, peso, nmero de
integrantes

Estadstica
descriptiva

Disciplina que describe el estado (conjunto de datos) sobre un hecho o


fenmeno

Estadstica

Disciplina que infiere, predice o estima el comportamiento futuro de un

34

inferencial

hecho o fenmeno

Poblacin

Conjunto finito o infinito de individuos (objetos o seres) que presentan


caractersticas o comportamientos similares: arboles, piedras, artculos,
etc.

Muestra

Parte de una poblacin con caractersticas similares

10

Censo

Indagatoria sobre las caractersticas de todos los individuos de una


poblacin

11

Encuesta

Registro de observaciones sobre una muestra de personas

12

Escala nominal

Nivel que agrupar, nombrar o categoriza objetos o fenmenos similares


ejemplo: grupo de tornillos, clavos, hojas, escritorios, etc. Sin definir
magnitudes

13

Escala ordinal

Nivel que ordena objetos o fenmenos de acuerdo a sus caractersticas


o atributos, usa magnitudes

14

Escala de
intervalo

Nivel que organiza objetos o fenmenos en rangos o lapsos (aos,


edades, ingresos)

15

Escala de razn

Nivel que organiza datos a partir de un punto cero (ausencia de


caracterstica), ejemplo: cantidad de hijos 0, 3, 6

16

Tabla de
frecuencias

Herramienta estadstica para organizar (agrupar) o tabular datos de


hechos o fenmenos

17

Intervalo

Espacio que existe entre un punto y otro, tomando en cuenta los puntos
intermedios

18

Variable
continua

Caracterstica o atributo que muestra valores intermedios (medidas,


velocidades, temperatura, etc)

19

Variable
discreta

Caracterstica o atributo que no muestra valores intermedios (nmero de


personas o cosas, etc)

20

Grafico

Representacin esquemtica de un conjunto de datos para facilitar su


observacin

35

TAREA No. 1

Nombre:_______________________________________________________
1. Seala con una X si la variable mencionada es cualitativa o cuantitativa. Si es
cuantitativa, indica con una X si es variable discreta o continua.
Variable

Cualitativa

Cuantitativa Discreta

Continua

Presencia de brigadas de emergencia en


empresas
Peso en kg de plstico recuperado
Nmero de trabajadores afiliados al IMSS
Nmero de empresas certificadas como
empresas limpias
Vida til en horas de focos ahorradores
Estado civil de los integrantes de una
poblacin
Registros de la precipitacin en mm en
Quertaro
Dimetro del tallo de una poblacin de
rboles
Categora de preferencia sexual de una
poblacin humana
Defunciones por accidentes automovilsticos
en Quertaro

2.
Un funcionario pblico de la Junta de Agua Potable est interesado en
conocer el nivel de cuidado del agua que tienen los habitantes que poseen cisterna
o aljibe en sus casas. Est planeando entrevistar a 300 de esos habitantes: Define
la poblacin de estudio y menciona cual es la muestra:

Elabora tres preguntas cuantitativas y tres cualitativas para responder a la inquietud


planteada.
36

MTODOS ESTADSTICOS
PRIMER EXAMEN

N0MBRE_________________________________________________________
Uno. Coloca el nmero del concepto que corresponda a la definicin apropiada
1

Estadstica descriptiva

Estado civil, preferencia sexual, opinin,


religin, idioma.

Poblacin

10

Mtodos y herramientas que permiten estimar


la situacin o comportamiento futuro de
hechos, poblaciones o fenmenos.

Ejemplos de variables 6
cuantitativas

Atributo, caracterstica de un individuo,


muestra o poblacin que no es constante.

Ejemplos
discreta

variable 5

Conjunto de valores entre dos puntos de una


recta.

Intervalo

Mtodos y herramientas que permiten


indagar y describir el comportamiento de
hechos, poblaciones o fenmenos.

Variable

Porcin de una poblacin.

Ejemplos
continua

Ejemplos de variables 7
cualitativas

Grados centgrados, metros, coordenadas


geogrficas.

Muestra

Conjunto de individuos con caractersticas


similares que ocupan un espacio y tiempo
determinado.

10

Estadstica inferencial

Automviles, seres humanos, cabezas de


ganado.

de

de

variable 3

Temperatura,
luminosidad.

velocidad,

longitud,

altura,

Dos. Un centro de acopio de residuos generados por actividades humanas recibi


durante 50 das diversas cantidades de materiales residuales, los valores
37

fluctuaron entre 57 y 132 kg por da, el responsable desea saber cul es la


cantidad ms frecuente. Define el ancho del intervalo si:

Se desean 5 intervalos de clase. = 15


Se desean 6 intervalos de clase. = 12
Se desean 7 intervalos de clase. = 11
Se desean 8 intervalos de clase. = 9
Se desean 9 intervalos de clase. = 8

Tres. En la tabla siguiente se presentan las cantidades en kilogramos de basura que


depositan cotidianamente en un tiradero a cielo abierto:
687
834
862
896
925
942
975
1019

700
838
863
902
927
946
980
1044

723
851
871
908
929
949
987
1055

776
855
873
912
929
957
1008
1083

824
855
879
914
941
974
1017
1096

El histograma resultante es:

Histograma
35
30

Frecuencia

25
20
15
Frecuencia
10
5
0
800

1000

1100

y mayor...

Clase

Interpreta brevemente el grfico:

38

MEDIDAS DE TENDENCIA CENTRAL


La tendencia central se refiere al punto medio de una distribucin de datos, las
medidas de tendencia central tambin se conocen como medidas de posicin. Con
ellas localizamos el centro de una base de datos.
La media o promedio, la moda y la mediana son las tres principales medidas de
tendencia central utilizadas en la estadstica descriptiva, sirven para describir una
poblacin o una muestra.

La media aritmtica o promedio


La media es el valor obtenido sumando todas las observaciones y dividiendo el
total por el nmero de observaciones que hay en el grupo. La media resume en un
valor las caractersticas de una variable teniendo en cuenta todos los valores o
datos.
Esta medida se simboliza con (x con raya superior) cuando representa la media
muestral (estadstico muestral) y para representar la media poblacional
(parmetro poblacional). La media o es la suma de todos los valores de la
muestra o poblacin, divididos por el nmero de casos.
Por ejemplo, los resultados de 5 alumnos en una evaluacin fueron:
39

Alumno

Resultado

6.0

5.4

3.1

7.0

6.1

Primero: se suman las notas: 6.0+5.4+3.1+7.0+6.1 = 27.6


Segundo: el total se divide entre la cantidad de alumnos: 27.6/5=5.52
Tercero: La media aritmtica en este ejemplo es 5.52
Definicin formal
Dado un conjunto numrico de datos, x1, x2, ..., xn, se define su media aritmtica
como

Esta definicin vara, aunque no sustancialmente, cuando se trata de variables


continuas, esto es, tambin puede calcularse para variables agrupadas en
intervalos.

40

Propiedades
Las principales propiedades de la media aritmtica son:

Su clculo es muy sencillo y en l intervienen todos los datos.

Su valor es nico para una serie de datos.

Se usa con frecuencia para comparar poblaciones, aunque es ms


apropiado acompaarla de una medida de dispersin.

Inconvenientes de su uso
Este parmetro, an teniendo mltiples propiedades que aconsejan su uso en
situaciones muy diversas, tiene tambin algunos inconvenientes, como son:

Para datos agrupados en intervalos (variables continuas) su valor oscila en


funcin de la cantidad y amplitud de los intervalos que se consideren.

Es una medida a cuyo significado afecta sobremanera la dispersin, de


modo que cuanto menos homogneos sean los datos, menos informacin
proporciona. Dicho de otro modo, poblaciones muy distintas en su
composicin pueden tener la misma media. Por ejemplo, un equipo de
baloncesto con cinco jugadores de igual estatura, 1,95 m, evidentemente,
tendra una estatura media de 1,95 m, valor que representa fielmente a esta
poblacin homognea. Sin embargo, un equipo de jugadores de estaturas
ms heterogneas, 2,20 m, 2,15 m, 1,95 m, 1,75 m y 1,70 m, por ejemplo,
tendra tambin, como puede comprobarse, una estatura media de 1,95 m,
valor que no representa a casi ninguno de sus componentes.

En el clculo de la media no todos los valores contribuyen de la misma


manera. Los valores altos tienen ms peso que los valores cercanos a cero.
Por ejemplo, en el clculo del salario medio de un empresa, el salario de un
alto directivo que gane 1.000.000 tiene tanto peso como el de diez
empleados "normales" que ganen 1.000 . En otras palabras, se ve muy
afectada por valores extremos.

41

Una debilidad de la media aritmtica es que es sensible a valores extremos


de la distribucin y que carece de sentido para variables medidas con un
nivel nominal u ordinal.

Moda
La moda es el dato ms repetido, el valor de la variable con mayor frecuencia
absoluta. En cierto sentido la definicin matemtica corresponde con la locucin
"estar de moda", esto es, siempre que sea lo ms usado.
La moda es la medida de tendencia central ms fcil de calcular y tambin es la
ms sujeta a fluctuaciones cuando cambian unos pocos valores de la distribucin.
Por esta razn la moda se suele usar para una evaluacin rpida de la tendencia
central. La moda se define como el valor ms frecuente de una distribucin. En
una tabla de frecuencias, la frecuencia mayor es la que contiene la moda. Su
clculo es sencillo, pues slo necesita un recuento.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se encuentran tres o ms modas, entonces
es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia
diremos que no hay moda.

Propiedades
Sus principales propiedades son:

42

Clculo sencillo.

Interpretacin muy clara.

Al depender slo de las frecuencias, puede calcularse para variables


cualitativas. Este es el parmetro ms utilizado cuando al resumir una
poblacin no es posible realizar otros clculos, por ejemplo, cuando se
enumeran en medios periodsticos las caractersticas ms frecuentes de
determinado sector social.

Esta medida se usa ms y tiene ms sentido cuando se describen datos


nominales, de hecho es la nica medida de tendencia central que funciona
con este tipo de escala.
Inconvenientes

Su valor es independiente de la mayor parte de los datos, lo que la hace


muy sensible a variaciones muestrales. Por otra parte, en variables
agrupadas en intervalos, su valor depende excesivamente del nmero de
intervalos y de su amplitud.

Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.

No siempre se sita hacia el centro de la distribucin.

Puede haber ms de una moda en el caso en que dos o ms valores de la


variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo.
Se puede hallar la moda para variables cualitativas y cuantitativas.
Por ejemplo: Hallar la moda de la distribucin:
Datos: 2, 3, 3, 4, 4, 4, 5, 5
Mo= 4

43

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa


frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene
varias modas. Datos: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9
Mo= 1, 5, 9
Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay
moda. Datos: 2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el
promedio de las dos puntuaciones adyacentes. Datos: 0, 1, 3, 3, 5, 5, 7, 8
3+5=8/2=4

Mo = 4

Clculo de la moda para datos agrupados, si todos los intervalos tienen la misma
amplitud.

Li es el lmite inferior de la clase modal.


fi es la frecuencia absoluta de la clase modal.
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal.
ai es la amplitud de la clase.
Ejemplo
Calcular la moda de una distribucin estadstica que viene dada por la
siguiente tabla:

44

66= Limite inferior de la clase modal (Li)


18= frecuencia absoluta inmediatamente inferior a la clase modal (fi-1)
42= Frecuencia absoluta de la clase modal (fi)
27= frecuencia absoluta inmediatamente posterior a la clase modal (fi+1)
3= amplitud de la clase (ai)

Mediana
En el mbito de la estadstica, una mediana es el valor de la variable que deja el
mismo nmero de datos antes y despus que l, una vez ordenados estos. De
acuerdo con esta definicin el conjunto de datos menores o iguales que la

45

mediana representarn el 50% de los datos, y los que sean mayores que la
mediana representarn el otro 50% del total de datos de la muestra.
La mediana Me de un conjunto de mediciones x1, x2, x3,..xn es el valor de x
que se encuentra en el punto medio o centro cuando se ordenan los valores de
menor a mayor.
Por ejemplo, la mediana del nmero de hijos de un conjunto de trece familias,
cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que,
una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la
posicin central es 2:

Me

= (n+1) / 2

Me = (13+1) / 2
Me = 14 / 2=7
En caso de un nmero par de datos, la mediana no correspondera a ningn valor
de la variable, por lo que se conviene en tomar como mediana el valor intermedio
entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los
anteriores:

Se toma como mediana

46

Existen dos estrategias para calcular la mediana: considerando los datos en forma
individual, sin agruparlos, o bien utilizando los datos agrupados en intervalos de
clase. A continuacin se describe un ejemplo con datos sin agrupar.
Datos sin agrupar
Sean

los datos de una muestra ordenada en orden creciente y

designando la mediana como Me, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin

una vez que

los datos han sido ordenados (en orden creciente o decreciente), porque ste es el
valor central. Es decir:

Por ejemplo, si tenemos 5 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,


x5 = 9 => El valor central es el tercero:

. Este valor, que es la

mediana de ese conjunto de datos, deja dos datos por debajo (x1, x2) y otros dos
por encima de l (x4, x5).
b) Si n es par, la mediana es la media aritmtica de las dos observaciones
centrales. Cuando n es par, los dos datos que estn en el centro de la muestra
ocupan las posiciones

. Es decir:

Por ejemplo, si tenemos 6 datos, que ordenados son: x1 = 3, x2 = 6, x3 = 7, x4 = 8,


x5 = 9, x6 = 10 => Hay dos valores que estn por debajo del
dos que quedan por encima del siguiente dato

y otros
. Por tanto, la

mediana de este grupo de datos es la media aritmtica de estos dos datos:


.

47

Propiedades e inconvenientes
Las principales propiedades de la mediana son:
Es menos sensible que la media a oscilaciones de los valores de la variable. Un
error de transcripcin en la serie del ejemplo anterior en, pongamos por caso, el
ltimo nmero, deja a la mediana inalterada.
No se ve afectada por la dispersin. De hecho, es ms representativa que la
media aritmtica cuando la poblacin es bastante heterognea. Suele darse esta
circunstancia cuando se resume la informacin sobre los salarios de un pas o una
empresa. Hay unos pocos salarios muy altos que elevan la media aritmtica
haciendo que pierda representatividad respecto al grueso de la poblacin. Sin
embargo, alguien con el salario "mediano" sabra que hay tanta gente que gana
ms dinero que l, como que gana menos.
Sus principales inconvenientes son que en el caso de datos agrupados en
intervalos, su valor vara en funcin de la amplitud de estos. Por otra parte, no se
presta a clculos algebraicos tan bien como la media aritmtica.
Comparacin entre las diferentes medidas de tendencia central
Las tres medidas de tendencia central: media, mediana y moda, no son
igualmente tiles para obtener la tendencia central de una distribucin o conjunto
de valores (datos). Cada una de las medidas tiene caractersticas que hacen que
su empleo sea una ventaja en ciertas condiciones y en otras no.

48

Medida de
tendencia
central

Ventajas y desventajas

Media

Incorpora todos los datos de la variable y su valor suele ser ms estable. Su valor
es nico para una serie de datos. Se usa con frecuencia para comparar
poblaciones, es ms apropiada acompaarla de una medida de dispersin. La
afecta sobremanera la dispersin, cuanto menos homogneos son los datos,
menos informacin proporciona. Es sensible a valores extremos de la distribucin y
carece de sentido para variables medidas con un nivel nominal u ordinal.

Moda

Clculo sencillo. Recomendada para variables cualitativas. Se usa ms y tiene ms


sentido para datos nominales. Su valor es independiente de la mayor parte de los
datos, lo que la hace muy sensible a variaciones muestrales. No siempre se sita
hacia el centro de la distribucin.
Preferida cuando se emplea una escala ordinal (situacin donde el valor asignado
slo indica el orden entre los casos). Es menos sensible que la media a
oscilaciones de los valores de la variable. No se ve afectada por la dispersin. No
se presta a clculos algebraicos tan bien como la media aritmtica.

Mediana

Para calcular la media, moda y mediana a travs de excell, se realizan los


siguientes pasos:
1. Se puede utilizar la va de establecer la formula en la barra de
funcin de la siguiente manera:
=PROMEDIO(----------)

dentro

del

parntesis

se

colocan

los

valores,

seleccionndolos con el cursor.


=MODA(-----------)

dentro

del

parntesis

se

colocan

los

valores,

seleccionndolos con el cursor.


=MEDIANA(-----------)

dentro

del

parntesis

se

colocan

los

valores,

del

parntesis

se

colocan

los

valores,

seleccionndolos con el cursor.


=DESVEST(----------)

dentro

seleccionndolos con el cursor.

49

=VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos


con el cursor.
La otra ruta es presionar el botn FORMULAS, posteriormente el de MAS
FUNCIONES y all seleccionar la funcin deseada: media, moda o mediana,
etc.
En cada una de ellas aparece un cuadro denominado ARGUMENTO DE
FUNCIN, en cuya barra inicial se seleccionan todos los valores a procesar, se
da clik en aceptar y el resultado aparece en la casilla seleccionada para tal
efecto.
Otra va es utilizar insertar funcin fx, se despliega un men como el siguiente,
donde se selecciona la funcin deseada:

50

MEDIDAS DE DISPERSIN O VARIABILIDAD


Las medidas de variabilidad indican la dispersin de los datos de una distribucin.
Las medidas de dispersin son intervalos, distancias o un nmero de unidades
en la escala de medicin. Este tipo de medida se complementa con las medidas
de tendencia central o centralidad y ambas permiten describir a la mayora de las
distribuciones.
Las medidas de dispersin describen la distribucin de los valores de la serie,
analizando si estos se encuentran ms o menos concentrados, o ms o menos
dispersos. Las ms comunes son: el rango, la desviacin estndar y la varianza.
El rango
El rango, recorrido o amplitud de un conjunto de mediciones, es la diferencia entre
el valor mayor y el valor menor, indica el nmero necesario y mnimo de unidades,
en la escala de medicin, para incluir los valores mnimo y mximo. Cuanto ms
grande es el rango, mayor ser la dispersin de los datos de una distribucin. El
rango es adecuado para medir la variacin de pequeos conjuntos de datos.
La desviacin estndar
La desviacin estndar es la medida de dispersin ms ampliamente usada y es la
ms estable ya que depende de todos los valores de la distribucin. La raz
cuadrada de la suma de las desviaciones alrededor de la media, elevadas al
cuadrado y divididas entre el nmero de casos menos uno.
Cuando se trabaja con muestras la desviacin estndar se simboliza con una S y
con la letra sigma minscula cuando se usan datos de una poblacin. Se
calcula como la raz cuadrada de la varianza:

= n1 (xi-)2 / N

S= n1 (xi -)2 / n-1

51

en mayscula se utiliza para indicar sumatoria:


1n xi = x1 + x2 + x3 + x4+xn
Donde x es el valor de cada medicin de la variable de estudio e i un ndice que
vara de 1 a n. El nmero de datos de la muestra se identifica con la letra n y de
la poblacin con N.
La desviacin estndar se interpreta como la cantidad o el cunto se desva de la
media un conjunto de valores. Este valor se grafica como un intervalo, solo se
utiliza con variables continuas u ordinales.
Ejemplo de clculo de desviacin estndar S, datos no agrupados:

S=((55-76.1)2+(62-76.1)2+(67-76.1)2+(68-76.1)2+69-76.1)2+(79-76.1)2+(8876.1)2+(89-76.1)2+(92-76.1)2+(92-76.1)2) /9
S= 13.6
La varianza
La varianza mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamao de la muestra.
La varianza es la desviacin estndar elevada al cuadrado y se simboliza como
S2 cuando es muestral y 2 cuando es poblacional. Esta es una medida que se
usa en muchas pruebas de hiptesis estadsticas inferenciales. Para fines
descriptivos de prefiere usar la desviacin estndar.
S2= (x-)2 / n-1
La varianza siempre ser mayor que cero. Mientras ms se aproxima al cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.

52

Para calcular la la desviacin estndar y la varianza a travs de excell, se


realizan los siguientes pasos:
1. Se puede utilizar la va de establecer la formula en la barra de
funcin de la siguiente manera:
=DESVEST(----------)

dentro

del

parntesis

se

colocan

los

valores,

seleccionndolos con el cursor.


=VAR(------------)dentro del parntesis se colocan los valores, seleccionndolos
con el cursor.
La va rpida para el clculo de los estadsticos de tendencia central y dispersin
es el uso de botn DATOS, posteriormente el de ANLISIS DE DATOS, que se
ubica en la parte superior derecha. Si no est disponible se carga de la siguiente
manera:
Se presiona el cono de Microsoft, ubicado en la parte superior izquierda y se
despliega el men.
Se elige el botn de opciones de excell ubicado en la parte inferior de la pantalla
anterior.
En el men de opciones de excell se elige complementos.
En ver y administrar complementos de excell se presiona ir ubicado en la parte
inferior y se da aceptar.
En complemento, colocar el curso en la casilla de anlisis de datos dar clik y
aceptar.
Posteriormente se carga el complemento y podemos usarlo.
Ya ubicados en anlisis de datos elegimos estadstica descriptiva damos
aceptar, colocamos los datos en la casilla de rango de entrada, se marca
resumen de estadsticas, finalmente presionamos aceptar
53

El resultado es el siguiente:
Columna1
Media
Mediana
Moda
Desviacin estndar
Varianza de la muestra
Rango
Mnimo
Mximo
Suma
Cuenta o nmero de datos de la
distribucin

76.5
74
92
13.19301162
174.0555556
37
55
92
765
10

Coeficiente de variacin de Pearson


El coeficiente de variacin o CV, es un cociente entre la desviacin estndar y la
media de los datos, expresado en porcentaje.
CV= (S/ ) 100
Este coeficiente permite comparar la variabilidad de diferentes muestras en una
misma variable o la variabilidad existente entre variables diferentes.
Interpretacin de las medidas de tendencia central y de dispersin o
variabilidad
Al describir los datos de una distribucin deben interpretarse de manera conjunta
las medidas de tendencia central y de dispersin. Con la media y la desviacin
estndar se pueden construir intervalos donde supuestamente estn l mayora de
los datos. La moda, la mediana y el rango pueden completar la informacin sobre
los datos y as comprender lo que sucede con la variable de estudio.
En una variable continua:
La media, la mediana y la moda son puntos en una recta
La desviacin estndar y el rango son intervalos.

54

REPASO No. 2

Identifiquen y nombren los siguientes signos o formulas:

Media de la muestra

Media de la poblacin

Formula de la media

Formula de la mediana par

Formula de la mediana impar

Desviacin estndar de la muestra

Desviacin estndar de la poblacin

Formula de la Moda

S=

n
1

n
1

(xi-) / N

Formula de la desviacin estndar de la poblacin

(xi -) / n-1

Formula de la desviacin estndar de la muestra

Signo de sumatoria

55

Varianza muestral

Varianza poblacional

S = (x-) / n-1

Formula de la varianza muestral

Identifica los valores de los siguientes conceptos en la tabla:


Li es el lmite inferior de la clase modal=
fi es la frecuencia absoluta de la clase modal=
fi--1 es la frecuencia absoluta inmediatamente inferior a la clase modal=
fi-+1 es la frecuencia absoluta inmediatamente posterior a la clase modal=
ai es la amplitud de la clase=

Amplitud de
clase

Frecuencia
absoluta

(60,63)

(63.66)

18

(66.69)

42

(69.72)

27

(72,75)

Explica el cuadro siguiente:

Estadstica descriptiva
Media
Mediana
Moda
Desviacin estndar
Rango
Mnimo
Mximo
Suma
Cuenta

76.5
74
92
13.1
37
55
92
765
10

56

TAREA No. 2
Nombre:_______________________________________________________

Medidas de tendencia central


a) Un fabricante de filtros para chimeneas debe decidir cul de dos modelos
diferentes de filtros tiene una mayor eficiencia. El fabricante basar su decisin
en los resultados de cinco pruebas para ambos modelos bajo las mismas
condiciones de operacin donde el mejor filtro ser aquel que presente un
menor porcentaje de luz filtrada. Los resultados son los siguientes:
Prueba

Filtros

13.2

13.1

13.1

18.2

13.2

13.4

13.5

13.5

13.6

13.5

Con base en los datos anteriores cul de los dos filtros debe elegir el
fabricante? por qu?
Debera ser diferente la seleccin si el fabricante supiera que hubo un cambio
en la intensidad de la energa luminosa durante la cuarta medicin del modelo
A? por qu?

b) Suponga que, por un error, se registra un conjunto de datos que contiene la


DQO para una muestra de agua de 713, 715, 714, 713, 716, 716 y 176 mg/L,
donde el ltimo valor debi haber sido 716 en vez de 176. Muestre que tanto
se ven afectadas la media y la mediana por el error cometido.
c) Un fabricante de focos ahorradores de energa tom una muestra de 13 piezas
de la produccin de un da y las utiliz en forma continua hasta que
comenzaron a fallar. El resultado en das de funcionamiento fue:
1142, 1226, 1117, 1345, 1064, 1251, 1349, 1431, 1312, 1066, 1292, 1362,
1098.

Calcule la media y la mediana. Qu medida descriptiva parece ser la mejor?


Por qu? De qu forma le puede ser til esta informacin al fabricante?

d) Examinando los registros del nmero de extintores sujetos a mantenimiento a


la semana por un prestador de este servicio, un auditor toma una muestra de
20 de estos registros:
8, 27, 19, 12, 34, 19, 5, 4, 12, 22, 11, 28, 12, 11, 10, 11, 8, 6, 7, 16

Calcule la media y la mediana.


57

TEORA DE CONJUNTOS
DEFINICIONES DE CONJUNTOS
Algunas definiciones de conjunto son:

Un conjunto es la reunin en un todo de objetos bien definidos y


diferenciables entre s, que se llaman elementos del mismo.

Un conjunto es una coleccin de elementos que se agrupan mediante


algunas caractersticas en comn y que solo aparecen una sola vez en el
grupo respectivo.

Es una coleccin bien definida de objetos o cosas, donde, bien definida


significa distinguir con claridad los elementos que forman parte del
conjunto.

Son colecciones, agrupaciones o reuniones de elementos a los cuales


identificamos por tener propiedades en comn.

Es una coleccin de objetos; en los que a cada uno de los objetos que
componen ese conjunto se le denomina elemento del mismo.

De lo dicho anteriormente, se introduce la relacin de pertenencia. El smbolo


usual para representar esta relacin es el smbolo

, una versin de la letra

griega (psilon). Los segundos argumentos de la relacin

son llamados

conjuntos, y los primeros argumentos son llamados elementos. As, si la


frmula

Para representar que un elemento "a" pertenece al conjunto "A" se aplica el


smbolo de pertenencia (). De esta forma a A y se lee: "a" pertenece a "A".
Esta relacin se conoce como relacin de pertenencia, seala la relacin entre
elementos y conjuntos exclusivamente.

58

Si un elemento no pertenece a un conjunto se denota por (), por ejemplo si b


no pertenece a A se expresara como b A, que se lee: b no pertenece a A.
Algunos ejemplos de pertenencia son:
Conjuntos

Elementos

D = Un da de la semana

Pertenencia
lD

m = mayo
M = Un mes del ao
l = lunes

mM

Z = Un nmero entero
n=2

NZ

Entonces se puede decir que el smbolo se utiliza para comparar o relacionar un


conjunto respecto de un elemento y nos permite relacionar la pertenencia o no, de
un elemento en un conjunto. No es correcto utilizar este smbolo para
comparar dos conjuntos si no que exclusivamente para relacionar elementos
respecto de un conjunto.

59

Formas de describir un conjunto

1).- Enumerando todos los elementos del conjunto (solo se puede hacer si el
conjunto es finito)
2).- Por medio de una propiedad caracterstica de los elementos que forman a ese
conjunto, esta propiedad puede expresarse de forma ordinaria o utilizando alguna
simbologa lgica.
Nota: Los conjuntos se nombran con letras maysculas latinas, los elementos se
colocan entre llaves, por ejemplo:

A ={0,1,2,3,4,5,6,7,8,9}
B = {a,v,e,s}
C = {Las soluciones de la ecuacin

N = {1,2,3,4,5,6,...} = {los nmeros naturales}


L={

donde n=1,2,3,4,...}

Sin embargo, existen formas ms formales para describir el contenido de un


conjunto como son las formas tabular o extensiva y la constructiva o por
comprensin.
DETERMINACIN DE UN CONJUNTO
Para determinar la forma de describir cmo han de agruparse los conjuntos
comnmente se utilizan dos formas: la tabular o extensiva y la constructiva o por
comprensin.

60

La forma tabular o extensiva. Es cuando el

conjunto es determinado por

extensin (o enumeracin), cuando se da una lista que comprende a todos los


elementos del conjunto y slo a esos elementos.
Ejemplos:
A = { a, e, i, o, u }
B = { 0, 2, 4, 6, 8 }
C = { c, o ,n , j, u, t, s }
D = {A, B, E, C, D, R, I, O}

La forma constructiva o por comprensin. Es cuando un conjunto de elementos


poseen una caracterstica o propiedad, la cumplen para todos los elementos del
conjunto.
Ejemplos:
A = { x l x es nmero entero}
B = { x I x es un nmero par menor que 10}
C = { x I x es una letra de la palabra conjuntos}
D = {x I x es una mujer de nacionalidad mexicana}
E = {x I x es color bsico}

Cuadro comparativo de cmo describir dos conjuntos mediante la forma


tabular o extensin y la forma constructiva o por comprensin.

POR EXTENSIN
A = { a, e, i, o, u }

POR COMPRENSIN
A = { x I x es una vocal}

61

B = { 0, 2, 4, 6, 8 }
C = {1, 3, 5, 7, 9 }
D = { c, o, n, j, u, t, s}
E = { b, c, d, f, g, h, j, .. . }
F = { Laura, Javier }
G = {mercurio}

B = { x I x es un nmero par menor que 10 }


C = { x I x es un nmero impar menor que 10 }
D = { x I x es una letra de la palabra conjuntos }
E = { x I x es una consonante }
F = {x I x es mdico y est en la clase}
G = {x I x es un metal lquido }

Los axiomas de Zermelo-Fraenkel

La teora de conjuntos de Zermelo-Fraenkel toma como primitivos los conceptos


de conjunto y de pertenencia y consiste de los diez axiomas siguientes:

Axioma de extensionalidad. Dos conjuntos X e Y son iguales (lo que se


representa por X = Y) si contienen los mismos elementos. Ms
formalmente, y en la simbologa usual,

Conjunto vaco. Existe un conjunto (representado por ) sin elementos.


Esto es,

Axioma de pares. Dados cualesquiera conjuntos x e y, existe otro


conjunto, representado por {x,y}, cuyos elementos son nicamente x e y.
Esto es,

62

Axioma de la unin. Dada cualquier coleccin (conjunto) de conjuntos C,


existe un conjunto, representado por

y llamado unin de C, que

contiene todos los elementos de cada conjunto de C. Esto es,

Axioma del conjunto potencia Para cualquier conjunto x existe otro


conjunto, representado por

, que contiene todos los subconjuntos de

x. En smbolos,

Esquema axiomtico de especificacin. Sea (v) una frmula de un


lenguaje de primer orden que contenga una variable libre v. Entonces, para
cualquier conjunto x existe un conjunto y cuyos elementos son aquellos
elementos a de x que cumplen (a). Formalmente,

Esquema axiomtico de reemplazo. Si (a,b) es una sentencia tal que


para cualquier elemento a de un conjunto x el conjunto
existe, entonces existe una funcin

tal que f(a) = y. Formalmente, si

entonces

63

Axioma de infinitud. Existe un conjunto x tal que


, entonces

y tal que si

. En smbolos,
.

Axioma de regularidad. Para todo conjunto no vaco x existe un conjunto


tal que

. Esto es, en trminos formales,

Axioma de eleccin. El producto cartesiano de cualquier familia no vaca


de conjuntos no vacos es no vaco. Este axioma puede expresarse en
trminos formales al igual que los otros, aunque resulta ms extenso.

Los axiomas anteriores, excepto el ltimo, constituyen la teora de ZermeloFraenkel, que se representa por ZF. Existen otros axiomas consistentes con los de
ZF, como el axioma de constructibilidad y el axioma de eleccin. Una vez
incorporado el axioma de eleccin a la teora ZF, la teora de conjuntos resultante
se denota por ZFC.
Resumen de los axiomas

Dos conjuntos son iguales, s y solamente s tienen los mismos elementos.

Existe un conjunto sin elementos llamado vaco.

Si A y B son dos conjuntos, existe un conjunto cuyos nicos elementos son


A y B.

La reunin de un conjunto de conjuntos es un conjunto.

Para todo conjunto A existe un conjunto que tiene por elementos las partes
de A.

El producto de una familia de conjuntos no vacos es un conjunto no vaco


(axioma de eleccin).

Ningn conjunto es elemento de s mismo.


64

CONJUNTOS FINITOS E INFINITOS


Un conjunto es finito si consta de un cierto nmero de elementos distintos, es
decir si al contar los diferentes elementos del conjunto el proceso de contar puede
acabar. En caso contrario, el conjunto es infinito.
Ejemplos:
M = { x / x es un ro de la tierra } Conjunto finito
N = { 0, 1, 2, 3, 4, 5, 6, 7, 8, ... } Conjunto infinito
P = { x / x es un pas de la tierra } Conjunto finito
V = { 3, 6, 9, 12, 15, 18, 21, 24, 27, ... } Conjunto infinito

DIAGRAMA DE VENN-EULER
El matemtico y lgico britnico, John Venn (1834 1923) es especialmente
conocido por su mtodo de representacin grfica de proposiciones (segn su
cualidad y cantidad) y silogismos. Los diagramas de Venn permiten, adems, una
comprobacin de verdad o falsedad de un silogismo. Entre sus obras destaca
Lgica Simblica y los principios de la lgica emprica o inductiva. Sin embargo,
tambin fue importante la participacin de Euler en la esquematizacin de las
representaciones de algunas operaciones.
Cada conjunto de elementos se encuentra encerrado dentro de un circulo, o figura
geomtrica, y estos a su vez estn encerrados dentro de otra figura, por lo general
est es un rectngulo, se pueden dibujar cada elemento del conjunto o bien solo
se puede indicar su existencia. Los diagramas de Venn son una buena
herramienta, que nos permite realizar las operaciones entre los diversos conjuntos
del universo de una forma ms sencilla.

65

OPERACIONES ENTRE CONJUNTOS


UNIN DE CONJUNTOS. La unin de los conjuntos A y B es el conjunto formado
por todos los elementos que pertenecen a A o a B o a ambos. Se denota: A U B.
La unin de conjuntos se define como:
A U B = {x I x A o x B}
El grfico es la representacin de la unin A B

INTERSECCIN ENTRE CONJUNTOS. Se define la interseccin de dos


conjuntos A y B al conjunto de elementos que son comunes a A y B. Se denota
por A

B, que se lee: A interseccin B. La interseccin de A y B tambin se puede

definir: A

B={x/x

Ayx

B } y mediante un diagrama de Venn-Euler:

El grfico es la representacin de la interseccin

66

DIFERENCIA ENTRE CONJUNTOS. Se denomina diferencia de dos conjuntos A


y B al conjunto formado por todos los elementos de A pero que no pertenecen a B.
La diferencia se denota por: A - B que se lee: A diferencia B o A menos B. Se
define la diferencia de dos conjuntos tambin como:
A - B = {x / x

Ayx

B}

El grfico representa la diferencia entre conjuntos:

INCLUSIN ENTRE CONJUNTOS: Sean A y B dos conjuntos. El conjunto A est


incluido en el conjunto B si se verifica que cada elemento de A pertenece a B. Se
lee A es un subconjunto de B. No confundir pertenencia con inclusin: La
pertenencia vincula un elemento con un conjunto. La inclusin vincula dos
conjuntos.
El conjunto A est incluido en el conjunto B.
El conjunto A es un subconjunto del conjunto B.

67

Cuando dos conjuntos no tienen ningn elemento en comn se dice que son
disjuntos.

Cuando los conjuntos tienen algunos elementos en comn:

68

Cuando todos los elementos de un conjunto estn contenidos en el otro, no es


necesario que los conjuntos sean iguales:

TEOREMAS BSICOS DE UNIN E INTERSECCIN:


Los conjuntos cuentan con algunas operaciones que son anlogas al lgebra y
que pueden ser demostradas.
Sean A,B,C cualquier conjunto entonces:

OPERACIN

Propiedad

a) A A = A ; A A =A

IGUALATIVA

b) A B = A B; A B = B A

CONMUTATIVA

c) (A B) C = A (B C) ; (A B) C = A (B C)

ASOCIATIVA

d) A ( B C) = (A B) (A C) ;

DISTRIBUTIVA

A ( B C) = (A B) (A C)
69

Elaboracin de diagramas de Venn con Word, Excell o Power point


Un diagrama de Venn emplea crculos cuyas intersecciones ilustrar similitudes,
diferencias y relaciones entre grupos o conjuntos. Las similitudes se representan
en las partes de interseccin de los crculos, mientras que las diferencias se
representan en las partes que no lo hacen. Para realizar los grficos se pueden
crear usando SmartArt de Word (botn de insertar en el men superior). Al usar
un elemento grfico SmartArt, puede crear un diagrama de Venn e incluirlo en una
hoja de clculo, un mensaje de correo electrnico, una presentacin o un
documento.

Crear un diagrama de Venn


1. En el boton Insertar en el grupo Ilustraciones, haga clic en SmartArt.

2. En la galera Elegir un grfico SmartArt, haga clic en Relacin, haga clic en un


diseo de diagrama de Venn (por ejemplo Venn bsico) y, a continuacin, en
Aceptar.
3. Para escribir texto para definir un crculo, siga uno de estos procedimientos:

Haga clic en [Texto] en el panel de texto y, a continuacin, escriba el texto.

Copie texto desde otra ubicacin o programa, haga clic en [Texto] en el


panel de texto y, a continuacin, pegue el texto.
70

NOTA Si el panel de texto no est visible, haga clic en el control.

Haga clic en un crculo en el elemento grfico SmartArt y, a continuacin,


escriba el texto

Agregar o eliminar crculos en el diagrama de Venn


1. Haga clic en el elemento grfico SmartArt al que desea agregar otro crculo.
2. Haga clic en el crculo existente que se encuentre ms cerca del lugar donde
desea agregar el nuevo crculo.
3. En Herramientas de SmartArt, en la ficha Diseo del grupo Crear grfico, haga
clic en Panel de texto.

Si no ve las fichas Herramientas de SmartArt o Diseo, asegrese de que


ha seleccionado un elemento grfico SmartArt.
4. Siga uno de estos pasos:

Para insertar un crculo detrs del crculo seleccionado, que se superpondr


al mismo, haga clic en Agregar forma detrs.

71

Para insertar un crculo delante del crculo seleccionado, que se


superpondr al mismo, haga clic en Agregar forma delante.

NOTAS

Cuando necesite agregar un crculo al diagrama de Venn, pruebe a agregar


formas detrs o delante del crculo seleccionado para obtener la ubicacin que
desea para el nuevo crculo. Es sencillo solucionar los errores de SmartArt
habituales.

Para agregar un crculo desde el panel de texto, haga clic en crculo existente,
mueva el cursor antes o despus del texto al que desea agregar el crculo y, a
continuacin, presione ENTRAR.

Para eliminar un crculo del diagrama de Venn, haga clic en el crculo que desea
eliminar y, a continuacin, presione SUPRIMIR.
Mover un crculo en el diagrama de Venn

Para mover un crculo, haga clic en l y, a continuacin, arrstrelo a su nueva


ubicacin.

Para mover un crculo en incrementos muy pequeos, presione CTRL mientras


presiona las teclas de flecha del teclado.
Cambiar a un diseo de diagrama de Venn diferente

1. Haga clic con el botn secundario en el diagrama de Venn que desea modificar y,
a continuacin, en Cambiar diseo.
2. Haga clic en Relacin y, a continuacin, siga uno de estos procedimientos:

Para mostrar las relaciones superpuestas en una secuencia, haga clic en


Venn lineal.

72

Para mostrar las relaciones resaltando el tamao o la gradacin, haga clic en


Venn apilado.

Para mostrar las relaciones superpuestas y la relacin en una idea central,


haga clic en Venn radial.

NOTA Tambin puede cambiar el diseo del elemento grfico SmartArt. Para
ello, haga clic en la opcin de diseo en el grupo Diseos de la ficha Diseo en
Herramientas de SmartArt. Al sealar una opcin de diseo, el elemento grfico
SmartArt cambia para mostrar una vista previa del aspecto que tendra con ese
diseo.
Cambiar los colores del diagrama de Venn
Para agregar fcilmente una apariencia y retoques profesionales al elemento
grfico SmartArt, puede cambiar los colores o aplicar un estilo SmartArt al
diagrama de Venn. Tambin puede agregar efectos, como resplandores, bordes
suaves o efectos 3D. Mediante las presentaciones de PowerPoint 2007 podr
animar el diagrama de Venn.
Puede aplicar combinaciones de colores derivadas de los colores del tema a los
crculos del elemento grfico SmartArt.
1. Haga clic en el elemento grfico SmartArt cuyo color desea cambiar.
2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo,
haga clic en Cambiar colores.
73

Si no ve las fichas Herramientas de SmartArt o Diseo, asegrese de que


ha seleccionado un elemento grfico SmartArt.
SUGERENCIA Al colocar el puntero sobre una miniatura, puede ver cmo
afectan los colores al elemento grfico SmartArt.
Cambiar el color de la lnea o el estilo del borde de un crculo
1. En el elemento grfico SmartArt, haga clic con el botn secundario del mouse en
el borde del crculo que desea cambiar y, a continuacin, en Formato de forma.
2. Para cambiar el color del borde del crculo, haga clic en Color de lnea, en Color
y, a continuacin, en el color que desea.
3. Para cambiar el estilo del borde del crculo, haga clic en Estilo de lnea y, a
continuacin, elija los estilos de lneas que desea.
Cambiar el color de fondo de un crculo en el diagrama de Venn
1. Haga clic en el elemento grfico SmartArt que desea cambiar.
2. Haga clic con el botn secundario del mouse en el borde del crculo y, a
continuacin, en Formato de forma.
3. Haga clic en Relleno y, a continuacin, en Relleno slido.
4. Haga clic en Color

y, a continuacin, en el color que desea.

Para cambiar el fondo de un color que no exista en los colores del tema, haga clic
en Ms colores y, a continuacin, haga clic en el color que desea en la ficha
Estndar o cree un color personalizado en la ficha Personalizado. Los colores
personalizados y los colores de la ficha Estndar no se actualizarn si cambia
ms adelante el tema del documento.
74

Para especificar cunto se puede ver a travs del color de fondo, mueva el control
deslizante Transparencia o escriba un nmero en el cuadro situado junto a dicho
control. El porcentaje de transparencia puede oscilar entre 0% (completamente
opaco, el valor predeterminado) y 100% (completamente transparente).
Aplicar un estilo SmartArt al diagrama de Venn
Un estilo SmartArt es una combinacin de distintos efectos, por ejemplo estilo de
lnea, bisel o 3D, que se puede aplicar a los crculos del elemento grfico SmartArt
para crear una apariencia nica y de diseo profesional.
1. Haga clic en el elemento grfico SmartArt que desea cambiar.
2. En Herramientas de SmartArt, en el grupo Estilos SmartArt de la ficha Diseo,
haga clic en el estilo SmartArt que desee.

Para ver ms estilos SmartArt, haga clic en el botn Ms

NOTAS

Al colocar el puntero sobre una miniatura, puede ver cmo afecta el estilo
SmartArt al elemento grfico SmartArt.

Tambin puede personalizar el elemento grfico SmartArt; para ello, puede mover
crculos, cambiar el tamao de los crculos, agregar un relleno o un efecto y
agregar una imagen.
Animar el diagrama de Venn
Si usa Microsoft Office PowerPoint 2007, puede animar el diagrama de Venn para
resaltar cada crculo.
75

1. Haga clic en el diagrama de Venn que desea animar.


2. En la ficha Animaciones, en el grupo Animaciones, haga clic en Animar y, a
continuacin, en Una a una.

NOTA

Si copia un diagrama de Venn con animacin aplicada a otra diapositiva,

tambin se copiar la animacin.


REPASO NUM. 3

1. Qu es un conjunto?
2. Define unin entre conjuntos
3. Define la interseccin entre conjuntos.
4. Cul es la diferencia entre una interseccin y una unin?
5. Cul es conjunto formado por la interseccin de los conjuntos:
{e, x, i, t, o} y {t, r, i, u, n, f, o}; {l, u, n, a} y B= {t, r, i, u, n, f, o}
6. Sean los conjunto: A = { 1, 2, 3, 4, 5 }; B = { 1, 2 };C = { 1, 5 }:D = { 1,
4 };E = { 1 } Cul de todos ellos es subconjunto de todos los
dems?
7. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 },C = {
-2,-1, 0,3}, construye los siguientes diagramas de Venn y descrbelos
formalmente a).- AUB, b).- AUC, c).- BUC

76

8. Dados los siguientes conjuntos: A = {2,4,6,8,10}, B = {0,1,2,3 }, C =


{ -1,-2, 0,3}, construye los diagramas de Venn y descrbelos
formalmente: a).- AB, b).- AC, c).- BC
9. Sean A ={1,2,3,4};

B ={2,4,6,8};

C ={3,4,5,6}

Hallar a).- A U B; b).- A U C; c).- B U C; d).- B U B

77

TEORIA DE PROBABILIDAD
INTRODUCCIN

La teora de la probabilidad es un rea de las matemticas. Se utiliza para el


anlisis y entendimiento de la ocurrencia de oportunidad; con ella se estudian los
fenmenos o experimentos aleatorios. Un experimento aleatorio es aquel que
cuando se repite bajo las mismas condiciones iniciales, el resultado que se obtiene
no siempre es el mismo. El ejemplo ms sencillo y cotidiano de un experimento
aleatorio es el de lanzar una moneda, un dado o jugar naipes.

En un experimento aleatorio, en principio, no sabemos cul ser el resultado, por


lo que conviene agrupar en un conjunto a todos los resultados posibles, ese
conjunto, espacio muestral o espacio muestra de un experimento aleatorio es el
lugar de todos los posibles resultados del experimento, y se le denota
generalmente por la letra griega (omega). Algunos textos prefieren la letra S
para denotar al espacio muestral. Esta letra proviene del trmino sampling space
o espacio muestral. Por otro lado, llamaremos evento a cualquier subconjunto del
espacio muestral y denotaremos a los eventos por las primeras letras del alfabeto
en maysculas: A, B, C, etc.

Ejemplo. Si un experimento aleatorio consiste en lanzar un dado y observar el


nmero que aparece en la cara superior, entonces claramente el espacio muestral
es el conjunto = {1, 2, 3, 4, 5, 6}. Como ejemplo de un evento para este
experimento podemos definir el conjunto A = {2, 4, 6}, que corresponde al suceso
de obtener como resultado un nmero par. Si al lanzar el dado una vez se obtiene
el nmero 4, decimos entonces que se observ la ocurrencia del evento A, y si
se obtiene por ejemplo el resultado 1, decimos que no se observ la ocurrencia
del evento A.

78

Entonces:

Espacio muestral o sampling space: o S: universo de posibles


resultados del experimento

Evento o suceso: subconjunto del espacio muestral, se denota con A, B, C,


etc.

La probabilidad se utiliza para pronosticar o predecir cientficamente la ocurrencia


de fenmenos, eventos, comportamientos, hechos, etc. Entenderlos y realizar
acciones en consecuencia (toma de decisiones) como: negocios, construir
infraestructura, describir el comportamiento de los fenmenos meteorolgicos, el
deporte, etc.

En la antigedad tambin se predeca el futuro con base en observaciones de los


chamanes, videntes, sacerdotes, etc. En el altiplano central los temporaleros,
graniceros o especialistas del tiempo basaban sus acciones predictivas en las
observaciones del comportamiento de los fenmenos meteorolgicos: lluvias,
serpientes de agua (tornados), nevadas, heladas, etc.

Los conceptos de espacio muestral y evento involucran forzosamente la


terminologa de conjuntos, por lo que el espacio muestral designado con la letra
omega de un experimento aleatorio es una especie de conjunto universal, y
cualquier elemento de lo denotaremos por (omega minscula). El conjunto
vaco lo denotaremos por . Otros smbolos usuales son los de pertenencia ( ), o
no pertenencia ( ) de un elemento en un conjunto. Recordamos a continuacin
las operaciones bsicas de conjuntos: unin, interseccin, diferencia y
complemento:
Unin: A B

Interseccin: A B

Diferencia: A B

Complemento: A B

79

Mediante un diagrama de Venn ilustramos grficamente las operaciones de unin,


interseccin, diferencia y complemento.

Qu es una probabilidad?
Una probabilidad (p) es la cualidad de probable, es decir que un evento o
fenmeno pueda o no suceder:
La probabilidad mide la frecuencia con la que aparece un resultado determinado
cuando se realiza el experimento aleatorio, el resultado puede ser el xito (P) o el
fracaso (Q).

Probabilidad de xito (P), representa la ocurrencia del evento de inters.

Probabilidad de fracaso (Q), representa la no ocurrencia del evento de


inters.

80

Frmula general para presentar una probabilidad


p(de xito) = No. De xito
= No. Resultados exitosos posibles
No. De ensayos No. Total de resultados posibles
Donde p (de xito) = probabilidad del evento de inters

Ejemplos:
Una moneda cualquiera tiene dos lados: guila o sol, cara o cruz

El espacio muestral =(Sol y guila); Al lanzar una sola moneda cul es la


probabilidad de obtener Sol?
p(cara)

= No. Caras
_________ = 1= .5000
No. De posibles resultados 2

Un paquete de cartas de poker se distribuye de la siguiente manera:

Total

As

As

As

As

4
4
4
4
4
4
4
4
4
4
4
4
52

2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
10
10
10
10
Jota
Jota
Jota
Jota
Quina Quina Quina Quina
Rey
Rey
Rey
Rey
13
13
13
13

81

El espacio muestral = (52 cartas diferentes); Cuando se toma una sola carta al
azar de un paquete estndar de 52 cartas
p(rey)

= No. De reyes en el paquete


Total e cartas en el paquete

= 4 = .0769
52

p(7)

No. De 7 en el paquete
__ = 4 = .0769
Total e cartas en el paquete
52

p(7)

No. De 7 en el paquete
= 4 = .0769
Total e cartas en el paquete 52

p()

No. De en el paquete
= 13 = .2500
Total e cartas en el paquete
52

REGLAS BSICAS DE LA TEORA DE LA PROBABILIDAD


Regla 1. Las probabilidades siempre oscilan en 0 y 1
Puesto que las probabilidades son proporciones, su lmite numrico inferior es
cero, es decir el evento no puede suceder y su lmite numrico superior es 1, esto
es el evento debe suceder. Las probabilidades siempre se calculan entre 0 y 1 (0
% y 100%).
Algunos eventos tienen un probabilidad cero de ocurrencia, es decir nunca
suceden, por ejemplo: permanecer vivo bajo el agua durante 24 horas sin
dispositivos de sobrevivencia. Otros eventos ocurren con una probabilidad del
100% (siempre suceden), por ejemplo que el sol salga maana. Muchos eventos,
sin embargo, no estn tan definidos; sus probabilidades de ocurrencia estn en
alguna parte entre nunca y siempre.
2. De adicin para eventos alternativos
Esta regla establece que la probabilidad de eventos alternativos es igual a la suma
de las probabilidades de los eventos individuales. Por consiguiente:
p (rey o as) = p (rey) + p (as)

82

No. De reyes en el paquete + No de ases en el paquete


No. de cartas en el paquete
No. de cartas en el paquete

= 4 + 4 = 8 = .1538 (aproximadamente 15%)


52 52 52

En la regla de adicin debe sustituirse la letra o por un signo de adicin +. La


regla de adicin lleva a un punto importante: la probabilidad de xito o fracaso
debe ser 1; es decir, P + Q = 1. De esto se desprende que si conocemos P,
entonces Q puede calcularse rpidamente:
Q= 1-P; P= 1-Q
Por ejemplo, si P=p (rey o as), entonces
Q= p (cualquier carta distinta de rey o as) = 1 - p= - .1538 = .8462
(aproximadamente 85%). En otras palabras, si tenemos cerca del 15% de
oportunidad de sacar un rey o un as, entonces tenemos aproximadamente 85 %
de oportunidad de no sacarlos.
Regla 3. Ajuste para las ocurrencias conjuntas
A veces el xito para un evento no es directo porque un resultado en particular es
exitoso en ms de una manera. Por ejemplo, al sacar una sola carta de un
paquete estndar de 52, existe un problema en el siguiente clculo que usa la
regla de adicin.
p (rey o reina o corazn) = p (rey) + p (reina) + p (corazn)

= No. De reyes + No. De reinas + No de corazones = 21 = .4038 (incorrecto)


No. Total de cartas en el paquete
52

Esta respuesta es incorrecta. Si tomamos un paquete de cartas

y contamos

cartas de xito (reyes, reinas y corazones), encontramos 19, no 21. Este es el


caso porque cuando sumamos las probabilidades separadas, contamos al rey y a

83

la reina de corazones dos veces. Siendo un rey y un corazn, el rey de corazones


es exitoso dos veces.

Cuando tenemos un evento que tiene doble xito o une dos aspectos de xito, se
denomina ocurrencia conjunta. Para calcular la probabilidad correcta, debemos
restar cada ocurrencia conjunta para eliminar ese doble conteo.

= (p (rey) + p (reina) + p (corazn) ) ( p ocurrencias conjuntas)


= No. De reyes + No. De reinas + No de corazones en el paquete 2 ocurrencias conjuntas
No. Total de cartas en el paquete
No. Total de cartas en el paquete

= 21 - 2 = 19 = .3654 (correcto)
52 52 52

Regla 4. Multiplicativa para eventos compuestos


Algunos eventos tienen dos o ms partes. A estos eventos con partes mltiples los
llamamos eventos compuestos, es decir que est compuesto de dos o mas
elementos.

Por ejemplo, definimos el xito como sacar un par de ases del

paquete de cartas, es decir, sacar un as, regresndolo, barajar una vez ms (es
decir al azar), y entonces sacar de nuevo un as. La regla multiplicativa para
eventos compuestos seala que la probabilidad de un evento compuesto es
igual al mltiplo de las probabilidades de las partes separadas del evento. As,
p (as luego as) = p (as) x p (as)

= 4 x 4 = 16
= .0059
52 52 2704

Nota: se cambia la palabra luego por el smbolo de multiplicacin


El simple caso de arrojar una moneda

utilizando la regla multiplicativa.

Calculemos la probabilidad de lanzar una moneda dos veces y obtener cara


ambas veces.
p (cara luego cara) = p (cara) x p (cara)

84

= .5 x .5 = .2500 (1 de 4)

Regla 5. Explicacin del reemplazamiento con eventos compuestos

En el caso de la regla 4, se mencion que la primera carta obtenida sera devuelta


al paquete antes de sacar la segunda. Esta estipulacin para calcular la
probabilidad de un evento compuesto se llama con reemplazamiento. Si no se
devuelve la primera carta, el clculo se habra realizado sin reemplazamiento y la
probabilidad calculada habra sido diferente.
p (as luego as) sin reemplazamiento = p (as) x p (as)

= 4 x 3 = 12
= .0045
52 51 2652

La probabilidad del primer as es la misma con o sin reemplazamiento porque el


evento empieza con 52 cartas y cuatro ases. Pero si la primera carta obtenida es
un as y no hay reemplazamiento, entonces al sacar la segunda solo hay 51 cartas
en el paquete, y solo tres son ases.
Nota: en cuestiones de reemplazamientos en eventos compuestos. Se ajustan
numeradores y denominadores consecuentemente. Por ejemplo:
p (as luego rey luego as) sin reemplazamiento = p (as) x p (rey) x p (as)

= 4 x 4 x 3 = 48 = .0004
52 51 50 132600

Probabilidad de sucesos
Al definir los sucesos hablamos de las diferentes relaciones que pueden guardar
dos sucesos entre s, as como de las posibles relaciones que se pueden
establecer entre los mismos. Vamos a ver ahora cmo se refleja esto en el clculo
de probabilidades.

85

a) Un suceso puede estar contenido en otro: entonces, la probabilidad del


primer suceso ser menor que la del suceso que lo contiene.
Ejemplo: lanzamos un dado y analizamos dos sucesos: a) que salga el nmero 6,
y b) que salga un nmero par. Dijimos que el suceso a) est contenido en el
suceso b). P(A) = 1/6 = 0,166

P(B) = 3 / 6 = 0,50

Por lo tanto, podemos ver que la probabilidad del suceso contenido, suceso a), es
menor que la probabilidad del suceso que lo contiene, suceso b).
b) Dos sucesos pueden ser iguales: en este caso, las probabilidades de ambos
sucesos son las mismas.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga
nmero par, y b) que salga mltiplo de 2. Las soluciones coinciden en ambos
casos.

P(A) = 3 / 6 = 0,50

P(B) = 3 / 6 = 0,50

c) Interseccin de sucesos: es aquel suceso compuesto por los elementos


comunes de los dos o ms sucesos que se intersectan. La probabilidad ser igual
a la probabilidad de los elementos comunes.
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga
nmero par, y b) que sea mayor que 3. La interseccin de estos dos sucesos tiene
dos elementos: el 4 y el 6.
Su probabilidad ser por tanto:

P(A B) = 2 / 6 = 0,33

d) Unin de dos o ms sucesos: la probabilidad de la unin de dos sucesos es


igual a la suma de las probabilidades individuales de los dos sucesos que se unen,
menos la probabilidad del suceso interseccin
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga
nmero par, y b) que el resultado sea mayor que 3. El suceso unin estara
formado por los siguientes resultados: el 2, el 4, el 5 y el 6.
86

P(A) = 3 / 6 = 0,50

P(B) = 3 / 6 = 0,50

P
Por lo tanto,
P (A u B) = (0,50 + 0,50) - 0,33 = 0,666
e) Sucesos incompatibles: la probabilidad de la unin de dos sucesos
incompatibles ser igual a la suma de las probabilidades de cada uno de los
sucesos (ya que su interseccin es el conjunto vacio y por lo tanto no hay que
restarle nada).
Ejemplo: lanzamos un dado al aire y analizamos dos sucesos: a) que salga un
nmero menor que 3, y b) que salga el nmero 6.
La probabilidad del suceso unin de estos dos sucesos ser igual a:
P(A) = 2 / 6 = 0,333

P(B) = 1 / 6 = 0,166

Por lo tanto,
P(A u B) = 0,33 + 0,166 = 0,50
f) Sucesos complementarios: la probabilidad de un suceso complementario a un
suceso (A) es igual a 1 - P(A)
Ejemplo: lanzamos un dado al aire. el suceso (A) es que salga un nmero par,
luego su complementario, suceso (B), es que salga un nmero impar.
La probabilidad del suceso (A) es igual a :
P(A) = 3 / 6 = 0,50
Luego, la probabilidad del suceso (B) es igual a:
P(B) = 1 - P(A) = 1 - 0,50 = 0,50
87

Se puede comprobar aplicando la regla de "casos favorables / casos posibles":


P(B) = 3 / 6 = 0,50
g) Unin de sucesos complementarios: la probabilidad de la unin de dos
sucesos complementarios es igual a 1.
Ejemplo: seguimos con el ejemplo anterior: a) que salga un nmero par, y b) que
salga un nmero impar. La probabilidad del suceso unin de estos dos sucesos
ser igual a:
P(A) = 3 / 6 = 0,50

P(B) = 3 / 6 = 0,50

Por lo tanto,
P(A U B) = 0,50 + 0,50 = 1

88

REPASO # 4
Completa las siguientes afirmaciones:
1. La probabilidad toma valores entre ________________
2. Los resultados de la probabilidad tambin pueden ser anotado
como__________________________
3. Un suceso imposible tendr una probabilidad de_____________________
4. Un suceso seguro tendr una probabilidad de_______________________
5. Probabilidad de que al lanzar un dado salga el nmero 2: el caso
favorable es tan slo uno (que salga el dos), mientras que los casos
posibles son seis (puede salir cualquier nmero del uno al seis). Por lo
tanto: P(A) =
6. Probabilidad de que al lanzar un dado salga un nmero par: en este
caso los casos favorables son tres (que salga el dos, el cuatro o el seis),
mientras que los casos posibles siguen siendo seis. Por lo tanto: P(A) =
7. Probabilidad de que al lanzar un dado salga un nmero menor que 5:
en este caso tenemos cuatro casos favorables (que salga el uno, el dos, el
tres o el cuatro), frente a los seis casos posibles. Por lo tanto: P(A) =
8. Probabilidad de que nos toque el "Gordo" de Navidad: tan slo un caso
favorable, el nmero que jugamos (qu triste...), frente a 100.000 casos
posibles. Por lo tanto: P(A) =
9. Que en un paquete completo de naipes previamente barajados
obtengamos:
p (As de )=
p (Rey )=
p (Jota )=
p (6 )=
p ()=

10. Que un paquete completo de naipes previamente barajados obtengamos:


p (As de o Rey o Jota o 6 )=
Menciona cual es la probabilidad de Q (fracaso) para el ejemplo anterior

PROBABILIDAD CONDICIONAL
La probabilidad condicional se refiere probabilidad de ocurrencia del evento A,
dada informacin acerca de la ocurrencia de otro evento B.

89

La probabilidad de A dado B es igual a la probabilidad de A y B dividida por la


probabilidad de B.
P(A B) = P(A y B)
P(B)
La probabilidad de B dado A es igual a la probabilidad de A y B dividida por la
probabilidad de A.
P(B A) = P(A y B)
P(A)
Donde: P(A y B) = probabilidad conjunta de A y B
P(A)= probabilidad de A
P(B)= probabilidad de B
Ejemplo: De 250 hogares donde se planeo comprar un televisor, en 200 realmente
se compro. Por lo tanto la probabilidad de que en un hogar realmente se compre
un equipo de televisin dado que lo planeo comprar es:
P(realmente compro plane comprar) = plane comprar y realmente compr
plane comprar

= 200 = 0.80
250

90

DISTRIBUCIN DE PROBABILIDAD
La distribucin de probabilidad de una variable aleatoria, es una funcin (fx) que
asigna a cada suceso definido, sobre la variable aleatoria, la probabilidad de que
dicho suceso ocurra. Indica la gama de valores que pueden representarse como
resultado de un experimento.
As mismo describe la probabilidad de que un evento se realice en el futuro,
constituye una herramienta fundamental para la prospectiva, puesto que se puede
disear un escenario de acontecimientos futuros considerando las tendencias
actuales de diversos fenmenos naturales.
Una variable es una caracterstica que al ser medida en diferentes individuos es
susceptible de adoptar diferentes datos. Los datos son los valores observados de
las variables, stas pueden ser:
Cualitativas: Son las variables que expresan distintas cualidades, caractersticas o
modalidades. Cada modalidad que se presenta se denomina atributo o categora y
la medicin consiste en una clasificacin de dichos atributos. Las variables
cualitativas pueden ser dicotmicas cuando slo pueden tomar dos valores
posibles como s y no, hombre y mujer o son politmicas cuando pueden adquirir
tres o ms valores. Dentro de ellas podemos distinguir:

Variable cualitativa ordinal: puede tomar distintos valores ordenados


siguiendo una escala establecida, aunque no es necesario que el intervalo
entre mediciones sea uniforme, por ejemplo: leve, moderado, grave.

Variable cualitativa nominal: En esta variable los valores no pueden ser


sometidos a un criterio de orden como por ejemplo los colores o el lugar de
residencia.

91

Cuantitativas o numricas
Son las variables que se expresan mediante cantidades numricas. Las variables
cuantitativas pueden ser:

Variable

discreta:

Es

la

variable

que

presenta

separaciones

interrupciones en la escala de valores que puede tomar. Estas


separaciones o interrupciones indican la ausencia de valores entre los
distintos valores especficos que la variable pueda asumir. Ejemplo: El
nmero de hijos (1, 2, 3, 4, 5).

Variable continua: Es la variable que puede adquirir cualquier valor dentro


de un intervalo especificado de valores. Por ejemplo la masa (2,3 kg,
2,4 kg, 2,5 kg, etc.) o la altura (1,64 m, 1,65 m, 1,66 m, etc.), que solamente
est limitado por la precisin del aparato medidor, en teora permiten que
siempre exista un valor entre dos cualesquiera.

DISTRIBUCIN DE VARIABLE
PROBABILIDADES DISCRETA

DISCRETA

DISTRIBUCIN

DE

Se denomina distribucin de variable discreta a aquella cuya funcin de


probabilidad slo toma valores positivos en un conjunto de valores de X finito o
infinito numerable. La distribucin de probabilidad discreta ms utilizada es la
binomial.

DISTRIBUCIN DE PROBABILIDAD BINOMIAL


La distribucin de probabilidad binomial (de dos nmeros o dicotmica) se utiliza
cuando la variable aleatoria discreta (donde no hay decimales) es el nmero de
xitos en una muestra compuesta de n observaciones.
1. La muestra se compone de un nmero fijo de observaciones, n.

92

2. Cada observacin se clasifica en una de dos categoras mutuamente


excluyentes, denominadas xito (p) o fracaso (q).
3. La probabilidad de que una observacin se clasifique como xito (p), es
constante de una observacin a otra, de la misma forma, la probabilidad de
que una observacin se clasifique como fracaso (q) o 1-p, es constante en
todas las observaciones.
4. El resultado (es decir, el xito o fracaso) de cualquier observacin es
independiente del resultado de cualquier otra observacin. Para garantizar la
independencia, las observaciones se deben seleccionar de manera aleatoria,
ya sea de una poblacin infinita sin reemplazo o de una poblacin finita con
reemplazo.
Cuando se cumple estas condiciones, la distribucin binomial proporciona cada
resultado posible de los N ensayos y la probabilidad de obtener cada uno de estos
resultados. La ecuacin que se utiliza para representar la distribucin de la
probabilidad binomial y calcular el nmero de xitos (X), dados los valores n y p,
es:

Donde: P(X) = probabilidad de X xitos dados los parmetros n y p


n = tamao de la muestra o nmero de observaciones
p = probabilidad de xito
1 p = probabilidad de fracaso
X = numero de xitos en la muestra (X = 0, 1, 2, .. n)

El trmino

indica la probabilidad de obtener X xitos de n

observaciones en una secuencia especfica.

El trmino

indica cuantas combinaciones de los X xitos entre n

observaciones son posibles. Entonces dado el nmero de observaciones n y la


probabilidad de xito p, la probabilidad de X xitos es:
93

P(X) = (numero de de secuencia posibles) x (probabilidad de un secuencia


especifica)

Ejemplo:
Supngase que en cierta poblacin el 52 por ciento de todos los nacimientos que
se registraron son varones. Si aleatoriamente se escogen 5 registros de
nacimientos dentro de esa poblacin, cul es la probabilidad de que exactamente
3 de ellos sean varones?
Tenemos los siguientes datos:
n = 5, nmero de ensayos, tamao de muestra o registros
X= 3, nmero de xitos (probabilidad de que sean varones)
p = 0.52, la probabilidad de xito

P(x)=

n!

p (1-p)

n-x

(n-x)! x!
P(x=20)=

5!
(5-3)! 3!

(0.52) (1-0.52)

5-3

P(x=20)= 120 (0.140608) (0.2304)


(2) 6

En excell se usa la siguiente frmula: =(A1/(B1*C1))*(D1*E1)


O bien de la siguiente manera:
1. Seleccionamos Insertar funcin fx
2. Seleccionamos DISTRIB. BINOM. y seleccionamos ACEPTAR
3. Ingresamos la informacin del problema y listo. P(X=3) = 0.3239

94

PROBLEMA
Hay una campaa en un centro mdico, sobre paternidad responsable a un grupo
de mujeres. Una vez finalizada la charla se les entrega un papelito con una nica
pregunta:
Deseara usted ser esterilizada?
1. Si 2. No
Estamos interesada en investigar si las charlas tienen un efecto favorable en el
sentido de que las mujeres se decidan a ser sometidas a la esterilizacin.
Ante este tipo de situaciones, tenemos que acudir a las Distribuciones de
Probabilidades. En nuestro ejemplo, la variable Deseo ser esterilizada, es una
variable cualitativa, discreta. Por lo tanto se requieren de las Distribuciones de
Probabilidades Discretas.

VARIABLE ALEATORIA
Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. Es decir se sabe qu valores puede tomar la variable
pero no se tiene certeza de su ocurrencia, slo se sabe que puede ocurrir con una
cierta probabilidad. Por ejemplo, en una epidemia de clera, se sabe que una
persona cualesquiera puede enfermar o no (eventos), pero no se sabe cul de los
95

dos eventos va a ocurrir. Solamente se puede decir que existe una probabilidad de
que la persona enferme.
Las variables aleatorias se clasifican:
1. Discretas: aquellas que resultan de contar el nmero de casos en los que el
evento de inters ocurre, por ejemplo: numero de hijos de una familia,
nmero de veces que llega una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medicin, por ejemplo: el
peso, el nivel de hemoglobina, etc.
VALOR ESPERADO
El valor esperado se llama tambin esperanza matemtica. Se trata de un
operador matemtico que al ser aplicado a la funcin probabilidad permite el
clculo de ese valor en el caso discreto, mientras que en el caso continuo se lo
aplica a la funcin frecuencia:
Sigamos con nuestro ejemplo del centro mdico. Nuestra variable de inters seria:
Deseo ser esterilizada.
Supongamos que a la charla asistieron tres mujeres, entonces definimos como
variable aleatoria a:
X : Nmero de mujeres que desearan ser esterilizadas.
Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede
considerar las posibles respuestas:
X = 0 (Ninguna deseara ser esterilizada)
X = 1 (Slo una de las mujeres deseara)
X = 2 (Dos mujeres desearan)
X = 3 (Las tres mujeres desearan)
Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuntas
estarn de acuerdo en ser esterilizadas, pero si conociera las probabilidades de
96

ocurrencia de cada uno de los posibles valores de la variable podra predecir su


ocurrencia con una cierta probabilidad. El conjunto de las probabilidades de
ocurrencia de los posibles valores de la variable aleatoria se denomina distribucin
de probabilidades.

DISTRIBUCION BINOMIAL
Esta distribucin se basa en el proceso de Bernoulli. Se denominan procesos de
tipo Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no
cierta propiedad o atributo, siendo aleatorios e independientes.
Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben
verificar tres condiciones:
1. Resultados dicotmicos: Los resultados de cada prueba se pueden
clasificar en "xito" si verifican cierta condicin, o "fracaso" en el caso
contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el
resultado de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado
considerado como un xito se mantiene constante a lo largo de toda la serie
de pruebas.
Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener
exactamente r xitos, en una serie de n pruebas, con una probabilidad de xito p,
se puede aplicar la frmula de la probabilidad binomial:

X = 0, 1, 2, , n.

97

Veamos el siguiente ejemplo:


Sea el caso de una droga X, con una dosis mortal de 1g/100 ml para cobayos
experimentales, en el 25% de los casos. Aplicando esta dosis a cien cobayos se
desea saber cunto vale la probabilidad de que mueran veinte de ellos.
Primero analizaremos si este caso cumple los supuestos bsicos de una
distribucin binomial:

Los cobayos mueren (xito) o sobreviven (fracaso).

Que un cobayo muera con la dosis, no significa que lo har el siguiente


(independencia) pues no se trata de una epidemia.

La probabilidad de que mueran se mantiene constante a lo largo de la serie de


pruebas (p = 0,25).

Entonces, como si cumple los supuestos bsicos, aplicamos la formula:

x=20

n=100

p= 0.25

O bien desglosando el ejemplo:


P(x)=

n!

p (1-p)

n-x

(n-x)! x!
P(x=20)=

100!
(0.25)
(100-20)! 20!
157

20

(1-0.25)

P(x=20)= 9.3326x10
118
18
(7.1569 x 10 ) 2.4329 x 10

100-20

-13

-10

(9.09495 x 10 ) (1.01135 x 10 )

98

Para calcular el factorial (!) se utiliza excell, insertar funcin (Fx), categora
matemticas

trigonomtricas,

seleccionar

fact,

insertar

el

nmero

seleccionado y dar aceptar. Para calcular la potencia se sigue el mismo


procedimiento y se selecciona potencia se inserta el nmero y la potencia, se da
aceptar.
157

9.3326x10
118
18
(7.1569 x 10 ) 2.4329 x 10

Para resolver la ecuacin tambin se utiliza Excel


Insertar funcin (fx) = =(A1/(B1*C1))
= (5.35983 x 1020) (9.09495 x 10-13) (1.01135 x 10-10)
=0.0493 49%

Todo lo anterior se resuelve con Excel de la siguiente forma:

Veamos otro ejemplo:


En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra
social es del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al
negocio y se desea calcular la probabilidad de concretar menos de tres ventas.
Si se cumple los supuestos bsicos de la distribucin binomial, entonces:
P(x<3) = P(x=0) + P(x=1) + P(x=2)

99

Matemticamente esto se resuelve as:

Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398; Ahora con Excel.


Matemticamente P(x<3) = P(x 2) . El Excel calcula siempre o igualdad o menor
igual. Cuando queremos menor igual, en la opcin de acumulado ingresamos
VERDADERO.
Entonces P(x<3) = 0.398

EJERCICIOS DE PROBABILIDAD BINOMIAL


El 60% de los estadounidenses leen sus contratos de trabajo, incluyendo las letras
pequeas. Suponga que el nmero de empleados que leen cada una de las palabras de
su contrato se puede modelar utilizando la distribucin binomial. Considerando un grupo
de cinco empleados, encuentre cual es la probabilidad de que:

100

a) Los cinco lean cada una de las palabras de su contrato


b) Al menos tres lean cada una de las palabras de su contrato
c) Menos de dos lean cada una de las palabras de su contrato
d) Cules seran sus respuestas para los incisos a), b) y c) si la probabilidad
de que un empleado lea cada una de las palabras de su contrato es de
0.80?
Variables:
a) x=5

n=5

p= 0.60

b) x=3

n=5

p= 0.60

x=4

n=5

p= 0.60

x=5

n=5

p= 0.60

c) x=1

n=5

p= 0.60

x=0

n=5

p= 0.60

a) P(x)=

n!
p (1-p)
(n-x)! x!

P(x=5)=

n-x

5!
(0.60) (1-0.60)
(5-5)! 5!

5-5

= 0.0778
b) P(x)=

n!
p (1-p)
(n-x)! x!

n-x

P(x3)
P(x=3)=

5-3

5-4

5-5

5!
(0.60) (1-0.60)
(5-3)! 3!

= 0.3456
P(x=4)=

5!
(0.60) (1-0.60)
(5-4)! 4!

= 0.2592
P(x=5)=

5!
(0.60) (1-0.60)
(5-5)! 5!

= 0.0778
P(x3) = P(x=3) + p(x=4)+ p(x=5)
P(x3) = 0.3456+0.2592+0.0778 = 0.6826

101

c) P(x)=

n!
p (1-p)
(n-x)! x!

n-x

P(x2)
P(x=1)=

5-1

5-0

5!
(0.60) (1-0.60)
(5-1)! 1!

= 0.0768
P(x=0)=

5!
(0.60) (1-0.60)
(5-0)! 0!

= 0.0102
P(x2) = P(x=1) + p(x=0)
P(x2) = 0.0768+0.0102 = 0.0870

Tabla de resultados en Excel

Ejercicio

n!

n-x!

x!

(a2/(b2*c2))

px

1-p n-x

d2*e2*f2

distribucin
binomial
en Excel

120

120

0.07776

0.0778

0.0778

0.0778

120

120

0.07776

0.0778

0.0778

0.6826

120

10

0.216

0.16

0.3456

0.3456

120

24

0.1296

0.4

0.2592

0.2592

120

24

0.6

0.0256

0.0768

0.0768

120

120

0.01024

0.0102

0.0102

solucin
en libro

0.0870

Un estudiante presenta un examen de opcin mltiple, en el que cada pregunta tiene


cuatro opciones. Suponga que el l no conoce la respuesta correcta de ninguna de las
preguntas, y que decidi utilizar una estrategia en la que colocar cuatro pelotas (A, B, C,
y D) dentro de una caja. Ahora, para responder cada pregunta, selecciona una pelota de
manera aleatoria y la devuelve a la caja. La letra de la pelota determinara su respuesta a
la pregunta. El examen se compone de cinco preguntas de opcin mltiple. Cul es la
probabilidad de que l obtenga?
a) Cinco respuestas correctas? b) Al menos cuatro respuestas
correctas?
b) Ninguna respuesta correcta? c) No ms de dos respuestas
correctas?

102

Variables:
a) x=5
b) x=4
x=5
c) x=0
d) x=2
x=1
x=0
a) P(x)=

n=5
n=5
n=5
n=5
n=5
n=5
n=5
x

n!
p (1-p)
(n-x)! x!

p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25
p= 0.25

n-x

5-5

5-5

5-4

5-0

5-2

5-1

5-0

P(x=5)=

5!
(0.25) (1-0.25)
(5-5)! 5!

b) P(x=5)=

5!
(0.25) (1-0.25)
(5-5)! 5!

P(x=4)=

5!
(0.25) (1-0.25)
(5-4)! 4!

c) P(x=0)=

5!
(0.25) (1-0.25)
(5-0)! 0!

d) P(x=2)=

5!
(0.25) (1-0.25)
(5-2)! 2!

P(x=1)=

5!
(0.25) (1-0.25)
(5-1)! 1!

P(x=0)=

5!
(0.25) (1-0.25)
(5-0)! 0!

Tabla de resultados en Excel

Ejercicio
A
B
C
D

n!
120
120
120
120
120
120
120

n-x!
1
1
1
120
6
24
120

x!
120
120
24
1
2
1
1

(a2/(b2*c2))
1
1
5
1
10
5
1

px
0.0009
0.0009
0.0039
1
0.0625
0.25
1

1-p n-x
1
1
0.75
0.2373
0.4218
0.3164
0.2373

d2*e2*f2
0.0010
0.0010
0.0146
0.2373
0.2637
0.3955
0.2373

Distribucin
binomial
en Excel
0.0010
0.0010
0.0146
0.2373
0.2637
0.3955
0.2373

Suma
0.0156

0.8965

103

DISTRIBUCIN DE PROBABILIDAD CONTINUA

La funcin de densidad de probabilidad continua es una expresin matemtica que


define la distribucin de los valores para una variable aleatoria continua como el
tiempo, la estatura, la distancia, la temperatura, la presin, entre otras; es decir
variables que se miden pero no se cuentan.

LA DISTRIBUCIN NORMAL
La distribucin normal o gaussiana, es la distribucin continua que se utiliza ms
comnmente en estadstica, sta es importante por tres razones:

Muchas variables continuas comunes en el mundo de los negocios tienen


distribuciones que se asemejan estrechamente a la distribucin normal.

La distribucin normal sirve para acercarse a diversas distribuciones de


probabilidad discreta como la distribucin binomial y la distribucin de
Poisson.

La distribucin normal proporciona las bases para la estadstica inferencial


clsica por su relacin con el teorema del lmite central.

La distribucin normal se representa por la clsica grfica en forma de campana,


con ella se puede calcular la probabilidad de que varios valores ocurran dentro de
ciertos rangos o intervalos. Sin embargo, la probabilidad exacta de un valor
particular dentro de una distribucin normal, es cero. Esta propiedad distingue a
las variables continuas, que son medidas (temperatura, peso, velocidad, presin),
de las variables discretas, las cuales son contadas (nmero de autos, cantidad de
personas). Por tanto es factible determinar, por ejemplo, que la probabilidad de
que el tiempo de descarga para una pgina de la web est entre 7 y 10 segundos,
entre 8 y 9 segundos o que la probabilidad de que el tiempo de descarga este

104

entre 7.99 y 8.01. Sin embargo, la probabilidad de que el tiempo de descarga sea
exactamente de 8 segundos es cero.
Distribucin normal estndar
La ms simple de todas las distribuciones normales, es la distribucin normal
estndar, denominada distribucin Z, est se encuentra distribuida alrededor de
una media (=0) con una desviacin estndar (=1). As por ejemplo, el valor
Z=1.5 est 1.5 desviaciones estndar por encima de la media y, en general:
Cada valor Z es el nmero de desviaciones estndar separado de la media.

Distribucin normal general


Una distribucin normal puede tener cualquier y cualquier desviacin estndar .
La distribucin normal es simtrica y con forma de campana, lo que implica que la
mayora de los datos tiende a agruparse alrededor de la media, la cual por su
forma simtrica, es igual a la mediana. Aunque desde el punto de vista terico los
valores en una distribucin normal pueden clasificarse del infinito negativo (-) al
infinito positivo (+), la forma de la distribucin hace poco posible que ocurran
valores extremadamente grandes o muy pequeos.
La expresin matemtica que representan la funcin de densidad de probabilidad
continua est indicada con el smbolo f(X).Para la distribucin normal, la funcin
de densidad de la probabilidad normal se da en la ecuacin

f(X) = _____1_____ e - (1/2)((X-)/)2


2
e= es contante matemtica: 2.71828
= constante matemtica: 3.1416

= es la media
= es la desviacin estndar
x= es cualquier valor de la variable continua

105

Puesto que

e y son constantes matemticas, las probabilidades de una

variable aleatoria X dependen slo de dos parmetros de la distribucin normal: la

media

y la desviacin estndar

combinacin particular

Cada vez que se especifique una

de la media y la desviacin estndar, se genera una

distribucin de probabilidad normal diferente.

La expresin matemtica antes descrita es tediosa de calcular y requiere de


clculo integral. Para evitar eso se usan las tablas de probabilidad normal. El
primer paso para encontrar probabilidades normales es usar la frmula de
transformacin, para convertir cualquier variable aleatoria normal X en una
variable aleatoria normal estandarizada Z.
Frmula de transformacin
El valor Z es igual a la diferencia entre X y la media

, dividida por la desviacin

estndar .

Z= X

Aunque los datos originales para la variable aleatoria X tenan una media y una
desviacin estndar, la variable aleatoria estandarizada Z siempre tendr una
media=0 y una desviacin estndar=1.
Al sustituir media=0 y desviacin estndar=1 en la ecuacin de funcin de
densidad de la probabilidad de una variable normal estandarizada Z. Dicha
funcin est dada en la siguiente ecuacin:

- (1/2)Z

f(X) = _____1_____ e
2

106

Cualquier conjunto de valores distribuidos normalmente son susceptibles de


convertirse a su forma estandarizada. Entonces se determinan las probabilidades
deseadas usando la Tabla de Distribucin normal estandarizada acumulativa.

Problema
Suponga que desea encontrar la probabilidad de que el tiempo de descarga para
un sitio Web sea menor a 9 segundos. La media es
=2
Primero utiliza la ecuacin Z= X-

=7 y la desviacin estndar

Encontrar P (X9)
Para transformar X=9 a unidades estandarizadas Z. Puesto que X=9 es una
desviacin estndar por arriba de la media 7+2= 9, Z= +1.00.
Z= 9-7 = 2 = +1.00
2
2
En seguida se utiliza la Tabla de distribucin normal estandarizada para encontrar
el rea acumulativa bajo la curva normal calculada menor que Z=+1.00 (es decir a
la izquierda de Z.
Para leer la probabilidad o rea bajo la curva menor que Z=+1.00 se revisa la
columna Z de la tabla, hasta localizar el valor Z de inters (en dcimos) en la fila Z
de 1.0. A continuacin se lee a travs del rengln hasta que intercepte la columna
que contiene el lugar del valor Z en los centsimos.

Por lo tanto, en el cuerpo de la tabla, la probabilidad tabulada para Z=1.00


corresponde con la interseccin de la fila Z=1.0 con la columna Z=.00, esta
probabilidad es de 0.8413, es decir hay un 84.13% de posibilidad de que el tiempo
de descarga sea menor a 9 segundos.

107

Encontrar P (X9)
Cul es la probabilidad de que el tiempo de descarga sea de ms de 9
segundos?
Solucin: La probabilidad de que el tiempo de descarga sea menor a 9 segundos
es de 0.8413. As, la probabilidad de que el tiempo de descarga sea mayor a 9
segundos es el complemento de que sea menor a 9 segundos, 1-0.8413= 0.1587.
Figura 1.
Figura 1.

108

Encontrar P (7X9)
Cul es la probabilidad de que el tiempo de descarga est entre 7 y 9 segundos?

Solucin: Ya se determino que la probabilidad de que el tiempo de descarga sea


menor a 9 segundos es de 0.8413. Ahora se determina la probabilidad de que el
tiempo de descarga sea menor a 7 segundos y sustraer esto de la probabilidad de
que el tiempo de descarga sea menor a 9 segundos.
Usando la ecuacin Z= X

Z= 7-7 = 0.00
2
Al utilizar la tabla de distribucin normal estandarizada acumulativa, se sabe que
el rea bajo la curva normal menor que la media de Z=0.00 es de 5.000. Por lo
tanto, el rea bajo la curva entre Z=0.00 y Z=1.00 es de 0.8413-0.5000 = 0.3413.
Figura 2.
Figura 2.

109

Encontrar P (X7 O X9)


Cul es la probabilidad de que el tiempo de descarga sea menor a 7 segundos o
mayor a 9 segundos?

Solucin: La probabilidad de que el tiempo de descarga sea entre 7 y 9 segundos


es de 0.3413; ahora la probabilidad de que el tiempo de descarga est por debajo
de los 7 segundos o por arriba de los 9 segundos es su complemento, 1-0.3413=
0.6587.
Otra manera de resolver el problema es el siguiente. Se calcula de forma
separada la probabilidad de tiempo de descarga menor a 7 segundos

y la

probabilidad mayor de 9 segundos, y despus sumar estas dos probabilidades


para obtener el resultado deseado.

Puesto que la media y la mediana son la misma para los datos distribuidos
normalmente, el 50% de los tiempos de descarga estn por debajo de los 7
segundos. Como se calcul, en el primer ejercicio, la probabilidad del tiempo de
descarga de ms de 9 segundos P (X9) es de 0.1587. Por lo tanto, la
probabilidad de que el tiempo de descarga est por debajo de 7 o por arriba de 9
segundos, P (X7 O X9), es 0.5000+0.1587= 0.6587. Figura 3.

Figura 3.

110

Encontrar P (5X9)
Cul es la probabilidad de que el tiempo de descarga este entre 5 y 9 segundos,
es decir P (5X9)?

Solucin: Considerando que el rea de inters se localiza entre los valores 5 y 9.


Siga los siguientes pasos:

1. Determine la probabilidad de menos de 9 segundos


2. Determine la probabilidad de menos de 5 segundos
3. Sustraiga el resultado menor del mayor

El rea bajo la curva normal menor que 9 segundos es, como se mencion
anteriormente, 0.8413. Para encontrar el rea bajo la curva menor que 5 segundos
(paso 2)

Z= 5-7 = -1.00
2

En la tabla busque Z= -1.00 y encuentre 0.1587. Para el paso tres, la probabilidad


de que el tiempo de descarga sea entre 5 y 9 segundos es 0.8413-0.1587 =
0.6826. Figura 4.
Figura 4.

111

Tabla distribucin normal estandarizada acumulativa


Normal

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.5000

0.5040

0.5080

0.5120

0.5160

0.5199

0.5239

0.5279

0.5319

0.5359

0.1

0.5398

0.5438

0.5478

0.5517

0.5557

0.5596

0.5636

0.5675

0.5714

0.5753

0.2

0.5793

0.5832

0.5871

0.5910

0.5948

0.5987

0.6026

0.6064

0.6103

0.6141

0.3

0.6179

0.6217

0.6255

0.6293

0.6331

0.6368

0.6406

0.6443

0.6480

0.6517

0.4

0.6554

0.6591

0.6628

0.6664

0.6700

0.6736

0.6772

0.6808

0.6844

0.6879

0.5

0.6915

0.6950

0.6985

0.7019

0.7054

0.7088

0.7123

0.7157

0.7190

0.7224

0.6

0.7257

0.7291

0.7324

0.7357

0.7389

0.7422

0.7454

0.7486

0.7517

0.7549

0.7

0.7580

0.7611

0.7642

0.7673

0.7704

0.7734

0.7764

0.7794

0.7823

0.7852

0.8

0.7881

0.7910

0.7939

0.7967

0.7995

0.8023

0.8051

0.8078

0.8106

0.8133

0.9

0.8159

0.8186

0.8212

0.8238

0.8264

0.8289

0.8315

0.8340

0.8365

0.8389

0.8413

0.8438

0.8461

0.8485

0.8508

0.8531

0.8554

0.8577

0.8599

0.8621

1.1

0.8643

0.8665

0.8686

0.8708

0.8729

0.8749

0.8770

0.8790

0.8810

0.8830

1.2

0.8849

0.8869

0.8888

0.8907

0.8925

0.8944

0.8962

0.8980

0.8997

0.9015

1.3

0.9032

0.9049

0.9066

0.9082

0.9099

0.9115

0.9131

0.9147

0.9162

0.9177

1.4

0.9192

0.9207

0.9222

0.9236

0.9251

0.9265

0.9279

0.9292

0.9306

0.9319

1.5

0.9332

0.9345

0.9357

0.9370

0.9382

0.9394

0.9406

0.9418

0.9429

0.9441

1.6

0.9452

0.9463

0.9474

0.9484

0.9495

0.9505

0.9515

0.9525

0.9535

0.9545

1.7

0.9554

0.9564

0.9573

0.9582

0.9591

0.9599

0.9608

0.9616

0.9625

0.9633

1.8

0.9641

0.9649

0.9656

0.9664

0.9671

0.9678

0.9686

0.9693

0.9699

0.9706

1.9

0.9713

0.9719

0.9726

0.9732

0.9738

0.9744

0.9750

0.9756

0.9761

0.9767

0.9772

0.9778

0.9783

0.9788

0.9793

0.9798

0.9803

0.9808

0.9812

0.9817

2.1

0.9821

0.9826

0.9830

0.9834

0.9838

0.9842

0.9846

0.9850

0.9854

0.9857

2.2

0.9861

0.9864

0.9868

0.9871

0.9875

0.9878

0.9881

0.9884

0.9887

0.9890

2.3

0.9893

0.9896

0.9898

0.9901

0.9904

0.9906

0.9909

0.9911

0.9913

0.9916

2.4

0.9918

0.9920

0.9922

0.9925

0.9927

0.9929

0.9931

0.9932

0.9934

0.9936

2.5

0.9938

0.9940

0.9941

0.9943

0.9945

0.9946

0.9948

0.9949

0.9951

0.9952

2.6

0.9953

0.9955

0.9956

0.9957

0.9959

0.9960

0.9961

0.9962

0.9963

0.9964

2.7

0.9965

0.9966

0.9967

0.9968

0.9969

0.9970

0.9971

0.9972

0.9973

0.9974

2.8

0.9974

0.9975

0.9976

0.9977

0.9977

0.9978

0.9979

0.9979

0.9980

0.9981

2.9

0.9981

0.9982

0.9982

0.9983

0.9984

0.9984

0.9985

0.9985

0.9986

0.9986

0.99865

0.99869

0.99874

0.99878

0.99882

0.99886

0.99889

0.99893

0.99896

0.99900

3.1

0.99903

0.99906

0.99910

0.99913

0.99916

0.99918

0.99921

0.99924

0.99926

0.99929

3.2

0.99931

0.99934

0.99936

0.99938

0.99940

0.99942

0.99944

0.99946

0.99948

0.99950

3.3

0.99952

0.99953

0.99955

0.99957

0.99958

0.99960

0.99961

0.99962

0.99964

0.99965

3.4

0.99966

0.99968

0.99969

0.99970

0.99971

0.99972

0.99973

0.99974

0.99975

0.99976

3.5

0.99977

0.99978

0.99978

0.99979

0.99980

0.99981

0.99981

0.99982

0.99983

0.99983

3.6

0.99984

0.99985

0.99985

0.99986

0.99986

0.99987

0.99987

0.99988

0.99988

0.99989

3.7

0.99989

0.99990

0.99990

0.99990

0.99991

0.99991

0.99992

0.99992

0.99992

0.99992

3.8

0.99993

0.99993

0.99993

0.99994

0.99994

0.99994

0.99994

0.99995

0.99995

0.99995

112

3.9

0.99995

0.99995

0.99996

0.99996

0.99996

0.99996

0.99996

0.99996

0.99997

0.99997

0.999968329 0.999969641

0.999970901

0.999972112 0.999973274

0.999974391

0.999975464

0.999976493

0.999977482

0.999978431

4.1

0.999979342 0.999980217

0.999981056

0.999981862 0.999982635

0.999983376

0.999984088

0.999984770

0.999985425

0.999986052

4.2

0.999986654 0.999987231

0.999987785

0.999988315 0.999988824

0.999989311

0.999989779

0.999990226

0.999990655

0.999991066

4.3

0.999991460 0.999991837

0.999992199

0.999992545 0.999992876

0.999993193

0.999993497

0.999993788

0.999994066

0.999994332

4.4

0.999994587 0.999994831

0.999995065

0.999995288 0.999995502

0.999995706

0.999995902

0.999996089

0.999996268

0.999996439

4.5

0.999996602 0.999996759

0.999996908

0.999997051 0.999997187

0.999997318

0.999997442

0.999997561

0.999997675

0.999997784

4.6

0.999997888 0.999997987

0.999998081

0.999998172 0.999998258

0.999998340

0.999998419

0.999998494

0.999998566

0.999998634

4.7

0.999998699 0.999998761

0.999998821

0.999998877 0.999998931

0.999998983

0.999999032

0.999999079

0.999999124

0.999999166

4.8

0.999999207 0.999999245

0.999999282

0.999999317 0.999999351

0.999999383

0.999999413

0.999999442

0.999999470

0.999999496

4.9

0.999999521 0.999999545

0.999999567

0.999999589 0.999999609

0.999999629

0.999999648

0.999999665

0.999999682

0.999999698

0.999999713 0.999999728

0.999999742

0.999999755 0.999999767

0.999999779

0.999999790

0.999999801

0.999999811

0.999999821

5.1

0.999999830 0.999999839

0.999999847

0.999999855 0.999999863

0.999999870

0.999999877

0.999999883

0.999999889

0.999999895

5.2

0.999999900 0.999999906

0.999999911

0.999999915 0.999999920

0.999999924

0.999999928

0.999999932

0.999999935

0.999999939

5.3

0.999999942 0.999999945

0.999999948

0.999999951 0.999999954

0.999999956

0.999999958

0.999999961

0.999999963

0.999999965

5.4

0.999999967 0.999999968

0.999999970

0.999999972 0.999999973

0.999999975

0.999999976

0.999999977

0.999999979

0.999999980

5.5

0.999999981 0.999999982

0.999999983

0.999999984 0.999999985

0.999999986

0.999999987

0.999999987

0.999999988

0.999999989

5.6

0.999999989 0.999999990

0.999999990

0.999999991 0.999999991

0.999999992

0.999999992

0.999999993

0.999999993

0.999999994

5.7

0.999999994 0.999999994

0.999999995

0.999999995 0.999999995

0.999999996

0.999999996

0.999999996

0.999999996

0.999999996

5.8

0.999999997 0.999999997

0.999999997

0.999999997 0.999999997

0.999999998

0.999999998

0.999999998

0.999999998

0.999999998

5.9

0.999999998 0.999999998

0.999999998

0.999999998 0.999999999

0.999999999

0.999999999

0.999999999

0.999999999

0.999999999

0.999999999 0.999999999

0.999999999

0.999999999 0.999999999

0.999999999

0.999999999

0.999999999

0.999999999

0.999999999

113

Para valores negativos de Z


Normal

0.5

0.01

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.496010644 0.492021686

0.488033527

0.484046563

0.480061194

0.476077817

0.47209683

0.468118628

0.464143607

-0.1

0.460172163 0.456204687 0.452241574

0.448283213

0.444329995

0.440382308

0.436440537

0.432505068

0.428576284

0.424654565

-0.2

0.420740291 0.416833837 0.412935577

0.409045885

0.405165128

0.401293674

0.397431887

0.393580127

0.389738752

0.385908119

-0.3

0.382088578 0.378280478 0.374484165

0.370699981

0.366928264

0.363169349

0.359423567

0.355691245

0.351972708

0.348268273

-0.4

0.344578258 0.340902974 0.337242727

0.333597821

0.329968554

0.32635522

0.32275811

0.319177509

0.315613697

0.312066949

-0.5

0.308537539 0.305025731 0.301531788

0.298055965

0.294598516

0.291159687

0.287739719

0.284338849

0.280957309

0.277595325

-0.6

0.274253118 0.270930904 0.267628893

0.264347292

0.2610863

0.257846111

0.254626915

0.251428895

0.24825223

0.245097094

-0.7

0.241963652 0.238852068 0.235762498

0.232695092

0.229649997

0.226627352

0.223627292

0.220649946

0.217695438

0.214763884

-0.8

0.211855399 0.208970088 0.206108054

0.203269392

0.200454193

0.197662543

0.194894521

0.192150202

0.189429655

0.186732943

-0.9

0.184060125 0.181411255

0.17878638

0.176185542

0.17360878

0.171056126

0.168527607

0.166023246

0.163543059

0.16108706

-1

0.158655254 0.156247645

0.15386423

0.151505003

0.14916995

0.146859056

0.1445723

0.142309654

0.14007109

0.137856572

-1.1

0.135666061 0.133499513 0.131356881

0.129238112

0.127143151

0.125071936

0.123024403

0.121000484

0.119000107

0.117023196

-1.2

0.11506967

0.113139446 0.111232437

0.109348552

0.107487697

0.105649774

0.103834681

0.102042315

0.100272568

0.098525329

-1.3

0.096800485 0.095097918 0.093417509

0.091759136

0.090122672

0.088507991

0.086914962

0.085343451

0.083793322

0.082264439

-1.4

0.080756659 0.079269841 0.077803841

0.07635851

0.0749337

0.07352926

0.072145037

0.070780877

0.069436623

0.068112118

-1.5

0.066807201 0.065521712 0.064255488

0.063008364

0.061780177

0.060570758

0.059379941

0.058207556

0.057053433

0.055917403

-1.6

0.054799292 0.053698928 0.052616138

0.051550748

0.050502583

0.049471468

0.048457226

0.047459682

0.046478658

0.045513977

-1.7

0.044565463 0.043632937 0.042716221

0.041815138

0.040929509

0.040059157

0.039203903

0.03836357

0.03753798

0.036726956

-1.8

0.035930319 0.035147894 0.034379502

0.033624969

0.032884119

0.032156775

0.031442763

0.030741909

0.030054039

0.02937898

-1.9

0.02871656

0.02742895

0.026803419

0.026189845

0.02558806

0.024997895

0.024419185

0.023851764

0.023295468

-2

0.022750132 0.022215594 0.021691694

0.02117827

0.020675163

0.020182215

0.01969927

0.019226172

0.018762766

0.0183089

-2.1

0.017864421 0.017429178 0.017003023

0.016585807

0.016177383

0.015777607

0.015386335

0.015003423

0.014628731

0.014262118

-2.2

0.013903448 0.013552581 0.013209384

0.012873721

0.012545461

0.012224473

0.011910625

0.011603792

0.011303844

0.011010658

-2.3

0.01072411

0.010444077 0.010170439

0.009903076

0.00964187

0.009386706

0.009137468

0.008894043

0.008656319

0.008424186

-2.4

0.008197536

0.00797626

0.007760254

0.007549411

0.007343631

0.007142811

0.006946851

0.006755653

0.006569119

0.006387155

-2.5

0.006209665 0.006036558 0.005867742

0.005703126

0.005542623

0.005386146

0.005233608

0.005084926

0.004940016

0.004798797

-2.6

0.004661188 0.004527111 0.004396488

0.004269243

0.004145301

0.004024589

0.003907033

0.003792562

0.003681108

0.003572601

-2.7

0.003466974

0.00336416

0.003166716

0.003071959

0.002979763

0.002890068

0.002802815

0.002717945

0.002635402

-2.8

0.00255513

0.002477075 0.002401182

0.0023274

0.002255677

0.002185961

0.002118205

0.002052359

0.001988376

0.001926209

-2.9

0.001865813 0.001807144 0.001750157

0.00169481

0.001641061

0.00158887

0.001538195

0.001488999

0.001441242

0.001394887

0.028066607

0.02

0.003264096

-3

0.001349898 0.001306238 0.001263873

0.001222769

0.001182891

0.001144207

0.001106685

0.001070294

0.001035003

0.001000782

-3.1

0.000967603 0.000935437 0.000904255

0.000874032

0.000844739

0.000816352

0.000788846

0.000762195

0.000736375

0.000711364

-3.2

0.000687138 0.000663675 0.000640953

0.000618951

0.000597648

0.000577025

0.000557061

0.000537737

0.000519035

0.000500937

-3.3

0.000483424

0.000450087

0.00043423

0.000418892

0.000404058

0.000389712

0.000375841

0.000362429

0.000349463

-3.4

0.000336929 0.000324814 0.000313106

0.000301791

0.000290857

0.000280293

0.000270088

0.000260229

0.000250707

0.00024151

-3.5

0.000232629 0.000224053 0.000215773

0.00020778

0.000200064

0.000192616

0.000185427

0.000178491

0.000171797

0.000165339

-3.6

0.000159109 0.000153099 0.000147302

0.000141711

0.000136319

0.00013112

0.000126108

0.000121275

0.000116617

0.000112127

0.00046648

-3.7

0.0001078

0.00010363

9.96E-05

9.57E-05

9.20E-05

8.84E-05

8.50E-05

8.16E-05

7.84E-05

7.53E-05

-3.8

7.23E-05

6.95E-05

6.67E-05

6.41E-05

6.15E-05

5.91E-05

5.67E-05

5.44E-05

5.22E-05

5.01E-05

114

-3.9

4.81E-05

4.61E-05

4.43E-05

4.25E-05

4.07E-05

3.91E-05

3.75E-05

3.59E-05

3.45E-05

3.30E-05

-4

3.17E-05

3.04E-05

2.91E-05

2.79E-05

2.67E-05

2.56E-05

2.45E-05

2.35E-05

2.25E-05

2.16E-05

-4.1

2.07E-05

1.98E-05

1.89E-05

1.81E-05

1.74E-05

1.66E-05

1.59E-05

1.52E-05

1.46E-05

1.39E-05

-4.2

1.33E-05

1.28E-05

1.22E-05

1.17E-05

1.12E-05

1.07E-05

1.02E-05

9.77E-06

9.34E-06

8.93E-06

-4.3

8.54E-06

8.16E-06

7.80E-06

7.46E-06

7.12E-06

6.81E-06

6.50E-06

6.21E-06

5.93E-06

5.67E-06

-4.4

5.41E-06

5.17E-06

4.94E-06

4.71E-06

4.50E-06

4.29E-06

4.10E-06

3.91E-06

3.73E-06

3.56E-06

-4.5

3.40E-06

3.24E-06

3.09E-06

2.95E-06

2.81E-06

2.68E-06

2.56E-06

2.44E-06

2.32E-06

2.22E-06

-4.6

2.11E-06

2.01E-06

1.92E-06

1.83E-06

1.74E-06

1.66E-06

1.58E-06

1.51E-06

1.43E-06

1.37E-06

-4.7

1.30E-06

1.24E-06

1.18E-06

1.12E-06

1.07E-06

1.02E-06

9.68E-07

9.21E-07

8.76E-07

8.34E-07

-4.8

7.93E-07

7.55E-07

7.18E-07

6.83E-07

6.49E-07

6.17E-07

5.87E-07

5.58E-07

5.30E-07

5.04E-07

-4.9

4.79E-07

4.55E-07

4.33E-07

4.11E-07

3.91E-07

3.71E-07

3.52E-07

3.35E-07

3.18E-07

3.02E-07

-5

2.87E-07

2.72E-07

2.58E-07

2.45E-07

2.33E-07

2.21E-07

2.10E-07

1.99E-07

1.89E-07

1.79E-07

-5.1

1.70E-07

1.61E-07

1.53E-07

1.45E-07

1.37E-07

1.30E-07

1.23E-07

1.17E-07

1.11E-07

1.05E-07

-5.2

9.96E-08

9.44E-08

8.95E-08

8.48E-08

8.03E-08

7.60E-08

7.20E-08

6.82E-08

6.46E-08

6.12E-08

-5.3

5.79E-08

5.48E-08

5.19E-08

4.91E-08

4.65E-08

4.40E-08

4.16E-08

3.94E-08

3.72E-08

3.52E-08

-5.4

3.33E-08

3.15E-08

2.98E-08

2.82E-08

2.66E-08

2.52E-08

2.38E-08

2.25E-08

2.13E-08

2.01E-08

-5.5

1.90E-08

1.79E-08

1.70E-08

1.60E-08

1.51E-08

1.43E-08

1.35E-08

1.27E-08

1.20E-08

1.14E-08

-5.6

1.07E-08

1.01E-08

9.55E-09

9.01E-09

8.50E-09

8.02E-09

7.57E-09

7.14E-09

6.73E-09

6.35E-09

-5.7

5.99E-09

5.65E-09

5.33E-09

5.02E-09

4.73E-09

4.46E-09

4.21E-09

3.96E-09

3.74E-09

3.52E-09

-5.8

3.32E-09

3.12E-09

2.94E-09

2.77E-09

2.61E-09

2.46E-09

2.31E-09

2.18E-09

2.05E-09

1.93E-09

-5.9

1.82E-09

1.71E-09

1.61E-09

1.51E-09

1.43E-09

1.34E-09

1.26E-09

1.19E-09

1.12E-09

1.05E-09

-6

9.87E-10

9.28E-10

8.72E-10

8.20E-10

7.71E-10

7.24E-10

6.81E-10

6.40E-10

6.01E-10

5.64553E-

115

ESTIMACIN DE INTERVALO DE CONFIANZA


En el contexto de estimar un parmetro poblacional, un intervalo de confianza es
un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parmetro, con una probabilidad determinada.
Se llama intervalo de confianza a un par de nmeros entre los cuales se estima
que estar cierto valor desconocido con una determinada probabilidad de acierto.
Formalmente, estos nmeros determinan un intervalo, que se calcula a partir de
datos de una muestra, y el valor desconocido es un parmetro poblacional.
INTERVALO DE CONFIANZA: Se llama as a un intervalo en el que sabemos
que est un parmetro, con un nivel de confianza especfico
La probabilidad de xito en la estimacin se denomina nivel de confianza y se
simboliza (1 ) x 100.
NIVEL DE CONFIANZA: Probabilidad de que el parmetro a estimar se
encuentre en el intervalo de confianza. Los valores que se suelen utilizar
para el nivel de confianza son el 95%, 99% y 99,9%
(alfa) es el llamado error aleatorio o nivel de significacin o de significancia,
esto es, una medida de las posibilidades de fallar o equivocar en la estimacin
mediante tal intervalo.
Para la construccin de un determinado intervalo de confianza es necesario
conocer la distribucin terica que sigue el parmetro a estimar. Es habitual que el
parmetro se distribuya normalmente.
Segn diferentes niveles de confianza el coeficiente de Z vara, as:
1- =90%, Z=1.64;
1- =97.5%, Z=2.24;

1- =95%,
1- =99%,

Z=1.96
Z=2.58

116

Para determinar el valor de Z, se realiza el siguiente procedimiento:


Nivel de
confianza

Nivel de
confianza

Nivel de
significancia

1-

/2

50

0.50

68.27

Sumatoria
1- + /2

Buscar en la Tabla de distribucin


normal acumulativa y unir los
valores de la columna y rengln de
Z=Valor crtico

0.25

0.75

Z=0.67

0.6827

0.1586

0.8413

Z=1.00

80

0.80

0.10

0.90

Z=1.28

90

0.90

0.05

0.95

Z= 1.64

95

0.95

0.025

0.975

Z= 1.96

95.45

0.9545

0.02275

0.97725

Z=2.00

96

0.96

0.02

0.98

Z=2.06

97.5

0.975

0.0125

0.9875

Z= 2.24

98

0.98

0.01

0.99

Z=2.33

99

0.99

0.005

0.995

Z= 2.58

99.73

0.9973

0.00135

0.9986

Z=2.99

La notacin /2, representa que estamos en una grfica de dos colas, por esta
razn (alfa) o nivel de significancia se divide entre dos.
Se llama valor crtico al valor de Z necesario para construir un intervalo de
confianza para la distribucin. El 95% de confianza corresponde a un valor de de
0.05. El valor crtico Z correspondiente al rea acumulativa de 0.9750 es 1.96.

117

Este valor nos dice que la media de la muestra se encuentran en un 95% de los
casos como mximo a 1.96 desviaciones tpicas de la media buscada.
Estimacin del intervalo de confianza para la media ( conocida)
Formula de intervalo de confianza para la media ( conocida)
Z /n

- Z /n - Z /n

Ejemplo estimacin del intervalo de confianza para la media con 95% de


confianza
Un fabricante de papel tiene un proceso de produccin continuo. Se espera que el
papel tenga una media de longitud de 11 pulgadas y una desviacin estndar de
0.02 pulgadas. Se selecciona una muestra para determinar si la media es igual a
11 pulgadas. Se selecciona una muestra aleatoria de 100 hojas; la media de
longitud de papel es de 10.998 pulgadas. Construya una estimacin de intervalo
de confianza del 95% para la media poblacional de la longitud del papel.
Z /n
= 10.998 (1.96) 0.02
100
= 10.9980.00392

El intervalo de confianza es:


10.99408 11.00192

Se concluye que con un 95% de confianza, se concluye que la media poblacional


est entre 10.99408 y 11.00192 pulgadas. Como el intervalo incluye al 11, valor
que indica que el proceso de produccin funciona adecuadamente, no hay razn
para creer que algo est mal.

118

Ejemplo estimacin del intervalo de confianza para la media con 99% de


confianza
Z /n
= 10.998 (2.58) 0.02
100

= 10.998 0.00516

El intervalo de confianza es:

10.99284 11.00316

Una vez ms, puesto que el 11 est incluido dentro de la amplitud de intervalo, no
hay razn para creer que algo est mal.

Problemas a resolver

1.- El Ayuntamiento, para planificar su poltica social, ha realizado una encuesta


en un barrio, basada en un muestreo aleatorio a 36 adultos, sobre los ingresos
medios mensuales, obtenindose 728 pesos de media y 120 pesos de desviacin
estndar. Estimar el valor medio de los ingresos en dicho barrio con un intervalo
de confianza del 95% y del 99%.
2.- Una encuesta realizada sobre 40 aviones comerciales, revela que la
antigedad media de estos es de 13,41 aos, con una desviacin estndar de la
muestra es s=8,28
Cul es con un 90% de confianza la antigedad media de toda la flota
comercial?
3.- En una muestra de 50 jvenes encontramos que la dedicacin media diaria al
ocio es de 400 minutos y la desviacin estndar de la muestra de 63 minutos.
Calcular el intervalo de confianza de la media de la poblacin al 95% de nivel de
confianza.
4.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl
(miligramos por decilitro) en medidas de colesterol. Suponiendo que la desviacin

119

estndar de la variable que mide las unidades de colesterol es s=28 mg/dl, se


pide:
a) Calcular el intervalo de confianza, con un nivel de confianza 0'95 para la media
de la poblacin.

Estimacin del intervalo de confianza para la media ( desconocida)


As como la media poblacional suele ser desconocida, rara vez se conoce la
desviacin estndar real de la poblacin . Por lo tanto se requiere desarrollar una
estimacin del intervalo de confianza de usando solo los estadsticos de
muestra: y S (media y desviacin estndar de la muestra).
La distribucin t (de t-Student) es una distribucin de probabilidad que surge del
problema de estimar la media de una poblacin normalmente distribuida cuando el
tamao de muestra es pequeo.
Se utiliza para la determinacin de las diferencias entre dos medias muestrales y
para la construccin del intervalo de confianza cuando se desconoce la desviacin
estndar de una poblacin y sta debe ser estimada a partir de los datos de una
muestra
Formula de intervalo de confianza para la media ( desconocida)
tn-1 S/n

- tn-1 S/n + tn-1 S/n

Ejercicio:
Una empresa de remodelaciones selecciona una muestra de 100 facturas de la
poblacin de facturas de ventas durante el mes; la media de la muestra de las 100
facturas de ventas es de $110.27, con una desviacin estndar de $28.95. Para
un nivel de confianza del 95% y 99 grados de libertad.

120

Para determinar el valor crtico (tn-1) se busca en la Tabla de valores crticos de t


(ver tabla al final) Las columnas de la tabla representan el rea de la cola
superior de la distribucin t. Cada fila representa el valor t determinado para cada
grado de libertad especfico.

Por ejemplo, con 99 grados de libertad, si se quiere un nivel de confianza del 95%
significa que el 2.5% de los valores, es decir un rea de 0.025, se encuentra en
cada extremo de la distribucin. Buscando en la columna para un rea de la cola
superior de 0.025 y en la fila correspondiente a 99 grados de libertad, se obtiene
un valor crtico para t de 1.9842 (ver figura). Entonces sustituimos:
tn-1 S/n = 110.27 (1.9842) 28.95
100
=110.27 (1.9842) 2.895

=110.27 5.74

$104.53 $116.01

121

122

123

PRUEBA DE HIPOTESIS
Una hiptesis es una proposicin aceptable que ha sido formulada a travs de la
recoleccin de informacin y datos, aunque no est confirmada sirve para
responder de forma tentativa a un problema con base cientfica.
Una hiptesis puede usarse como una propuesta provisional que no se pretende
demostrar estrictamente, o puede ser una prediccin que debe ser verificada por
el mtodo cientfico. En el primer caso, el nivel de veracidad que se otorga a una
hiptesis depender de la medida en que los datos empricos apoyan lo afirmado
en la hiptesis. Esto es lo que se conoce como contrastacin emprica de la
hiptesis o bien proceso de validacin de la hiptesis. Este proceso puede
realizarse mediante confirmacin (corroborar, dar validez) o mediante verificacin
(demostrar o comprobar que es verdadera una cosa de la que se dudaba).
Hiptesis nula y alternativa
En un trabajo de investigacin generalmente se plantean dos hiptesis
mutuamente excluyentes: la hiptesis nula o hiptesis de nulidad (H0) y la
hiptesis alternativa o de investigacin (H1).
La hiptesis nula (H0), siempre es una de status quo: expresa que el fenmeno o
proceso est funcionando de manera adecuada, de acuerdo con la norma o las
especificaciones.
La hiptesis de investigacin (H1), es una afirmacin especial cuya validez se
pretende demostrar, si las pruebas empricas no apoyan decididamente la
hiptesis de investigacin se aceptar la hiptesis nula y se abandona la hiptesis
de investigacin. La hiptesis alternativa es opuesta a la hiptesis nula, la primera
es cierta si la segunda es falsa.
El anlisis estadstico de los datos servir para determinar si se puede o no
aceptar H1. Cuando se rechaza H0, significa que el factor estudiado ha influido
significativamente en los resultados y es informacin relevante para apoyar la
124

hiptesis de investigacin H1. Plantear hiptesis de investigacin (H1) que no sea


excluyente con H0 supondra una aplicacin incorrecta del razonamiento
estadstico.
Ejemplo:
Es el peso medio de las cajas de cereal incluidas en la muestra de una empresa
de cereales un valor congruente con lo que usted esperara si la media de toda la
poblacin de cajas de cereales es de 368 gr? o puede usted inferir que la media
poblacional

no es igual a 368 gramos porque la media muestral es

significativamente diferente a 368 gramos?.


Hiptesis nula (H0): El llenado medio concuerda con la especificacin de 368
gramos. H0: = 368
Hiptesis de investigacin o alternativa (H1): El llenado medio no concuerda con la
especificacin de 368 gramos. H1: 368
En la metodologa de prueba de hiptesis, no poder rechazar la hiptesis nula no
comprueba que sea cierta. Usted nunca podr demostrar que la hiptesis nula es
correcta, porque la decisin se basa solo en informacin de la muestra, no en
toda la poblacin. Por lo tanto, si no se rechaza la hiptesis nula, solo puede
concluir que no existe evidencia suficiente para garantizar su rechazo.
Los siguientes puntos fundamentales resumen las hiptesis nula y alternativa.

La hiptesis nula H0 representa al status quo o creencia actual en una


situacin

La hiptesis alternativa H1 es lo opuesto a la hiptesis nula H0 y representa


una afirmacin de investigacin o inferencia especfica que quisiera
demostrar.

Si se rechaza la hiptesis nula, tiene una prueba estadstica de que la


hiptesis alternativa es correcta.
125

Si no se rechaza la hiptesis nula, entonces no ha podido demostrar la


hiptesis alternativa. El no poder demostrar la hiptesis alternativa no
quiere decir que haya demostrado la hiptesis nula.

La hiptesis nula siempre se refiere a un valor especfico del parmetro


poblacional , no a un estadstico de muestra ().

El enunciado que describe la hiptesis nula siempre contiene un signo de


igual relacionado con el valor especfico del parmetro poblacional.

El enunciado que describe la hiptesis alternativa nunca contiene un signo


de igual relacionado con el valor especfico del parmetro poblacional.

Valor crtico del estadstico de prueba


La lgica subyacente a la metodologa de prueba de hiptesis radica en
determinar qu tan probable es que la hiptesis nula sea cierta, considerando la
informacin recabada en una muestra. El estadstico () es una estimacin del
parmetro poblacional (). Si la hiptesis nula es cierta cabe esperar que

el

estadstico () sea cercano al parmetro (). Si es cercano a , no se cuenta con


evidencia suficiente para rechazar H0. Pero si existe una gran diferencia entre y
establecida en la hiptesis, usted concluir que sta ltima es falsa.
Regiones de rechazo y aceptacin
La distribucin muestral del estadstico de muestra , se divide en dos regiones:
una de rechazo o regin crtica y una de aceptacin o no rechazo.
Si el estadstico de prueba queda en la regin de aceptacin o de no rechazo, no
rechace la hiptesis nula. Por el contrario si queda en la regin de rechazo, se
rechaza la hiptesis nula.

126

Error tipo I y II
Al utilizar un estadstico de muestra para tomar decisiones sobre el parmetro
poblacional, existe el riesgo de llegar a una conclusin equivocada, se puede
cometer error tipo I y el error tipo II.
El error tipo I se presenta cuando se rechaza la hiptesis nula H0 siendo cierta y
no debera rechazarse. La probabilidad de que se presente un error tipo I es .
El error tipo II se presenta cuando no se rechaza la hiptesis nula H0 siendo falsa
y debera rechazarse. La probabilidad de que se presente un error tipo II es .
La probabilidad de cometer un error tipo denotado por , se denomina nivel de
significancia del estadstico de prueba, por lo general se seleccionan nivel de
0.01, 0.5 o 0.10. Despus de especificar el valor de , usted conoce el tamao de
la regin de rechazo, porque es la probabilidad de rechazo bajo la hiptesis nula.
A partir de este hecho, se determina el valor o valores crticos que dividen las
zonas de rechazo y aceptacin.
El complemento de la probabilidad de un error tipo I (1- ) se denomina
coeficiente de confianza. Al multiplicarlo por cien (1- ) x 100, el coeficiente de
confianza produce el nivel de confianza. El coeficiente de confianza (1- ),
expresa la probabilidad de que la hiptesis nula no se rechace cuando es cierta y
no debe rechazarse. El nivel de confianza de una prueba de hiptesis es (1- ) x
100.

127

La posibilidad de cometer el error tipo II () depende de la diferencia que existe


entre los valores hipotticos y real del parmetro poblacional. Si la diferencia que
existe entre los valores hipottico y real del parmetro poblacional es grande, es
pequea y si la diferencia entre los valores hipottico y real del parmetro
poblacional es pequeo es mayor.
Prueba Z de hiptesis para la media con conocida
Cuando se conoce la desviacin estndar poblacional (), y si tiene una
distribucin normal se utiliza la prueba de Z de hiptesis para la media (
conocida):
Z= -

n
Si la poblacin no tiene una distribucin normal, todava se puede utilizar la prueba
Z si el tamao de la muestra es lo bastante grande como para que tenga efecto el
teorema del lmite central. La ecuacin anterior define el estadstico de prueba Z
para determinar la diferencia que existe entre la media muestral y la media
poblacional cuando se conoce la desviacin estndar poblacional .

El resultado obtenido de la prueba Z, se compara con los valores crticos. Si se


utiliza un nivel de significancia de 0.05, este valor de divide entre dos 0.05/2=
0.025. De esta forma la distribucin normal tiene como resultado un rea
acumulada de 0.025 bajo el valor crtico inferior (izquierda de la grfica) y un rea
acumulada de 0.975 bajo el valor critico superior. Con este nivel de confianza, de
acuerdo a la Tabla de distribucin normal estandarizada acumulativa los valores
crticos que dividen las regiones de rechazo y aceptacin son -1.96 y + 1.96. Los
valores de Z mayores que + 1.96 y menores que -1.96 indican que la media
muestral est muy alejada de la media poblacional , por lo que sera muy poco
probable que se presentara uno de estos valores si Ho fuera verdadera.

128

Por lo tanto la regla de decisin es:


Rechace Ho si Z +1.96 o si Z -1.96
De lo contrario, no rechace Ho.

Ejemplo:

Una empresa de empaquetado de cereales quiere determinar si el proceso de


llenado de cereal funciona de manera adecuada, es decir sus paquetes presentan
los 368 gramos especificados y no requiere accin correctiva. Para evaluar esto,
se toma una muestra aleatoria de 25 cajas, pesa cada una y define una hiptesis
nula y alternativa:
Hiptesis nula (H0): El llenado medio concuerda con la especificacin de 368
gramos. H0: = 368
Hiptesis de investigacin o alternativa (H1): El llenado medio no concuerda con la
especificacin de 368 gramos. H1: 368

El resultado del pesado de las 25 cajas indica una media muestral de =372.5
gramos y que la desviacin estndar de la poblacin es de 15 gramos

129

Z= - = 372.5-368 = +1.50

15
n
25

Puesto que el estadstico de prueba Z= +1.50 se encuentra entre 11.96 y + 1.96,


no se rechaza Ho, la conclusin se redacta de la siguiente manera: no existe
suficiente evidencia de que el llenado medio sea diferente a 368 gramos

Prueba t de hiptesis para la media ( desconocida)

En la mayora de las situaciones de prueba de hiptesis que implican datos


numricos, no se conoce la desviacin estndar poblacional . En su lugar, se
utiliza la desviacin estndar de la muestra S. Si se supone que la poblacin tiene
una distribucin normal, la distribucin muestral de la media seguir una
distribucin t con n-1 grados de libertad. Si la poblacin no tiene una distribucin
normal se puede utilizar la prueba t si el tamao es suficientemente grande (
120).

La ecuacin siguiente define al estadstico prueba t para determinar la diferencia


que existe entre la media muestral y la media poblacional cuando se utiliza la
desviacin estndar muestral S.
t= -
S
n
130

En los ltimos cinco aos una empresa presenta un monto medio por factura de
120 pesos. Se utiliza la prueba de hiptesis para tratar de demostrar que el monto
medio por factura est aumentando o disminuyendo.
Paso 1. Definir hiptesis nula y de investigacin.
Ho: = 120

H1: 120

La hiptesis de investigacin H1 contiene la informacin que se trata de


comprobar, si se rechaza la hiptesis nula, se tendrn evidencias estadsticas de
que la cantidad media por factura no supera los 120. Si la conclusin estadstica
es no rechazar H0, entonces se concluir que existe n evidencias suficientes
para demostrar que la cantidad media es distinta de la media a largo plazo de 120.
Paso 2. Se selecciona un tamao de muestra, que en este caso es n= 12. Se
decide utilizar un nivel de significancia =0.05
Paso 3. Puesto que no se conoce , se utiliza la distribucin t y el estadstico de
prueba t. Se supone que la poblacin de facturas tiene una distribucin normal.

Paso 4. Para una muestra de tamao n, el estadstico de prueba t sigue una


distribucin t con n-1 grados de libertad. En la tabla valores crticos de t. Para
localizar el rea de cola superior, el nivel de significancia se divide entre dos:
=0.05/2= 0.025, con este dato y n-1 grados de libertad= 12-1=11, se localiza

131

Determinacin del valor crtico para un rea de 0.025 en cada cola, con 11
grados de libertad, a partir de la tabla de valores crticos de t.
Puesto que la hiptesis de investigacin H1 de que 120 es no direccional, el
rea en la regin de rechazo de la cola izquierda (inferior) de la distribucin t es
0.025, y el rea en la regin de rechazo de la cola derecha (superior) de la
distribucin t es de 0.025.
A partir de la tabla t, los valores crticos son 2.201. La regla de decisin es:
Rechazar Ho si t -t11 = - 2.201

O si t -t11 = + 2.201

Paso 5. Los siguientes datos son las cantidades de la muestra de 12 facturas, con
la media y la desviacin estndar S:

Media

110.59
75.71
127.46
128.58
107.26
135.11
112.85

108.98
93.32
152.22
91.97
111.45
111.56
20.79

desviacin estndar

132

t= -
S
n

=112.85-120 =-1.19
20.80
12

Paso 6. Puesto que 2.201 t=-1.19+2.201, no se rechaza la hiptesis nula. No


existen evidencias suficientes para concluir que la cantidad media por factura no
supera los 120. Debe sugerirse que el monto medio por factura no ha cambiado.

REGRESIN LINEAL SIMPLE


INTRODUCCIN
Si se presenta una relacin entre una variable denominada dependiente y otra
denominada independiente, como, por ejemplo, las existentes entre la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc., puede
darse el problema de que la variable dependiente asuma mltiples valores para
una combinacin de valores de las variables independientes.
La variable dependiente es la variable que desea predecir. La variable
independiente es aqulla que es manipulada por el investigador en un
experimento con el objeto de estudiar cmo incide sobre la expresin de la
variable dependiente.
Variable dependiente e independiente

133

Una variable independiente a aqulla que es manipulada por el


investigador en un experimento con el objeto de estudiar cmo incide sobre
la expresin de la variable dependiente. Esto significa que las variaciones,
ejercidas por el investigador sobre la variable independiente repercutirn
en variaciones en la variable dependiente. Tambin se la conoce como
variable explicativa y suele denotarse como X

A la variable dependiente se la conoce como variable explicada. Esta


dependen de los valores que tome la otra variable. En una funcin suele
estar representada por Y, en el eje ordenadas (vertical).

La variable Y est en funcin (depende) de la variable X, que es la variable


independiente.

Ejemplos
El precio que pagamos por frutas, verduras u otra mercanca depende del nmero
de kilogramos que compremos.

x = Kg de mercanca

y = P r ec i o e n $

10

El eje de ordenadas o eje Y es el eje vertical de un sistema de coordenadas


cartesianas, el eje de las abscisas, o eje X, es el eje horizontal.
134

Si se dan las relaciones descritas, se suele recurrir a los estudios de regresin


en los cuales se obtiene una nueva relacin pero de un tipo especial
denominado funcin, en la cual la variable independiente se asocia con un
indicador de tendencia central de la variable dependiente. Cabe recordar que
en trminos generales, una funcin es un tipo de relacin en la cual para cada
valor de la variable independiente le corresponde uno y slo un valor de la
variable dependiente.
Adems de predecir los valores de la variable dependiente, el anlisis de regresin
tambin permite identificar el tipo de relacin matemtica que existe entre la
variable dependiente e independiente, para cuantificar el efecto que los cambios
ejercidos sobre la variable independiente tienen sobre la variable dependiente.

REGRESIN LINEAL SIMPLE


La regresin lineal simple y la correlacin son dos tcnicas estadsticas que se
pueden utilizar para solucionar problemas comunes en los negocios. Muchos
estudios se basan en la creencia de que es posible identificar y cuantificar alguna
relacin funcional entre dos o ms variables, donde una variable depende de la
otra variable. Se puede decir que Y depende de X, en donde Y y X son dos
variables cualquiera en un modelo de Regresin Simple.
"Y es una funcin de X"
Y = f(X)
Como Y depende de X,
Y es la variable dependiente, y
135

X es la variable independiente.

En el Modelo de Regresin es muy importante identificar cul es la variable


dependiente y cul es la variable independiente. Este modelo establece que Y es
una funcin de slo una variable independiente y se representa as:

Y = f (X)
"Y est regresando por X"

La variable dependiente Y es la variable que se desea explicar o predecir.


Tambin se le llama regresando o variable de respuesta. La variable
independiente X se le denomina variable explicativa o regresor y se le utiliza para
explicar Y.

ANLISIS ESTADSTICO: REGRESIN LINEAL SIMPLE


En el estudio de la relacin funcional entre dos variables poblacionales, una
variable X, llamada independiente, explicativa o de prediccin y una variable Y,
llamada dependiente o variable respuesta, presenta la siguiente notacin:

Yi = 0 + 1 Xi + ei
Donde:
Yi = variable dependiente (de respuesta)
0 = interseccin en Y para la poblacin
1= pendiente para la poblacin
Xi = variable independiente (explicatoria)
ei= error aleatorio en Y para la observacin i
ECUACIN DE REGRESIN LINEL SIMPLE
136

Consiste en determinar los valores de "a" y "b " a partir de la muestra, es decir,
encontrar los valores de a y b con los datos observados de la muestra. El mtodo
de estimacin es el Mtodo de Mnimos Cuadrados, mediante el cual se obtiene:

Luego, la ecuacin de regresin muestral estimada es:

Yi=bo + b1Xi

Que se interpreta como:


Yi= valor predicho de Y para la observacin i
Xi= valor de X para la observacin i
bo= interseccin de la muestra en Y
b1= pendiente de la muestra
a es el estimador de a
Est expresado en las mismas unidades de Y por cada unidad de X. Indica el
nmero de unidades en que vara Y cuando se produce un cambio, en una unidad,
en X (pendiente de la recta de regresin). Un valor negativo de b sera
interpretado como la magnitud del decremento en Y por cada unidad de aumento
en X.
PROBLEMA
Se desea pronosticar las ventas anuales para todas las tiendas nuevas de una
marca, con base en el tamao de los establecimientos. Para examinar la relacin
entre la superficie de la tienda (en pies cuadrados) y las ventas anuales, se
selecciono una muestra de 14 tiendas (ver tabla).

137

TIENDA

PIES 2

VENTAS ANUALES

1.7

3.7

1.6

3.9

2.8

6.7

5.6

9.5

1.3

3.4

2.2

5.6

1.3

3.7

1.1

2.7

3.2

5.5

10

1.5

2.9

11

5.2

10.7

12

4.6

7.6

13

5.8

11.8

14

4.1

Para realizar el anlisis por el Mtodo de mnimos cuadrados mediante Excel, se


hace de la siguiente forma: 1) En la barra de men seleccionar Datos, 2) Anlisis
de datos, 3) Regresin, 4) Aceptar, 5) En rango Y de entrada colocar variables
dependientes (ventas anuales), 6) En rango X de entrada colocar variables
independientes (pies2), 7) marcar con nivel de confianza, residuos, residuos
estndares, grficos residuales, curva de regresin ajustada y grfico de
probabilidad normal; dar aceptar.

138

8) los resultados obtenidos con Excel son los siguientes:


Tabla 1. Estadsticas de regresin

Estadsticas de la regresin
Coeficiente de correlacin mltiple
Coeficiente de determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0.95088
0.90418
0.89619
0.96638
14.00000

Tabla 2. Anlisis de varianza (ANOVA)

Regresin
Residuos
Total

Grados de
libertad

Suma de
cuadrados

1.00000
12.00000
13.00000

105.74761
11.20668
116.95429

Promedio de los cuadrados

Valor crtico de
F

105.74761
0.93389

113.23351

0.00000

Tabla 3. Tabla de coeficientes

Intercepcin
Variable X 1

Coeficientes

Error
tpico

0.96447 (b0)
1.66986 (b1)

0.52619
0.15693

Estadstico
Probabilidad
t
1.83293
10.64112

0.09173
0.00000

Inferior
95%

Superior
95%

Inferior
95.0%

Superior
95.0%

-0.18200
1.32795

2.11095
2.01177

-0.18200
1.32795

2.11095
2.01177

139

En la tabla 3 se observan los coeficientes b0= 0.964 y b1= 1.669. Por lo tanto, la
lnea de prediccin para estos datos es: Yi= 0.964 + 1.669i

La pendiente b1 es+ 1.669. Esto significa que para cada incremento de 1 unidad
en X, se estima que el valor promedio de Y se incrementar por 1.669 unidades.
En otras palabras por cada incremento de 1.0 mil pies cuadrados en el tamao de
la tienda, se estima que la media de ventas anuales se incrementar por 1.669
millones. Por lo tanto la pendiente representa la porcin de las ventas anuales que
se estima que variar de acuerdo con el tamao de la tienda.

Variable X 1 Curva de regresin ajustada


14

Y
VENTAS ANUALES

12
10
8
6

Pronstico para Y

2
0
0

Variable X 1 SUPERFICIE DE LA TIENDA

140

GRFICOS DE CONTROL

Las grficas de control son una herramienta ampliamente utilizada para analizar el
proceso de recoleccin secuencial de datos, permiten monitorear la variacin de
una caracterstica de productos o servicios a lo largo del tiempo. Con ellas se
estudia el desempeo pasado, se evalan las condiciones presentes o predicen
las condiciones futuras. La informacin obtenida al analizar una grfica de control,
constituye la base para el proceso de mejoramiento. Con ellas se analizan
variables categricas, discretas y continuas. Las grficas de control hacen nfasis
en separar las causas de variacin especiales de las causas comunes de
variacin.
De esta forma la idea convencional de inspeccionar el producto final y eliminar las
unidades que no cumplen con las especificaciones una vez terminado el proceso,
es reemplazada por una estrategia ms econmica de prevencin antes y durante
del proceso, con el fin de lograr que precisamente estos productos o servicios
lleguen al consumidor sin defectos. Pues las variaciones de calidad producidas
antes y durante el proceso pueden ser detectadas y corregidas gracias al empleo
masivo de Grficas de Control.
Como se menciono, para el enfoque de las grficas de control existen dos tipos de
variacin. El primer tipo es una variabilidad aleatoria debido a "causas al azar" o
"causas comunes". Estas representan cambios que existen en un proceso, son
fluctuaciones que operan aleatoriamente o por casualidad.
El segundo tipo de variabilidad, en cambio, representan un cambio real en el
proceso atribuible a "causas especiales" o causas asignables de variacin, las
cuales, por lo menos tericamente, pueden ser identificadas y eliminadas.
Representan grandes fluctuaciones

en los datos que no son inherentes al

proceso.

141

De esta forma, un proceso se encuentra bajo control estadstico cuando la


variabilidad se debe slo a "causas comunes" y est fuera de control cuando se
debe a causas especiales.
La distincin entre las dos causas de variacin es importante porque las causas
especiales no forman parte del proceso y son corregibles, sin cambiar el sistema,
Las causas comunes se reducen cambiando el sistema.

Errores comunes en las grficas de control


El primer tipo de error implica la creencia de que un valor observado representa
una causa especial, cuando en realidad se debe a una causa comn; tratar una
causa comn como especial tiene como consecuencia el sobreajuste o
manipulacin de un proceso, lo que aumenta la variacin del proceso.
El segundo tipo de error implica tratar una causa especial como si fuera comn y
da como resultado no tomar una accin correctiva inmediata cuando es necesaria.

Situaciones de las grficas de control


Para cada uno de los grficos de control, existen dos situaciones diferentes; a)
cuando no existen valores especificados y b) cuando existen valores
especificados. Antes de utilizar las Grficas de Control por variables, debe tenerse
en consideracin lo siguiente:

El proceso debe ser estable y los datos o deben obedecer a una


distribucin normal

El nmero de datos a considerar debe ser de aproximadamente 20 a 25


subgrupos con un tamao de muestras de 4 a 5, para que las muestras
consideradas sean representativas de la poblacin.

Los datos deben ser clasificados teniendo en cuenta que, la dispersin


debe ser mnima dentro de cada subgrupo y mxima entre subgrupos

Se deben disponer de tablas estadsticas


142

Construccin de grficos de control


Para construir un grfico de control, se recolectan muestras (subgrupos) de las
salidas de un proceso a lo largo del tiempo. Para cada subgrupo o muestra se
calcula un estadstico asociado con una variable: Los estadsticos utilizados
incluyen la fraccin disconforme1, la media y el rango de una variable numrica.
Entonces se grafican los valores contra el tiempo y se agregan los lmites de
control a la grfica. La forma ms comn de grafica de control establece limites de
control que estn 3 desviaciones estndar de la medida estadsitica de inters.
La ecuacin media del proceso 3 desviaciones estndar define, en general,
los lmites de control superior e inferior para la grficas de control. El lmite
superior (LCS o UCL) es = media del proces + 3 desviaciones estndar, y el
lmite inferior (LIC o LCL) = media del proceso - 3 desviaciones estndar.
Entonces se grafican los valores contra el tiempo y se agregan los lmites de
control a la grfica.

Patrones de las grficas de control

El porcentaje o fraccin disconforme se define como el cociente del nmero de artculos


disconformes de una poblacin entre el nmero total de artculos que contiene sta ltima. Los
artculos pueden tener varias caractersticas de calidad que el inspector examina simultneamente.
Si no est conforme con el estndar de una o ms caractersticas, se clasificar como disconforme.

143

Panel A. No existe un patrn aparente de los valores a lo largo del tiempo y no hay
puntos que caigan fuera del lmite de control de 3 desviaciones estndar. El
proceso parece estable y contiene causas comunes de variacin.
Panel B. Contiene dos puntos que caen fuera de los lmites de control de las 3
desviaciones estndar. Se debe investigar estos puntos para tratar de determinar
las causas especiales que llevan a su ocurrencia.
Panel C. No tienen ningn punto fuera de los lmites de control, tiene una serie de
puntos consecutivos por arriba del valor promedio y una serie de puntos
consecutivos por debajo del valor promedio. Adems se observa claramente una
tendencia global descendente, se debe investigar para determinar que ha causado
este patrn.

Tipos de control de procesos

Cuando una grfica de control exhibe un punto fuera de los lmites de control o
una tendencia (como en B y C) est fuera de control y es impredecible. Un
proceso fuera de control contiene tanto causas comunes de variacin como
causas especiales y estas ltimas no forman parte del diseo del proceso, si las
causas especiales de variacin actan en detrimento del producto o servicio, se
requiere elaborar planes para eliminar la causa; por el contrario si stas
incrementan la calidad del producto o servicio, se debe cambiar el proceso para
incorporarla dentro del diseo del proceso.

Un proceso bajo control, contiene nicamente causas comunes de variacin


puesto que son inherentes al proceso en s mismo. Un proceso bajo control es
predecible. En ocasiones se denomina que estn en un estado de control
estadstico.

144

Tipos de grficas de control


La grfica p, control para la proporcin de artculos disconformes
Las graficas de atributos se utilizan para variables categricas o discretas, como la
grfica p, que se utiliza cuando los elementos que son muestreados se clasifican
de acuerdo a si se conforman o no con los requerimientos definidos
operacionalmente. La grfica p ayuda a monitorear y analizar la proporcin de
elementos disconformes que estn en muestras repetidas (subgrupos) que se
seleccionan de un proceso.
Una empresa hotelera quiere conocer la proporcin de habitaciones con ausencia
de comodidad o mal funcionamiento de electrodomsticos. Se recolectaron los
datos de las disconformidades de una muestra de 200 habitaciones (tabla 1)
durante 28 das.
Frmula de lmites de control para la grfica:
p 3 p (1-p)
n
Lmite superior de control (LSC)= p+ 3 p (1-p)
n
Lmite inferior de control (LIC)= p- 3 p (1-p)
n
k
p= pi
i=1
k
En donde:
Pi= xi/ni = proporcin de elementos disconformes en el subgrupo i
n= tamao promedio del subgrupo
k= nmero de subgrupos seleccionados

145

Tabla 1
Da

Habitaciones
estudiadas

Habitaciones no
preparadas

proporcin
=c2/b2

200

16

0.080

200

0.035

200

21

0.105

200

17

0.085

200

25

0.125

200

19

0.095

200

16

0.080

200

15

0.075

200

11

0.055

10

200

12

0.060

11

200

22

0.110

12

200

20

0.100

13

200

17

0.085

14

200

26

0.130

15

200

18

0.090

16

200

13

0.065

17

200

15

0.075

18

200

10

0.050

19

200

14

0.070

20

200

25

0.125

21

200

19

0.095

22

200

12

0.060

23

200

0.030

24

200

12

0.060

25

200

18

0.090

26

200

15

0.075

27

200

20

0.100

28

200

22

0.110

k=28

n=200

2.315
pi=2.315

146

Para los datos de la tabla anterior


k=28
k

Pi= 2.315
p=

n= 200

pi

i=1

k= 28

p=

i=1

pi

=2.315

=0.0827

28

0.0827 (0.0827)(0.9173) = 0.0584


p 3 p (1-p)
n

200

LSC=

0.0827+0.0584= 0.1411

LIC=

0.0827-0.0584=0.0243

147

Grafica p, control para la proporcin


de artculos disconformes
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
1

11 13 15 17 19 21 23 25 27

La figura presenta un proceso en estado de control estadstico, con los puntos


individuales alrededor de p sin ningn patrn y con todos los puntos dentro de los
lmites de control. Por lo tanto cualquier mejora en el proceso analizado deber
provenir de la reduccin de la causa comn de variacin. Tal reduccin requiere
un cambio en el proceso.
Procedimiento para realizar la grfica p en Excel
Una vez que se tiene la base de datos como la tabla 1 se elige el men insertar,
posteriormente dentro de ste se seleccionan grficos de lnea, all se opta por
grficas de lnea con marcadores.

148

Una vez seleccionada la opcin anterior aparece un recuadro en blanco, se coloca


el cursor sobre ste y se da clik en el botn derecho, all parece un men y se
elige seleccionar datos

Aparecer la siguiente ventana, donde se selecciona agregar

Y subsecuentemente la ventana siguiente:

149

En la lnea de nombre de la serie se colocan para ste caso los das y en


valores de las serie los datos de proporcin y finalmente se arregla el formato de
la grfica.

Grafca p para control de la proporcin de artculos


disconformes
0.140
0.120
0.100
0.080
0.060
0.040
0.020
0.000
Das

Como se observa en la grfica la lnea de 0.080 corresponde al valor de p, el


lmite superior de control esta en 0.1411 y el lmite inferior de control est en
0.0243.

150

Grfica de control para el rango y la media


Las variables numricas comunes incluyen tiempo, dinero y peso, las grficas de
control de variables son ms sensibles para detectar la variacin por causas
especiales respecto a la grfica p. Las grficas de control, generalmente se usan
en parejas, una permite monitorear la dispersin o variabilidad, y la otra monitorea
el promedio del proceso.
Primero se debe examinar la grfica de dispersin porque, si indica la presencia
de condiciones fuera de control, la interpretacin del diagrama para la media ser
falseada.
La grfica R
Se utiliza la grfica de rango nicamente cuando el tamao de muestra sea de 10
o menos, si es mayor de 10 es preferible utilizar una grfica de desviacin
estndar. La grfica R permite determinar si la variabilidad en un proceso est
bajo control o si los cambios en la cantidad de variabilidad se estn dando a lo
largo del tiempo.
Si el rango del proceso est bajo control, entonces la cantidad de variacin en el
proceso es consistente a lo largo del tiempo, y los resultados de la grfica R sern
tiles para desarrollar los lmites de control del promedio.
Para desarrollar los lmites de control para el rango, se requiere una estimacin
del rango promedio y de la desviacin estndar del rango. Estos lmites dependen
de dos constantes: factor d2, que representa la relacin entre la desviacin
estndar y el rango para tamaos de muestra que varan, y el factor d3, que
representa la relacin entre la desviacin estndar y el error estndar del rango
para tamaos de muestra que varan.

Lmites de control para el rango


R3R d3
d2

151

Lmite de control superior (LCS)= R+3R d3


d2
Lmite de control inferior (LCI)= R-3R d3
d2

k
Donde: R= Ri
i=1
k

Problema:
Se defini operacionalmente la cantidad de tiempo para entregar el equipaje. Se
registraron datos durante un periodo de 4 semanas. Se seleccionaron subgrupo
(muestras) de cinco entregas del turno de la tarde de cada da (ver tabla 2).
Tabla 2. TIEMPOS DE ENTREGA DE EQUIPAJE EN MINUTOS
DIA
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

A
6.7
7.6
9.5
9.8
11
8.3
9.4
11.2
10
8.6
10.7
10.8
9.5
12.9
7.8
11.1
9.2

B
11.7
11.4
8.9
13.2
9.9
8.4
9.3
9.8
10.7
5.8
8.6
8.3
10.5
8.9
9
9.9
9.7

C
9.7
9
9.9
6.9
11.3
9.7
8.2
10.5
9
8.7
9.1
10.6
7
8.1
12.2
8.8
12.3

D
7.5
8.4
8.7
9.3
11.6
9.8
7.1
9
8.2
9.5
10.9
10.3
8.6
9
9.1
5.5
8.1

E
7.8
9.2
10.7
9.4
8.5
7.1
6.1
9.7
11
11.4
8.6
10
10.1
7.6
11.7
9.5
8.5

MEDIA
8.68
9.12
9.54
9.72
10.46
8.66
8.02
10.04
9.78
8.8
9.58
10
9.14
9.3
9.96
8.96
9.56

RANGO
5
3.8
2
6.3
3.1
2.7
3.3
2.2
2.8
5.6
2.3
2.5
3.5
5.3
4.4
5.6
4.2

152

18
19
20
21
22
23
24
25
26
27
28

9
9.9
10.7
9
10.7
10.2
10
9.6
8.2
7.1
11.1

8.1
10.1
9.8
10
9.8
10.5
11.1
8.8
7.9
11.1
6.6

10.2
8.9
10.2
9.6
9.4
9.5
9.5
11.4
8.4
10.8
12

9.7
9.6
8
10.6
7
12.2
8.8
12.2
9.5
11
11.5

8.4
7.1
10.2
9
8.9
9.1
9.9
9.3
9.2
10.2
9.7
Sumas:

9.08
9.12
9.78
9.64
9.16
10.3
9.86
10.26
8.64
10.04
10.18
265.38

2.1
3
2.7
1.6
3.7
3.1
2.3
3.4
1.6
4
5.4
97.5

k= nmero de subgrupos seleccionados = 28


k
Ri = sumatoria de rangos = 97.5
i=1

k
R= Ri = 97.5 = 3.482
i=1

28

k
n= 5

R3R d3
d2

LCS= R+3R d3
d2

LCI= R-3R d3
d2

Constantes

d2= 2.362

d3= 0.864

153

3.4823 (3.482) [ 0.864 ] = 3.4823.880


2.326
Por lo tanto
LCS= 3.482+3.880= 7.362
LCI= 3.482-3.8800
El LCI no existe porque es imposible obtener un rango negativo.

La grfica
La grfica de control utiliza subgrupos cada uno de tamao n para k periodos
consecutivos de tiempo. Para calcular los lmites de control para el promedio, se
necesita calcular la media de los promedios de los subgrupos (denominada ), y la
desviacin estndar de la media (que se denomina error estndar de la media ).
El estimado de la desviacin estndar de la media es una funcin del factor d2 ,
154

que representa la relacin entre la desviacin estndar y el rango para tamao de


muestras variables.

Lmite de control para la grfica

=X3 R___
d2 n

LCI= X-3 R___


d2n

LCS= X+3 R___


d2n

Donde
k
X=

Xi

Ri

R=

i=1

i=1

A partir de los datos de la Tabla 2 tiempos de entrega de equipaje en minutos


k= nmero de subgrupos seleccionados = 28
k

Xi = sumatoria de las medias de los subgrupos seleccionados

= 265.38

i=1
k

Ri = sumatoria de los rangos de los subgrupos seleccionados= 97.5


i=1

X=

Xi = 265.38 = 9.478
i=1

28

R=

Ri = 97.5 = 3.482
i=1

28

155

Aplicando

LCS= X+3 R___


d2n

=X3 R___
d2 n

LCI= X-3 R___


d2n

= 9.478 3 3.482 =
2.3625
= 9.478 2.008
Por tanto:
LCS= 9.478 + 2.008 = 11.486
LCI= 9.478 - 2.008 = 7.470
Graficando

Grfica X barra para los tiempos de entrega de


equipaje
12
10
8
6
4
2
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28

La grfica no revela ningn punto fuera de los lmites de control as como tampoco
una tendencia. Aunque existe una cantidad considerable de variabilidad entre las
medias de los 28 subgrupos, y como ambas grficas R y X barra estn bajo
control, el proceso de entrega de equipaje se encuentra en estado de control
estadstico. Si se desea reducir la variacin o la media del tiempo de entrega,
entonces se necesita cambiar el proceso.
156

S-ar putea să vă placă și