Documente Academic
Documente Profesional
Documente Cultură
Aplicada
PROBABILIDAD Y ESTADISTICA
Estas técnicas evolucionaron a la par con el desarrollo de las matemáticas, utilizando sus
herramientas en el proceso del análisis e interpretación de la información. Para mediados
del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin mayores
restricciones legales. El febril jugador De Méré consultó al famoso matemático y filosofo
Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el juego de los
dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar con el tímido
Pierre de Fermat (1601-1665, funcionario público apasionado por las matemáticas;
célebre porque no publicaba sus hallazgos) dando origen a la teoría de la probabilidad,
la cual se ha venido desarrollando y constituyéndose en la base primordial de la
estadística.
En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo
de observaciones muéstrales o históricas, crean modelos lógico-matemáticos que se
"aventuran" describir o pronosticar un determinado fenómeno con cierto grado de
certidumbre medible. El presente texto no pretende teorizar el saber estadístico, desde
luego, no es un libro para estadísticos, ya que, adrede se obvia el rigor científico de lo
expuesto en beneficio de la sencillez necesaria para el neófito; con un lenguaje coloquial
se conduce al lector a través del contenido, a partir de dos o tres ejemplos que ilustran la
aplicabilidad de los temas tratados.
1
como que: la estadística es la tecnología del método científico, o que es el conocimiento
relacionado.
2
Contenido
Introducción ..................................................................................................................... 1
Conclusión ..................................................................................................................... 16
Bibliografía..................................................................................................................... 17
3
1.1 Muestreo
1.1.1Tipos De Muestreo
2.- Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar
todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo
se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y
los elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k,
i+3k,...,i+(n-1)k, es decir se toman los individuos de k en k, siendo k el resultado de dividir
el tamaño de la población entre el tamaño de la muestra: k= N/n. El número i que
empleamos como punto de partida será un número al azar entre 1 y k. El riesgo este tipo
de muestreo está en los casos en que se dan periodicidades en la población ya que al
elegir a los miembros de la muestra con una periodicidad constante (k) podemos
4
introducir una homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son
varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con
k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una
representación de los dos sexos.
3.- Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un
tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí
(estratos) que poseen gran homogeneidad respecto a alguna característica (se puede
estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado
civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los
estratos de interés estarán representados adecuadamente en la muestra. Cada estrato
funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio
simple o el estratificado para elegir los elementos concretos que formarán parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige
un conocimiento detallado de la población. (Tamaño geográfico, sexos, edades,...)
4.- Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las
unidades muéstrales son los elementos de la población. En el muestreo por
conglomerados la unidad muestral es un grupo de elementos de la población que forman
una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales.
5
En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo,
las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse
de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar
aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño
muestral establecido) y en investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
3.- Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos
a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes,
sectas, determinados tipos de enfermos, etc.
4.- Muestreo Discrecional · A criterio del investigador los elementos son elegidos sobre
lo que él cree que pueden aportar al estudio.
Cada muestra de tamaño n que podemos extraer de una población proporciona una
media. Si consideramos cada una de estas medias como valores de una variable aleatoria
podemos estudiar su distribución que llamaremos distribución muestral de medias.
7
Si tenemos una población normal N(,) y extraemos de ella muestras de tamaño n, la
distribución muestral de medias sigue también una distribución normal
1.2 Estimación
1.2.1Estimación puntual
Consiste en la estimación del valor del parámetro mediante un sólo valor, obtenido de
una fórmula determinada. Por ejemplo, si se pretende estimar la talla media de un
determinado grupo de individuos, puede extraerse una muestra y ofrecer como
estimación puntual la talla media de los individuos. Lo más importante de un estimador,
8
es que sea un estimador eficiente. Es decir, que sea insesgado (ausencia de sesgos) y
estable en el muestreo o eficiente (varianza mínima).
9
( ). Se puede demostrar que la media de todas las medias muestrales coincide con la
media poblacional:
que:
En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual
caigan un determinado porcentaje de las observaciones, esto es, es sencillo
hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado.
10
Dicho punto es el número tal que:
Así:
11
Si no se conoce y n es grande (habitualmente se toma n ≥ 30):
Aproximaciones para el valor para los niveles de confianza estándar son 1,96
para y 2,576 para .
Dada una variable aleatoria con distribución Binomial B(n, p), el objetivo es la
construcción de un intervalo de confianza para el parámetro p, basada en una
observación de la variable que ha dado como valor x. El mismo caso se aplica si
estudiamos una Binomial B(1, p) y consideramos el número de veces que ocurre el
suceso que define la variable al repetir el experimento n veces en condiciones
de independencia.
Cuando usted realiza una prueba de hipótesis, puede cometer dos tipos de errores: tipo
I y tipo II. Los riesgos de estos dos errores están inversamente relacionados y son
determinados por el nivel de significancia y la potencia de la prueba. Por lo tanto, usted
debe determinar qué error tiene consecuencias más graves para su situación antes de
definir sus riesgos.
12
Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en
probabilidades, siempre existe la posibilidad de sacar una conclusión incorrecta.
Error de Tipo I
Si rechaza la hipótesis nula cuando ésta es verdadera, usted comete un error de tipo I.
La probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que
usted establece para su prueba de hipótesis. Un α de 0.05 indica que usted está dispuesto
a aceptar una probabilidad de 5% de que está equivocado cuando rechaza la hipótesis
nula. Para reducir este riesgo, debe utilizar un valor más bajo para α. Sin embargo, si
utiliza un valor más bajo para alfa, significa que tendrá menos probabilidades de detectar
una diferencia verdadera, si es que realmente existe.
Error de tipo II
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La
probabilidad de cometer un error de tipo II es β, que depende de la potencia de la prueba.
Puede reducir su riesgo de cometer un error de tipo II al asegurarse de que la prueba
tenga suficiente potencia. Para ello, asegúrese de que el tamaño de la muestra sea lo
suficientemente grande como para detectar una diferencia práctica cuando ésta
realmente exista.
La probabilidad de rechazar la hipótesis nula cuando es falsa es igual a 1–β. Este valor
es la potencia de la prueba.
Usted puede seguir seis pasos básicos para configurar y realizar correctamente una
prueba de hipótesis. Por ejemplo, el gerente de una fábrica de tuberías debe asegurarse
de que el diámetro de los tubos sea de 5 cm. El gerente sigue los pasos básicos para
realizar una prueba de hipótesis.
NOTA
Debe determinar los criterios para la prueba y el tamaño de muestra necesario antes de
recolectar los datos.
13
Especificar las hipótesis.
En primer lugar, el gerente formula las hipótesis. La hipótesis nula es: la media de la
población de todos los tubos es igual a 5 cm. Formalmente, esto se escribe como: H0: μ
=5
Como tiene que asegurarse de que los tubos no sean más grandes ni más pequeños de
5 cm, el gerente elige la hipótesis alternativa bilateral, que establece que la media de la
población de todos los tubos no es igual a 5 cm. Formalmente, esto se escribe como H1:
μ≠5
14
Comparar el valor p de la prueba con el nivel de significancia.
El gerente rechaza la hipótesis nula y concluye que el diámetro medio de todos los tubos
no es igual a 5 cm.
Si queremos decidir entre dos hipótesis que afectan a un cierto parámetro de la población,
a partir de la información de la muestra usaremos el contraste de hipótesis, cuando
optemos por una de estas dos hipótesis, hemos de conocer una medida del error
cometido, es decir, cuantas veces de cada cien nos equivocamos. En primer lugar,
veremos cómo se escribirían las hipótesis que queremos contrastar: H0 se llama
hipótesis nula y es lo contrario de lo que sospechamos que va a ocurrir (suele llevar los
signos igual, mayor o igual y menor o igual) H1 se llama hipótesis alternativa y es lo que
sospechamos que va a ser cierto (suele llevar los signos distinto, mayor y menor). Los
contrastes de hipótesis pueden ser de dos tipos:
Las pruebas de proporciones son adecuadas cuando los datos que se están analizando
constan de cuentas o frecuencias de elementos de dos o más clases. El objetivo de estas
pruebas es evaluar las afirmaciones con respecto a una proporción (o Porcentaje)
de población. Las pruebas se basan en la premisa de que una proporción muestral (es
decir, x ocurrencias en n observaciones, o x/n) será igual a la proporción verdadera de la
población si se toman márgenes o tolerancias para la variabilidad muestral. Las pruebas
15
suelen enfocarse en la diferencia entre un número esperado de ocurrencias, suponiendo
que una afirmación es verdadera, y el número observado realmente. La diferencia se
compara con la variabilidad prescrita mediante una distribución de muestreo que tiene
Conclusión
Los conceptos antes mencionados han sido analizados e investigados de tal manera de
hacer más fácil su comprensión y entendimientos ya que la estadística es la ciencia que
trata de entender, organizar y tomar decisiones que estén de acuerdo con los análisis
efectuados. La estadística juega un papel muy importante en nuestras vidas, ya que
actualmente ésta se ha convertido en un método muy efectivo para describir con mucha
precisión los valores de datos económicos, políticos, sociales, psicológicos, biológicos y
físicos, además, sirve como herramienta para relacionar y analizar dichos datos. El
trabajo del experto estadístico ha evolucionado mucho, ya no consiste sólo en reunir y
tabular los datos, sino sobre todo en el proceso de interpretación de esa información,
ahora tiene un papel mucho más importante del que tenia en años pasados.
Es de vital importancia para nuestra vida profesional venidera, que manejemos estos
conceptos con facilidad, así mismo el que los usemos de la manera apropiada, siempre
en pro de buscar soluciones a los problemas que se nos puedan presentar.
16
Bibliografía
17