Documente Academic
Documente Profesional
Documente Cultură
UNIVERSIDAD DE ORIENTE
NCLEO ANZOTEGUI
ESCUELA DE CIENCIAS ADMINISTRATIVAS
COORDINACIN DE ESTUDIOS DE POSTGRADO.
MAESTRA EN CIENCIAS ADMINISTRATIVAS
MENCIN: ADMINISTRACIN DE LA PRODUCCIN
ESTADSTICA BSICA
Facilitador: Autores:
MSc. Hamlet Mata Ana Velsquez C.I.19.940.620
Daniel Rengel. C.I.12.659.167
Milagros G. Montero C.I.15.014.386
Haidee Martnez. C.I.19.142.427
Luis Condales. C.I.14.133.407
Para mediados del siglo XVII en Europa, los juegos de azar eran frecuentes, aunque sin
mayores restricciones legales. El febril jugador De Mr consult al famoso matemtico
y filsofo Blaise Pascal (1623-1662) para que le revelara las leyes que controlan el
juego de los dados, el cual, interesado en el tema, sostuvo una correspondencia epistolar
con el tmido Pierre de Fermat (1601-1665, funcionario pblico apasionado por las
matemticas; clebre porque no publicaba sus hallazgos) dando origen a la teora de la
probabilidad, la cual se ha venido desarrollando y constituyndose en la base primordial
de la estadstica.
En nuestros das, son de uso cotidiano las diferentes tcnicas estadsticas que partiendo
de observaciones muestrales o histricas, crean modelos lgico-matemticos que se
"aventuran" describir o pronosticar un determinado fenmeno con cierto grado de
certidumbre medible.
1. SPSS
Es uno de los programas estadsticos ms conocidos por su capacidad para trabajar con
grandes bases de datos y una sencilla interfaz para la mayora de los anlisis.
Fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre
1969 y 1975 la Universidad de Chicago por medio de su National Opinion Research
Center estuvo a cargo del desarrollo, distribucin y venta del programa. A partir de
1975 corresponde a SPSS Inc.
Editor de datos. Sistema verstil, similar a una hoja de clculo, para definir, introducir,
editar y presentar datos.
Navegar dentro del DVD hasta la carpeta SPSS20 y seleccionar el sistema operativo de
acuerdo a las caractersticas de su computadora (32bits 64bits)
Ya seleccionado su sistema operativo correspondiente, buscar el archivo setup y darle
doble click.
Seleccionar Instalar para dar inicio al proceso de instalacin del SPSS 20.
Esta ventana muestra el avance de la instalacin, debe esperar hasta que finalice para
continuar con el siguiente paso de la instalacin.
Esta ventana muestra el avance de la instalacin, debe esperar hasta que finalice para
continuar con el siguiente paso de la instalacin.
Una vez finalizada la instalacin, aparecer esta ventana para iniciar con el proceso de
licenciamiento del producto. Seleccionar Aceptar
Seleccionar el cono que se indica para accesar al archivo que contiene la licencia
temporal.
Automticamente aparecer el archivo que contiene la licencia temporal. Dar doble clic
sobre el archivo temp.txt y luego Abrir.
Automticamente se agregar la ruta de acceso al archivo temp.txt
Seleccionar Siguiente
Listo, a partir de este momento, tiene 14 das para utilizar el SPSS20 . Por favor
contacte a su representante local para adquirir una licencia del producto.
4. ESTRUCTURA INTERNA DE SPSS
SPSS est formado por cinco bloques, que reciben el nombre de mdulos, cada uno
de ellos especializado en una rama de la estadstica:
Como programa, el SPSS est organizado en base a comandos, que constituyen los
elementos de un lenguaje. Cada procedimiento tiene asociado una serie de comandos y
con la combinacin de los mismos se puede elaborar un fichero de sintaxis para llevar a
cabo anlisis estadsticos ms complejos. Los ficheros de sintaxis se ejecutan
directamente mediante la opcin Ejecutar Proceso dentro del men Utilidades. A esta
opcin se la denomina Proceso por lotes.
Subsecciones
1.1 Ventanas
1.2 Botones
1.3 Men Principal
1.4 Iconos
1.4.1 Iconos de la Ventana Principal
1.4.2 Iconos del Visor
1.4.3 Iconos de la Ventana de Grficos
1.5 Barra de Estado
1.6 Los Comandos
El programa tiene varios tipos de ventanas (las cuales permiten, por un lado, gestionar
la introduccin de datos y decidir los anlisis a realizar y, por otro lado, acceder a
distintos aspectos de la manipulacin de los resultados generados. Todas ellas presentan
sus propias barras de herramientas que pueden ser, como en casi todas las aplicaciones
del entorno Windows, personalizadas a gusto del usuario.
5. SINTAXIS DE COMANDOS
Como ya hemos indicado, es posible acceder a la mayora de los comando desde los
mens y cuadros de dilogo. No obstante, algunas rdenes slo estn disponibles
mediante el uso del lenguaje de comandos. El lenguaje de comandos tambin permite
guardar los trabajos en un archivo de sintaxis, con lo que es posible repetir los anlisis
Introduccin al SPSS.Un archivo de sintaxis es simplemente un archivo de texto que
contiene comandos.Aunque es posible abrir una ventana de sintaxis y escribir
comandos, es ms sencillo permitir que el programa ayude a construir un archivo de
sintaxis mediante uno de los siguientes mtodos:
Se trata de una tpica ventana de una aplicacin en Windows que, de arriba abajo,
consta de los siguientes elementos:
7. INTRODUCCIN DE DATOS
Denominar la variable
Definir el tipo de la misma
Fijar un formato de columnas
Fijar un formato para los datos
En lo referente al nombre de las variables, hay que cumplir una serie de requisitos:
Las etiquetas de los valores pueden tener una extensin mxima de 60 caracteres,
aunque aqu es aconsejable limitar su longitud a un valor cercano a 20.
SPSS permite seleccionar entre tres opciones mutuamente excluyentes: escala, ordinal y
nominal, adaptndose a la propuesta clsica de Stevens en la que el nivel de intervalo se
agrupa en la categora de escala que podemos tambin identificar con las variables
cuantitativas.
Puede que nos interese generar nuevas variables a partir de datos ya almacenados en el
archivo. Para calcular nuevas variables, elegimos en el Men "Transformar" la opcin
"Calcular", accediendo a una pantalla que nos aparece permite llevar a cabo la siguiente
secuencia de operaciones:
1. Dar un nombre a la nueva variable en la ventana "Variable de destino"
2. Especificar su "Tipo y Etiqueta"
3. Generar una "expresin numrica" para la nueva variable que contendr tres
elementos: variables almacenadas - operadores simples y funciones
predeterminadas por el SPSS.
4. Establecer una condicin para el clculo (botn "SI")
1. ESTADSTICA
VARIABLE: Toda caracterstica que puede tomar diferentes valores (Ej. nmero de
hijos, precio de la habitacin) Las variables se suelen denotar por letras maysculas: X,
Y.
Tipos de variables:
Las escalas de medicin son el conjunto de los posibles valores que determinada
variable puede tomar. Por tal razn, los tipos de escala de medicin estn ntimamente
ligados con los tipos de variables a estudiar. Las magnitudes de las observaciones
cuantitativas se conocen como los valores que una variable puede asumir.
Dependiendo de la medicin y de la esencia de las variables, se obtienen diversas
clases de datos que originan diferentes escalas. Resulta imprescindible conocer el tipo
de escala que representan los datos, debido a que, de su esencia dependen las tcnicas
estadsticas que se debern aplicar para su anlisis.
Escala de Medicin Ordinal: Establece una relacin de orden entre los elementos
(personas, animales, objetos, etc.), en atencin a una caracterstica, sin que reflejen
distancia entre ellos. La diferencia entre dos nmeros ordinales no tiene significado
cuantitativo, slo expresan, por ejemplo, que una situacin es mejor que otra, pero no
dice cuanto es uno que el otro.
La escala ordinal sigue siendo una forma de medicin dbil porque no se pueden hacer
planteamientos numricos significativos con respecto a las diferencias entre las
categoras. Es decir, la ordenacin establece slo cul categora es mayor, mejor o
preferida; y no se habla cunto es mayor, mejor o ms preferida.Esta escala
se emplea, cuando un estudio esta basado en ciertas normas que se asignan a un
conjunto de objetos, personas o caractersticas o a un conjunto de categoras
ordenadas. Las categoras de la escala se ordenan d acuerdo con la cantidad de
rasgos o caractersticas que representan cada una de ellas ya que la escala ordinal
distingue los diferentes valores de la variable, ubicando las caractersticas en orden,
desde la ms alta hasta la ms baja.
La diferencia fundamental entre una escala nominal y una ordinal es que en la ordinal
rige no slo la relacin de igualdad, de identidad, sino tambin la relacin de mayor
que.
Ejemplos:
La razn entre dos intervalos es siempre independiente del punto cero y de la unidad
que se emplee en la medicin. En el caso de las escalas de intervalos las unidades de
medicin son iguales.
Ejemplos:
Otro ejemplo de esta escala lo constituyen las escalas utilizadas para medir
temperatura, bien sea en grados Centgrados o Fahrenheit. En estas escalas la
diferencia entre 80 y 85 es igual a la que existe entre 90 y 95 o entre dos puntos
cualesquiera de la escala.
Las estadsticas apropiadas para esta escala son: media, desviacin estndar, rango,
varianza, coeficiente de variacin, asimetra y kurtosis. Tipos de grficos: histograma,
polgono de frecuencias y grfico de tallos y hojas.
Cuando se emplea este tipo de escala, los nmeros indican razones o cocientes entre
ciertas magnitudes de los objetos, y los datos obtenidos con tales escalas pueden ser
sometidos a los tratamientos ms elaborados.
Otros ejemplos de esta escala son: la medicin del peso o altura de un grupo de
personas, el ingreso familiar, la intensidad de corriente elctrica de un cable, la edad de
un grupo de personas, etc.
Generalmente, se supone que los datos que se obtienen para una variable cuantitativa
se miden en escalas de intervalo o de razn. Estas escalas constituyen los niveles ms
elevados de medicin. Son formas ms fuertes de medicin que la escala nominal y
ordinal, porque permiten comprender no slo cul de los valores de un estudio es
mayor o menor, sino por cuntas unidades de medida. Las escalas de razn son
medidas de Longitud, peso, capacidad, etc., los nmeros reflejan razones entre
particularidades y los datos obtenidos segn tales escalas pueden ser sometidas a
cualquier tratamiento estadstico.
a) Recoleccin de datos
Por ejemplo: si se desea realizar un estudio estadstico de las estaturas de los alumnos
de tercer ao,
10. Puntaje obtenido por los alumnos que ingresan a la carrera de Medicina.
6. DISTRIBUCIONES DE FRECUENCIAS
Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero
total de datos. Las frecuencias relativas se designan con las letras h i .
Se calcula,
PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.
Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre nmero
total de datos. Se designa con las letras Hi. Se calcula;
Ejemplo 1:
0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6
Se pide:
a). Construir la tabla de frecuencias absolutas
b). Cul es el nmero de familias que tiene como mximo dos hijos?
c). Cuntas familias tienen ms de 1 hijo pero como mximo 3?
d). Qu porcentaje de familias tiene ms de 3 hijos?
Solucin:
a). Para construir la tabla de frecuencias hay que tener en cuenta que la variable en
estudio es el nmero de hijos (discreta), que toma los valores existentes entre 0
y 6 hijos y las frecuencias son el conjunto de familias, de esta forma tenemos:
Para agrupar los datos en intervalos de clase se deben seguir las siguientes reglas
generales:
Es la semisuma del lmite inferior y superior de una clase, tal como lo indica la
siguiente formula:
Los intervalos de clases pueden ser de tres tipos: Clases de igual tamao, clases de
tamaos desiguales y clases abiertas. En trminos generales, las clases de igual tamao
son los ms utilizados y recomendados para los clculos estadsticos. Se designa por
las letras Ic.
Ejemplo 2
Un nuevo hotel va abrir sus puertas en una cierta ciudad. Antes de decidir el precio de
sus habitaciones, el gerente investiga los precios por habitacin de
40 hoteles de la misma categora de esta ciudad. Los datos obtenidos (en miles de
pesetas) fueron:
3.3 3.3 3.7 3.8 3.9 3.9 3.9 4.0 4.1 4.2
4.2 4.3 4.3 4.3 4.3 4.4 4.4 4.5 4.5 4.5
4.5 4.7 4.7 4.7 4.7 4.8 4.9 5.0 5.0 5.1
5.1 5.3 5.3 5.4 5.6 5.8 5.8 6.0 6.1 6.1
Procedimiento:
1. El menor valor es 3.3 y el mayor 6.1, la diferencia es 2.8 y por tanto R=2.8.
2. K= 1+3,322 log(40) = 6.3 6 nmeros de intervalos
3. Ic = 2.8 / 6 = 0.467 0.5 tamao de los intervalos
9. MTODOS GRFICOS
Para construir el diagrama de sectores partimos del hecho de que un circulo encierra
un total de 360 grados. Luego, mediante una regla de tres simple, repartimos los 360
grados en distintos sectores, de acuerdo con cada porcentaje; tenemos as que para
determinar el sector correspondiente al 50%, resolvemos la ecuacin:
Ejemplo:
1. Forma de la distribucin.
2. Acumulacin o tendencia posicional (valor central de la distribucin).
3. Dispersin o variabilidad.
Despus que los datos han sido reunidos y tabulados, se inicia el anlisis con el fin de
calcular un nmero nico, que represente o resuma todos los datos. Las medidas de
posicin forman parte del conjunto de medidas descriptivas numricas, las cuales se
clasifican en parmetros cuando se calculan a partir de la poblacin total- y los
estadgrafos - cuando se calculan a partir de los datos de una muestra. Una medida de
posicin es un nmero que se toma como orientacin para referirnos a un conjunto de
datos.
Todas ellas a su manera tratan de dar una idea del nmero alrededor del cual se
centra a todo el conjunto de datos.
MEDIA ARITMTICA
La media aritmtica de una serie de n valores de una variable X1, X2, X3;
X4,.........Xn, es el cociente de dividir la sumatoria de todos los valores que toma la
variable Xi, entre el nmero total de ellos. La frmula se puede expresar as:
Desviaciones o desvos. Son diferencias algebraicas entre cada valor de la serie o cada
punto medio y la media aritmtica de dicha serie, o un valor cualquiera tomado
arbitrariamente. Los desvos o desviacin se designan con la letra di.
Dado una serie de valores X1, X2, X3,.......Xn , se llama desvo a la diferencia entre
un valor cualquiera Xi de la serie y un valor indicado k de esa misma serie. Si el valor
indicado k de la serie corresponde precisamente a la media aritmtica de esos valores
dados, se dice entonces que los desvos son con respecto a la media aritmtica. En
smbolo:
Donde:
Adems,
4. La media del producto de una constante por una variable, es igual al producto de la
constante por la media de la variable.
El valor de la media depende de cada una de las medidas que forman la serie
de datos, y se halla afectada excesivamente por los valores extremos de la serie
de datos.
La media se calcula con facilidad y es nica para cada caso y permite
representar mediante un solo valor la posicin de la serie de valores.
La media es una medida de posicin que se calcula con todos los datos de la
serie de valores y es susceptible de operaciones algebraicas.
Ejemplo:
MTODO DIRECTO
Este mtodo se le conoce tambin como mtodo largo; el mismo resulta demasiado
engorroso cuando las magnitudes de los puntos medios o de las frecuencias de clase
son muy grandes, debido a que los clculos son demasiados extensos. Los pasos a
seguir para calcular la media con este mtodo son los siguientes:
1. Se agrupan los datos en clases y se llevan a una columna, se calculan los puntos
medios de cada clase y se colocan en sus respectivas columnas, se determinan las
frecuencias de cada clase y se ubican en sus respectivas columnas.
2. Se multiplican los puntos medios de cada clase por sus respectivas frecuencias,
luego se obtiene la sumatoria de las frecuencias (fi) multiplicadas por el punto medio
b) Puede que a la hora de tomar los datos nos encontremos con valores muy extremos
(asimtricos), en ese caso debemos valorar si son errores, entonces deberemos
eliminarlos para realizar la media. Pero si por el contrario estos valores extremos son
importantes para nuestro estudio, deberemos escoger otros ndices de medicin, como
por ejemplo la mediana que veremos a continuacin.
LA MEDIANA
Luego el nmero que se obtiene indica el lugar o posicin que ocupa la mediana en
la serie de valores, luego la mediana ser el nmero que ocupe el lugar de lo posicin
encontrada.
Sean los siguientes datos, 5, 12, 7, 8, 10, 6, y 9, los aos de servicios de un grupo de
trabajadores. Determine la mediana.
Lo primero que se hace es ordenar los datos en forma creciente o decreciente; Los
datos ordenados quedaran as:
5, 6, 7, 8, 9, 10, 12.
Para ubicar la posicin de la mediana. Esto indica que la mediana ocupa la posicin
4, que en la serie de valores esa posicin corresponde al nmero 8, entonces, Me = 8.
Como se trata de un nmero par de datos (n =8), la mediana est dada por:
Donde,
Ejemplo:
Dada la siguiente distribucin de frecuencia referida a las horas extras laboradas por
un grupo de obreros. Calcule la mediana. Realice los clculos respectivos para
completar el siguiente cuadro.
Solucin:
Luego se busca en la frecuencia acumulada Fi, un valor que sea igual o superior a 66,
este se encuentra en la clase 70 -74, la cual llamaremos clase mediana. Por lo tanto el
lmite inferior de esa clase es 70 = Li. La frecuencia absoluta de esa clase es 50 = fi ,
F(i-1) = 44 y el Ic = 5. Aplicando la formula se tiene:
Luego la mediana de esa distribucin es 72.2. Esto quiere decir que un 50 % de los
obreros trabajaron horas extras por debajo de 72.2 horas y el otro 50 % trabajaron
horas extras por encima de 72.2 horas.
CARACTERSTICAS DE LA MEDIANA
La mediana no es afectada por los valores extremos de una serie de valores, puesto
que la misma no es calculada con todos los valores de la serie.
La mediana no est definida algebraicamente, ya que para su clculo no
intervienen todos los valores de la serie.
LA MODA
La moda es la medida de posicin que indica la magnitud del valor que se presenta
con ms frecuencia en una serie de datos; es pues, el valor de la variable que ms se
repite en un conjunto de datos. De las medidas de posicin la moda es la que se
determina con mayor facilidad, ya que se puede obtener por una simple observacin
de los datos en estudio, puesto que es el dato que se observa con mayor frecuencia. Se
designa con las letras Mo.
Donde,
Ejemplo:
La clase que presenta mayor frecuencia absoluta es 80----89, entonces esta sera la
clase modal, donde Li = 80 1 = 16 12 = 4; 2,=16 2 = 14;Ic=10
CARACTERSTICAS DE LA MODA
12.MEDIDAS POSICINALES
Cuando se estudi la mediana se pudo detectar que esta divide la serie de valores en
dos partes iguales, una generalizacin de esta medida da origen a unas nuevas
medidas de posicin denominadas:
50 % que est por debajo de los valores de Q2 y otro 50 % que est por encima del
valor de Q2. El Q2 es igual a la mediana.
El clculo de los percentiles es similar al clculo de los cuartiles con una variante en la
posicin de ubicacin de estos, que viene expresada por la siguiente formula:
13. MEDIDAS DE DISPERSIN
Son aquellas que vienen expresadas en las mismas unidades originales que indican la
serie de datos. Entre las medidas de dispersin absoluta se encuentran: el rango, el
rango intercuartilico, la desviacin media, la varianza y la desviacin tpica.
RANGO O RECORRIDO.
El rango nos dar una primera idea sobre las dispersin de los datos ya que si su valor
es pequeo nos indicar una gran concentracin de los datos, y si por el contrario su
valor es grande nos puede indicar una gran variabilidad o dispersin de los datos.
RANGOS ESPECIALES
El rango nos da una idea de la dispersin total de las observaciones, por lo tanto,
puede estar afectada por valores extremos dando en consecuencia una idea de alta
dispersin. Por tal motivo, se han definido otros rangos que tratan de subsanar este
problema.
Si los valores de la RI o RSI son pequeos indica una alta concentracin de los datos
de la distribucin en los valores centrales de la serie de datos. Estas medidas se
utilizan para comparar los grados de variacin de los valores centrales en diferentes
distribuciones de frecuencias. Los mismos no son afectados por los valores extremos,
no se adaptan a la manipulacin algebraica, por tal motivo son de poco utilidad.
En esta frmula X& es el punto medio de cada clase y fi es la frecuencia de cada clase.
La Desviacin Media a pesar de que para su clculo se toman todas las observaciones
de la serie, por el motivo de no tomar en cuenta los signos de las desviaciones (di), es
de difcil manejo algebraico. Su utilizacin en estadstica es muy reducida o casi nula,
su importancia es meramente histrica, ya que de esta frmula es la que da origen a la
desviacin tpica o estndar.
VARIANZA
2
DESVIACIN TPICA
Se encuentra la casi totalidad de los datos, es decir, el 99,73% de los datos; adems,
existe una regla general de gran utilidad para la comprobacin de los clculos que
dice: una oscilacin igual a seis veces la , centrada en la media comprende
aproximadamente el 99% de los datos.
Ejemplo:
DISPERSIN RELATIVA
Las medidas de variabilidad, estudiadas hasta ahora, solo permitan medir las
dispersiones absolutas de los trminos de la muestra. Las medidas, tomadas en esas
condiciones, sern de utilidad, solo cuando se trata de analizar una sola muestra;
pero, cuando hay que establecer comparaciones entre distintas muestras, ser
necesario expresar tales medidas en valores relativos, que pueden ser proporciones o
porcentajes.
Una serie de valores ser ms dispersa que otra mientras su CV sea mayor. Ejemplo:
Por ejemplo SPSS puede ser utilizado para evaluar cuestiones educativas.
Actualmente, compite no slo con softwares licenciados como lo son SAS, MATLAB,
Statistica, Stata, sino tambin con software de cdigo abierto y libre, de los cuales el
ms destacado es el Lenguaje R. Recientemente ha sido desarrollado un paquete libre
llamado PSPP, con una interfaz llamada PSPPire que ha sido compilada para diversos
sistemas operativos como Linux, adems de versiones para Windows y OS X. Este
ltimo paquete pretende ser un clon de cdigo abierto que emule todas las
posibilidades del SPSS.
Modelos de Regresin
Modelos Avanzados
o Reduccin de datos: Permite crear variables sintticas a partir de
variables colineales por medio del Anlisis Factorial.
o Clasificacin: Permite realizar agrupaciones de observaciones o de
variables (cluster analysis) mediante tres algoritmos distintos.
o Pruebas no paramtricas: Permite realizar distintas pruebas estadsticas
especializadas en distribuciones no normales.
Tablas: Permite al usuario dar un formato especial a las salidas de los datos para
su uso posterior. Existe una cierta tendencia dentro de los usuarios y de los
desarrolladores del software por dejar de lado el sistema original de TABLES
para hacer uso ms extensivo de las llamadas CUSTOM TABLES.
Tendencias
Categoras: Permite realizar anlisis multivariados de variables normalmente
categoras. Tambin se pueden usar variables mtricas siempre que se realice el
proceso de recodificacin adecuado de las mismas.
Anlisis Conjunto: Permite realizar el anlisis de datos recogidos para este tipo
especfico de pruebas estadsticas.
Son muchos los factores o sucesos que no tienen respuesta, es por esto que se deben
realizar estudios pertinentes que aclaren la situacin que se desea analizar. Dicho
estudio se logra por medio de la experimentacin constante, que muestran cada uno de
los resultados que se van obteniendo con la ayuda de la estadstica. Su tarea
fundamental es el anlisis de los datos que se obtienen a partir de experiencias, con el
objetivo de representar la realidad y conocerla, permite la recoleccin de datos
importantes para el estudio de situaciones que se presentan a diario y permite dar
respuesta a los problemas de una forma til y significativa.
Definiciones:
Funcin:
1.PROBABILIDAD
TIPO DE PROBABILIDAD.
PROBABILIDAD CLSICA
PROBABILIDAD EMPRICA
TEOREMA DE BAYES
- P (A i | B) = P(B/A1) P(A1)
P(B)
Donde:
P(A1): Son las probabilidades a priori,
P (B/A1): es la probabilidad de B en la hiptesis A1.
P(A1/B): son las probabilidades a posteriori.
Ejercicio 1: El parte meteorolgico ha anunciado tres posibilidades para el fin de
semana:
2.DISTRIBUCIN DE PROBABILIDAD
Es el espacio muestral, o conjunto de todos los posibles sucesos aleatorios, sobre el que
se define el espacio de probabilidad en cuestin. es la variable aleatoria en cuestin, es
decir, una funcin definida sobre el espacio muestral a los nmeros reales.
- Distribucin Uniforme
-Distribucin Binomial
- Distribucin de Poisson
Cuando nos planteamos estudiar estas distribuciones de probabilidad, lo hacemos
partiendo de la base que su estudio nos permitir simplificar el tratamiento estadstico
de muchos fenmenos reales. De esta manera, si nosotros nos encontramos con un
fenmeno real tal y como puede ser realizar una inversin o no. Este es un fenmeno
que tiene dos posibles valores, invertir, no invertir
Decimos que una variable aleatoria discreta (X) tiene distribucin uniforme cuando la
probabilidad en todos los puntos de masa probabilstica es la misma; es decir, cuando
todos los posibles valores que puede adoptar la variable (x1, x2,xk) tienen la misma
probabilidad.
Pongamos el socorrido pero til caso del lanzamiento de un dado. Si definimos una
variable aleatoria (X) como el nmero resultante tras su lanzamiento, los valores que
puede tomar esa variable aleatoria son {1, 2, 3, 4, 5, 6}. Pues bien, esa variable aleatoria
tiene distribucin uniforme si, como es el caso, la probabilidad es la misma para cada
uno de los resultados posibles.
Una buena parte de los fenmenos que ocurren en la vida real pueden ser estudiados
como una variable aleatoria discreta con distribucin binomial, por lo que su estudio
puede ser de gran utilidad prctica.
DISTRIBUCIN DE POISSON
Algunos ejemplos de fenmenos que se ajustan a una distribucin de Poisson son los
siguientes:
Puedes usar la tabla de abajo para saber el rea bajo la curva desde la lnea central hasta
cualquier lnea vertical "a valor Z" hasta 3, en incrementos de 0.1
En lugar de una tabla larga, hemos puesto los incrementos de 0.1 hacia abajo, y los de
0.01 de lado.
Por ejemplo, para saber el rea debajo de la curva entre 0 y 0.45, ve a la fila de 0.4, y
sigue de lado hasta 0.45, all pone 0.1736
Como la curva es simtrica, la tabla vale para ir en las dos direcciones, as que 0.45
negativo tambin tiene un rea de 0.1736.
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
4.MANEJO DE TABLAS ESTADSTICAS - DISTRIBUCIN NORMAL.
Para calcular la probabilidad de una variable aleatoria z, que sigue una distribucin
tpica (media=0; desviacin tpica=1) se dispone de una tabla, en la que para cada valor
de z se da la probabilidad del intervalo z - +. Para ahorrar espacio, solamente se
presentan los valores de z desde 0 hasta 3 (por encima de ese valor, la probabilidad es
prcticamente nula). Para calcular otras probabilidades se recurre a la simetra de la
curva normal, y que el rea bajo la curva entre - y + es igual a 1. a) P(z 0,86) El
rea que corresponde a esta probabilidad se obtiene directamente en la tabla. En la
primera columna a la izquierda se localiza el valor 0,8 y en la primera fila el valor 0,06.
En la interseccin de la fila y de la columna se encuentra el valor buscado. En este caso:
P(z 0,86) = 0.1977.
b) P(z < 1,04) Para calcular esta probabilidad, tendremos en cuenta que esta es la
complementaria a la que aparece en la tabla, P(z 1.04). En consecuencia: P(z < 1,04) =
1 - P(z 1.04) = 1 - 0,1515= 0.8485.
4
TEORA DE MUESTREO
1. MUESTREO
2. EL MUESTREO PROBABILSTICA
3. EL MUESTREO NO PROBABILSTICA
Es una tcnica de muestreo donde las muestras se recogen en un proceso que no brinda
a todos los individuos de la poblacin iguales oportunidades de ser seleccionados. En
cualquier tipo de investigacin es difcil lograr un muestreo aleatorio autntico.
La mayora de los investigadores tienen limitaciones temporales, monetarias y de mano
de obra y, gracias a ellas, es casi imposible tomar una muestra aleatoria de toda la
poblacin. Generalmente, es necesario emplear otra tcnica de muestreo, la tcnica de
muestreo no probabilstico.
Este tipo de muestreo puede ser utilizado cuando se quiere mostrar que existe un rasgo
determinado en la poblacin. Tambin se puede utilizar cuando el investigador tiene
como objetivo hacer un estudio cualitativo, piloto o exploratorio. Se puede utilizar
cuando es imposible la aleatorizacin, como cuando la poblacin es casi ilimitada. Se
puede utilizar cuando la investigacin no tiene como objetivo generar resultados que se
utilicen para hacer generalizaciones respecto de toda la poblacin.
Esta tcnica tambin se puede utilizar en un estudio inicial que ser llevado a cabo
nuevamente utilizando un muestreo probabilstico aleatorio.
MUESTREO PROBABILSTICA
Cuantitativo
Todos los casos tienen la misma probabilidad de ser
seleccionados
Es ciego a la hora de seleccionar los casos
No requiere un conocimiento de la poblacin a estudiar
Persigue la inferencia estadstica
Requiere una muestra con mayor nmero de casos
MUESTREO NO PROBABILSTICA
Cualitativo
Todos los casos no tienen la misma probabilidad de ser
seleccionados
El investigador elige los casos que ms le interesan (ms ricos
en informacin)
Requiere un conocimiento ms levado de la poblacin
Persigue la inferencia lgica
Requiere una muestra con menos casos
5. MUESTREO ESTADSTICO
Algunas de las ventajas que se presentan, si se piensa en realizar una muestra, son
mencionadas a continuacin:
COSTO REDUCIDO
Si los datos obtenidos provienen de una pequea fraccin de la poblacin, los gastos
asociados a su recopilacin sern mucho menores que si se intenta realizar un censo.
Cuando se trata con poblaciones grandes, resultados precisos pueden obtenerse de
muestras que solamente representan una pequea fraccin de la poblacin.
MAYOR RAPIDEZ
Dado que se reduce el volumen de trabajo en gran medida, se puede utilizar personal
ms capacitado y someterlo a entrenamiento intensivo, con el fin de tener una
supervisin cuidadosa del trabajo decampo y procesamiento de los resultados.
En el diseo de una muestra hay que considerar dos aspectos; inicialmente un proceso
de seleccin, en la que se incluyen en la muestra algunos elementos de la poblacin; y
posteriormente un proceso de estimacin, en el que se llevan a cabos los clculos de las
estadsticas de la muestra, que son estimadores mustrales de valores de la poblacin.
Una de las desventajas al utilizar el muestreo, es que dentro de los valores mustrales
que se pueden obtener, es posible llegar a toparse con algunas deficiencias resultado de
una designacin de solo una fraccin de la poblacin total a ser observada en la muestra,
sin embargo, al realizar un buen diseo de muestra, se tiene como consecuencia que
estos errores tengan la menor presencia posible.
Es un procedimiento por el que se infieren los valores verdaderos de una poblacin, a travs de
la experiencia obtenida con una muestra de esta. El uso de muestras para estimar valores de una
poblacin ofrece diversas ventajas. En trminos generales se puede afirmar que el muestreo
permite una reduccin considerable de los costos materiales del estudio, una mayor rapidez en
la obtencin de la informacin y el logro de resultados con mxima calidad.
Hoy las tcnicas de muestreo asistidas por computadoras, son herramientas bsicas,
pues la rpida toma de decisiones que hay que ejecutar en la dinmica de los procesos
econmicos, demanda el uso de nuevas tecnologas que le impriman una rapidez,
confiabilidad, disponibilidad y capacidad, entre otras facilidades, que se han ido
buscando a travs de los recursos informticos. El muestreo es por lo tanto una
herramienta de la investigacin cientfica, cuya funcin bsica es determinar que parte
de una poblacin debe examinarse, con el fin de hacer deducciones sobre dicha
poblacin.
8. RAZON DE LA UTILIZACION DE LOS METODOS DE MUESTREO
La teora del muestreo tiene por objetivo, el estudio de las relaciones existentes entre la
distribucin de una representacin en dicha poblacin y las distribuciones de dicho
representacin en todas sus muestras.
Hay veces en que no es posible o favorable efectuar un censo (analizar a todos los
elementos de una poblacin), se toma una muestra, deduciendo que dicha muestra es
una parte representativa de la poblacin.
TIPOS DE MUESTREO
Cada elemento del universo tiene una probabilidad conocida y no nula de figurar en la
muestra, es decir, todos los elementos del universo pueden formar parte de la muestra.
Los mtodos de muestreo probabilstico son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los elementos del universo tienen
la misma probabilidad de ser elegidos para formar parte de la muestra.
Para explicarlo en un lenguaje sencillo, consiste en rifar sortear entre todos los
elementos del universo los que pertenecern a la muestra.
Por ejemplo, para obtener una muestra de alumnos del Instituto Tecnolgico de Nuevo
Casas Grandes a los que se les aplicar una encuesta. Lo primero que se hace es
enumerar a todo el alumnado de la institucin. Se obtiene una lista de los alumnos
matriculados y se le asigna un nmero a cada uno de ellos en orden alfabtico y
ascendente. Suponiendo que el total de alumnos es de 700 se utilizan los nmeros 000,
001, 002, 003,...,699. Se determina el tamao de muestra, suponiendo que en este caso
es de tamao 75. Enseguida se utiliza la tabla de nmeros aleatorios formando nmeros
de tres dgitos aceptando como unidad de anlisis muestral a todos aquellos que estn
comprendidos entre el 000 y el 699.
9.1.2 MUESTREO ALEATORIO SISTEMTICO.
Se elige un nmero al azar que sea como mximo el coeficiente de elevacin, es decir
un nmero entre 1 y K. A este nmero lo llamaremos a.
Obviamente para utilizar este mtodo necesitamos disponer de la lista de todos los
elementos del universo y por supuesto debe ser un universo no muy grande.
Ejemplo:
Vamos a realizar un estudio sobre el nivel de satisfaccin de las y los clientes de una
empresa.
Si el personal de la empresa, por ejemplo de una tienda, atiende en orden a las y los
clientes, es decir, que el personal se turna para atender a cada cliente, nos puede
provocar conflictos si utilizamos el muestreo aleatorio sistemtico.
Imaginen que el coeficiente de elevacin es siete, y en la tienda hay siete vendedores y
vendedoras, la muestra correspondera solamente a los y las clientes atendidos por el
vendedor nmero siete. Esto producira que el estudio sera sobre la calidad de atencin
de un determinado vendedor o vendedora y no sobre la totalidad.
Para utilizar este tipo de muestreo y evitar estos riesgos se puede desordenar el listado
de los elementos del universo antes de realizar la seleccin.
Ventajas y Desventajas
El muestreo sistematizado se utiliza con frecuencia porque, si se sigue de modo
correcto, es una forma relativamente fcil de tomar una muestra, a la vez que sea segura
la aleatoriedad. La disponibilidad de listas y el corto tiempo hacen de este un mtodo
atractivo y econmico. La mayor debilidad del muestreo aleatorio sistematizado es el
potencial de que haya patrones ocultos en los datos que no sean detectados por el
investigador. No obstante la pequea perdida potencial en la representatividad
contrarresta con los ahorros econmicos significativamente mayores en tiempo,
esfuerzo y costo. Otra dificultad es que el investigador tiene que conocer exactamente
cuntas unidades es mustrales integran la poblacin meta definida.
Las Tablas de Nmeros Aleatorios contienen los dgitos 0, 1, 2,..., 7, 8, 9. Tales dgitos
se pueden leer individualmente o en grupos y en cualquier orden, en columnas hacia
abajo, columnas hacia arriba, en fila, diagonalmente, etc., y es posible considerarlos
como aleatorios. Las tablas se caracterizan por dos cosas que las hacen particularmente
tiles para el muestreo al azar. Una caracterstica es que los dgitos estn ordenados de
tal manera que la probabilidad de que aparezca cualquiera en un punto dado de una
secuencia es igual a la probabilidad de que ocurra cualquier otro. La otra es que las
combinaciones de dgitos tienen la misma probabilidad de ocurrir que las otras
combinaciones de un nmero igual de dgitos. Estas dos condiciones satisfacen los
requisitos necesarios para el muestreo aleatorio, establecidos anteriormente. La primera
condicin significa que en una secuencia de nmeros, la probabilidad de que aparezca
cualquier dgito en cualquier punto de la secuencia es 1/10. La segunda condicin
significa que todas las combinaciones de dos dgitos son igualmente probables, del
mismo modo que todas las combinaciones de tres dgitos, y as sucesivamente.
Existen mtodos ms eficaces para generar nmeros aleatorios, en muchos de los cuales
se utilizan calculadoras u otra clase de aparatos electrnicos. Las tablas elaboradas
mediante estos mtodos son verificadas completamente para asegurarse de que en
realidad sean aleatorias. Sin embargo, el inters no radica en elaborar estas tablas, sino
utilizarlas. Para utilizar una Tabla de Nmeros Aleatorios:1- Hacer una lista de los
elementos de la poblacin.2- Numerar consecutivamente los elementos de la lista,
empezando con el cero (0,00, 000, etc.).3- Tomar los nmeros de una Tabla de Nmeros
Aleatorios, de manera que la cantidad de dgitos de cada uno sea igual a la del ltimo
elemento numerado de su lista. De ese modo, si el ltimo nmero fue 18, 56 72, se
deber tomar un dgito de dos nmeros.
Omitir cualquier dgito que no corresponda con los nmeros de la lista o que repita
cifras seleccionadas anteriormente de la tabla. Continuar hasta obtener el nmero de
observaciones deseado. Utilizar dichos nmeros aleatorios para identificar los elementos
de la lista que se habrn de incluir en la muestra.
1+ { t . N } = 1+ { t . 600}
10K 100.000
El proceso se repite tomando los siguientes nmeros de la tabla de nmeros aleatorios,
hasta obtener la muestra de 10 individuos
.U = t
10k
Las cantidades pueden ser consideradas como observaciones de una v. a. U, que sigue
una distribucin uniforme en el intervalo [0,1]
UU (0,1)
Se basa en dividir los elementos del universo en grupos, donde cada elemento del
universo pertenece a un solo grupo, y el conjunto de los grupos forman la totalidad del
universo. A cada grupo lo llamamos estrato.
Ventajas:
permite tratar de forma independiente los elementos de cada uno de los estratos.
puede realizar diferentes mtodos de muestreo y/o estimacin en determinados
estratos, lo que permite reducir la varianza (desviacin estndar) y por tanto
disminuir el tamao de la muestra.
permite aumentar la precisin de los resultados.
facilita la coordinacin y realizacin de los trabajos de campo.
Proceso de estratificacin:
1. Definir las caractersticas (variables) que utilizaremos para definir los estratos.
Las caractersticas han de estar relacionadas con la variable a estudiar.
2. Determinar el nmero de estratos.
El nmero de estratos no puede ser muy grande porque estratos con pocos elementos
dificultan y encarecen el proceso, pero tampoco puede ser muy pequeo porque nos
aportara muy pocas ventajas.
3. Determinar el tamao de la muestra.
4. Seleccionar la muestra en cada estrato.
Se puede utilizar el muestreo aleatorio simple o el sistemtico en cada estrato.
EJEMPLO
Supongamos que estamos interesados en estudiar el grado de aceptacin que la
implantacin de la reforma educativa ha tenido entre los padres de una determinada
provincia. A tal efecto seleccionamos una muestra de 600 sujetos. Conocemos por los
datos del ministerio que de los 10000 nios escolarizados en las edades que nos
interesan, 6000 acuden a colegios pblicos, 3000 a colegios privados concertados y
1000 a colegios privados no concertados. Como estamos interesados en que en nuestra
muestra estn representados todos los tipos de colegio, realizamos un muestreo
estratificado empleando como variable de estratificacin el tipo de centro.
Si empleamos una afijacin simple elegiramos 200 nios de cada tipo de centro, pero
en este caso parece ms razonable utilizar una afijacin proporcional pues hay bastante
diferencia en el tamao delos estratos. Por consiguiente, calculamos que proporcin
supone cada uno de los estratos respecto de la poblacin para poder reflejarlo en la
muestra.
En este tipo de muestreos la unidad muestral no son los elementos del universo, sino un
conjunto de elementos que bajo determinados aspectos se puede considerar que forman
una unidad. Por ejemplo las diferentes carreras en la universidad o las juntas receptoras
de votos en un proceso electoral forman conglomerados naturales.
Definidas las unidades mustrales, los conglomerados, se realiza la seleccin de la
muestra. La muestra ser un nmero determinado de conglomerados. Se entrevista a
todos y cada uno de los elementos del conglomerado si son pocos. Si el nmero de
elementos de cada conglomerado es muy grande se realiza un sub-muestreo en cada uno
de los conglomerados, pudiendo utilizar cualquiera de los mtodos de muestreo
anteriormente mencionados.
Las diferencias entre los conglomerados y los estratos son:
Los elementos de los estratos son homogneos (similares) entre si, mientras
que los elementos de los conglomerados son heterogneos (diferentes) entre
s.
Los estratos son heterogneos (diferentes) entre s, mientras que los
conglomerados son homogneos (similares) entre s.
9.2 MUESTREO NO PROBABILSTICO
Teniendo claro que no sirven para realizar generalizaciones, en ocasiones son tiles para
estudios exploratorios o cuando los estudios probabilsticos resultan excesivamente
costosos.
Tipos de muestreo NO probabilstico:
Muestreo causal o accidental
Muestreo opintico o intencional
Muestreo por cuotas
Muestreo por bola de nieve.
9.2.1 MUESTREO CAUSAL O ACCIDENTAL
Ejemplos cercanos:
Cuando un profesor o profesora pregunta a un par de estudiantes, los que tiene
ms cerca por ejemplo.
Cuando un programa de televisin o radio realiza un sondeo mediante las
llamadas telefnicas al programa.
Cuando un programa de televisin saca un equipo a la calle y le pregunta a unas
cuantas personas.
Se localiza a algunos elementos del universo, los cuales conducen a otros, y estos a
otros, y as hasta conseguir una muestra suficiente, llegando incluso a completar el
censo del universo.
Aunque pueda parecer que no tiene utilidad, se utiliza frecuentemente cuando con
conocemos la poblacin, por ejemplo con poblaciones como delincuentes, sectas,
determinados tipos de enfermedades,
Ejemplo:
Al realizar un estudio sobre el nivel de satisfaccin de las y los clientes de una empresa,
podemos pretender determinar el nivel de satisfaccin de cada uno de los
departamentos, por ejemplo a nivel general y tambin la satisfaccin con vendedores,
con caja, con servicio tcnico,
Ejemplo:
Realizar un estudio a nivel nacional pero en el que pretendemos dar resultados de cada
una de las regiones del pas, requiere que cada regin se trabaje como un universo
diferente.
Como la precisin del estimador, de la variable que queremos estimar, est ntimamente
relacionada con el tamao de la muestra y no con la fraccin del muestreo, esto hace
que en ciertos casos pueda necesitarse una muestra prcticamente del mismo tamao
para obtener datos de una regin o departamento y la totalidad del pas.
Hemos de tener en cuenta estas tcnicas en el ejemplo del estudio del nivel de
satisfaccin en el caso que las y los clientes no reciban los servicios de todas y cada una
de las reas que queremos analizar. Por ejemplo si el servicio tcnico atiende a una
minora de las y los clientes, ser necesario realizar una afijacin no proporcional entre
las y los clientes de esta rea o incrementar la muestra hasta que tengamos suficientes
clientes de esta rea.
12. ERRORES EN EL MUESTREO
El error muestral deseado, generalmente puede ser controlado tomando una muestra
aleatoria de la poblacin, suficientemente grande, sin embargo, el costo de esto puede
ser limitante. Si las observaciones son tomadas de una muestra aleatoria, la teora
estadstica brinda clculos probabilsticos del tamao deseado del error muestral para
una estadstica en particular o estimacin. Estos usualmente son expresados en trminos
del error estndar.
El error muestral puede ser contrastado con el error no muestral, el cual se refiere al
conjunto de las desviaciones del valor real que no van en funcin de la muestra
escogida, entre los cuales se encuentran varios errores sistemticos y algunos errores
aleatorios. Resultan mucho ms difciles de cuantificar que el error muestral.
Cualquier medida conlleva algn error. Si se usa la media para medir, estimar, la media
poblacional , entonces la media muestral, como medida, conlleva algn error. Por
ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamao 25 de una
poblacin con media = 15: si la media de la muestra es x=12, entonces a la
diferencia observada x- = -3 se le denomina el error muestral. Una media muestral x
puede pensarse como la suma de dos cantidades, la media poblacional y el error
muestral; si denota el error muestral, entonces:
Los errores que surgen al tomar las muestras no pueden clasificarse como errores
muestrales y se denominan errores no muestrales.
Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.
Ejemplo:
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos. 20C5 da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos
las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de
5 si seleccionamos un trozo de papel con cinco nombres. Un procedimiento ms simple
para elegir una muestra aleatoria sera escribir cada uno de los 20 nombres en pedazos
separados de papel, colocarlos en un recipiente, revolverlos y despus extraer cinco
papeles al mismo tiempo.
Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para las
encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales, sera
muy costoso o tardado.
Dados dos estudios exactamente iguales, dos mtodos de muestreo iguales y la misma
poblacin, el estudio con un tamao de muestra ms grande tendr menos error del
proceso de muestreo que el estudio con un tamao menor de la muestra. Debes recordar
que a medida que aumenta el tamao de la muestra, se acerca al tamao de toda la
poblacin y, por lo tanto, se aproxima a todas las caractersticas de la poblacin,
disminuyendo el error del proceso de muestreo.
La pregunta importante que debe ser contestada en todas las encuestas de muestra es:
"Cuntos participantes deben ser elegidos para una encuesta?" Sin embargo, la
respuesta no puede ser dada sin tener en cuenta los objetivos y circunstancias de las
investigaciones.
La eleccin del tamao de la muestra depende de consideraciones no estadsticas y
estadsticas. Las consideraciones no estadsticas pueden incluir la disponibilidad de los
recursos, la mano de obra, el presupuesto, la tica y el marco de muestreo. Las
consideraciones estadsticas incluirn la precisin deseada de la estimacin de la
prevalencia y la prevalencia esperada de los problemas oculares en nios en edad
escolar.
Para determinar el tamao adecuado de las muestras es necesario seguir los tres
criterios:
1. Nivel de precisin
El nivel de precisin, tambin llamado error de muestreo, es el rango en donde se estima
que est el valor real de la poblacin. Este rango se expresa en puntos porcentuales. Por
lo tanto, si un investigador descubre que el 70% de los agricultores de la muestra han
adoptado una tecnologa recomendada con una tasa de precisin de ~+mn~ 5%, el
investigador puede concluir que entre el 65% y el 75% de los agricultores de la
poblacin han adoptado la nueva tecnologa.
2. Nivel de confianza
El intervalo de confianza es la medida estadstica del nmero de veces de cada 100 que
se espera que los resultados se encuentren dentro de un rango especfico.
Por ejemplo, un intervalo de confianza de 90% significa que los resultados de una
accin probablemente cubrirn las expectativas el 90% de las veces.
La idea bsica descripta en el Teorema del lmite central es que cuando una poblacin
se muestrea muchas veces, el valor promedio de un atributo obtenido es igual al valor
real de la poblacin. En otras palabras, si un intervalo de confianza es del 95%, significa
que 95 de 100 muestras tendrn el valor real de la poblacin dentro del rango de
precisin.
3. Grado de variabilidad
Dependiendo de la poblacin objetivo y los atributos a considerar, el grado de
variabilidad vara considerablemente. Cuanto ms heterognea sea una poblacin,
mayor deber ser el tamao de la muestra para obtener un nivel ptimo de precisin.
Ten en cuenta que una proporcin de 55% indica un nivel ms alto de variabilidad que
un 10% o un 80%. Esto se debe a que 10% y 80% significa que una gran mayora no
posee o posee el atributo en cuestin.
Donde:
n = tamao de la muestra.
N = tamao de la poblacin.
Desviacin estndar de la poblacin que, generalmente cuando no se tiene su valor,
suele utilizarse un valor constante de 0,5.
Z = Valor obtenido mediante niveles de confianza. Es un valor constante que, si no se
tiene su valor, se lo toma en relacin al 95% de confianza equivale a 1,96 (como ms
usual) o en relacin al 99% de confianza equivale 2,58, valor que queda a criterio del
investigador.
e = Lmite aceptable de error muestral que, generalmente cuando no se tiene su valor,
suele utilizarse un valor que vara entre el 1% (0,01) y 9% (0,09), valor que queda a
criterio del encuestador.
La frmula del tamao de la muestra se obtiene de la frmula para calcular la
estimacin del intervalo de confianza para la media, la cual es:
De donde el error es:
De esta frmula del error de la estimacin del intervalo de confianza para la media se
despeja la n, para lo cual se sigue el siguiente proceso:
Elevando al cuadrado a ambos miembros de la frmula se obtiene:
Multiplicando fracciones:
Eliminando denominadores:
Eliminando parntesis:
Transponiendo n a la izquierda:
Factor comn de n:
Despejando n:
EJEMPLOS ILUSTRATIVOS
Solucin:
Se tiene N=500, para el 95% de confianza Z = 1,96, y como no se tiene los dems
valores se tomar y e = 0,05.
Solucin:
Se tiene N=500, para el 99% de confianza Z = 2,58, y como no se tiene los dems
valores se tomar y e = 0,05.
Reemplazando valores en la frmula se obtiene:
En donde
Z = nivel de confianza,
P = probabilidad de xito, o proporcin esperada
Q = probabilidad de fracaso
D = precisin (error mximo admisible en trminos de proporcin)
Certeza 95% 94% 93% 92% 91% 90% 80% 62.27% 50%
Para ver como se distribuye algunas de las caractersticas de la muestra con respecto a la
variable que se est midiendo, podemos recurrir a la famosa campana de Gauss o
Student que refleja la curva normal de distribucin cuya caracterstica principal es la de
ser unimodal donde la media, mediana y la moda siempre coinciden.
Esta curva esta detallada en todos los libros de estadstica y recurriremos a ella cuando
deseemos obtener otros valores de certeza como por ejemplo el 99% de estimacin y
que da por resultado z=3.00 o z=1.65 para el 90%.
En donde: N = Universo
q = Probabilidad en contra.
Supngase que se desea determinar la calidad y el nivel de servicio que ofrece una
Unidad de informacin Archivstica; por lo que resulta necesario entrevistar a los
distintos usuarios que acuden a los archivo para as conocer su opinin. Cmo
calcularamos el tamao de la muestra?
Valores a estimar
n=?
e = 5% =0.05 o 10% = 0.1
N= 43,700 (universo)
p = 0.50
q = 0.50
7. Mediante una tabla de nmeros aleatorios se elegirn a los usuarios a los que se les
aplicara la encuesta.
Resultados: P = 0.5
Valor para P (-1.9550000000000414< Z < 1.9550000000000414) = 0.95
Tabla para la determinacin de una muestra sacada de una poblacin finita para
mrgenes de error del 1%, 3%, 4%, 5% y 10% en la hiptesis de P=0.5 y nivel de
confianza 0.95
N 1% 2% 3% 4% 5% 10%
100 98.9745249 96.02052544 91.47047033 85.77977275 79.4265408 49.1135019
7329496 640351 27214 915327 0143045 4840137
150 147.696840 141.1930401 131.5392028 120.0478994 107.925649 58.6078802
88493875 374244 0835462 8959662 82280896 7019096
200 195.919648 184.6199363 168.4295763 150.0120201 131.521285 64.8789151
86425546 5919077 3981064 1529656 6104389 2707041
250 243.650591 226.4004809 202.5053381 176.4350836 151.378717 69.3298880
2727507 9421358 160043 699387 60647587 2443973
300 290.897155 266.6265543 234.0767695 199.9097744 168.321093 72.6527489
3610507 521874 7389586 3609302 94783802 3431207
350 337.666677 305.3833246 263.4101616 220.9034988 182.946413 75.2281447
1842368 774017 150704 1309047 61319566 1355451
400 383.966345 342.7498500 290.7353437 239.7898245 195.699578 77.2827857
3991781 703429 578777 270112 53437913 6131878
450 429.803204 378.7996167 316.2517180 256.8709045 206.918440 78.9601173
9479907 7596515 985343 0854566 45224107 444645
500 475.184160 413.6010215 340.1331333 272.3937639 216.864171 80.3553313
63158645 510508 959296 1982705 40215167 8999169
550 520.115980 447.2178047 362.5318513 286.5623242 225.741849 81.5340823
5771206 7297625 217004 736703 91986732 6940564
600 564.605299 479.7094400 383.5817962 299.5464119 233.714753 82.5431191
6029928 6024973 088736 520024 07085532 5708388
650 608.658622 511.1314854 403.4012348 311.4885980 240.914490 83.4166330
4849187 1537464 936684 7225824 60684647 1941661
700 652.282327 541.5359002 422.0949999 322.5094552 247.448327 84.1802087
1264457 515017 4084416 8517275 20975703 8153922
750 695.482667 570.9713321 439.7563445 332.7116430 253.404562 84.8533724
6371598 083432 157457 903234 8435298 6657377
800 738.265777 599.4833763 456.4684981 342.1831153 258.856546 85.4512845
3217059 853077 917474 3889056 6124638 485999
850 780.637671 627.1148120 472.3059784 350.9996623 263.865712 85.9858954
5826177 086742 7618617 6748793 5858739 0926203
900 822.604250 653.9058155 487.3357016 359.2269434 268.483904 86.4667522
7398469 947552 6149906 1101356 76916035 580897
950 864.171302 679.8941563 501.6179279 366.9221246 272.755178 86.9015743
769765 63968 332276 763185 11903967 013925
1000 905.344505 705.1153737 515.2070688 374.1352095 276.717208 87.2966702
9663079 944991 859263 4421296 37459503 6594012
1500 1296.59061 921.6472347 621.9107385 427.3403214 304.753874 89.8848460
9964387 146847 480862 535419 1842089 8320645
2000 1653.97452 1088.830092 693.7516024 460.0519089 321.016377 91.2373507
1948461 195294 29586 7123924 2295833 3245491
2500 1981.71000 1221.808597 745.4162660 482.1983914 331.634534 92.0685687
44072452 3588657 389466 20928 53897625 1409462
3000 2283.33955 1330.105534 784.3577539 498.1865580 339.112342 92.6311796
6418513 2399325 988307 4482404 428483 8865404
3500 2561.86292 1420.008916 814.7607032 510.2715460 344.663477 93.0372729
58133533 7951908 952571 722558 36302106 1363818
4000 2819.83722 1495.837991 839.1559643 519.7271858 348.947577 93.3441871
5923997 0816236 602843 06882 7483599 9026479
4500 3059.45567 1560.657823 859.1641200 527.3273929 352.354004 93.5843018
3404084 995034 544292 290222 9813682 3801005
5000 3282.61009 1616.703714 875.8709668 533.5694965 355.127408 93.7772848
5978404 1220003 548792 535495 79014956 2186193
5500 3490.94098 1665.644183 890.0312997 538.7876651 357.429241 93.9357729
35385504 932048 16249 982584 72396425 916014
6000 3685.87788 1708.749909 902.1861110 543.2147457 359.370353 94.0682562
5600687 1869813 592345 25093 7852138 6295027
6500 3868.67225 1747.005627 912.7332863 547.0179591 361.029376 94.1806497
9747404 468994 676316 275241 76955423 2395686
7000 4040.42436 1781.186284 921.9719884 550.3204988 362.463636 94.2772009
7130497 6757558 86659 108461 5145255 6084701
7500 4202.10543 1811.910078 930.1314879 553.2151257 363.715911 94.3610389
6754517 2691312 005355 463578 37267626 7194441
8000 4354.57604 1839.676181 937.3904472 555.7730190 364.818771 94.4345196
1870733 5658142 702512 287069 5307109 4327319
8500 4498.60142 1864.892073 943.8901547 558.0497074 365.797452 94.4994506
2810053 5286924 645256 454029 54092904 3300314
9000 4634.86433 1887.893668 949.7438113 560.0891466 366.671809 94.5572420
2272339 781115 33632 951832 9305647 73743
9500 4763.97585 1908.960367 955.0431797 561.9265850 367.457680 94.6090101
816683 6048894 214479 945719 37849103 5361914
10000 4886.48458 1928.326461 959.8634300 563.5906179 368.167849 94.6556499
6003653 2136875 578553 43896 5338237 1408816
10500 5002.88439 1946.189882 964.2667280 565.1046864 368.812753 94.6978874
0631685 1193738 177361 686695 00226815 3399788
11000 5113.62109 1962.718993 968.3049304 566.4881889 369.400992 94.7363179
0721232 6708282 5295 764006 55769945 0292036
11500 5219.09815 1978.057912 972.0216371 567.7573164 369.939722 94.7714338
5047394 9337777 977066 332364 01047654 4330567
12000 5319.68161 1992.330723 975.4537715 568.9256890 370.434939 94.8036463
45449475 694355 800091 336314 57878377 3225452
12500 5415.70430 2005.644840 978.6328112 570.0048469 370.891712 94.8333011
61795475 5098438 797958 483098 16741573 683019
13000 5507.46955 2018.093716 981.5857565 571.0046327 371.314349 94.8606913
2325796 9038218 69904 886745 36435664 3434289
13500 5595.25436 2029.759042 984.3358990 571.9334926 371.706539 94.8860667
1351852 187605 660637 738254 8332897 1028185
14000 5679.31222 2040.712536 986.9034373 572.7987154 372.071459 94.9096417
0556575 1241067 462915 183485 25385714 1836133
14500 5759.87554 2051.017424 989.3059738 573.6066241 372.411856 94.9316013
0774185 781513 827393 873636 5015312 969466
15000 5837.15780 2060.729661 991.5589191 574.3627312 372.730123 94.9521062
22986505 75039 508116 858315 0186804 6716221
15500 5911.35544 2069.898944 993.6758225 575.0718640 373.028349 94.9712962
3852824 547545 330902 983094 081264 6331005
16000 5982.64952 2078.569565 995.6686450 575.7382682 373.308369 94.9892939
97960555 1916058 361179 63285 7610264 3066318
16500 6051.20722 2086.781125 997.5479854 576.3656927 373.571802 95.0062070
536089 67915 172657 42719 71963796 4515558
17000 6117.18310 2094.569142 999.3232687 576.9574603 373.820079 95.0221307
5221824 750378 503978 879581 47955657 7333046
17500 6180.72031 2101.965561 1001.002904 577.5165268 374.054471 95.0371494
6958112 4279973 5132785 071793 448454 6400171
18000 6241.95161 2108.999192 1002.594419 578.0455297 374.276111 95.0513381
7842369 99036 7932662 361402 6961898 4286543
18500 6301.00030 2115.696090 1004.104572 578.5468306 374.486013 95.0647637
0758755 0408253 0633886 528146 27168075 6597426
19000 6357.98102 2122.079868 1005.539445 579.0225500 374.685084 95.0774862
2840624 9672247 0931726 212033 6845184 7627502
19500 6413.00054 2128.171988 1006.904530 579.4745972 374.874143 95.0895594
85465335 2041066 8651594 738775 05046724 983862
20000 6466.15841 2133.991989 1008.204799 579.9046964 375.053925 95.1010318
7307451 2073553 8227748 273252 3020186 997905
20500 6517.54754 2139.557705 1009.444761 580.3144080 375.225097 95.1119472
4529318 8432 3437551 546472 78832534 4114463
21000 6567.25476 2144.885446 1010.628515 580.7051482 375.388264 95.1223451
358523 918442 9898755 05952 52816824 3410424
21500 6615.36131 2149.990155 1011.759800 581.0782047 375.543974 95.1322615
5448051 787203 8087857 599292 3314079 216535
22000 6661.94329 2154.885550 1012.842028 581.4347516 375.692726 95.1417290
1771264 324047 7424556 044927 96587 9321563
22500 6707.07203 2159.584246 1013.878323 581.7758609 375.834978 95.1507776
6501032 0245785 0177107 75479 51567705 446468
23000 6750.81451 2164.097864 1014.871547 582.1025142 375.971146 95.1594343
0477965 5595997 2487934 266147 05206315 9146663
23500 6793.23362 2168.437129 1015.824331 582.4156112 376.101611 95.1677242
2947458 749476 8629983 586107 7174322 4226215
24000 6834.38853 2172.611952 1016.739097 582.7159787 376.226726 95.1756700
3430398 6272773 3629135 981897 3068907 380502
24500 6874.33492 2176.631507 1017.618074 583.0043776 376.346812 95.1832927
7000476 010998 8584188 874377 41794436 6244292
25000 6913.12526 2180.504296 1018.463324 583.2815093 376.462167 95.1906117
5661811 7977533 2351264 188085 227908 2668839
5
ESTIMACIN DE PARMETROS Y PRUEBA DE
HIPTESIS
1.- INTRODUCCIN
La Estadstica descriptiva y la teora de la Probabilidad van a ser los pilares de
un nuevo procedimiento (Estadstica Inferencial) con los que se va a estudiar el
comportamiento global de un fenmeno. La probabilidad y los modelos de distribucin
junto con las tcnicas descriptivas, constituyen la base de una nueva forma de
interpretar la informacin suministrada por una parcela de la realidad que interesa
investigar.
Estimacin Puntual
Estadstica
Descriptiva Intervalos
INFERENCIA
Contraste
Probabilidad y
modelos
Por tanto, algunos de los objetivos que se persiguen en este tema son:
Calcular los parmetros de la distribucin de medias o proporciones
muestrales
de tamao n, extradas de una poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a partir de la media o
proporcin muestral.
Utilizar distintos tamaos muestrales para controlar la confianza y el error
admitido.
Contrastar los resultados obtenidos a partir de muestras.
Visualizar grficamente, mediante las respectivas curvas normales, las
estimaciones realizadas.
En definitiva, la idea es, a partir de una poblacin se extrae una muestra por
algunos de los mtodos existentes, con la que se generan datos numricos que se van a
utilizar para generar estadsticos con los que realizar estimaciones o contrastes
poblacionales.
El estudio muestral no es un tema que entre a formar parte de este tema, pero si
necesitaremos una serie de conceptos necesarios para el desarrollo del tema, y que se
detallan a continuacin.
- La media poblacional: X
- Total poblacional: X
- Proporcin: P
ESTIMACIN: Este trmino indica que a partir de lo observado en una muestra (un
resumen estadstico con las medidas que conocemos de Descriptiva) se extrapola o
generaliza dicho resultado muestral a la poblacin total, de modo que lo estimado es el
valor generalizado a la poblacin. Consiste en la bsqueda del valor de los parmetros
poblacionales objeto de estudio. Puede ser puntual o por intervalo de confianza:
1
Todas las variables aleatorias que forman la muestra verifican que son independientes
entre s, que
E[ X i ] = 2
y que su V [
Xi ] = .
n
o Total: t = i = 1 xi .
MEDIA MUESTRAL: Sea X1.....Xn, una m.a.s. con media o con E(x)= y
con
2
varianza muestral V [ X ] = , entonces la media muestra se distribuye como una
n
normal de parmetros:
X N (, ).
n
muestral
TOTAL MUESTRAL: Sea X1......Xn, una m.a.s. con E(t)= n y con V(t)= n 2
,
entonces se distribuye como una normal:
(
t N n ; n 2
).
Lim n = {P[ +
]}.
P[ X < z ] = 1 P[ X > z ] = 1 .
UNILATERAL:
P z < X < z .
BILATERAL:
2 2
x
P z < < z = P z . < x < z =
2
/ n 2 2
n 2
n
P x z . < < x + z .
2 2 n
n
Ordenando la informacin:
P [ x - z /2 < < x + z /2 ] = (1- ).
n n
Sabemos que para cualquier distribucin, por el Teorema Central del Lmite, si
tiene un tamao de muestra grande, se puede aproximar o se distribuye como una
Normal de parmetros:
s
X N (, )
,
n
siendo s la cuasidesviacin tpica muestral. En consecuencia,
x
Z= N (0;1) ,
s/ n
y procediendo de forma anloga a la anterior llegamos a que el intervalo de confianza
que buscamos es
s s
x z ;x + z .
2 n 2 n
s
I .C . x t s ; x + t .
n1;
2 n n1;
2 n
(n <1)s 2
P 2 2
= 1 .
n 1;1 2 < n1;
2
2
2 1 11)s 2 (n (n 1)s 2
2
P > > = P > > = 1 .
(n 1)s 2 2
2 2 2
n n 1;
n n 1;
1;1
1;1
2
2
2 2
(n 1)s 2 (n 1)s 2
; .
2 2
n 1;
2
n1;1
2
Es una regla de decisin que nos dice cuando aceptar y rechazar las hiptesis,
con esto vemos si los datos de una muestra son compatibles o no con los de la
poblacin.
Una hiptesis estadstica, por tanto, es una proposicin acerca de la funcin de
probabilidad o de la funcin de densidad de probabilidad de una variable aleatoria o de
varias variables aleatorias. Tal proposicin debe referirse bien a la forma de la
distribucin de probabilidad, bien al valor o valores de los parmetros que lo definan o
bien a ambos. Hiptesis estadstica es, una afirmacin acerca de la distribucin de la
poblacin. Puede haber hiptesis estadsticas en contextos paramtricos y no
paramtricos.
Aquella hiptesis que se desea contrastar se llama hiptesis nula (Ho), por tanto,
la que se acepta o rechaza como conclusin del contraste. La hiptesis nula suele ser
una estrategia o medio del que se sirve el investigador para probar la alternativa. Suele
ir acompaada por la hiptesis alternativa o hiptesis experimental, simbolizada por H1.
La hiptesis alternativa es la que se verifica cuando no se verifica la hiptesis
nula. El planteamiento de Ho permite elaborar un modelo Probabilstico a partir del cual
podemos llegar a la decisin final.
A su vez, al plantear una hiptesis, esta puede ser simple o compuesta. Una
hiptesis es simple si se especifica exactamente el valor del parmetro. Una hiptesis es
compuesta, si contiene dos ms valores del parmetro. La hiptesis nula (Ho) por ser
ms concreta suele ser simple y la alternativa, compuesta. Es frecuente plantearlas como
complementarias.
5.2.- Supuestos
Las suposiciones que podemos hacer dependiendo del tipo de contraste que
necesitemos son:
a) Supuestos acerca de las caractersticas de los datos que se van a manipular,
como puede ser la independencia de la observaciones, nivel de medida
utilizada, etc.
b) Supuestos acerca de la forma de distribucin de partida: Normal, Binomial,
etc.
Los contrastes unilaterales suelen ser mejores que los contrates bilaterales. La
eleccin de uno u otro, est condicionada al planteamiento de la hiptesis alternativa.
Ejemplo:
Si Ho 0.50 H1 > 0.50 Es unilateral.
Verdadera Falsa
(1-
Acertar )
Error tipo II
correcta
Decisin (1-
Rechazar )
Error tipo I
Decisin Correcta
De aqu se pueden obtener las siguientes conclusiones que deben de tenerse en
cuenta:
As, las probabilidades asociadas a los tipos dos tipos de Error vienen dadas por
las siguientes expresiones:
Carencia de Sesgo:
Consistencia:
[ ]
p = P Z > z exp .
El p-valor puede considerarse como el valor lmite para que un contraste sea
significativo, es decir, elegido un nivel de significacin , se rechazar H0 si p .
5.14.- Contraste de hiptesis para la media con varianza conocida
.
n
Como ya se conoce su distribucin, el estadstico de contraste ser:
x
N (0;1) .
/
n
H0 : x 0
RECHAZO H0 si > z
0
B)
H1 : > s/ n
0
H0 : x 0
RECHAZO H0 si < z
0
C)
H1 : < 0 s/ n
En caso contrario se acepta la hiptesis nula.
5.16.- Contraste de hiptesis para la media con varianza
desconocida y n<30
H0 : = x 0
RECHAZO H0 si >t
0
A)
H1 : s/ n n1;
2
0
H0 : x 0
RECHAZO H0 si > t n 1;
0
B)
H1 : > s/ n
0
H0 : x 0
RECHAZO H0 si < t n1;
0
C)
H1 : < s/ n
0
p P0
N (0;1) .
p0 q0
n
H 0 : P = P0 p P0
A) RECHAZO H0 si > z
H 1 : P P0 p 0 q0 2
n
H 0 : P P0 p P0 > z
B) RECHAZO H0 si
H 1 : P > P0 p 0 q0
n
H 0 : P P0 p P0 < z
C) RECHAZO H0 si
H 1 : P < P0 p0 q0
n
En caso contrario se acepta la hiptesis nula.
0 2: =
2
H 2
0
si
(n 1)s 2 ; 2
A) RECHAZO H0 2
H1 : 2 0
1
2
0
2 2
H 0 : 2 0 (n=
RECHAZO H0
2 1)s= 2
B) si > 2
H1 : >2
0
02
2
H0 : 2 0 (n= 1)s= 2
RECHAZO H
2 si < 2
C) 0 1
H1 : 2 < 02
0
Nota: En caso
contrario se
acepta la
hiptesis nula.
6
REGRESIN, CORRELACIN Y ANOVA
Yi = + Xi + Ei
Siendo:
Parmetros:
: Origen de la recta
: Pendiente de la recta
Ei: Error aleatorio
Ejemplo: Se intenta predecir el absentismo laboral Y (en horas al ao) a partir del
salario X (en euros semanales).
Contraste sobre
Objetivo: Comprobar si hay relacin lineal, y de que tipo es esta, entre X e Y.
Hiptesis Bilateral:
Unilateral derecho:
Unilateral izquierdo:
Supuestos
Independencia
Normalidad
Homocedasticidad
Estadstico de contraste
T / 2 tn-2yT1-/2tn-2
1. Hiptesis
H0: 0
H1: > 0
3. Estadstico de contraste
4. Zona crtica
5. Decisin
Mantener H0
2. REGRESIN EN FORMATO ANOVA
Ejemplo: Un examen tiene dos partes: terica y prctica. La parte terica (Y) cuenta un
40% y la parte prctica (Z) un 60% de la nota final (X).
2,2 y 2.
Contraste sobre xy
3. Estadstico de contraste
Unilateral derecho:
T 1- t n-2
Unilateral izquierdo:
T t n-2
CONCLUSIN
La estadstica, entonces, dej de ser una tcnica exclusiva de los estados, para
convertirse en una herramienta imprescindible de todas las ciencias, de donde proviene
la desconcertante desuniformidad en las definiciones de los diferentes autores, ya que
cada estudioso la define de acuerdo con lo que utiliza de ella y tenemos definiciones
como que la estadstica es la tecnologa del mtodo cientfico, o que es el conocimiento
relacionado con la toma de decisiones en condiciones de incertidumbre, o que la
estadstica son mtodos para obtener conclusiones a partir de los resultados de los
experimentos o procesos, o que es un mtodo para describir o medir las propiedades de
una poblacin. En fin, no se trata de discutir si la estadstica es una ciencia, una tcnica
o una herramienta, sino de la utilizacin de sus mtodos en provecho de la evolucin del
conocimiento.
La estadstica es una ciencia auxiliar para todas las ramas del saber; su utilidad se
entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan
cierto grado de incertidumbre... y la Estadstica ayuda en la incertidumbre, trabaja con
ella y nos orienta para tomar las decisiones con un determinado grado de confianza.
BIBLIOGRAFA
https://es.wikipedia.org/wiki/Tama%C3%B1o_de_la_muestra
https://explorable.com/es/tamano-de-la-muestra
http://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema4.
pdf
http://inferencial1.blogspot.com/p/unidad-1.html
https://www.clubensayos.com/Temas-Variados/IMPORTANCIA-DE-LA-
ESTADISTICA-INFERENCIAL-EN-LAINVESTIGACI%C3%93N/996702.html
https://es.slideshare.net/maguieb/estadsticainferencial16313544?next_slideshow=
1
https://www2.ulpgc.es/hege/almacen/download/5/5509/Tema_1.pdf
https://www.u-cursos.cl/ingenieria/2009/2/MA3403/3/material_docente/bajar?id