Documente Academic
Documente Profesional
Documente Cultură
DISEÑO MUESTRAL POLIETÁPICO: Es una muestra representativa diseñada para obtener datos y
generalizarlos a una cierta población, que requiere distintas etapas o procedimientos. Recoge
datos en encuesta de opinión, dividido en etapas de planificación y ejecución.
TIPO DE MUESTREO:
- Aleatorio
- Estratificado
- Sistemático
- Conglomerado
POTENCIA DE LA MUESTRA: Está relacionado con Beta. Porcentaje de población necesario para
garantizar cierta respuesta. El límite de potencia es el 80%. Una muestra que no alcance el 80% de
potencia, no sirve.
NIVEL DE CONFIANZA: Está relacionado con el error tipo 1 (alfa). (1 – alfa = Nivel de confianza).
SELECCIÓN DE LA MUESTRA:
Theta gorrito (Estimador). Magnitud variable de una muestra a otra. Función de los valores.
29 Marzo 2019:
Ho = Hipótesis
Error de tipo I: Cuando rechazamos la hipótesis nula (Ho) y ésta es verdadera. Siempre
desearemos que α sea lo más pequeña posible.
Si yo quiero coeficientes de confianza muy altos, entonces α debe ser muy pequeño y viceversa.
Si yo quiero potencia de prueba muy alta, entonces β debe ser muy pequeño y viceversa.
Se espera que en dos muestras, una de control y otra experimental, las diferencias observadas en
las muestras permitan afirmar que esas diferencias son significativas. La probabilidad de que esto
ocurra es lo que llamamos “Potencia de la prueba (1 – β)”. No debe ser inferior al 80%, es decir,
que el β debe ser menor al 20%.
Me voy a EscuelaMuestreo.xls
Doy =aleatorio.entre(1;500)
Saco 10 muestras de aleatorio
Vamos a muestrear con una media como la de la población 11,14 con una varianza 1,38 … elijamos
un tamaño muestral de 20 niños, un tamaño muestral de 10 y vamos a generar 100 intervalos con
una confianza del 95%
Esto significa que 7 muestras de toda la población (rojos) no logran estimar la media poblacional
Vamos a hacer un muestreo aleatorio simple sobre hemoglobina:
Observemos que el error estándar es “O” ya que la población y la muestra ambas son 500, no hay
posibilidad de error.
Ensayemos otras:
El MAS no me garantiza que hayan muestras de todos los estratos, el muestreo estratificado SI me
garantiza que salgan muestras de todos los estratos.
Vamos con R:
Abrir Escuela.r
Corregir dirección
Comando Boxplot es diagrama de caja, en nuestro caso pusimos Hemog~parasito, eso significa
que graficará que saca un gráfico de la hemoglobina de los que tienen parásito y elgráfico de los
que no tienen parásito.
n<-30
m30<- sample(1:nrow(tabla),n,replace=FALSE)
View(m30)
toma una muestra de tamaño 30 sin remplazo (es decir qu euna muestra no puede aparecer
nuevamente en la siguiente) .. esto es lo mismo que hicimos con Excel
Defina una matriz que va a estar generada por la población que tenga todas las filas (30) por 4
columnas:
m30ind<- tabla[m30, ]
dim(m30ind)
head(m30ind)
View(m30ind)
n<-100
m100<- sample(1:nrow(tabla),n,replace=FALSE)
View(m100)
… y la he llamado “MAS30.csv”
RESUMEN DE LA CLASE:
#Clear memory
rm(list=ls())
#Split Screen
par(mfrow=c(1,2),new=T, font=2,cex=1)
#Lectura Data
names(tabla)
attach(tabla)
head(tabla, n = 4)
#Resumen datos
summary(tabla)
dim(tabla)
tabla
#Histogramas
hist(Hemog)
table(Escuela)
table(Sexo)
table(Parasito)
table(Sexo,Parasito)
class(tabla)
table(Sexo,Escuela)
names(tabla)
attach(tabla)
hist(Hemog)
boxplot(Hemog~Parasito)
boxplot(Hemog)
head(tabla)
tail(tabla)
View(tabla)
table(Parasito,Sexo)
ftable(Parasito,Sexo)
#Seleccion de la muestra
#Tamaño de la muestra
n<-30
m30<- sample(1:nrow(tabla),n,replace=FALSE)
View(m30)
m30ind<- tabla[m30, ]
dim(m30ind)
head(m30ind)
View(m30ind)
n<-100
m100<- sample(1:nrow(tabla),n,replace=FALSE)
View(m100)
TAREA. Hacer completo el taller 1 (Muestreo taller 1.ppt) para IMC, generar una muestra de 30 o
de 50 y hacer todo lo que se pide ahí.
12 de abril de 2019
SCRIPT:
# Generar una muestra de tamaño 300 de una poblaciòn de 1 a 30.000, sin reposición
#Muestre la tabla que acaba de generar. Esta es una tabla de 500 números elegidos al azar de
una muestra de tamaño 30.000
#Grafique el histograma de esa tabla. Este histograma tenderá a ser parejo, ya que el tamaño de
la muestra es relativamente grande
hist(s)
#Crear un conjunto de datos (otro nuevo) a partir de una población normal que tenga una media
= 100 y una DE = 20
#grafique
#La muestra de 10.000 tiene m ayor potencia que una muestra pequeña,por ejeplo de 100
Los estimadores muestrales se calculan, mientras que los parámetros poblacionales se estiman a
partir de los estimadores muestrales.
Se infiere desde la muestra a la población. Cuando se hacen las inferencias se quiere que los
errores tipo 1 sean lo más pequeños posibles (1 – 2%), lo mismo sucede con el error tipo 2. La
estadística privilegia minimizar el error 1 al error 2.
Es casi imposible que Beta y Alfa se eliminen a la vez (Ver gráfico), porque mientras una crece la
otra decrece. La única manera de eliminar a las dos es hacer que n sea igual a N (Si se tiene el
presupuesto suficiente).
El Muestreo Probabilístico garantiza que toda unidad de muestreo (y en consecuencia toda unidad
de la población) tiene una probabilidad positiva y conocida de pertenecer a la muestra que se usa
para realizar el estudio de las características de la población. Dicha probabilidad puede ser igual
para todos los elementos o distinta para cada uno.
MASI: Muestreo aleatorio simple irrestricto (Irrestricto significa “sin reposición”). En el MASI todos
los elementos tienen la misma probabilidad de ser elegidos.
El estimador (Thetha gorrito) es función de la muestra, puede ser una media estimada (miu
gorrito), puede ser una proporción estimada (p gorrito), puede ser un total estimado (tau gorrito).
El estimador siempre debe venir acompañado de la varianza del estimador (V función de theta)
X1 X2 X3
0 3 1
3 3 5
4 3 5
3 3 4
5 3 5
X trazo 3 3 4
Margen de Error de Estimación: Es el margen de error que estamos dispuestos a aceptar cuando
muestreamos =
rm(list=ls())
#Los datos del caribú pueden ser entrados y almacenados como un vector “y”
N=286
y= c(1, 50, 21, 98, 2, 36, 4, 29, 7, 15, 86, 10, 21, 5, 4)
n=15
#Media muestral de y
#Varianza muestral de y
#Ahora calculemos la varianza pero sin el factor de correcciòn y entendamos cual es el efecto de
quitarle ese factor en un tamaño muestral pequeño
#Error estandar:
1. OBJETIVO: Estimar la cantidad de estudiantes cuya estatura sea mayor que 1,9 m (Nótese
que al utilizarse la expresión “Estimar” nos estamos refiriendo a tomar una muestra, hallar
los estadísticos y luego estimar los parámetros en la población). Otro ejemplo podría ser
indagar la cantidad de personas que viajan a Europa.
2. DISEÑO DE INSTRUMENTO: En este caso sería medir mediante un metro o solicitar el
documento de identidad. En otros casos tendría que ser un cuestionario.
3. OBTENCIÓN DE LA MUESTRA: Para conocer la población mediante la estimación de los
parámetros poblacionales. Hay distintos tipos de muestreo (Aleatorio, Estratificado,
Sistemático, o Conglomerado, etc). Implica determinar el tamaño de la muestra. Luego
implica la recolección de los datos.
4. ANÁLISIS DE RESULTADOS: Sistematización de los resultados.
JUNIO 14 CLASE
Esto es Y trazo
Implícitamente el cálculo del tamaño de la muestra me lo da la potencia. Eso lo vamos a ver
cuando veamos diseño de experimento.
Obsérvese en la fórmula de “n” que a mayor sea la varianza (datos muy heterogéneos), la muestra
va a resultar muy grande.
Si se trata de proporciones:
Cuando se trata de elegir el mayor tamaño de muestra, entonces se elige p= 0,5 Es la exprtesión
de lamáxima ignorancia, no sabemos nada, nos da igual a la izquierda que a la derecha de la
curva, se elige cuando no tenemos conocimiento de nada, en cambio otrs proporciones como 0,1
se eligen cuando tenemos mucha confianza de que vamos a acertar.
ASIGNACIÓN PROPORCIONAL:
ASIGNACIÓN NEYMAN (Léase Noiman) (Teóricamente es superior a la afijación porporcional,
pero es cuestión de gustos): Pondera cada estrato con su variabilidad (Desviacion estándar)
ASIGNACIÓN ÓPTIMA:
Dentro de cada estrato se puede hacer muestreo aleatorio simple o sistematico u otra forma, para
ubicar en cada estrato el respectivo ni.
Vran = varianza aleatoria, de muestreo aleaotrio.
Vamos al Excel “MuestraEstratificada Ejercicio_Junio1.xlsx”
Vamos al ppt “2_Muestreo Estratificado R.pptx” página 3, ver el script y abrirlo en “R”.
library(SDaA)
library(sampling)
library(TeachingSampling)
Instalar paquetes:
SDaA
sampling
TeachingSampling
LAS TAREAS QUE HACEN FALTA TIENEN PLAZO DE ENTREGA EL MIÉRCOLES 26 DE JUNIO
14 junio 2019
m1 m2 m3
m4 m5 m6
m7 m8 m9 m10
El criterio debe ser claramente definido, ya que este ejemplo podría ser bietápico o multietápico, o
más, es decir, cada finca tiene distinta cantidad de plantas, cada planta tiene distinta cantidad de
mazorcas, cada mazorca tiene distinta cantidad de granos, cada planta es de distinta especie.
Entonces cada finca termina siendo un Cluster (Internamente dicho estrato es heterogéneo), lo
cual me genera varianzas relativamente grandes en cada estrato inicial (fincas) lo cual hace
ineficiente la estratificación, y el MASI termina siendo más eficiente.
En este caso se considera el Muestreo por Conglomerados, el muestreo Bietápico funciona así,
suponga que m5 tiene sub estratos así: m51, m52 y m53, entonces se trabaja como si ese Cluster
(m5) fuera una población, se estratifica internamente y se sacan los respectivos datos ni y el resto.
Los métodos estudiados hasta ahora (MAS; ME) están pensados para seleccionar directamente los
elementos de la población: las unidades muestrales son los elementos de la población.
diferentes entre sí, una muestra con pocos conglomerados recoge gran cantidad de información
sobre un parámetro poblacional.
Estratos: deben ser homogéneos internamente, pero diferentes entre ellos, con respecto a la
característica que se está midiendo.
Conglomerados: heterogéneos internamente, pero similares entre ellos para que el muestreo
por conglomerados sea eficiente.