Sunteți pe pagina 1din 30

Qu es describir una muestra?

Describir una
muestra es
Medir frecuencias
Medir qu tan dispersos
son los datos
Mostrar cmo
se distribuyen
los datos
Describir variables
Buscar relacin entre sus
variables
Encontrar la
estructura de
una variable.
Cmo se puede medir?
La forma clsica de obtener datos en metodologas cuantitativas en
ciencias sociales es a travs de encuestas. Otros enfoques de
laboratorio, por ejemplo con ratones utilizan otras formas de
medicin, pero lo que tienen en comn, es que son a muchos
sujetos.
La idea es que el instrumento que se utilice para medir permita
conocer los datos que interesan.

Esto significa, que cobra vital importancia el proceso en que se
construye y se valida el instrumento.

El anlisis estadstico se puede lograr a travs de diferentes pruebas
hechas a lo que la gente ha respondido en dicho instrumento.
Qu datos obtenemos al medir?
Datos que
pueden
obtenerse
Medidas de
Dispersin
Medidas de
Tendencia
Central
Medidas de
Posicin
Relaciones
entre
variables
Varianza
Desviacin
estndar
Percentiles
Deciles
Quintiles
Media
Moda
Mediana
Covarianza
Correlacin
Qu es una tabla de frecuencias?
Es una tabla que indica la cantidad de
personas que obtuvieron un valor
especfico.
Se utiliza para calcular medidas de
posicin, y al graficarla, se puede
tener una representacin grfica de
cmo se distribuyen los datos.
Qu es una tabla de frecuencias?
Por ejemplo, si preguntamos cuantas personas son de cada signo
zodiacal a 60 personas
Signo Zodiacal Frecuencia
Frecuencia
Acumulada
Acuario 3 5% 3
Piscis 5 8,3% 8
Aries 7 11,6% 15
Tauro 4 6,6% 19
Gminis 6 10% 25
Cncer 4 6,6% 29
Leo 5 8,3% 34
Virgo 4 6,6% 38
Libra 6 10% 44
Escorpin 4 6,6% 48
Sagitario 7 11,6% 55
Capricornio 5 8,3% 60
Totales 60 100%
La frecuencia en nmero
nos indica la cantidad de
personas que es de cada
signo.
El porcentaje nos dice que
parte del total es de cada
signo.
La frecuencia acumulada
nos indica cuanta gente
hay bajo un intervalo
especfico. Es til en
variables ordinales o
escalares. En nominales
como el ejemplo no sirve
de mucho.
Grficos de poblacin
0
1
2
3
4
5
6
7
8
Signo Zodiacal
Los grficos de poblacin son una representacin grfica de la tabla
de frecuencias, y permite dar luces de cmo se distribuyen las
frecuencias.
Cmo se pueden distribuir los
datos? Se llaman medidas de forma, y nos indican cmo se
comporta la poblacin en cuanto a las frecuencias.
Distribucin Sesgada: Los datos tienden
a cargarse a un valor en particular.
Puede ser positiva o negativa segn se
carguen a valores altos o bajos
respectivamente.
Distribucin Bimodal: Aqu los datos
tienden a concentrarse en torno a
dos valores diferentes. Si es a mas
de dos valores, se llama Multimodal
Cmo se pueden distribuir los
datos? Se llaman medidas de forma, y nos indican cmo se
comporta la poblacin en cuanto a las frecuencias.
Distribucin Normal: Los datos se
concentran en torno a la media, que
es a su vez la moda y la mediana. A
medida que los valores se extreman, la
frecuencia tiende a disminuir.
Distribucin rectangular: No hay una
tendencia marcada, y en general las
frecuencias o los valores en el eje Y son
muy similares.
Medidas de Tendencia
Central
Medidas de Tendencia Central
Dan cuenta de la tendencia que
siguen los datos de una muestra,
dando nmeros que representan
dichos valores.
Promedio (media)
Moda
Mediana
Medidas de
Tendencia
Central
Es la mas utilizada y
corresponde al nmero que
representa a la muestra o a
un conjunto de datos.
Es el nmero que se ubica en
la mitad de los datos cuando
estn ordenados de menor a
mayor.
Es el valor que obtuvo la
frecuencia mas alta, es decir,
el que mas se repite.
Es la mas utilizada y corresponde al nmero que representa a la
muestra o a un conjunto de datos.
Se obtiene por la frmula:
En donde n es el nmero de personas y x son todos los valores de X. La
frmula se lee como la sumatoria de todos los valores de X divididos por
el total de x.
Media
0
1
2
3
4
5
6
7
8
9
Cantidad de
horas de sueo
Media
Media
Bsicamente es un proceso que distribuye uniformemente los valores
de cada persona. Como se ve en el ejemplo.
Es el valor que obtuvo la frecuencia mas alta, es decir, el que mas se
repite.
Se obtiene observando la tabla de frecuencias
Moda
Signo Zodiacal Frecuencia
Frecuencia
Acumulada
Acuario 3 5% 3
Piscis 5 8,3% 8
Aries 7 11,6% 15
Tauro 4 6,6% 19
Gminis 6 10% 25
Cncer 4 6,6% 29
Leo 5 8,3% 34
Virgo 4 6,6% 38
Libra 6 10% 44
Escorpin 4 6,6% 48
Sagitario 7 11,6% 55
Capricornio 5 8,3% 60
Totales 60 100%
En este caso, la
moda son dos
y
corresponden
a los signos
Aries y
Sagitario.
Es el nmero que se ubica en la mitad de los datos cuando estn
ordenados de menor a mayor.
Mediana
Se obtiene por la frmula:
|
|
.
|

\
|
+

i
f
f N/2
i X
b
ll
Mdn =
Xii= lmite inferior del intervalo
i=tamao de la categora
fb= sumatoria de la frecuencia
bajo el intervalo
(frecuencia acumulada)
fi= frecuencia dentro del intervalo
N= tamao de la muestra
Esta frmula, aplica para datos
agrupados en las tablas de
frecuencias. Cuando no estn
agrupados, se obtiene ordenando
de mayor a menor los datos y
viendo los que estn en la mitad
de la secuencia.
Estas medidas se utilizan para estimar sus
valores en la poblacin general. En ese
caso, se denominan estimadores. El mas
comn de usar es la media, que es el que
mas informacin entrega.
Medidas de Dispersin
Medidas de Dispersin
Indican que tan dispersos son los datos, es decir, si la distancia
entre ellos es grande o pequea.
Medidas de
Dispersin
Varianza
Desviacin
Estndar.
Raz cuadrada de la varianza. Es un indicador
menos sensible a las variaciones en los valores,
y es la unidad en que se mide la distribucin
normal. Se expresa en la misma unidad de la
muestra (segundos, metros, etc.)
Media de las diferencias entre cada
valor y la media al cuadrado.
Medidas de Dispersin
Varianza
Desviacin Estndar
Para muestras pequeas (N<100) se utiliza la varianza
insesgada, reemplazando la n por n-1.
Considerando la lnea celeste como el promedio,
la media del cuadrado de cada una de esas
lneas punteadas violeta es la varianza. La raz de
ese nmero es la desviacin estndar.
Medidas de Dispersin
Las frmulas consideran la divisin por N para promediar las
diferencias cuadradas. Pero cuando la muestra es muy pequea
(N<100) se trabaja con N-1 para que el resultado crezca y de ste
modo hacerla mas sensible a las fluctuaciones de los valores. En el
primer caso, cuando se trabaja con N, se conoce como Varianza
Sesgada, y con N-1 se llama Variabza Insesgada.
Interpretando las medidas de
dispersin
Si la desviacin estndar es muy alta comparada con los datos, se
debe considerar que la media no representa muy bien a la
muestra. ste estadstico la representar mejor mientras la ds sea
mas baja.
Si la ds (y por consiguiente la varianza) tendiente a 0, significar
que los datos se parecen mucho. Si son iguales a 0 significa que
todos ellos son iguales.
La ventaja de la ds es que est expresada en la misma unidad de
la variable.
Parte 6
Medidas de Posicin
Medidas de Posicin
Son indicadores que permiten conocer la posicin
de un dato dentro de una muestra. Con ellos se
puede determinar a partir de qu valor se puede
considerar el X% mas algo o bajo, o predecir valores
centrales como la mediana.
Operan dividiendo el continuo de datos ordenados
en partes iguales, de modo que un dato ubicado en
un lugar determinado pertenezca a una de esas
divisiones.
Cmo se dividen los datos?
Datos ordenados
Percentiles
Deciles
Quintiles
Cuartiles
25% 50%
75% 80%
30% 10%
Entonces, con lo anterior se pueden hacer dos tipos de
clculos.
1) Dado un dato especfico, determinar a que percentil
pertenece.
2) Dado un percentil, calcular cual es el valor de ese dato.
90%
Cuartiles 4 partes
Divide la muestra en
Quintiles 5 partes
El 25% de la muestra
Cada parte
representa
El 20% de la muestra
Deciles 10 partes El 10% de la muestra
Percentiles 100 partes El 1% de la muestra
Cmo se dividen los datos?
Percentiles
Saber cuanta gente realiza
una accin en un
determinado nivel
Que valor
mnimo se debe
tener para estar
en el 30%
superior?
Qu porcentaje de
personas estarn
entre un valor x y uno
y?
Estudios con datos
ordenados donde no
se conocen los datos
por extensin
Usados en
la mayora
de los
estudios en
ciencias
sociales
Quintiles usados en
estudios
demogrficos
Frmula general
Xii= lmite inferior del intervalo
i=tamao de la categora
fb= sumatoria de la frecuencia bajo el intervalo
(frecuencia acumulada)
fi= frecuencia dentro del intervalo
N= tamao de la muestra
d= cantidad de partes en que se dividir la muestra.
Esta es una generalizacin de la frmula para calcular cualquier medida.
La letra d corresponde a la cantidad de partes en que se desea dividir la
muestra. Por ejemplo, si se quiere trabajar con quintiles, deber
reemplazarse por un 5.
El nmero resultante es la divisin d-sima que ocupa el valor. (Si es 5,
indicar el quintil, si es 8 el octil, si es 100 el percentil, etc.)
Cmo se calculan percentiles?
Xii= lmite inferior del intervalo
i=tamao de la categora
fb= sumatoria de la frecuencia
bajo el intervalo
(frecuencia acumulada)
fi= frecuencia dentro del intervalo
N= tamao de la muestra
Interpretacin
Interpretar un percentil significa
obtener conclusiones acerca de la
posicin de un valor.
Supongamos que en un curso, el percentil 75 es un 4,7
Significa que alguien
que ha obtenido dicha
nota super al 75% del
curso
Igualmente, un 25% del
curso tuvo mas de 4,7.
Si el curso tena 40 personas,
significa que 10 de ellos tuvieron
mas de un 4,7.

S-ar putea să vă placă și