Sunteți pe pagina 1din 22

ESTADSTICA DESCRIPTIVA EN GEOGRAFA

REPASO BLOQUE I:
TEMAS 1-4
Qu hemos visto?
Tipos de variables

Niveles de medicin de las variables

Tabulacin y representacin grfica de las variables

Estadsticos/ Parmetros:

Medidas de centralizacin: Media, mediana y moda


Diferenciar sus propiedades.
Posicin (cuantiles, percentiles,...)
Medidas de dispersin
con unidades: rango, rango intercuartlico, varianza, desv. Tpica
sin unidades: coeficiente de variacin intercuartlica, coeficiente
variacin Pearson
TIPOS DE VARIABLES
CUALITATIVAS
Se refieren a los aspectos no medibles o cualidades de los individuos
(estado civil, lugar de nacimiento...). Las variables cualitativas toman
valores que no pueden ser ordenados ni operados conforme a las reglas
aritmticas; a estos valores se les suele denominar modalidades

CUANTITATIVAS
Miden alguna cualidad o atributo "cuantificable" de los individuos. (Valor
numrico)

DISCRETAS CONTINUAS
Las variables discretas, al ser Las variables continuas, aquellas
numerables, pueden tomar una serie de medibles que pueden tomar infinitos
valores determinados, pero no los valores dentro de un campo de
valores intermedios (Ej, nmero de variacin (peso, altura, temperatura)
aos de escolarizacin, nmero de
hijos por familia).
NIVELES DE MEDICIN DE LAS VARIABLES

TIPOS DE NIVELES DE PROPIEDADES DE LOS NIVELES


VARIABLES MEDICIN DE MEDICIN
CUALITATIVA NOMINAL - Nivel de medicin ms bsico
-Clasifica a los individuos u objetos en clases o
Ej: lugar de nacimiento
categoras meramente descriptivas y excluyentes

ORDINAL - Contiene las mismas propiedades del nivel de


medicin nominal + una nueva: ordena segn se
Ej: nivel de instruccin posea en mayor o menor grado la caracterstica que
se pretenda medir

CUANTITATIVA INTERVALOS -Adems de lo observado para las otras dos escalas,


sta tiene la propiedad de poder medir la distancia o
(Discretas/ Ej: Temperatura, presin la diferencia numrica que aparece entre una
continuas) categora y otra

RAZONES/ -Posee todas las propiedades de las anteriores ms el


cero absoluto, es decir, se emplea un punto natural u
PROPORCIONES origen no arbitrario en la escala de medida; de esta
forma no slo podremos establecer diferencias entre
Ej: renta per cpita, peso las categoras sino que adems las cantidades en
esta escala, y por lo tanto las proporciones, tienen un
significado. Esta escala posee adems la propiedad
de que la razn de dos valores cualesquiera es
independiente de la unidad de medicin
TABULACIN Y REPRESENTACIN
GRFICA DE LAS VARIABLES

CUALITATIVA NOMINAL CUALITATIVA CUANTITATIVA CUANTITATIVA


ORDINAL DISCRETA CONTINUA

TABULACIN f y f% f, f%, F y F% f, f%, F y F% MC, f, f%, F y F%


REPRESENTACIN Diagrama de crculo; Diagrama de Diagrama de Histogramas
GRFICA diagrama rectangular; crculo; diagrama barras; polgono frecuencias;
diagrama triangular, rectangular; de frecuencias; polgono de
diagrama de barras (si diagrama polgono de frecuencias,
alto n de triangular (si alto frecuencias polgono de
modalidades y/o n de acumuladas (ojiva) frecuencias
frecuencia muy baja) modalidades y/o acumuladas
frecuencia muy (ojiva).
baja)

La correcta realizacin de un grfico necesita que se incluya en el mismo:

- la fuente origen de los datos que permita consultas directas a la informacin,


- las unidades de medida de los datos (porcentajes, nmeros absolutos...),
- el ao o periodo de referencia de la informacin
- el mbito de referencia de la informacin (regin, pas...).
- y un ttulo en el que se indique claramente la variable a que corresponde la informacin
TIPOS DE GRFICOS
100%
90%
80%
MADRID 70%
BARCELONA UNIVERSIDAD
60%
BILBAO SECUNDARIA
SEVILLA 50%
PRIMARIA
40%
ANALFABETO
30%
20%
10%
CICLOGRAMA 0%
1

DIAGRAMA
RECTANGULAR

DIAGRAMA DE BARRAS HISTOGRAMA


Parmetros y estadsticos
Parmetro: Es un valor calculado sobre una poblacin

La altura media de los individuos de un pas

La idea es resumir toda la informacin que hay en la poblacin en unos pocos


nmeros (parmetros).

Estadstico: dem (cambiar poblacin por muestra)

La altura media de los que estamos en este aula.


Somos una muestra (representativa?) de la poblacin.
Un brevsimo resumen sobre
estadsticos
Centralizacin
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuartiles, quintiles, deciles y percentiles.
Dispersin
Indican la mayor o menor concentracin de los datos con respecto
a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza,
MEDIA
Se define como la suma de todos los valores numricos (que adopta la variable
estudiada) divididos por el nmero total de valores observados

Media de 2,2,3,7 es (2+2+3+7)/4=3,5


-Conveniente cuando los datos se concentran simtricamente con respecto a
ese valor.
-Muy sensible a valores extremos. En estos casos es ms conveniente calcular
la mediana
-En distribuciones a partir de intervalos de clase no se puede estimar si existen
intervalos abiertos

a)Media aritrmtica:
Datos sin agrupar Datos agrupados
X= x X= fx
N N
b)Media Ponderada:
Xw= wx
w
Ejemplo
x
xf i i

N
45 5 55 10 115 3
Peso M. Clase Fr. Fr. ac. 69,3
58
40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36

70 < 80 75 11 47

80 < 90 85 5 52

90 < 100 95 3 55

100 < 130 115 3 58

58
Mediana: de un conjunto de valores ordenados en magnitud es el valor central
o la media de los dos valores centrales. Es un valor que divide a las
observaciones en dos grupos con el mismo nmero de individuos .

Altura mediana
Mediana de n observaciones impar: N/2 + 0,5:
Ejemplo: 1,2,4,5,6,6,8
n observaciones, 7; (7/2)+0,5=4 ; hay que buscar el valor que ocupa la
posicin 4: 1,2,4,5,6,6,8 ;luego la mediana es 5

Mediana de n observaciones par es el valor medio de los valores que


ocupan las posiciones N/2 y N/2 +1
Ejemplo: 1,2,4,5,6,6,8,9
N observaciones par, 8; hay que buscar los valores que ocupan las
posiciones 8/2 y (8/2)+1, es decir, las posiciones 4 y 5; los valores que
ocupan las posiciones 4 y 5 son el 5 y el 6; la ,mediana es la media de
esos dos valores
1,2,4,5,6,6,8,9 es (5+6)/2=5,5
MEDIANA
- No es sensible a valores extremos.
-Es conveniente cuando los datos son asimtricos.

EJEMPLO

-Mediana de 3,5,6,8,9,11 es 7
-Mediana de 3,5,6,8,9,29 es 7
Ejemplo
Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36
1 / 2 * N Fi 1
70 < 80 75 11 47 Mediana L c
80 < 90 85 5 52
fi
1 / 2 * 58 15
90 < 100 95 3 55
60 10 66,6
100 < 110 115 3 58 21
58
La moda: se define como el valor que tiene una mayor frecuencia en un
conjunto de datos (es decir, aquel que ms se repite).
Para datos agrupados en intervalos

Mo= Li + c. D1
D1+D2
D1: fi-fi-1
D2: fi- fi+1

Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36 Intervalo modal


70 < 80 75 11 47

80 < 90 85 5 52
11
Mo 60 10 65,24
90 < 100 95 3 55
11 10
100 < 110 115 3 58

58
Estadsticos de posicin
Cuartiles: Dividen a la muestra en 4 grupos homogneos.
Primer cuartil = Percentil 25 = Cuantil 0,25
Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Tercer cuartil = Percentil 75 = cuantil 0,75

Quintiles: 4 valores que dividen a una muestra en 5 grupos


homogneos
Quintil 2= Decil 2= Percentil 20

Deciles: 9 valores que dividen a una muestra en 10 grupos


homogneos
Decil 5= mediana= cuartil segundo= percentil 50

Percentil de orden k = cuantil de orden k/100


Percentil 50= mediana= cuartil segundo= decil quinto,
El percentil de orden 15 deja por debajo al 15% de las
observaciones. Por encima queda el 85%
Ejemplo
Peso M. Clase Fr. Fr. ac.

40 < 50 45 5 5

50 < 60 55 10 15

60 < 70 65 21 36

70 < 80 75 11 47

80 < 90 85 5 52

90 < 100 95 3 55

100 < 130 115 3 58

58

75 / 100 N Fi 1 43,5 36
P75 Li c 70 10 76,8
f 11
Medidas de dispersin
Las medidas de dispersin indican el grado de representatividad de las
medidas de tendencia central. Miden el grado de dispersin/ concentracin de
los datos en torno a las medidas de tendencia central

Existen dos tipos de medidas de dispersin: ABSOLUTAS Y RELATIVAS

Mediana Rango
Rango intercuartlico
Rango entre percentiles
ABSOLUTAS Media Desviacin media
Varianza
Desviacin tpica

Mediana Coeficiente variacin intercuartlica


RELATIVAS Media Coeficiente variacin de Pearson
Dispersin absoluta: mediana
Amplitud o Rango:
Diferencia entre observaciones extremas.

0.05
Mn. P25 P50 P75 Mx.
1, 2, 3,4,4,8. El rango es 8-1=7

0.04
Es muy sensible a los valores extremos.

0.03
Rango entre percentiles (interquartile range):
Es la distancia entre percentil 90 y percentil 10. 25% 25% 25% 25%

0.02
Rango entre percentiles = P90 P10
Rango intercuartlico
Parecida al rango, pero eliminando las

0.01
observaciones ms extremas inferiores y superiores. Rango

No es tan sensible a valores extremos

0.00
Rango intercuartlico: 150 160 170 180 190
Es la distancia entre primer y tercer cuartil.
Rango intercuartlico = Q3 - Q1
Parecida al rango, pero eliminando las
observaciones ms extremas inferiores y superiores.
Es el menos sensible a valores extremos.
Dispersin absoluta: media
Desviacin media:
Mide el promedio de las desviaciones (absolutas) de las observaciones con respecto
a la media.

Es la menos sensible a valores extremos (alejados de la media).

Viene expresada en las mismas unidades de la variable.

Varianza S2 :
Mide el promedio de las desviaciones (al cuadrado) de las observaciones con
respecto a la media.

Es sensible a valores extremos (alejados de la media).

Sus unidades son el cuadrado de las de la variable. De interpretacin difcil para


un principiante.

Desviacin tpica
Es la raz cuadrada de la varianza

Tiene las misma dimensionalidad (unidades) que la variable. Es sensible a valores


extremos (alejados de la media).
Dispersin relativa: mediana
Q3 Q1
Vq *100
me
Es la razn entre el rango intercuartlico y la mediana.
Mide el rango intercuartlico en forma dequ tamao tiene con respecto a
la mediana

Es frecuente mostrarla en porcentajes


Si la mediana es 80 y el rango intercuartlico es de 5 entonces
Vq=5/80*100=6,25%

Es una cantidad adimensional (independiente de las unidades de medida).


Interesante para comparar la variabilidad de diferentes variables.
Si el peso tiene Vq=6,25% y la edad tiene Vq=10%, los individuos
presentan ms dispersin en edad que en peso.
Dispersin relativa: media
Coeficiente de variacin de PEARSON
S
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de
CV *100
qu tamao tiene con respecto a la media x
Tambin se la denomina variabilidad relativa.

Es frecuente mostrarla en porcentajes


Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad relativa)

Es una cantidad adimensional (independiente de las unidades de medida). Interesante


para comparar la variabilidad de diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms dispersin
en peso que en altura.

No debe usarse cuando para variables cuyo nivel de medicin es por intervalos, es decir,la
variable cuenta con un valor 0 fijado arbitrariamente.

Por ejemplo 0C 0F

Si la variable presenta valores negativos, al calcular el coeficiente de variacin de pearson los


habr que considerar como positivos
VARIABLES NORMALIZADAS O UNIDADES
TIPIFICADAS

VARIABLES NORMALIZADAS O UNIDADES TIPIFICADAS


Normal.............. |z| < 1
Anormal............ 1 < |z| < 2
Muy anormal...... |z| >=2

Variables normalizadas: nmero de unidades de desviacin tpica que


un individuo queda por encima o por debajo de la media del grupo.
Son unidades independientes de las unidades originales de medida
con lo cual facilitan enormemente la comparacin. til para comparar
un individuo respecto a los datos poblacionales a los que pertenece.
Las unidades Z se calculan: Z= x - x
S

S-ar putea să vă placă și