Sunteți pe pagina 1din 39

TEMA 1: VARIABLE ESTADSTICA

UNIDIMENSIONAL

BLOQUE I:
Anlisis Estadstico Unidimensional

NDICE
Tipos de frecuencias.
Caractersticas de una distribucin de frecuencias.
 Medidas de posicin.
 Medidas de dispersin.
 Medidas de forma.

Distribuciones de frecuencias: tipos de frecuencias

OBSERVACIONES
DE LA VARIABLE

DATOS

Recogida y Ordenacin de datos:


*Se realizan N observaciones de la variable X
*Se ordenan de menor a mayor
*Se construye la tabla de frecuencias

 TIPOS DE FRECUENCIAS
Frecuencia total

Frecuencia absoluta

ni

Frecuencia relativa

fi = ni / N

Frecuencia absoluta acumulada

Frecuencia relativa acumulada

N i = ni
x xi

Fi = Ni / N

Distribucin de frecuencias (xi; ni)

TIPOS DE FRECUENCIAS

Observaciones:
n

=N

Nn = N

fi = 1

Fn = 1

i =1

i =1

Recorrido : R = mx (xi) mn (xi)

Caractersticas de una distribucin de frecuencias

Resumen de la
informacin
contenida en la
tabla de
frecuencias

Caractersticas de una
distribucin de frecuencias:
Medidas de posicin
Medidas de dispersin
Medidas de forma

MEDIDAS DE POSICIN

DEDE
POSICIN
MEDIDAS
MEDIDAS
POSICIN

Central
Media aritmtica
Alpha-trimmed mean
Alpha-Winsorized mean
Media geomtrica
Media armnica
Mediana
Moda

No Central
Cuantiles:
Cuartil
Decil
Percentil

MEDIDAS DE POSICIN: CENTRAL


MEDIA ARTMTICA:

x1 n1 + x2 n2 + + xn nn 1
x=
=
N
N
Cuando la distribucin
est agrupada en
intervalos, utilizamos
las marcas de clase.

x = xi f i
i =1

x n
i =1

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:
La suma de las desviaciones de los valores de la variable respecto a
su media es cero .
n

(x
i =1

x ) ni = 0

( x x )n = x n x n
i =1

i =1

i i

i =1

= xN xN = 0

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:
La media de las desviaciones al cuadrado de los valores de la
variable respecto a una constante k se hace mnima cuando k =
. (Tma de Kning)

1
N
1
f (k ) =
N
1
f (k ) =
N

(x k)
i =1

ni = mnimo si k = x

2
(
x

k
)
ni
i
i =1
n

1
2( xi k ) ni (1) = 0

N
i =1

( x k )n
i =1

=0k =x

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:
Cambio de origen. Si a todos los valores de una variable se les
suma o resta una cantidad constante b, entonces su media
tambin queda aumentada o disminuida en esa cantidad.

xi yi = xi b y = x b
1
y=
N

1
yi ni =

N
i =1

1
(xi b)ni =

N
i =1

1
xi ni

N
i =1

bn
i =1

= x b

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:

Cambio de escala. Si se multiplican todos los valores de una


variable por una cantidad constante a, entonces su media
tambin queda multiplicada por a.

xi y i = axi y = ax
1
y=
N

1
yi ni =

N
i =1

1
(axi )ni =

N
i =1

1
axi ni = a

N
i =1

xn
i =1

i i

= ax

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:

Cambio de origen y escala

xi yi = axi b y = ax b

MEDIDAS DE POSICIN: CENTRAL


Propiedades de la media aritmtica:
Si se dividen los datos de la variable en varias partes y conocemos
la media aritmtica de cada parte, entonces se puede calcular la
media aritmtica del total de datos tratando a la media de cada
subconjunto como datos concretos.
p

xi

x1

xp

ni

x1

n1

...

...

xf

nf

...

...

xl

nl

...

...

xn

nn

k =1

N1

Np

=N

1 f

x = xi ni + ... + xi ni =
N i =1
i =l

xi ni
1
=
N1 i =1
+ ... + N p

N
N1

1
= (x1 N1 + ... + x p N p )
N

xi ni

=
i =l
Np

MEDIDAS DE POSICIN: CENTRAL


MEDIANA:
Es el valor central de la variable cuando los valores estn
ordenados de menor a mayor.
Ejemplo: 2,3,6,8,9,10,11,14,15

Me= 9

Ejemplo: 2,3,6,8,9,10,11,14

Me= (8+9)/2=85

MEDIDAS DE POSICIN: CENTRAL


MODA:
El valor de la variable con mayor frecuencia absoluta.
Clculo:
-Variable discreta: basta buscar el valor con mayor ni.
-Variable agrupada en intervalos:
* Misma amplitud: buscamos el intervalo modal con
la mayor frecuencia absoluta
* Distinta amplitud: buscamos el intervalo modal con la
mayor DENSIDAD de frecuencia

 MEDIDAS DE POSICIN: NO CENTRAL


CUARTILES:
Dividen la distribucin en cuatro partes; cada una contiene el 25%
de los datos:.
C1

C2

C3

DECILES:
Dividen la distribucin en diez partes; cada una contiene el 10%
de los datos.
D1 D2 D3 D4 D5 D6 D7 D8 D9
PERCENTILES:
Dividen la distribucin en cien partes; cada una contiene el 1%
de los datos.
P1 P2

P20

...

P50

...

P98 P99

MOMENTOS POTENCIALES
Momento de orden r respecto a un origen O:
n

ni
M r = ( xi O)
N
i =1
r

*momentos respecto al origen:


n

ni
a0 = x
=1
N
i =1
0
i

ni
a 1= x
=x
N
i =1
1
i

ni
a2= x
N
i =1
2
i

ar =

r
i

ni
N

*momentos respecto a la media o centrales:

ni
m r = ( xi x )
N
r

m0= 1
m1= 0
m2= a2-a12

m3 = a3 3a 2 a1 + 2 a13
m 4 = a 4 4 a3 a1 + 6 a 2 a12 3a14

MEDIDAS DE DISPERSIN

MEDIDAS DE DISPERSIN
DISPERSIN:: Cuanto ms agrupados estn los
valores alrededor de la media, ms representativa ser, y menos
cuanto ms dispersos estn.

EJEMPLO: Salarios de la poblacin en dos pases

xA

xB

La media de la segunda distribucin es ms representativa


porque los datos estn ms agrupados respecto a ella.

VARIANZA:

1
2
S =
N

( xi x )
i =1

ni

A mayor valor de la varianza, mayor dispersin y por tanto


menor representatividad de la media aritmtica entre el
conjunto de los datos.
Nota: La varianza viene medida en las unidades
de la variable al cuadrado.

Propiedades de la varianza:

S2 0
2

n
n
2
2 i
2 ni
i
S X = xi xi = xi x 2 = a2 a12
N i=1 N i=1 N
i =1
n

Podemos conocer la varianza de un conjunto de datos conociendo la de


distintos subconjuntos.

S x2

S X2

(
S
=

2
1

+x

2
1

)N

+ + (S

2
k

+x

2
k

)N

N
k

k
N
2
2 Ni
i
= Si
+ ( xi x )
N i =1
N
i =1

V. Intragurpos

V. Intergurpos

x N + xk N k
1 1

Propiedades de la varianza:

La varianza no vara ante cambios de origen.

xi yi = xi b S y2 = S x2
n

S = ( yi y )
2
y

i =1

ni
ni
= [( xi b ) ( x b )]
=
N i =1
N

= (xi x )
i =1

ni
= S x2
N

Propiedades de la varianza:

Ante un cambio de escala, la varianza queda multiplicada por


el cuadrado de la constante.

xi yi = axi S = a S
2
y

S = ( yi y )
2
y

=a

(x x )
i =1

2
x

ni
ni
= (axi ax )
=
N i =1
N

i =1

ni
= a 2 S x2
N

DESVIACIN TPICA

S =+ S

Nota: La desviacin tpica viene medida en las


mismas unidades de la variable.

Propiedades:
1. Es no negativa
2. Es tambin una medida de dispersin ptima.
3. Se calcula como

S = a2 a

2
1

4. Tampoco le afectan los cambios de origen.


5. Tambin le afectan los cambios de escala.

Sy = a Sx

Teorema de Tchevichev
 Al menos las tres cuartas partes de las observaciones estn entre la
media y mas/menos 2 desviaciones tpicas
 Al menos las el 90% de las observaciones estn entre la media y
mas/menos 3 desviaciones tpicas
 Si la distribucin de las observaciones es campaniforme,
aproximadamente el 68% de las observaciones estn entre la media y
mas/menos una desviacin tpica (no demostrable)

 MEDIDAS DE DISPERSIN: RELATIVAS


Medidas de dispersin relativas: Permiten comparar la
dispersin de dos distribuciones al carecer de unidades.
COEFICIENTE DE VARIACIN DE PEARSON

S
CV =
x
*Si CV es alto, X est muy dispersa, luego la media no es representativa.
*Si CV es bajo, X no est muy dispersa, luego la media s es representativa.

TIPIFICACIN DE UNA VARIABLE:

xi x
zi =
Sx

z =0
Sz = 1

EJEMPLO:
Comparar la posicin relativa de un individuo en tres pruebas:
1. Puntuacin = 5,5

Media = 6

Desviacin tpica = 1,5

2. Puntuacin = 6,5

Media = 7

Desviacin tpica = 0,5

3. Puntuacin = 5

Media = 4

Desviacin tpica = 1,5

z1= -0,3333

z2 = - 1

z3= 0,6666

MEDIDAS DE FORMA:
Asimetra y Curtosis

 MEDIDAS DE FORMA: ASIMETRA


Es una medida de forma que mide el grado de asimetra de la
grfica respecto a la recta vertical x = x .

Distribucin simtrica

Distribucin asimtrica
positiva

Distribucin asimtrica
negativa

Asimetra

Utilizamos el momento de orden 3 respecto a la media:


n

ni
m3 = ( xi x )
N
i =1
3

Donde:

si m3 = 0 la distribucin es simtrica
si m3 > 0 la distribucin es asimtrica positiva
si m3 < 0 la distribucin es asimtrica negativa

Coeficiente de asimetra de Fisher:

m3
g1 = 3
S
m3 = a3 3a 2 a1 + 2a

3
1

 MEDIDAS DE FORMA: CURTOSIS


Leptocrtica

Mesocrtica

Platicrtica

Las medidas de curtosis estudian la altura de la grfica, es decir, la


mayor o menor concentracin de datos alrededor de la media.

Curtosis
Se compara la representacin grfica de la variable en
estudio con la de la distribucin normal:

f ( x) =

1
S 2

1 ( x x )

2 S2

As, una distribucin es leptocrtica si es ms apuntada que la


normal, platicrtica si tiene menos altura central y mesocrtica si
es igual.

Caracterstica de la normal:

m 4 = 3S
4

m4
S

=3

m 4 = a 4 4 a3 a1 + 6 a 2 a12 3a14
Por tanto:

g2 =

m4

S
g2 > 0
g2 < 0

3 = 0

mesocrtica

leptocrtica
platicrtica

S-ar putea să vă placă și