Sunteți pe pagina 1din 15

1

ESTADSTICA DESCRIPTIVA

A continuacin sern expuestas las definiciones y notaciones que vamos a utilizar en


estadstica descriptiva:

Frecuencia Absoluta: f i
Frecuencia Relativa: hi
Frecuencia Relativa Porcentual: hi %
Frecuencia Acumulada: Fi
Frecuencia Relativa Acumulada: H i
Frecuencia Porcentual Acumulada: H i %
LimiteInfe rior LimiteSupe rior
Marca de Clase ( X i ):
2
M N
Amplitud de Clase ( a ): M Mximo , N Mnimo
k
1) Nmero de Clases ( k ): k n n tamao de la muestra
Observacin: Esta regla es til cuando n 400 .

2) Nmero de Clases ( k ): 1 3,322 * log( n) (Regla de Sturges)


3) Nmero de Clases ( k ): log( n) / log( 2)

La estadstica descriptiva se divide en tres partes que sern expuestas a continuacin:

Representacin Grafica:

- Sectores Circulares.
- Histograma.
- Diagrama de Cajas.
- Barras.
- Puntos.
2

Medidas de Tendencia Central: Son un nmero entorno a que valor est concentrado el
resto de la muestra.

- Media Aritmtica.
- Moda: Es la variable de la muestra que ms se repite.
- Mediana: Es el valor que divide el conjunto de datos ordenados en dos partes
iguales.

Medidas de Dispersin: Cuan disperso estn los valores.

- Recorrido.
- Desviacin Estndar.
- Varianza.

Medidas de Posicin: Dividen la muestra en distintas partes iguales.

- Cuartiles: Dividen el conjunto de datos ordenados en 4 partes iguales.


- Deciles: Dividen el conjunto de datos ordenados en 10 partes iguales.
- Percentiles: Dividen el conjunto de datos ordenados en 100 partes iguales.

Frmulas de Medidas de Tendencia Central:

Media Aritmtica:

x Cuando sea para una muestra.


Cuando sea para una poblacin.

Datos no Agrupados Datos Agrupados


n n

X i
X X 2 X 3 ... X n X i * fi
X 1 * f1 X 2 * f 2 ... X n * f n
x i 1
1 x i 1

n n n n
X i : Marcas de Clases.
N

X i
f i : Frecuencias absolutas.
i 1

Moda: Es el valor que ms se repite en un grupo de nmeros dentro de una muestra.

Datos no Agrupados Datos Agrupados


No existe frmula para datos no agrupados, lo Los pasos son:
nico que hay que hacer es tomar la variable 1. Ubicar la mayor f i , para hallar el
con el valor que ms se repite. intervalo modal
3

2. Aplicar la frmula

i
Mo li *a
i s
li : Lmite inferior.
i : Es el valor que se obtiene de restar la
f mod al con la frecuencia anterior.
s : Es el valor que se obtiene de restar la
f mod al con la frecuencia siguiente.
a : Amplitud de Clase.

Consideraciones:

- Puede haber ms de una moda cuando dos o ms nmeros se repiten la misma


cantidad de veces. En este caso se estara hablando de una muestra multi-modal.
- No hay moda si ningn nmero se repite ms de una vez.

Mediana:

Datos no Agrupados Datos Agrupados


El valor de la mediana puede coincidir o no Los pasos son:
con un valor de la muestra, todo depende si el n
nmero de datos es par o impar. 3. Calcular:
2
4. Localizar ese valor en Fi , si no est
Los pasos son:
1. Organizar en orden ascendente los pasar al inmediato superior, con esto
datos. se haya el intervalo de la mediana.
2. Si el nmero de datos es impar, 5. Aplicar la formula sustituyendo los
valores correspondientes.
n 1
utilizamos la siguiente frmula:
2 n
Si el nmero de datos es par, la Fa
mediana ser el promedio aritmtico Me li 2 *a
de los dos valores que se encuentran f med
en la mitad de la muestra. li : Lmite inferior.
Fa : Frecuencia acumulada anterior.
f med : Frecuencia absoluta del intervalo de la
mediana.
a : Amplitud de Clase.

Frmulas de Medidas de Dispersin:

Recorrido: Es la diferencia entre el valor ms alto y el ms bajo observado.


4

R Xmximo Xmnimo

Desviacin tpica o estndar: Se define como la raz cuadrada positiva de la varianza.

S Cuando sea para una muestra.


Cuando sea para una poblacin.

Datos no Agrupados Datos Agrupados


n n

(X i X )2 (X i X )2 * fi
S i 1
S i 1

n 1 n 1

N N

( X i )2 (X i )2 * fi
i 1
i 1

N N

Consideraciones:

- La desviacin tpica de una constante es cero.


- Siempre es una cantidad positiva.
- La desviacin tpica del producto de una constante por una variable es igual al
producto de la constante por la desviacin tpica de la variable.

Varianza: Es la medida del cuadrado de la distancia promedio entre la media y cada


elemento de la poblacin.

S 2 Cuando sea para una muestra.


2 Cuando sea para una poblacin.

Datos no Agrupados Datos Agrupados


n n

(X i X )2 (X i X )2 * fi
S2 i 1
S2 i 1
n 1 n 1
N N

( X i )2 (X i )2 * fi
2 i 1
2 i 1

N N

Consideraciones:

- Cuando deseamos estimar la varianza de una poblacin, a partir de una muestra,


el error cometido es mucho menor si lo dividimos entre n 1 y no n .
5

Frmulas de Medidas de Posicin:

MEDIANA Q2 D5 P50

Anteriormente observamos la mediana con su respectiva medida de posicin. Adems


podemos denotar otros tipos de igualdades entre las diferentes medidas de posicin:

Cuartiles = Percentiles
Q1 P25
Q3 P75

Deciles = Percentiles
D1 P10 D6 P60
D2 P20 D7 P70
D3 P30 D8 P80
D4 P40 D9 P90

Datos no Agrupados Datos Agrupados


Los pasos son: Los pasos son:
1. Organizar en orden ascendente los n* p
datos. 1. Ubicar el resultado de en Fi
100
2. Calcular el ndice i: 2. Si no est el valor, se pasa al
inmediato superior.
p 3. Al ubicar el valor de Fi determinamos
i *n
100 el valor de donde se obtendrn los
p : Percentil que queremos hallar. datos para sustituir en la ecuacin.
n : Tamao de la muestra. 4. Aplicamos la frmula:

- Si i es entero el percentil es el n* p
promedio de los valores de los datos Fa
Pp li 100 *a
ubicados en los lugares i e i+1.
fp
- Si i no es entero el percentil se
redondea al valor entero inmediato li : Lmite inferior.
superior. Fa : Frecuencia acumulada anterior.
p : Percentil que queremos hallar.
n : Tamao de la muestra.
a : Amplitud de Clase.
f p : Frecuencia Absoluta del intervalo.
6

PROBLEMAS
Debemos destacar que los problemas expuestos en esta seccin son sacados de libros,
guas, internet o cualquier otra herramienta bibliogrfica.

Tabla de distribucin de frecuencias para datos sin agrupar:

1) (Prof. Jos Campos) Si en un examen de base de datos las notas fueron 7, 7, 7, 8, 9,


9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

Construimos la tabla de distribucin de frecuencias.

NOTAS Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta Relativa Acumulada Relativa Relativa Porcentual
Porcentual Acumulada Acumulada
7 3 3/16 =0,19 3 19 0,19 19
8 1 1/16 =0,06 4 6 0,25 25
9 3 3/16 =0,19 7 19 0,44 44
10 2 2/16 =0,125 9 12,5 0,565 56,5
11 4 4/16 =0,25 13 25 0,815 81,5
12 2 2/16 =0,125 15 12,5 0,94 94
14 1 1/16 =0,06 16 6 1 100
TOTAL 16 1 16 100 1 100

Clculo de Medidas de Tendencia Central para datos sin agrupar:

a. Media:

16

X i
7 7 7 8 9 9 9 10 10 11 11 11 11 12 12 14
x i 1

16 16

16

X i
158
x i 1
9,88
16 16

b. Mediana

Xn Xn
1 X 8 X 9 10 10
Par.- Me 2 2
10
2 2 2
7

c. Moda

La moda es: Mo 11

Clculo de Medidas de Dispersin para datos sin agrupar:

a. Recorrido

R Xmximo Xmnimo 14 7 7

b. Desviacin tpica o estndar

(X i X )2
S i 1

n 1

[3 * (7 9,88) 2 ] (8 9,88) 2 [3 * (9 9,88) 2 ] [2 * (10 9,88) 2 ] [4 * (11 9,88) 2 ]


[2 * (12 9,88) 2 (14 9,88) 2
S
15

24,88 3,53 2,32 0,03 5,02 8,99 16,97 61,74


S 4,116 2,029
15 15

c. Varianza

V S 2 4,116

Tabla de distribucin de frecuencias para datos agrupados:

2) (Prof. Jos Campos) Si en un examen de base de datos las notas fueron 7, 7, 7, 8, 9,


9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

- Para construir la tabla de distribucin de frecuencias (datos agrupados):

1) Ordeno los datos en forma ascendente.


2) Busco n .
3) Busco el nmero de clases k .
8

4) Busco la amplitud de la clase a .

1) Ordeno los datos en forma ascendente:

7, 7, 7, 8, 9, 9, 9, 10, 10, 11, 11, 11, 11, 12, 12, 14.

2) Buscamos n :

n 16

3) Buscamos el nmero de clases k .

k 16 4

4) Buscamos la amplitud de la clase a .


14 7 7
a 1,75 2
4 4

Construimos la tabla de distribucin de frecuencias.

NOTAS Frecuencia Marca Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta de Clase Relativa Acumulada Relativa Relativa Porcentual
Porcentual Acumulada Acumulada
[7-9) 4 8 4/16 = 0,25 4 25 0,25 25
[9-11) 5 10 5/16 = 0,31 9 31 0,56 56
[11-13) 6 12 6/16 = 0,38 15 38 0,94 94
[13-15) 1 14 1/16 = 0,06 16 6 1 100
TOTAL 16 1 16 100 1 100

Clculo de Medidas de Tendencia Central para datos agrupados:

a. Media:

16

X i * fi
8 * 4 10 * 5 12 * 6 1 *14 168
x i 1
10,5
16 16 16

El valor anterior es un estimado de la media ya que al agrupar las clases no conocemos


el verdadero valor de cada individuo de la muestra, se renuncia a la exactitud por la
comodidad de los clculos.

b. Mediana
9

n 16
Calcular: 8
2 2

Como no se encuentra 8 en la frecuencia acumulada, se toma el inmediato superior, que en este


caso vendra siendo 9.

84
Me 9 * 2 10,6
5

c. Moda

65
Mo 11 * 2 11,333
(6 5) (6 1)

Clculo de Medidas de Dispersin para datos agrupados:

a. Recorrido

R Xmximo Xmnimo 14 7 7

b. Desviacin tpica o estndar

(X i X )2 * fi
S i 1

n 1

[(8 10,5) 2 * 4] [(10 10,5) 2 * 5] [(12 10,5) 2 * 6] [(14 10,5) 2 *1]


S
15

25 1,25 13,5 12,25 52


S 3,467 1,862
15 15

c. Varianza

V S 2 3,467

3) (Prof. Jos Campos) Un investigador desea determinar cmo varan las estaturas de
las obreras de una empresa y toma una muestra de 50 mujeres para registrar luego sus
estaturas en pulgadas. Los datos obtenidos fueron los siguientes:
10

65 63 65 63 69 67 53 58 60 61
64 65 64 72 68 66 55 57 60 62
64 65 64 71 68 66 56 59 61 62
63 65 63 70 67 66 57 59 61 62
64 64 63 69 67 66 58 60 61 62

- Para construir la tabla de distribucin de frecuencias (datos agrupados):

5) Ordeno los datos en forma ascendente.


6) Busco n .
7) Busco el nmero de clases k .
8) Busco la amplitud de la clase a .

1) Ordeno los datos en forma ascendente:

53, 55, 56, 57, 57, 58, 58, 59, 59, 60, 60, 60, 61, 61, 61, 61, 62, 62, 62, 62, 63, 63, 63, 63,
63, 64, 64, 64, 64, 64, 64, 65, 65, 65, 65, 65, 66, 66, 66, 66, 67, 67, 67, 68, 68, 69, 69, 70,
71, 72.

2) Buscamos n :

n 50

3) Buscamos el nmero de clases k .

k 50 7,071 7

4) Buscamos la amplitud de la clase a .


72 53 19
a 2,71 3
7 7

Construimos la tabla de distribucin de frecuencias.

ESTATURAS fi Xi hi Fi hi % Hi Hi %
[53-56) 2 54,5 0,04 2 4 0,04 4
[56-59) 5 57,5 0,1 7 10 0,14 14
[59-62) 9 60,5 0,18 16 18 0,32 32
[62-65) 15 63,5 0,3 31 30 0,62 62**
[65-68) 12 66,5 0,24 43 24* 0,86 86
[68-71) 5 69,5 0,1 48 10 0,96 96
[71-74) 2 72,5 0,04 50 4 1 100
TOTAL 50 1 50 100 1 100
11

Interpretacin

* El 24% de las obreras tienen una estatura mayor de 65 y menor de 68 pulgadas.

** El 62% de las obreras tienen una estatura menor de 65 pulgadas.

a. Media:

50

X i * fi
54,5 * 2 57,5 * 5 60,5 * 9 63,5 *15 66,5 *12 69,5 * 5 72,5 * 2 3184
x i 1
63,68
50 50 50

Las obreras en promedio tienen una estatura de 63,68 pulgadas

b. Mediana

n 50
Calcular: 25
2 2

Como no se encuentra 25 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendra siendo 31.

25 16
Me 62 * 3 63,8
15

El 50% de las obreras tienen una estatura igual o inferior a 63,68 aproximadamente.

c. Moda

15 9
Mo 62 * 3 64
(15 9) (15 12)

La mayora de las obreras tienen una estatura de 64 pulgadas aproximadamente.

d. Recorrido

R Xmximo Xmnimo 72 53 19
12

e. Desviacin tpica o estndar

[(54,5 63,68) 2 * 2] [(57,5 63,68) 2 * 5] [(60,5 63,68) 2 * 9] [(63,5 63,68) 2 *15]


[(66,5 63,68) 2 *12] [(69,5 63,68) 2 * 5] [(72,5 63,68) 2 * 2]
S
49

871,38
S 17,783 4,217
49
f. Varianza

V S 2 17,783

4) (Prof. Jos Campos) La siguiente tabla representa la edad de los empleados que
trabajan en cierta empresa:

Edad N de Empleados
22-26) 12
26-30) 29
30-34) 27
34-38) 19
38-42) 16
42-46) 10
46-50) 7

Construimos la tabla de distribucin de frecuencias.

Edad fi Xi hi Fi hi % Hi Hi %
[22-26) 12 24 0,1 12 10 0,1 10
[26-30) 29 28 0,24 41 24 0,34 34
[30-34) 27 32 0,23 68 23 0,57 57
[34-38) 19 36 0,16 87 16 0,73 73
[38-42) 16 40 0,13 103 13 0,86 86
[42-46) 10 44 0,08 113 8 0,94 94
[46-50) 7 48 0,06 120 6 1 100
TOTAL 120 1 120 100 1 100
13

a. Edad ms frecuente:

29 12
Mo 26 * 4 29,58
(29 12) (29 27)

b. La edad que se encuentra justo en el 50% de la distribucin:

n 120
Calcular: 60
2 2

Como no se encuentra 60 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendra siendo 68.

60 41
Me 30 * 4 32,81
27

c. La edad mnima del 40% entre los mayores:

Calculamos el P60

120 * 60
72
100

Como no se encuentra 72 en la frecuencia acumulada, se toma el inmediato superior, que en


este caso vendra siendo 87.

120 * 60
68
P60 34 100 * 4 34,84
19

d. Porcentaje entre 28 y 40 aos:

Pp 28 Pp 40

( Pp li ) * f i ( Pp li ) * f i
Fa Fa
p a *100 p a *100
n n

(28 26) * 29 (40 38) *16


12 87
p 4 *100 22,08 p 4 *100 79,17
120 120
12

e. Desviacin tpica o estndar

[(54,5 63,68) 2 * 2] [(57,5 63,68) 2 * 5] [(60,5 63,68) 2 * 9] [(63,5 63,68) 2 *15]


[(66,5 63,68) 2 *12] [(69,5 63,68) 2 * 5] [(72,5 63,68) 2 * 2]
S
49

871,38
S 17,783 4,217
49
f. Varianza

V S 2 17,783

4) (Prof. Jos Campos) La siguiente tabla representa la edad de los empleados que
trabajan en cierta empresa:

Edad N de Empleados
22-26) 12
26-30) 29
30-34) 27
34-38) 19
38-42) 16
42-46) 10
46-50) 7

Construimos la tabla de distribucin de frecuencias.

Edad fi Xi hi Fi hi % Hi Hi %
[22-26) 12 24 0,1 12 10 0,1 10
[26-30) 29 28 0,24 41 24 0,34 34
[30-34) 27 32 0,23 68 23 0,57 57
[34-38) 19 36 0,16 87 16 0,73 73
[38-42) 16 40 0,13 103 13 0,86 86
[42-46) 10 44 0,08 113 8 0,94 94
[46-50) 7 48 0,06 120 6 1 100
TOTAL 120 1 120 100 1 100
15

g. Calcule el coeficiente de asimetra e interprete:

3 * ( x Med ) 3 * (33,87 32,81)


SK 0,47
S 6,72

La asimetra es positiva, lo que quiere decir, sesgo a la derecha.

h. Histograma:

35

30

25

20

15

10

0
[22-26) [26-30) [30-34) [34-38) [38-42) [42-46) [46-50)

S-ar putea să vă placă și