Sunteți pe pagina 1din 25

Estadstica

Al hacer
Un sondeo de opinin
El control de calidad de un artculo
Un estudio para conocer la efectividad de un
medicamento
Calcular la composicin futura de una poblacin
.... Estamos haciendo
Tipos de Estadstica
La Estadstica descriptiva o deductiva:
Trata del recuento, ordenacin y clasificacin de los
datos obtenidos de las observaciones:
Construccin de tablas, grficos y clculo de parmetros.
La Estadstica inferencial o inductiva:
Utiliza los resultados de la estadstica descriptiva y se
apoya en el clculo de probabilidades para la obtencin
de conclusiones sobre una poblacin a partir de los
resultados obtenidos de una muestra.
Poblacin, muestra y variable estadstica
Habitantes de una ciudad.
Televisores fabricados en una factora.
Alumnos de primero de bachillerato.
Color del pelo: negro, castao, rubio o pelirrojo
Sexo: hombre o mujer
Miembros asalariados de una familia: 0, 1 , 2 , 3 ,4 , 5
Alturas de alumnos:178, 169, 172, 183,
Variable estadstica: Cada uno de los rasgos o caractersticas que
se quiere estudiar de los elementos de la poblacin, susceptible o no
de medida.
Poblacin: Conjunto de elementos que se quiere estudiar.
Muestra: Cualquier subconjunto de una poblacin. El nmero de
elementos de una muestra se llama tamao.
Variables cualitativas y cuantitativas

vas Cuantitati
as Cualitativ
Variables

Continuas
Discretas
(modalidad)
(nmeros)
Poblacin: Alumnos de bachillerato de una localidad determinada
Nmero de hermanos
Nm.de suspensos en la 1 evaluacin
Nm de libros ledos trimestralmente
Num. de llamadas telefnicas diarias
Tiempo diario delante del televisor
Tiempo de estudio
Altura
Peso
Tiempo empleado en llamadas
Sexo
Modelo de zapatillas deportivas
Barrio de la localidad en que vive
Deporte preferido
(Recuentos)
(Cualquier
cantidad en
un intervalo)
Preferencias musicales de 120 alumnos
Frecuencias Frecuencias
Msica absolutas relativas
f
i
h
i
Clsica 1 0,008
Rock 36 0,300
Pop 49 0,408
Jazz 4 0,033
Flamenco 2 0,017
Techno 28 0,233
Sumas 120 1
Las frecuencias absolutas f
i
, i= 1,..., r, verifican:
I n
i
> 0 II n
1
+n
2
+n
3
+... +n
r
= N
Las frecuencias relativas h
i
, i= 1,..., r, verifican:
I h
i
> 0 II h
1
+h
2
+h
3
+... +h
r
= 1
Clase modal o moda
Variables cualitativas: Distribucin de frecuencias
Frecuencia absoluta del valor x
i
:
Nmero de veces que se repite.
Se representa por f
i
.
Frecuencia relativa del valor x
i
:
Cociente entre la frecuencia
absoluta de xi y el nmero total de
datos de la distribucin.
Se representa por h
i
.
Propiedades:
Variables cualitativas: Representacin grfica
Diagrama de Barras
Diagrama de Sectores
Sabores de refrescos preferidos por 50 personas
Clases Frecuencias Frecuencias
Refrescos absolutas: fi relativas: hi
Naranja 18 0,36
Limn 12 0,24
Pia 10 0,20
Manzana 10 0,20
Sumas 50 1
Sabores de refescos
0
2
4
6
8
10
12
14
16
18
20
Naranja Limn Pia Manzana
F
r
e
c
u
e
n
c
i
a
s
Naranja
36%
Limn
24%
Pia
20%
Manzana
20%
Naranja
Limn
Pia
Manzana
Variables cuantitativas discretas: Distribucin de frecuencias
Un profesor tiene anotadas en su cuaderno las notas
de 30 alumnos de un clase:
5 3 4 1 2 8
9 8 7 6 6 7
9 8 7 7 1 0
1 5 9 9 8 0
8 8 8 9 5 7
Tabla de Frecuencias
Notas Frec. Abs. Frec. Abs. Frec. Relat. Frec. Relat.
Acumuladas Acumuladas
xi fi Fi hi Hi
0 2 2 0,07 0,07
1 3 5 0,10 0,17
2 1 6 0,03 0,20
3 1 7 0,03 0,23
4 1 8 0,03 0,27
5 3 11 0,10 0,37
6 2 13 0,07 0,43
7 5 18 0,17 0,60
8 7 25 0,23 0,83
9 5 30 0,17 1,00
Suma 30 1
Frecuencia absoluta acumulada de xi: Suma de las frecuencias
absoluta de todos los valores anteriores a x
i
ms la frecuencia
absoluta de xi: F
i
=f
1
+f
2
+f
3
++f
1
Frecuencia relativa acumulada de x
i
: Cociente entre la
frecuencia absoluta acumulada de x
i
y el nmero total de datos:
H
i
= F
i
/N = h
1
+h
2
+h
3
++h
i
0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6 7 8 9
Notas de alumnos
N

m
e
r
o

d
e

a
l
u
m
n
o
s

(
F
r
e
c
.

a
b
s
o
l
u
t
a
s
)
Frecuencias absolutas
Diagrama de barras y polgono de
frecuencias
Frecuencias absolutas acumuladas
Diagrama de barras y polgono de
frecuencias
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9
Notas de alumnos
N


d
e

a
l
u
m
n
o
s

(
F
r
e
c
.

A
b
s
.

a
c
u
m
u
l
a
d
a
s
)
Agrupacin de datos
Si la variable es continua, o discreta con un nmero de datos muy grande, es aconsejable
agrupar los datos en CLASES.
Cul es el nmero idneo de clases?
El nmero clases debe ser aproximadamente igual a la raz cuadrada positiva del nmero de datos.
Cmo escoger las clases?
Es aconsejable que los lmites de clase (tanto el superior como el inferior) sean nmeros redondos,
como mltiplos de 5, 10,
Se debe procurar que todas las clases tengan la misma amplitud o tamao.
Los intervalos se deben construir de modo que el lmite superior de una clase coincida con el lmite
inferior de la siguiente.
Adoptaremos el criterio de que los intervalos sean cerrados por la izquierda y abiertos por la derecha.
Las edades de las personas que acuden al logopeda a lo
largo de un mes son:
3 2 11 13 4 3 2 4 5 6
7 3 4 5 3 2 5 6 27 15
4 21 12 4 3 6 29 13 6 17
6 13 6 5 12 26
Variables cuantitativas discretas: Datos agrupados
Como hay 36 datos, el nmero de clases que debemos
formar puede ser aproximadamente 6. Si el intervalo lo
extendemos desde 0 hasta 30, al dividir por 6 se tiene
que la amplitud de cada clase debe ser 5.
Histograma
Los rectngulos tienen como base
la longitud de los intervalos y
como altura la frecuencia absoluta
de cada intervalo
Los histogramas se utilizan
generalmente para
distribuciones de variable
continua o discreta con gran
nmero de datos y que se han
agrupado en clases.
Si los intervalos no son de
igual amplitud, la altura de los
rectngulos deben calcularse
teniendo en cuenta que sus
reas sean proporcionales a la
frecuencia de cada intervalo.
0 5
10 15 20 25 30
Clases Marcas
de clase
fi Fi hi Hi
[0,5) 2,5 13 13 0,36 0,36
[5,10) 7,5 11 24 0,31 0,67
[10,15) 12,5 6 30 0,17 0,83
[15,20) 17,5 2 32 0,06 0,89
[20,25) 22.5 1 33 0,03 0,92
[25,30) 27,5 3 36 0,08 1
Sumas 36 1
0
2
4
6
8
10
12
14
Edades
N


d
e

p
a
c
i
e
n
t
e
s
0 5 10 15 20 25 30
Variables cuantitativas: Medidas de posicin
N
x
N
x x ... x x x x
x
N
i
i
N N =
=
+ + + + + +
=
1 1 4 3 2 1
Media aritmtica
Si conocemos la frecuencia de cada uno de los datos:
1 1 2 2 3 3 1
.
. . . ... .
r
i i
r r i
x n
x n x n x n x n
x
N N
=
+ + + +
= =

Media aritmtica
Media aritmtica: Valor tal que si todos los N valores de la
variable tomaran dicho valor, sumaran lo mismo que suman
efectivamente. Se obtiene dividiendo la suma de todos los
valores de la variable entre el nmero de valores.
Las calificaciones en la asignatura de historia de los 40 alumnos
de una clase viene dada por la tabla:
Calificaciones 1 2 3 4 5 6 7 8 9
N de alumnos 2 2 4 5 8 9 3 4 3
Se ha aplicado un test sobre satisfaccin en el trabajo a 88
empleados de una fbrica, obtenindose las resultados:
Puntuaciones Nm. de trabajadores
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
Hoja de clculo
Hoja de clculo
Moda: Se llama moda de una variable estadstica al valor de
dicha variable que presenta mayor frecuencia absoluta. Se
representa por Mo.
Variables cuantitativas: Medidas de posicin
En el caso de datos agrupados en intervalos, es fcil determinar
la clase modal (clase con mayor frecuencia), pero el valor
dentro del intervalo se obtiene mediante la expresin:
2 1
1
.
D D
D
c L M
i o
+
+ =
L
i
= Lmite inferior de la clase modal
C = amplitud de los intervalos
D
1
= Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
anterior.
D
2
= Diferencia entre la frecuencia
absoluta de la clase modal y la
frecuencia absoluta de la clase
siguiente.
c
x c-x
D1
D2
Mo
Li
2 1
D
x c
D
x
=
2 1
1
1 1 2
1 1 2
) (
D D
D
c x
D c D D x
D x D c D x
+
=
= +
=
Clculo de la moda
Mediana: Se llama mediana de una variable estadstica a un
valor de la variable, tal que el nmero de observaciones
menores que l es igual al nmero de observaciones mayores
que l. Se representa por M.
Variables cuantitativas: Medidas de posicin
Datos simples:
Si el n de datos es impar, el valor central de la variable
es nico.
Si el n de datos es par, existen dos trminos centrales.
Se toma como valor de la mediana la semisuma de
estos dos valores.
Datos agrupados:
Se construye la tabla de frecuencias acumuladas. La
mediana es el primer valor de la variable cuya
frecuencia acumulada excede a la mitad del nmero de
datos.
Cuando la mitad del nmero de datos coincida con la
frecuencia acumulada de un valor, la mediana es la
semisuma entre ese valor y el siguiente de la tabla.
Clculo de la mediana
Variable estadstica discreta
Ejemplos
Clculo de la mediana (II)
Variable estadstica continua o discreta con datos agrupados
en intervalos
Para determinar la clase mediana se procede del mismo modo
que en el caso de variables discretas con datos no agrupados en
intervalos.
Para determinar el valor concreto de la variable que deja a su
izquierda igual nmero de datos que a su derecha, aplicamos la
frmula:
i
i
i
f
F
N
c L M
1
2
.

+ =
L
i
= Lmite inferior de la clase modal
c = amplitud de los intervalos
N = Nmero total de datos
F
i-1
= Frecuencia absoluta acumulada
de la clase anterior a la clase
mediana.
F
i
= frecuencia absoluta de la clase
mediana.
Test sobre satisfaccin en el trabajo: N=88
Clases f
i
F
i
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30 < 44
55 > 44
73
82
88
Clase mediana:
[56-62)
36 . 3
25
14
6 = = x
M=56+3.36=59.36
x
14
6
25
=
Aplicando la frmula:
L
i
= 56
c = 6
N/2 = 44
F
i-1
= 30
f
i
= 25
36 . 59
25
30 44
6 56 =

+ = M
6
14
x
25
56
62
50
M
Mtodo grfico para el clculo de la mediana
1. Representamos el histograma de frecuencias acumuladas porcentuales
2. Trazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores
derechos de los rectngulos del histograma.
3. Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia
acumulada del 50%.
Cuantiles: La mediana divide los datos de la distribucin en dos
partes iguales.
Podemos estudiar otros parmetros que dividan la distribucin de
datos en otras proporciones.
Variables cuantitativas: Medidas de posicin
Los cuartilesson tres valores que dividen la distribucin de
datos en 4 partes iguales, dejando debajo de ellos el 25%, el 50
% y el 75 % de los datos respectivamente.
Se representan por Q1, Q2 y Q3.
0
100%
25% 50%
75%
Q1 Q2
Q3
Los quintiles son cuatro valores que dividen la distribucin de
datos en 5 partes iguales, dejando debajo de ellos el 20%, el 40 %,
60% y el 80 % de los datos respectivamente.
Se representan por K
1
, K
2
, K
3
y K
4
.
0
100%
20%
40%
K
1
K
2
K
4
80% 60%
K
3
Los deciles son nueve valores que dividen la distribucin de datos
en 10 partes iguales, dejando debajo de ellos el 10%, el 20 %,
30%, , y el 90 % de los datos respectivamente.
Se representan por D
1
, D
2
, D
3
,., D
9
.
Los percentiles son noventa y nueve valores que dividen la
distribucin de datos en 100 partes iguales, dejando debajo de
ellos el 1%, el 2 %, 30%, , y el 99 % de los datos
respectivamente.
Se representan por P
1
, P
2
, P
3
,., P
99
.
Las calificaciones en la asignatura de historia de los 40 alumnos
de una clase viene dada por la tabla:
Calificaciones 1 2 3 4 5 6 7 8 9
N de alumnos 2 2 4 5 8 9 3 4 3
Calcular los cuartiles primero y tercero y los percentiles de
orden 30 y 70
Xi fi Fi
1
2
3
4
5
6
7
8
9
2
2
4
5
8
9
3
4
3
2
4
8
13
21
30
33
37
40
Clculo de Q
1
N/4=10.
<10
>10
Q
1
=4
Clculo de Q
3
3.N/4=30
=30
Q
3
=6.5
Clculo de P
30
30.N/100=12
>12
P
30
=4
Clculo de P
70
70.N/100=28
>28
P
70
=6
<12
<28
Total = 40
Se ha aplicado un test sobre satisfaccin en el trabajo a 88
empleados de una fbrica, obtenindose las resultados:
Puntuaciones Nm. de trabajadores
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
Calcular: a) Los cuartiles primero y tercero.
b) Los percentiles de orden 40 y 90
Test sobre satisfaccin en el trabajo: N=88
Clases f
i
F
i
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55
73
82
88
Clase del primer
cuartil: [50-56)
8 . 2
15
7
6 = = x
M=50+2.8=52.8
x
7
6
15
=
Aplicando la frmula:
L
i
= 50
c = 6
N/4 = 22
F
i-1
= 15
f
i
= 15
8 . 52
15
15 22
6 50 =

+ = M
6
7
x
15
50
56
Q
1
deja la cuarta parte de la distribucin a su izquierda :N/4=22
<22
>22
Test sobre satisfaccin en el trabajo: N=88
Clases f
i
F
i
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55
73
82
88
Clase del tercer
cuartil: [62-68)
67 . 3
18
11
6 = = x
M=62+3.67=65.67
x
11
6
18
=
Aplicando la frmula:
L
i
= 62
c = 6
N/4 = 66
F
i-1
= 55
f
i
= 18
67 . 65
18
55 66
6 62 =

+ = M
6
11
x
18
62
68
Q
3
deja las tres cuartas partes de los datos a su izquierda :3.N/4=66
<66
>66
Test sobre satisfaccin en el trabajo: N=88
Clases f
i
F
i
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55
73
82
88
Clase de P
40
:
[56-62)
25 . 1
25
2 . 5
6 = = x
M=56+1.25=57.25
x
2 . 5
6
25
=
Aplicando la frmula:
L
i
= 56
c = 6
40.N/100 = 35.2
F
i-1
= 30
f
i
= 25
25 . 57
25
30 2 . 35
6 56 =

+ = M
6
5.2
x
25
56
62
P
40
deja el 40% de los datos a su izquierda :88.40/100=35.2
< 35.2
> 35.2
Test sobre satisfaccin en el trabajo: N=88
Clases f
i
F
i
[38-44)
[44-50)
[50-56)
[56-62)
[62-68)
[68-74)
[74-80)
7
8
15
25
18
9
6
7
15
30
55
73
82
88
Clase de P
90
:
[68-74)
13 . 4
9
2 . 6
6 = = x
M=68+4.13=72.13
x
2 . 6
6
9
=
Aplicando la frmula:
L
i
= 68
c = 6
90.N/100 = 79.2
F
i-1
= 73
f
i
= 9
13 . 72
9
73 2 . 79
6 68 =

+ = M
6
6.2
x
9
68
74
P
90
deja el 90% de los datos a su izquierda :88.90/100=79.2
< 79.2
> 79.2
Mtodo grfico para el clculo de los cuantiles
1. Representamos el histograma de frecuencias acumuladas porcentuales
2. Trazamos el polgono de frecuencias acumuladas, uniendo los vrtices superiores
derechos de los rectngulos del histograma.
3. Sobre el polgono determinamos el valor de la variable que corresponde a una frecuencia
acumulada correspondiente al cuantil deseado
0,00
10,00
20,00
30,00
40,00
50,00
60,00
70,00
80,00
90,00
100,00
41 47 53 59 65 71 77
Putuaciones
P
o
r
c
e
n
t
a
j
e
s
Q
1
P
40
Q
3
25%
75%

S-ar putea să vă placă și