Documente Academic
Documente Profesional
Documente Cultură
ESTADISTICA DESCRIPTIVA
POR:
ERIKA FERNANDA AGUIRRE LASSO
PAULA ELIZABETH ESCOBAR
MICHAEL STEVEN HIDALGO
GRUPO
100105_206
TUTOR:
HAROLD EMILIO CABRERA MESA
INTRODUCCION
Los datos son la materia prima con que trabaja la estadstica, puesto que la
estadstica se ocupa de una gran cantidad de datos, debe primeramente definir de
cules datos se va a ocupar. El conjunto de datos de los cuales se ocupa un
determinado estudio estadstico se llama poblacin.
Ademas se Desarrolla competencias interpretativas y propositivas,
mediante anlisis de las medidas univariantes que permitan la solucin
de problemas. Se Calcula e interpreta adecuadamente las medidas
estadsticas univariantes y asocia sus resultados con posibles
alternativas de solucin al problema
JUSTIFICACION
Hay situaciones en las que no bastan las tablas y grficas, por esto en la
estadstica existen otras herramientas precisas, como son las medidas
estadsticas univariantes y bivariantes; las cuales permiten el estudio de una serie
de variables que se involucran en los clculos matemticos.
Con el siguiente trabajo queremos mostrar como se aplican estas herramientas en
la interpretacin de una investigacin acerca de un estudio de la poblacin, a partir
de una informacin previa.
OBJETIVOS
Xi (Materias
aprobadas
TOTAL
F
5
12
26
34
10
32
Fr
1/110=0,00
9
5/110=0,04
5
12/110=0,1
0
26/110=0,2
36
34/110=0,3
0
32/110=0,2
9
110
FA
FrA
1
0,009
0,054
18
0,154
44
0,39
78
0,69
110
%
0,009*100=
0,9
0,045*100=
4,5
0,10*100=1
0
0,236*100=
23,6
0,30*100=3
0
0,29*100=2
9
100%
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
110
110
110
Media = 8,66
Mediana
Me = n - Fk-1
2
= 110 - 18
* Ak+Lk =
Fk
2
44
* 1+8 = 55-18
*9 =0,84*9= 7,56
44
Me=12,78
Moda
Mo= 34 mayor nmero de frecuencia
D7= 7*(110)/ 10 = 77
El percentil 50, es aquel valor de la variable que supera al 50% de las observaciones,
Es decir que la posicin 55 representa el P50, por lo cual P50= 9. Este resultado
Indica que el 30% de los estudiantes de instituciones educativas pblicas y privadas
Del municipio de San Sebastin de Mariquita (Tolima) de los grados de bsica
Primaria, en el mes de septiembre de 2014 aprobaron 9 materias.
Variable discreta medidas univariantes de dispersion
Variable discreta: Materias aprobadas
Xi (Materias
aprobadas
FX2
FX
7,5
7,5
56,25
8,5
42,5
361,25
12
9,5
114
1083
26
10,5
273
2866,5
34
11,5
391
4496,5
10
32
12,5
400
5000
TOTAL
PUNTO
MEDIO
X
110
1228
13863,5
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
110
110
110
Media = 8,66
Varianza:
S2 = F * X2 - X2
n
110
Desviacin estndar
110
110
Coeficiente de varianza:
CV= S
X
Rango
R = Xmax Xmin =12,5-7,5=5
A= R / K=22/9= 2,4=3
CASO ESPECIAL:
R* = (A)(K)= 3*9=27
Calcular exceso:
Ra-Rn= 27-22=5
A=27/9=3
INTERVALO DE CLASE:
A-1=3-1=2
TABLA DE FRECUENCIAS
Xi (EDAD)
F
7
29
29
10
28
11
17
Fr
7/110=0,06
3
29/110=0,2
63
29/110=0,2
63
28/110=0,2
54
17/110=0,1
54
110
TOTAL
AMPLITUD=3
Poligono de frecuencia
Media Aritmtica
= FX
1009 =
9,17
FA
FrA
CLASE A-1=2 FX
0,063
7+2=9 49
36
0,326
29+2=31 232
65
0,589
29+2=31 261
93
0,843
28+2=30 280
110
17+2=19 187
1009
110
Media = 9,17
Mediana
Me = n - Fk-1
110 - 36
* Ak+Lk =
Fk
* 1+9 = 55-36
65
65
Me=2,9
Moda
Mo=
36
* 31+9 =
36+7
36
73
TIPO DE ASIMETRIA:
Asimetra negativa
Como la posicin del cuartil 1 es 27,5, su valor es el promedio de los datos veintisiete y
Veintiocho (revisamos la posicin N 27 y 28 en los datos de la variable), es decir, Q1
(10+8)/2 = 18/2 =9. Este resultado indica que el 97% de los estudiantes de instituciones
educativas pblicas y privadas del municipio de San Sebastin de Mariquita ( Tolima) de
los grados de bsica primaria, en el mes de septiembre de 2014 entre las edades de 7 y 9
aos.
Q2= 2*(110)/ 4 = 55
La posicin 55 dice que el cuartil 2 est ubicado al 50% del trayecto, (revisamos la posicin
N55 en los datos de la variable que estn organizados en forma ascendente), es decir, Q2 =
7. Este resultado indica que el 6,3% de los los estudiantes de instituciones educativas
pblicas y privadas del municipio de San Sebastin de Mariquita (Tolima) de los grados de
bsica primaria, en el mes de septiembre de 2014 estn entre las edad de 7aos.
Q3= 3*(110)/ 4 = 82,5
Como la posicin del cuartil 3 es 82,5, su valor es el promedio de los datos ochenta y dos y
Ochenta y tres (revisamos la posicin N 82 y 83 en los datos de la variable) es decir, Q3
(8+10)/2 =18/2 = 8. Este resultado indica que el 32% de los estudiantes de instituciones
educativas pblicas y privadas del municipio de San Sebastin de Mariquita ( Tolima) de
los grados de bsica primaria, en el mes de septiembre de 2014 estn entre la edad de 8
aos.
DECILES 5 y 7 PARA VARIABLE EDAD
D7= 7*(110)/ 10 = 77
El percentil 50, es aquel valor de la variable que supera al 50% de las observaciones,
Es decir que la posicin 55 representa el P50, por lo cual P50= 7. Este resultado
Indica que el 6,3% de los estudiantes de instituciones educativas pblicas y privadas
Del municipio de San Sebastin de Mariquita (Tolima) de los grados de bsica
Primaria, en el mes de septiembre de 2014 estn en la edad de los 7 aos.
Xi (EDAD)
TOTAL
PUNTO
MEDIO
X
FX2
FX
63
567
29
10
290
2900
29
11
319
3509
10
28
12
336
4032
11
17
13
221
2873
110
1229
13881
Media Aritmtica
= FX
1009 =
9,17
110
Media = 9,17
Varianza:
S2 = F * X2 - X2
n
= 110 * 72 - 9,172 =
110
Desviacin estndar
110
110
Coeficiente de varianza:
CV= S
X
Rango
R = Xmax Xmin =17-7= 10
CONCLUSIONES.
REFERENCIAS BIBLIOGRFICAS.
TRABAJO COLABORATIVO N 2
ESTADSTICA DESCRIPTIVA
PASO 1
1. Identificar las variables discretas dentro del problema de estudio y calcular las
medidas Univariantes de tendencia central ms adecuadas, a aquellas que
consideren sean relevantes para el problema de estudio.
Variables discretas del problema:
Estrato
Nmeros de textos escolares que posee en la casa.
Materias aprobadas.
Nmero de materias con desempeo bajo.
Nmero de materias con desempeo bsico.
FA
1
2
3
14
51
45
14
65
110
Media Aritmtica
= 1*14+2*51+3*45
= 14+102+135
110
110
251
= 2
110
Media = 2
Mediana
Me = n - Fk-1
2
= 110 - 14
* Ak+Lk =
Fk
* 1+2 =
51
51
Me=2,4
Moda
Mo= 51 mayor numero de frecuencia
55-14
FA
3
4
10
3
7
17
*3 =0,80*3= 2,4
6
7
8
9
10
11
12
13
14
15
18
20
22
23
25
28
30
35
40
7
7
13
3
10
1
18
3
3
6
3
7
1
4
2
1
1
2
1
24
31
44
47
57
58
76
79
82
88
91
98
99
103
105
106
107
109
110
Media Aritmtica
= 3*3+4*4+5*10+6*7+7*7+8*13+9*3+10*10+11*1+12*18+13*3+14*3+15*6+18*3
110
+20*7+22*1+23*4+25*2+28*1+30*1+35*2+40*1 = 9+16+50+42+49+104+27+100
110
+11+216+39+42+90+54+140+22+92+50+28+30+70+40 = 1321
110
Media = 12
Mediana
110
= 12
Me = n - Fk-1
2
= 110 - 47
* Ak+Lk =
Fk
* 1+10 = 55-47
57
57
Me= 1,54
Moda
Mo= 18 mayor nmero de frecuencia
FA
1
5
12
26
34
32
1
6
18
44
78
110
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
= 5+30+84+208+306+320 =
110
110
953
110
8,66
Media = 8,66
Mediana
Me = n - Fk-1
2
= 110 - 18
* Ak+Lk =
* 1+8 = 55-18
*9 =1,423*9= 12,80
Fk
26
26
Me=12,80
Moda
Mo= 34 mayor nmero de frecuencia
FA
32
34
26
12
5
1
32
66
92
104
109
110
Media Aritmtica
= 0*32+1*34+2*26+3*12+4*5+5*1
= 0+34+52+36+20+5 =
110
110
147
= 1,33
110
Media = 1,33
Mediana
Me = n - Fk-1
2
* Ak+Lk =
Fk
Me=2
= 110 - 32
Moda
2
66
* 1+1 = 55-32
34
*33 =0,676*= 2
FA
FR
3
33
39
22
9
3
1
3
36
75
97
106
109
110
2,72%
30%
35,45%
20%
8,18
2,72%
1%
Media Aritmtica
= 1*3+2*33+3*39+4*22+5*9+6*3+7*1
110
110
= 3,12
Media = 3,12
Mediana
Me = n - Fk-1
3+66+117+88+45+18+7 =
= 110 - 3
344
110
* Ak+Lk =
Fk
* 1+2 = 55-3
*3 =1,3*3= 4
36
39
Me=4
Moda
Mo= 39 mayor nmero de frecuencia
una tabla de
Xi (Materias
aprobadas
TOTAL
F
5
12
26
34
10
32
Fr
1/110=0,00
9
5/110=0,04
5
12/110=0,1
0
26/110=0,2
36
34/110=0,3
0
32/110=0,2
9
110
FA
FrA
1
0,009
0,054
18
0,154
44
0,39
78
0,69
110
%
0,009*100=
0,9
0,045*100=
4,5
0,10*100=1
0
0,236*100=
23,6
0,30*100=3
0
0,29*100=2
9
100%
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
110
110
110
Media = 8,66
Mediana
Me = n - Fk-1
2
= 110 - 18
* Ak+Lk =
Fk
2
44
* 1+8 = 55-18
44
Me=12,78
Moda
Mo= 34 mayor nmero de frecuencia
*9 =0,84*9= 7,56
D7= 7*(110)/ 10 = 77
El percentil 50, es aquel valor de la variable que supera al 50% de las observaciones,
Es decir que la posicin 55 representa el P50, por lo cual P50= 9. Este resultado
Indica que el 30% de los estudiantes de instituciones educativas pblicas y privadas
Del municipio de San Sebastin de Mariquita (Tolima) de los grados de bsica
Primaria, en el mes de septiembre de 2014 aprobaron 9 materias.
3. Elegir una variable Continua que sea representativa y siguiendo los lineamientos,
disear una tabla de frecuencia para datos agrupados, representarla grficamente
por medio de un histograma de frecuencias, un polgono de frecuencias, calcular
las medidas de tendencia central, determinar el tipo de asimetra, los cuartiles ,
deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados)
Variable continua: edad
Rango:
R = Xmax Xmin =29-7=22
A= R / K=22/9= 2,4=3
CASO ESPECIAL:
R* = (A)(K)= 3*9=27
Calcular exceso:
Ra-Rn= 27-22=5
A=27/9=3
INTERVALO DE CLASE:
A-1=3-1=2
TABLA DE FRECUENCIAS
Xi (EDAD)
F
7
29
29
10
28
11
17
Fr
7/110=0,06
3
29/110=0,2
63
29/110=0,2
63
28/110=0,2
54
17/110=0,1
54
110
TOTAL
AMPLITUD=3
Poligono de frecuencia
Media Aritmtica
= FX
1009 =
9,17
FA
FrA
CLASE A-1=2 FX
0,063
7+2=9 49
36
0,326
29+2=31 232
65
0,589
29+2=31 261
93
0,843
28+2=30 280
110
17+2=19 187
1009
110
Media = 9,17
Mediana
Me = n - Fk-1
110 - 36
* Ak+Lk =
Fk
* 1+9 = 55-36
65
65
Me=2,9
Moda
Mo=
36
* 31+9 =
36+7
36
73
TIPO DE ASIMETRIA:
Asimetra negativa
Como la posicin del cuartil 1 es 27,5, su valor es el promedio de los datos veintisiete y
Veintiocho (revisamos la posicin N 27 y 28 en los datos de la variable), es decir, Q1
(10+8)/2 = 18/2 =9. Este resultado indica que el 97% de los estudiantes de instituciones
educativas pblicas y privadas del municipio de San Sebastin de Mariquita ( Tolima) de
los grados de bsica primaria, en el mes de septiembre de 2014 entre las edades de 7 y 9
aos.
Q2= 2*(110)/ 4 = 55
La posicin 55 dice que el cuartil 2 est ubicado al 50% del trayecto, (revisamos la posicin
N55 en los datos de la variable que estn organizados en forma ascendente), es decir, Q2 =
7. Este resultado indica que el 6,3% de los los estudiantes de instituciones educativas
pblicas y privadas del municipio de San Sebastin de Mariquita (Tolima) de los grados de
bsica primaria, en el mes de septiembre de 2014 estn entre las edad de 7aos.
Q3= 3*(110)/ 4 = 82,5
Como la posicin del cuartil 3 es 82,5, su valor es el promedio de los datos ochenta y dos y
Ochenta y tres (revisamos la posicin N 82 y 83 en los datos de la variable) es decir, Q3
(8+10)/2 =18/2 = 8. Este resultado indica que el 32% de los estudiantes de instituciones
educativas pblicas y privadas del municipio de San Sebastin de Mariquita ( Tolima) de
los grados de bsica primaria, en el mes de septiembre de 2014 estn entre la edad de 8
aos.
DECILES 5 y 7 PARA VARIABLE EDAD
D7= 7*(110)/ 10 = 77
El percentil 50, es aquel valor de la variable que supera al 50% de las observaciones,
Es decir que la posicin 55 representa el P50, por lo cual P50= 7. Este resultado
Indica que el 6,3% de los estudiantes de instituciones educativas pblicas y privadas
Del municipio de San Sebastin de Mariquita (Tolima) de los grados de bsica
Primaria, en el mes de septiembre de 2014 estn en la edad de los 7 aos.
TRABAJO COLABORATIVO N 2
ESTADSTICA DESCRIPTIVA
PASO 2
Estrato
Nmero de Textos Escolares que posee en la casa
Materias Aprobadas
Nmero de materias con desempeo bajo
Nmero de materias con desempeo bsico.
1
2
3
TOTAL
14
51
45
110
Media Aritmtica
PUNTO
MEDIO
X
2
4
6
FX
FX2
28
204
270
502
56
816
1620
2492
X = 1*14+2*51+3*45
14+102+135
110
251
110
110
Media = 2
Varianza:
S2 = F * X2 - X2
n
= 110* 22
- 2 =
440
110
- 2 = 4 -2=2
110
Desviacin estndar
110
Coeficiente de varianza:
CV= S
Desviacin media:
110*0
110
Rango
R = Xmax Xmin =6-2=4
=0
= 2
F
3
4
10
7
7
13
3
10
1
18
3
3
6
3
7
1
4
2
1
1
2
1
110
PUNTO
MEDIO
X
21,5
22,5
23,5
24,5
25,5
26,5
27,5
28,5
29,5
30,5
31,5
32,5
33,5
34,5
35,5
36,5
37,5
38,5
39,5
40,5
41,5
42,5
FX
FX2
64,5
90
235
171,5
178,5
344,5
82,5
285
29,5
549
94,5
97,5
201
103,5
248,5
36,5
150
77
39,5
40,5
83
42,5
3244
1386,75
2025
5522,5
4201,75
4551,75
9129,25
2268,75
8122,5
870,25
16744,5
2976,75
3168,75
6733,5
3570,75
8821,75
1332,25
5625
2964,5
1560,25
1640,25
3444,5
1806,25
98467,5
Media Aritmtica
= 3*3+4*4+5*10+6*7+7*7+8*13+9*3+10*10+11*1+12*18+13*3+14*3+15*6+18*3
110
+20*7+22*1+23*4+25*2+28*1+30*1+35*2+40*1 = 9+16+50+42+49+104+27+100
110
+11+216+39+42+90+54+140+22+92+50+28+30+70+40 = 1321
110
110
= 12
Media = 12
Varianza:
S2 = F *X2 - X2
n
= 110- 102
- 24 =
110
110
Desviacin estndar
S = F * X2 - X2 = 110 . 102 - 24
n
Coeficiente de varianza:
*100% = 9,9 *100% =99,8
10
Desviacin media:
= 99,78 = 9,9
110
CV= S
110*9,5
110
12
Rango
R = Xmax Xmin =42,5-21,5= 21
= -2
INTERVALO
MATERIAS
APROBADAS
5
6
7
8
9
10
TOTAL
F
1
5
12
26
34
32
110
PUNTO
MEDIO
X
7,5
8,5
9,5
10,5
11,5
12,5
FX
FX2
7,5
42,5
114
273
391
400
1228
56,25
361,25
1083
2866,5
4496,5
5000
13863,5
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
= 5+30+84+208+306+320 =
110
110
8,66
Media = 8,66
Varianza:
S2 = F * X2 - X2
n
= 110 * 82 - 82 =
110
Desviacin estndar
110
Coeficiente de varianza:
CV= S
Desviacin media:
953
110
DM= F . X-X =
N
110*8-8=
110
110* 0
110
=0
Rango
R = Xmax Xmin =12,5-7,5=5
F
32
34
26
12
5
1
110
PUNTO
MEDIO
X
FX
80
119
117
66
32,5
7,5
422
2,5
3,5
4,5
5,5
6,5
7,5
FX2
200
416,5
526,5
363
211,25
56,25
1773,5
Media Aritmtica
= 0*32+1*34+2*26+3*12+4*5+5*1
110
= 0+34+52+36+20+5 =
110
147
110
Media = 1,33
Varianza:
S2 = F * X2 - X2
n
Desviacin estndar
110
= 1,33
110
110
1,33
Desviacin media:
Coeficiente de varianza:
CV= S
687,5
110*1,17 = 1,17
110
1,33
Rango
R = Xmax Xmin =7,5-2,5=5
F
3
33
39
22
9
3
1
110
PUNTO
MEDIO
X
4
5
6
7
8
9
10
FX
12
165
234
154
72
27
10
674
FX2
48
825
1404
1078
576
243
100
4274
Media Aritmtica
= 1*3+2*33+3*39+4*22+5*9+6*3+7*1
3+66+117+88+45+18+7 =
110
110
= 3,12
Media = 3,12
Varianza:
S2 = F * X2 - X2
n
= 110 * 42
- 3,122 = 1760
110
110
Desviacin estndar
S = F *X2 - X2 = 110 *4 2
n
- 3,122 = 1760
110
Desviacin media:
110
- 9,7 = 4 -9,7=-5,7
Coeficiente de varianza:
CV= S
Rango
R = Xmax Xmin =7,5-2,5=5
= 1,5
344
110
Xi (Materias
aprobadas
FX2
FX
7,5
7,5
56,25
8,5
42,5
361,25
12
9,5
114
1083
26
10,5
273
2866,5
34
11,5
391
4496,5
10
32
12,5
400
5000
TOTAL
PUNTO
MEDIO
X
110
1228
13863,5
Media Aritmtica
= 5*1+6*5+7*12+8*26+9*34+10*32
110
110
110
Media = 8,66
Varianza:
S2 = F * X2 - X2
n
110
Desviacin estndar
110
110
Coeficiente de varianza:
CV= S
7,5
Rango
R = Xmax Xmin =12,5-7,5=5
Xi (EDAD)
TOTAL
PUNTO
MEDIO
X
FX2
FX
63
567
29
10
290
2900
29
11
319
3509
10
28
12
336
4032
11
17
13
221
2873
110
1229
13881
Media Aritmtica
= FX
1009 =
9,17
110
Media = 9,17
Varianza:
S2 = F * X2 - X2
n
= 110 * 72 - 9,172 =
110
Desviacin estndar
110
110
Coeficiente de varianza:
CV= S
X
Rango
R = Xmax Xmin =17-7= 10