Documente Academic
Documente Profesional
Documente Cultură
PRCTICA 1:
ESTADISTICA DESCRIPTIVA
Contenido:
1.
2.
3.
4.
5.
Nieves Martnez-Alzamora
Nieves Martnez-Alzamora
Como punto de partida, cumplimentaremos la encuesta para que los datos obtenidos puedan
servir de base para el prximo curso y nos ayudar a familiarizarnos con los items
Las respuestas de la encuesta sobre la que trabajaremos se encuentran almacenadas en el fichero
DATOSPRACT_GIB_P1.
Nieves Martnez-Alzamora
Aunque parece un tema exclusivamente terico, esta cuestin tendr una importante repercusin
en la seleccin del tratamiento a utilizar para estudiar los datos obtenidos. Tambin es
importante considerar cuantas respuestas diferentes es posible obtener en cada pregunta.
Sexo
Mes Nacimiento
Opinin poltica
Digito azar
Residencia
categrica
Transporte
categrica
Tiempo
cuantitativa continua
Problema
categrica=cualitativa
categrica
categrica
1. Tablas de frecuencias
Nieves Martnez-Alzamora
Valor
DESIG. SOCIAL
EDUCACION/SANIDAD
PARO
PERDIDA VALORES
Frecuencia
1
17
33
8
Frecuencia
Relativa
0,0169
0,2881
0,5593
0,1356
Frecuencia
Acumulada
1
18
51
59
Frecuencia
Rel. acum.
0,0169
0,3051
0,8644
1,0000
Nieves Martnez-Alzamora
Statgraphics: Para obtener el diagrama de barras para frecuencias relativas: pulsar el botn
derecho del ratn, elegir Opciones de Ventana y seleccionar frecuencias relativas.
Slo ha cambiado la escala pero la forma no
Diagrama de Barras de PROBLEMA
DESIG. SOCIAL
EDUCACION/SANIDAD
PARO
PERDIDA VALORES
0
10
20
frecuencia
30
40
DESIG. SOCIAL
EDUCACION/SANIDAD
PARO
PERDIDA VALORES
10
20
30
40
porcentaje
50
60
/**
{[}
{\}
{]}
{^}
{_}
{`}
Nieves Martnez-Alzamora
c) Obtener el diagrama de sectores o diagrama de tarta Qu relacin tiene con los diagramas de
barra? Qu ventaja presenta? Es equivalente a un diagrama de barras en frecuencia
relativa(porcentaje); pero la ventaja es que se visualiza mejor
Nieves Martnez-Alzamora
13,56%
28,81%
PROBLEMA
DESIG. SOCIAL
EDUCACION/SANIDAD
PARO
PERDIDA VALORES
55,93%
Nieves Martnez-Alzamora
b)Obtn la tabla de frecuencias de la variable PESO , como variable cuantitativa tal como se
indica en el recuadro
Statgraphics: Desplegar el men Describir, el submen Datos Numricos y elegir la opcin
Anlisis de una variable. Pulsar el icono que indica las subopciones del anlisis y seleccionar
Tabla de frecuencias. Para modificar el nmero o anchura de los intervalos que Statgraphics
hace por defecto, situarse sobre la tabla y con el botn derecho del ratn seleccionar Opciones
Ventana.
Clase
1
2
3
4
5
Lmite
Inferior
menor o igual
39,0
43,4444
47,8889
52,3333
56,7778
Lmite
Superior
39,0
43,4444
47,8889
52,3333
56,7778
61,2222
Punto Medio
41,2222
45,6667
50,1111
54,5556
59,0
Frecuencia
0
1
3
6
10
6
Frecuencia
Relativa
0,0000
0,0169
0,0508
0,1017
0,1695
0,1017
Frecuencia
Acumulada
0
1
4
10
20
26
Frecuencia
Rel. Acum.
0,0000
0,0169
0,0678
0,1695
0,3390
0,4407
Nieves Martnez-Alzamora
6
7
8
9
10
11
12
13
14
15
16
17
18
61,2222
65,6667
63,4444
65,6667
70,1111
67,8889
70,1111
74,5556
72,3333
74,5556
79,0
76,7778
79,0
83,4444
81,2222
83,4444
87,8889
85,6667
87,8889
92,3333
90,1111
92,3333
96,7778
94,5556
96,7778
101,222
99,0
101,222
105,667
103,444
105,667
110,111
107,889
110,111
114,556
112,333
114,556
119,0
116,778
mayor de
119,0
Media = 63,0678 Desviacin Estndar = 11,347
12
10
4
3
1
0
2
0
0
1
0
0
0
0
0,2034
0,1695
0,0678
0,0508
0,0169
0,0000
0,0339
0,0000
0,0000
0,0169
0,0000
0,0000
0,0000
0,0000
38
48
52
55
56
56
58
58
58
59
59
59
59
59
0,6441
0,8136
0,8814
0,9322
0,9492
0,9492
0,9831
0,9831
0,9831
1,0000
1,0000
1,0000
1,0000
1,0000
El StatAdvisor
Esta opcin ejecuta una tabulacin de frecuencias dividiendo el rango de PESO en intervalos del mismo ancho, y contando el
nmero de datos en cada intervalo. Las frecuencias muestran el nmero de datos en cada intervalo, mientras que las frecuencias
relativas muestran las proporciones en cada intervalo. Puede cambiarse la definicin de los intervalos pulsando el botn secundario
del ratn y seleccionando Opciones de Ventana. Pueden verse grficamente los resultados de la tabulacin seleccionando
Histograma de Frecuencias de la lista de Opciones Grficas.
c) Crees que los lmites de intervalo seleccionados por el Statgraphics son ptimos para
realizar comparaciones con otros grupos de alumnos? T que limites cogeras?
Frecuencia
0
1
4
12
9
12
10
7
1
0
1
1
0
1
0
10
Frecuencia
Relativa
0,0000
0,0169
0,0678
0,2034
0,1525
0,2034
0,1695
0,1186
0,0169
0,0000
0,0169
0,0169
0,0000
0,0169
0,0000
Frecuencia
Acumulada
0
1
5
17
26
38
48
55
56
56
57
58
58
59
59
Frecuencia
Rel. Acum.
0,0000
0,0169
0,0847
0,2881
0,4407
0,6441
0,8136
0,9322
0,9492
0,9492
0,9661
0,9831
0,9831
1,0000
1,0000
Nieves Martnez-Alzamora
Histograma
12
frecuencia
10
8
6
4
2
0
40
60
80
PESO
100
120
11
Nieves Martnez-Alzamora
Histograma
24
porcentaje
20
16
12
8
4
0
40
60
80
PESO
100
120
Histograma
24
porcentaje
20
16
12
8
4
0
40
60
80
PESO
12
100
120
Nieves Martnez-Alzamora
Histograma
100
porcentaje
80
60
40
20
0
40
60
80
PESO
13
100
120
Nieves Martnez-Alzamora
Las medidas de posicin, dispersin y forma nos proporcionan informacin acerca de la posicin
de los datos y su variabilidad y acerca de si el modelo normal ser adecuado para describir la
distribucin de la variable.
Forma sirve para saber si el modelo normal es adecuado
Statgraphics: Para obtener medidas de posicin y dispersin, desplegar el men Describir, el
submen Datos Numricos y elegir la opcin Anlisis de una variable. Pulsar el icono amarillo
de opciones de anlisis y seleccionar Resumen Estadstico y Percentiles.
Por defecto, Statgraphics mostrar algunas de las medidas definidas anteriormente. Si se desea
seleccionar otras medidas que no aparezcan de esta forma, nos situaremos sobre la ventana de
resultados y con el botn derecho del ratn seleccionaremos Opciones de Ventana. Aparecer un
cuadro de dilogo donde podemos elegir las medidas muestrales que queramos obtener.
a)Con los datos de la variable PESO, utilizar Statgraphics para hallar el valor de las
siguientes medidas de posicin:
Mnimo
Mximo
Media muestral ( x ) (promedio)
Primer cuartil (un 25% de los valores son inferiores)
Segundo cuartil (Mediana) (un 50% de los valores son inferiores)
Tercer cuartil (un 75% de los valores son inferiores)
Moda
14
Nieves Martnez-Alzamora
Resumen Estadstico para PESO
Recuento
59
Promedio
63,0678
Mediana
64,0
Moda
65,0
Mnimo
43,0
Mximo
105,0
Cuartil Inferior
55,0
Cuartil Superior 70,0
d)Qu medida de posicin utilizaras para PROBLEMA? Tendran sentido las medidas del
apartado a)? Por qu? La moda: me interesa saber cul ha respondido ms veces.
15
Nieves Martnez-Alzamora
16
Nieves Martnez-Alzamora
Coeff. of variation
Range
Interquartile range
17,9917%
62,0
15,0
a)Con los datos de la variable PESO, utilizar Statgraphics para estudiar si el modelo normal es
adecuado para describir la distribucin de esta variable:
b) Summary Statistics for PESO
Count
59
Skewness
1,08697
Stnd. skewness
3,40852
Kurtosis
2,4117
Stnd. kurtosis
3,78132
17
Nieves Martnez-Alzamora
Coeficiente de asimetra
Coeficiente de curtosis
Coeficiente de asimetra estandrizado
Coeficiente de curtosis estandarizado
4. Diagrama de box-whisker
El grfico de box-whisker permite analizar de un modo sencillo la posicin, dispersin, simetra y
presencia de datos anmalos en una distribucin. La sencillez de su construccin e interpretacin
facilita tambin la comparacin de distintas distribuciones.
Para su construccin es necesario localizar los valores mnimo y mximo de los datos y calcular
los cuartiles. Se dibuja una caja que se extiende entre el primer y el tercer cuartil. Su amplitud
es por tanto igual al recorrido intercuartlico y entre sus lmites se ubican un 50% de los datos
(los centrales). En el interior se traza una lnea vertical que corresponde a la mediana (segundo
cuartil) y una cruz que indica la media.
Cruz roja: media aritmtica;
Lnea en la caja: mediana
18
Nieves Martnez-Alzamora
Partiendo de cada lado de la caja se dibujan una lneas horizontales llamadas bigotes . El
bigote de la izquierda se extiende entre el valor mnimo y el primer cuartil 1 y el bigote de la
derecha entre el tercer cuartil y el valor mximo.
Aquellos valores extremos que difieren del cuartil ms prximo en ms de 1,5 veces la anchura
de la caja o recorrido intercuartlico se representan como puntos aislados por considerar que se
corresponden con datos anmalos
Comprabar si he introducido bien los datos
Observar la influencia de esos datos.
El bigote se detiene en el dato anterior al que supera 1,5*longitud caja
Para estudiar la simetra de la distribucin se comparan la media y la mediana o los cuartiles
Si la distancia del bigote izqdo. A la mediana es mayor que la distancia del
bigote dcho a la mediana presenta asimetra a izquierdas.
Ejercicio 6: Diagrama de box-whisker
Se han recogido datos sobre la presin mxima hasta la rotura de 100 botellas de agua mineral.
Los datos se encuentran en la variable PRESION.
a) Obtener y copiar el diagrama de box-whisker. Identifica utilizando el Localizador el valor
mnimo, el valor mximo, primer y tercer cuartil, media y mediana
Statgraphics: Para representar el grfico box-whisker, seleccionar con el botn de opciones
grficas del Statfolio la opcin Grfico de caja-bigotes. Recordar que utilizando el botn derecho
del ratn, en cualquier grafico podemos activar la funcin Localizar que nos ayudara a leer el
valor de la abscisa o de la ordenada en cualquier punto
Media: 1047.3
Mediana: 1066.25
Valor mximo: 1222
Valor mnimo: 810.1
Primer cuartil: 992.55
Tercer cuartil: 1114.1
19
Nieves Martnez-Alzamora
Re=Mx-Mn
RI=Q3-Q1
Recuento
Rango
Rango
intercuatlico
100
411,9
121,55
c) Es simtrica la distribucin?
20
Nieves Martnez-Alzamora
Recuento
Sesgo
Sesgo Estandarizado
100
-0,716774
-2,92622
ALTINT
150-160
160-170
170-180
180-190
190-200
Total
Count
6
28
17
7
1
59
Average
50,0
58,5
66,5294
81,7143
80,0
63,0678
Standard
Deviation
6,16441
6,28638
6,24618
13,2503
11,347
21
Nieves Martnez-Alzamora
Estadsticas de Resumen
Datos/Variable: PESO
ALTINT
150-160
160-170
170-180
180-190
190-200
Total
ALTINT
150-160
160-170
170-180
180-190
190-200
Total
Recuento
6
28
17
7
1
59
Promedio
50,0
58,5
66,5294
81,7143
80,0
63,0678
Desviacin
Estndar
6,16441
6,28638
6,24618
13,2503
Coeficiente
de Variacin
12,3288%
10,7459%
9,38859%
16,2154%
11,347
17,9917%
Mnimo
43,0
47,0
54,0
70,0
80,0
43,0
Mximo
60,0
70,0
75,0
105,0
80,0
105,0
Rango
17,0
23,0
21,0
35,0
0,0
62,0
Sesgo
Estandarizado
0,806838
0,511929
-0,549422
1,05899
3,40852
Curtosis
Estandarizada
0,0245152
-1,21078
-0,173863
-0,110438
3,78132
El StatAdvisor
Esta tabla presenta las estadsticas muestrales para los 5 niveles de ALTINT.
22
Nieves Martnez-Alzamora
Estadsticas de Resumen
Datos/Variable: TIEMPO
TRANSPORTE
ANDANDO
COCHE
COCHE AMIGO
MOTO/BICI
TRANSP.PUBLICO
Total
Recuento
21
9
4
4
21
59
Promedio
13,619
23,3333
26,25
15,75
37,619
24,6441
TRANSPORTE
ANDANDO
COCHE
COCHE AMIGO
MOTO/BICI
TRANSP.PUBLICO
Total
Sesgo
Estandarizado
0,887591
-0,131223
0,0493305
-0,928421
0,593221
3,44299
Desviacin
Estndar
5,14272
5,0
18,8746
5,67891
15,5418
15,0605
Coeficiente
de Variacin
37,7613%
21,4286%
71,9032%
36,0566%
41,3137%
61,1122%
Mnimo
6,0
15,0
10,0
8,0
10,0
6,0
Curtosis
Estandarizada
-0,362947
-0,393668
-2,3075
0,0629018
-0,765625
0,876548
23
Mximo
25,0
30,0
45,0
20,0
65,0
65,0
Rango
19,0
15,0
35,0
12,0
55,0
59,0