Sunteți pe pagina 1din 33

Anlisis de datos 1.

DESCRIPCION

La Estadstica trata del recuento, la


ordenacin y clasificacin de datos obtenidos
por las observaciones, para poder hacer
comparaciones y sacar conclusiones.
Un estudio estadstico consta de las
siguientes fases:
a) Recogida de datos
b) Organizacin y representacin de datos
c) Anlisis descriptivo de datos (y luego
anlisis inferencial)
d) Obtencin de conclusiones

PASO 1: RECOGIDA DE DATOS


Planteado el test o encuesta oportuno, una vez elegido
el tema al que se quiere hacer el estudio estadstico, y
recogidos los datos que correspondan, el primer anlisis
que realizaremos es el del tipo de variable que
pretendemos estudiar (Cualitativa o Cuantitativa;
Discreta o Continua).
Esto condicionar en gran medida su posterior
tratamiento.

PASO 2: ORGANIZACIN DE
LOS DATOS
Determinado el modo de agrupamiento de las observaciones,
procedemos a su recuento, construyendo la tabla de
frecuencias.
Posteriormente podremos visualizar tales frecuencias de forma
grfica con el diagrama estadstico apropiado.
a) TABLA DE FRECUENCIAS (Tabla en APA)

b) GRFICOS (Figura en APA): diagrama de barras,


histograma, polgono de frecuencias, diagrama de
sectores, pictogramas, pirmides de poblacin,
climogramas, etc.

Recuento

TABLA DE FRECUENCIAS
Tabla de frecuencias es una ordenacin en forma de tabla de los datos
estadsticos, asignando a cada dato su frecuencia correspondiente.

Frecuencia absoluta es el nmero de veces que aparece un


determinado valor en un estudio estadstico. Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos,
que se representa por N.

Frecuencia relativa decimal es el cociente entre la frecuencia


absoluta de un determinado valor y el nmero total de datos.
Se representa por hi.

f
hi = i
N
La suma de las frecuencias relativas decimales es igual a 1.

Frecuencia relativa porcentual es la frecuencia relativa


decimal multiplicada por 100. Se puede expresar por %i
La suma de las frecuencias relativas porcentuales es 100.

%i =100hi
Frecuencias acumuladas
correspondientes
considerado.

es la suma de las frecuencias


de todos los valores inferiores o iguales al valor

Se representa por:

Fi la frecuencia absoluta acumulada


Hi la frecuencia relativa decimal acumulada
%Ai la frecuencia relativa porcentual acumulada
Para que tengan sentido los frecuencias acumuladas, los
valores de la variable deben estar ordenados.

TABLA DE FRECUENCIAS CON


VARIABLE CUANTITATIVA DISCRETA
Frecuenci
a
absoluta

Frecuencia
absoluta
acumulada

fi

DATOS

Frecuencia relativa
Decimal

Porcentual

Fi

hi = fi
N

%i =100hi

0,0150

48

54

95

xi

Frecuencia relativa
acumulada
Decimal

Porcentual

Hi

%Ai

1,5 %

0,0150

1,5 %

0,1200

12 %

0,1350

13,5 %

149

0,2375

23,75 %

0, 3725

37,25 %

105

254

0,2625

26,25 %

0,6350

63,50 %

87

341

0,2175

21,75 %

0,8525

85,25 %

10

59

400

0,1475

14,75 %

100 %

100 %

N = 400

TABLA DE FRECUENCIAS CON


VARIABLE CUANTITATIVA CONTINUA
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
[35, 40)
[40, 45)
[45, 50)

xi
2.5
7.5
12.5
17.5
22.5
27.5
32.5
37.5
42.5
47.5

fi
1
1
3
3
3
6
7
10
4
2
N = 40

Fi
1
2
5
8
11
17
24
34
38
40

hi
0.025
0.025
0.075
0.075
0.075
0.150
0.175
0.250
0.100
0.050
1

Hi
0.025
0.050
0.125
0.200
0.2775
0.425
0.600
0.850
0.950
1

%
2.5
2.5
7.5
7.5
7.5
15
17.5
25
10
5
100

%Ai
2.5
5
12.5
20
27.5
42.5
60
85
95
100

GRAFICAS ESTADISTICAS
LAS GRFICAS ESTADSTICAS
PERMITEN VISUALIZAR LA
INFORMACIN
CONTENIDA EN LAS TABLAS DE
MANERA RPIDA Y SENCILLA

DIAGRAMA DE BARRAS

HISTOGRAMA

EXISTEN MUCHOS TIPOS DE


GRFICAS ESTADSTICAS,
UNAS SE EMPLEAN CON
VARIABLES CUANTITATIVAS
Y OTRAS CON VARIABLES
CUALITATIVAS

Diagrama de barras se utiliza para de presentar datos

cualitativos o datos cuantitativos de tipo discreto.


Se representan sobre ejes de coordenadas, en el eje de abscisas
se colocan los valores de la variable, y sobre el eje de ordenadas
las frecuencias absolutas, relativas, porcentajes o frecuencias
acumuladas.
Los datos se representan mediante barras de una altura
proporcional a la frecuencia.

Grupo sanguneo
fi 10
9
8
7
6
5
4
3
2
1
0

Grupo
sanguneo

fi

AB

9
N = 20

AB

Histograma se utiliza para presentar datos cuantitativos de

tipo continuo.
Se representan sobre unos ejes de coordenadas, en el eje de
abscisas se colocan los intervalos de los valores de la variable, y
sobre el eje de ordenadas las frecuencias absolutas, relativas ,
porcentajes o frecuencias acumuladas.
Los datos se representan mediante barras pegadas unas a otras
de una altura proporcional a la frecuencia.

Puntuacin

Marca de
clase xi

fi

11-17

14

18-24

21

25-31

28

15

32-38

35

13

39-45

42

46-52

49

1
N = 40

Polgono de frecuencias se realiza para cualquier tipo

de variable. Es el polgono que se forma al unir los puntos


medios de las barras tanto en histogramas como en
diagramas de barras.

Diagrama de sectores es un grfico donde se suele


representar los porcentajes. Cada sector es proporcional al
porcentaje que representa. Los grados de cada sector es:

grados =360hi
Poblacin de la encuesta por edad
12 Aos

15%

6%

9%

13 Aos

21%

14 Aos

15%
15 Aos

15%

19%

16 Aos
17 Aos
18 Aos

Pictograma es un grfico con figuras

Pirmide de poblacin consiste en dos histogramas, uno para


hombres y otro para mujeres, correspondientes a habitantes de
una misma comunidad ms o menos extensa, repartidos por
edades.
Es til para estudiar su situacin demogrfica y buscar
explicaciones a situaciones presentes , pasadas y futuras.

Pirmide de poblacin Per 1900

Pirmide de poblacin Per 2005

PASO 3: ANALISIS DE DATOS

a)Descripcin de datos
b)Prueba de hiptesis

PASO 3: ANALISIS DE DATOS


Para este anlisis se utilizan los parmetros
estadsticos:
a) Medidas de centralizacin
MEDIA, MEDIANA y MODA
b) Medidas de dispersin
RECORRIDO, DESVIACIN MEDIA,.
c) Medidas de posicin
PERCENTILES y CUARTILES

Medidas de dispersin
RECORRIDO, DESVIACIN MEDIA,.

MEDIA ARITMTICA es el valor obtenido al sumar


todos los datos y dividir el resultado entre el nmero
total de datos.

Si los datos vienen agrupados en una tabla de frecuencias, la


expresin de la media es:

Evidentemente esta medida slo se puede hallar para variables


cuantitativas.

Ejemplo de clculo de media:


Si Ud. Conoce el tiempo que le lleva arreglarse por la
maanas, podr planear mejor su inicio del da y reducir
al mnimo cualquier retraso (o adelanto) para llegar a su
destino. A lo largo de 10 das hbiles consecutivos, Ud.
recaba los tiempos en minutos que le lleva arreglarse que
se muestran a continuacin.

Da

Tiempo 39 29
(min)

10

43

52

39

44

40

31

44

35

396
=
= 39.6
10

Ejemplo de clculo de media:


En un test realizado a un grupo de 42 personas se han
obtenido las puntuaciones que muestra la tabla. Calcula
la puntuacin media
xi

fi

xi fi

[10, 20)

15

15

[20, 30)

25

200

[30,40)

35

10

350

[40, 50)

45

405

[50, 60)

55

440

[60,70)

65

260

[70, 80)

75

150

42

1 820

MODA es el valor que tiene mayor frecuencia absoluta (Mo). Se


puede hallar para cualquier tipo de variable, aunque para variables
cuantitativas es poco til.

La moda de los tiempos en minutos que le lleva arreglarse que se


muestran a continuacin la distribucin:
Tiempo
(m)

29

31

35

39

39

40

43

44

44

52

Mo= 39, 44
Si en un grupo hay dos o varias puntuaciones con la misma
frecuencia y esa frecuencia es la mxima, la distribucin es
bimodal o multimodal, es decir, tiene varias modas.

MEDIANA es el valor que ocupa el lugar central de


todos los datos cuando stos estn ordenados de menor a
mayor (Me)

La mediana se puede hallar slo para variables cuantitativas.


Clculo de la mediana con pocos datos
1. Ordenamos los datos de menor a mayor.
2. Si la serie tiene un nmero impar de medidas la mediana es la
puntuacin central de la misma.
3. Si la serie tiene un nmero par de puntuaciones la mediana es
la media entre las dos puntuaciones centrales.
29, 31,35,39,39,40,43,44,44,52

Me= 39.5

Clculo de la mediana para datos agrupados

[60, 63)

fi

Fi

Se divide N entre dos para ver


dnde est el centro

100/2 = 50
[63, 66)

18

23

[66, 69)

42

65

[69, 72)

27

92

Se busca en la columna de Fi
dnde estara 50.
Luego el valor o intervalo
mediano ser:
Clase de la mediana: [66, 69)

[72, 75)

8
100

100

RELACIN ENTRE MEDIA Y MEDIANA


a) Si
b) Si

x=Me ,

la distribucin es completamente simtrica

los valores de

Me

son prximos, la distribucin es

aproximadamente simtrica.
c) Si los valores de

asimtrica

Me

son poco prximos, la distribucin es

ACTIVIDAD 1
a) A partir de las siguientes grficas realiza la tabla de frecuencias
y calcula
MEDIA, MEDIANA y MODA de cada una de las
distribuciones.
b) Indica tipo de variable y tipo de grfico en cada caso.
c) Indica cmo es simtricamente cada una de ellas.

Notas del control

Notas del control

Grupo A

Grupo B

2
1

0
1

10

10

ACTIVIDAD 2
En un restaurant se da a elegir a la clientela entre varios primeros
platos. El resultado de las distintas elecciones nos lo da el
siguiente grfico.

a) Indica tipo de variable, y tipo de grfica.


b) Sabiendo que se le ha preguntado a 240 personas, realiza la tabla
de frecuencias y calcula las medidas de centralizacin que ms
sentido tengan.

23%

10%

Espaguetis
22%

Cocido
Lentejas

15%

Gazpacho
30%

Paella

Medidas de dispersin
RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA

Recorrido es la diferencia entre los valores extremos, es decir, entre


el mayor valor y el menor
RECORRIDO = Valor mayor - Menor valor

Medidas de dispersin
RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA

VARIANZA
Es la suma de las diferencias con respecto a la media elevada al cuadrado
y dividida por el tamao de la muestra menos 1.

DESVIACION ESTANDAR
Es la raz cuadrada de la suma de los cuadrados de las diferencias con
respecto a la media dividida por el tamao de la muestra menos 1.

Medidas de dispersin
RECORRIDO O RANGO, VARIANZA, DESVIACIN TIPICA
Xi - X

Xi - X

29

-10.6

112.36

31

-8.6

73.96

35

-4.6

21.16

39

-0.6

0.36

39

-0.6

0.36

40

0.4

0.16

43

3.4

11.56

44

4.4

19.36

44

4.4

19.36

52

12.4

153.76

Media

39.6

Varianza

45.82

Desviacion tipica

6.77

Tiempo X

Los tiempos necesarios para arreglarse varia en 6.77 minutos de la media de 39.6; es
decir varia entre 32.83 y 46.37 minutos.
La varianza esta en minutos cuadrados.

Taller: Edad de los doctorandos

Elabore una tabla de frecuencia y


calcule la media aritmtica, mediana,
moda, varianza y desviacin tpica de
las edades de los estudiantes del IX
semestre de la FAE UNCP. Interprete
los resultados.

Ejemplo: Variable Calidad de servicio

Moda: 3.05
Media: 3.14
Mediana: 3.16
Desviacin estndar: 0.62
Punto ms alto observado (mximo): 5
Punto ms baja observada (mnimo): 1
Rango: 4

CALIDAD

PUNTAJE

EXCELENTE

BUENA

REGULAR

DEFICIENTE

MUY DEFICIENTE

Figura 6: Calidad de servicio en la administracin acadmica de la UNCP


Media (3. 14)
Moda (305)
1

Mediana (3.16)

Desviacin
estndar
(promedio de
desviacin)
0.62

Rango (4)

La calidad de los servicios administrativos en la UNCP es regular. La categora que ms se repiti fue 3.05.
Cincuenta por ciento de los sujetos est por encima del valor 3.16 y el restante cincuenta por ciento se sujeta por
debajo de este valor (mediana) en promedio los sujetos se ubican en 3.14 (favorable). Asimismo se desvan de
3.14, en promedio, 0.62 unidades de escala. Hay usuarios que calificaron la calidad como muy deficiente y otros
como excelente.

Contacto:
Espinozaisac@yahoo.es
Cel: 964913378
RPM: #961650207

http://www.youtube.com/watch?v=g4TFaDVwQvA&feature=related

S-ar putea să vă placă și