Sunteți pe pagina 1din 44

Estadística Descriptiva

Mg. Ing. Osmart Morales Chalco


Email: omorales16@hotmail.com
Contenido del Curso
I. Aspectos Generales de la Estadística e Informática

II Medidas de Tendencia Central

III. Medidas de Dispersion

.IV Analisis de Regresión y Correlación

.V Prueba de Hipótesis

VI Análisis estadístico Computacional


ESTADÍSTICA DESCRIPTIVA

Sesión 1:
ASPECTOS GENERALES DE LA ESTADÍSTICA E INFORMÁTICA

1. Introducción
Variables
Variable: Es una característica observable que varía entre los
diferentes individuos de una población.

Ejemplo: Edad, peso, género

Género, colores, distrito


de residencia, etc.
• Nominal
Cualitativa
• Ordinal
Grado de instrucción.

Variable
Temperatura, talla de ropa.
• Discreta
Cuantitativa
• Continua
Porcentaje de productos
defectuosos en un lote,
tasa de natalidad, etc.
Ejemplo de preguntas en un
cuestionario

1. Cargo:
1. Tesorero ( )
2. Contador ( )
3. Analista de Sistemas ( )
4. Asistente de Personal ( )
5. Administrador ( )

2. ¿Cuántos hijos tiene usted? _______

3. ¿Cuál es su remuneración mensual? _________


ESTADÍSTICA DESCRIPTIVA

Organización de
Información
INTRODUCCIÓN

Una vez recopilados los datos (población o


muestra), se obtiene datos en bruto, los cuales
rara vez son significativos sin organización ni
tabulación. A continuación presentamos el
procedimiento para organizar datos en una
tabla de distribución de frecuencias según el
tipo de variable.
Organización de los datos en
Tablas de Distribución de
Frecuencias

1. Para variables cualitativas


2. Para variables cuantitativas:
• Discretas
• Continuas
¿Qué es una Tabla de distribución
de frecuencia?

La tabla de distribución de frecuencias


constituye la agrupación de elementos que
tienen característica común. Estas tablas
presentan diversos tipos de frecuencias
(absolutas, relativas y acumuladas).
¿Qué es una Tabla de distribución
de frecuencia?

Categoría Frecuencia Frecuencia Frecuencia Frecuencia


Rango Absoluta Relativa Absoluta Relativa
Intervalos Acumulada Acumulada

fi hi Fi Hi

. n 100%

Total n 100%
¿Cuáles son los tipos de
frecuencias?

1. Frecuencia absoluta (Variables cualitativas y


cuantitativas)

Es el número de veces que se repite un determinado


valor de la variable; en el caso de intervalos es el
número de observaciones comprendido en dicho
intervalo. Se representa por fi con (i = 1,2,...,m)
donde m representa el número de valores distintos que
toma la variable o el número de intervalos. Para tabular
en forma manual las frecuencias o repeticiones, se usa
una rayita vertical (/) que se va agrupando cada cinco
casos.
¿Cuáles son los tipos de
frecuencias?

2. Frecuencia Relativas (Variables cualitativas y


cuantitativas)
Es el cociente fi/n se representa por hi% con i = 1,2,.....m.

fi Frecuencia absoluta
hi % = --- = -----------------------------* 100
n número de observaciones
¿Cuáles son los tipos de
frecuencias?

3. Frecuencia absoluta acumulada (Variables cuantitativas)

Resulta de acumular sucesivamente las frecuencias absolutas, se


representa por Fi (i = 1,2,...,m)
donde:
F1 = f1
F2 = f1 + f2 = F1 + f2
F3 = f1 + f2 + f3 = F2 + f3
.
.
.
Fm = f1 + f2 + f3 + ... + fm = Fm-1 + fm
¿Cuáles son los tipos de
frecuencias?

4. Frecuencia relativa acumulada (Variables cuantitativas)

Resulta de acumular sucesivamente las frecuencias relativas, se


representa por Hi (i = 1,2,...,m)
donde:
H1 = h1
H2 = h1 + h2 = H1 + h2
H3 = h1 + h2 + h3 = H2 + h3
.
.
.
Hm = h1 + h2 + h3 + ... + hm = Hm-1 + hm
1. Tablas de distribución de frecuencias
para variables cualitativas

Una variable cualitativa es aquella que


expresa una cualidad, característica o
atributo, sus datos se expresan mediante
una palabra. Las tablas de frecuencias se
construyen contabilizando las veces que se
repite cada categoría o modalidad.
Ejemplo 1:
A continuación se presentan los datos
correspondientes a la variable cargo del
personal empleado de una empresa:
Trabajador Cargo Trabajador Cargo Trabajador Cargo
01 2 09 2 17 4
02 3 10 3 18 1
03 2 11 2 19 1
04 4 12 3 20 3
05 5 13 4 21 5
06 3 14 1 22 5
07 2 15 4 Leyenda:
1. Tesorero 2. Contador
08 1 16 2 3. Analista de Sistema
4. Asistente de Personal
5. Administrador
Tabla de distribución de frecuencias para la
variable Cargo
Lima. 2013
Ejemplo_clase.xls
Frecuencia Frecuencia
Absoluta Relativa
Categoría
fi hi
Tesorero 4 18.2%

Contador 6 27.3%
Analista de Sistema 5 22.7%
Asistente de Personal 4 18.2%
Administrador 3 13.6%
Total 22 100%
2. Tablas de distribución de frecuencias
para variables cuantitativas discretas

Una variable cuantitativa discreta, es


aquella variable que proviene de un
proceso de conteo.
Ejemplo 2:
A continuación se presentan los datos correspondientes a la
variable Número de hijos del personal empleado de una
empresa:

Trabajador Número Trabajador Número Trabajador Número


de hijos de hijos de hijos
01 1 09 2 17 2
02 2 10 3 18 2
03 3 11 3 19 5
04 3 12 3 20 1
05 2 13 2 21 1
06 5 14 1 22 1
07 2 15 2
08 1 16 5
Tabla de distribución de frecuencias para la
variable Número de Hijos
Lima. 2013
Ejemplo_clase.xls
Frecuencia Frecuencia Frecuencia Frecuencia
Rango Absoluta Relativa Absoluta Relativa
Acumulada Acumulada

fi hi Fi Hi
1 6 27.3% 6 27.3%

2 8 36.4% 14 63.7%

3 5 22.7% 19 86.4%

5 3 13.6% 22 100.0%

Total 22 100%
3. Tablas de distribución de frecuencias
para variables cuantitativas continuas

Una variable cuantitativa continua, es


aquella variable que proviene de un
proceso de medición.
Ejemplo 3:
A continuación se presentan los datos correspondientes a la
variable Remuneración mensual (S/.) del personal empleado
de una empresa:

Trabajador Remune Trabajador Remune Trabajador Remune


ración ración ración
01 1800 09 1780 17 1960.20
02 910 10 1880 18 978
03 1800 11 1820 19 897.5
04 1900 12 2000 20 2210.10
05 1440 13 2500 21 2540
06 3700 14 900 22 2480.20
07 1850 15 1850
08 890 16 2633.25
Ejemplo 3:
Identificamos:
1) Valor mínimo =890
Valor máximo = 3700
Como el recorrido es demasiado amplio, entonces se
construye intervalos, en estadística se trabaja con intervalos
semiabiertos [ >.
2) Se determina el número de intervalos con la regla de
Sturges:
m  1  3.322 log n

Para nuestro casos es:m = 1+3.322*log(22) =5.5 podemos


trabajar con 5 ó 6 intervalos

3) Se determina la amplitud del intervalo:


X max  X min
C
m
Ejemplo 3:
Para nuestro caso la amplitud es:

X max  X min 3700  890 2810


C    562
m 5 5

4) Construimos los 5 intervalos, comenzando por el valor


mínimo.

1) [890 – 1452>
2) [1452 – 2014>
3) [2014 – 2576>
4) [2576 – 3138>
5) [3138 - 3700]

5) Construimos la tabla de distribución de frecuencias


Tabla de distribución de frecuencias para la
variable Remuneración mensual
Lima. 2013
Ejemplo_clase.xls
Frecuencia Frecuencia Frecuencia Frecuencia
Absoluta Relativa Absoluta Relativa
Intervalos Acumulada Acumulada

fi hi Fi Hi
[890 – 1452> 6 27.3% 6 27.3%

[1452 – 2014> 10 45.5% 16 72.8%

[2014 – 2576> 4 18.2% 20 91.0%

[ 2576 – 3138> 1 4.5% 21 95.5%

[3138 – 3700] 1 4.5% 22 100%

Total 22 100%
Tabla Bidimensional (Doble entrada)

Categorías de la Categorías de la variable


variable 1 2 …
1
2
.
.
.

• Frecuencias observadas (absolutas).


• Frecuencias relativas con respecto al total general.
• Frecuencias relativas con respecto al total fila.
• Frecuencias relativas con respecto al total columna.
Ejemplo

Tabla de bidimensional para la variable nivel directivo según interés por los
temas ambientales para una muestra de directivos de grandes empresas.

Interés por los temas ambientales


Gran
Nivel directivo Sin interés Algo interés preocupación

Gerencia superior 15 13 12
Gerencia media 20 15 21
Supervisor 7 7 6
ESTADÍSTICA DESCRIPTIVA

Presentación gráfica
de los datos
ESTADÍSTICA DESCRIPTIVA

Gráficos para datos


agrupados en tablas de
distribución de frecuencias
1. Gráficos para variables cualitativas

Administrador

Gráfico
14%
Tesorero
18%

Asistente de
Personal
Circular
18%

Contador
Analista de 27%
Sistemas
23%

Gráfico de 100.00%

Barras
80.00%

60.00%

40.00%
27.27%
22.73%
18.18% 18.18%
20.00% 13.64%

0.00%
Tesorero Contador Analista de Asistente de
Sistemas Personal Administrador
Las gráfica para variables cuantitativas,
permiten identificar la forma de distribución
2. Gráficos para variables cuantitativas
Discretas

Diagrama para la variable Número de hijos Gráfico de


100.0% Barras
Frecuencias

80.0%
Relativas

60.0%
36.4%
40.0% 27.3% 22.7%
13.6%
20.0%
0.0%
1 2 3 5
Número de hijos
3. Gráficos para variables cuantitativas
Continuas
Histigrama para la variable Remuneración

12
Frecuencias Absolutas

Histogramas
10
8
6
4
2
0
[890 – 1452> [1452 – 2014> [2014 – 2576> [ 2576 – 3138> [3138 – 3700]
Intervalos

Polígono para la variable Remuneración

Polígonos Frecuencias Absolutas


12
10
8
6
4
2
0
0 1000 2000 3000 4000 5000
Marca de Clase
ESTADÍSTICA DESCRIPTIVA

Gráficos para datos no


agrupados
Gráfico de dispersión
Analiza la relación existente entre las variables

FUERTE POSITIVA
FUERTE NEGATIVA
60

50 50
Variab le B

40
40
30

Va ria ble B
30
20

10 20

0 10
0 10 20 30 40 50 60

Variable A 0
0 10 20 30 40 50
SIN CORRELACIÓN
Variable A

60

50
Variable B

40

30

20

10

0
0 10 20 30 40 50 60

Variable A
Ejemplo:

Analizar la relación entre la edad y el tiempo de servicio de


15 trabajadores, contando con la siguiente información:
Trabajador Edad Tiempo Trabajador Edad Tiempo
de de
servicio servicio
1 48 24 9 34 10
2 40 18 10 46 20
3 30 9 11 32 12
4 39 14 12 42 18
5 46 22 13 40 16
6 42 22 14 32 8
7 27 4 15 27 6
8 36 13
Gráfico de dispersión:

30

25
Tiempo de Servicio

20

15

10

0
0 10 20 30 40 50 60
Edad

En el gráfico de dispersión se puede observar que existe una relación


positiva entre las variables, a medida que aumenta la edad aumenta el
tiempo de servicio de los trabajadores.
Gráfico de cajas
Se realiza para:
• Identificar la forma de distribución.
• Identificar la presencia de datos discordantes.
• Analizar el grado de dispersión existente entre grupos
11,0
Corte
Superior
10,5
Tercer Cuartil

Mediana
10,0

Primer Cuartil
9,5
Corte
Inferior
CONC

121

9,0
N= 92 108

1,00 2,00

SEXO
Ejemplo de un gráfico de cajas
Tallo y hoja:
Es una técnica que combina dos procedimientos: uno gráfico y otro de
ordenación.
Un diagrama de Tallo y Hojas se realiza para:
• Identificar la forma de distribución
• Identificar la presencia de datos discordantes.
Taller Nº 1:
Elaboración de una base de
datos, construcción de tablas de
distribución de frecuencias y
presentación gráfica de datos,
usando Excel y Software
Estadístico.

S-ar putea să vă placă și