Documente Academic
Documente Profesional
Documente Cultură
ESTADÍSTICA Y PROBABILIDADES
DOCENTE:
M. Sc. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
DEFINICIÓN:
OBJETIVOS DE LA ESTADÍSTICA
• Descripción
• Análisis
• Predicción
RAMAS DE LA ESTADÍSTICA
Estadística Descriptiva
Estadística Inferencial
POBLACIÓN
Es un conjunto de elementos (que consiste de personas,
animales, objetos, etc.) que contienen una o más características
en común, observables que se puedan medir.
TIPOS DE POBLACIÓN
MUESTRA
Es una parte o pequeña porción representativa y adecuada de la
población. Representativa en el sentido de reflejar fielmente las
características de la población de la cual procede y defiere de ella
sólo en el tamaño. Adecuada, quiere decir que debe incluir un
número óptimo y mínimo de elementos de la población. Este
número óptimo se determina mediante el empleo de las fórmulas
del muestreo. El tamaño de una muestra se simboliza “n”.
UNIDAD DE ANÁLISIS
Es todo elemento Indivisible que conforma la población, pudiendo
ser: aulas, carpetas, animales, instituciones, personas, etc.
PARÁMETRO
Es una medida resumen que describe una característica de toda la
población.
ESTADíGRAFO
VARIABLE
Naturaleza
Variable Cualitativa
Es aquella característica cuyos valores o respuestas son
cualidades o atributos. Por ejemplo: Sexo, Estado Civil, Lugar de
Procedencia, Nivel Económico, Tipo de Inflación, etc.
Variable Cuantitativa
Es aquella característica cuyos valores resultan de la operación de
contar o de medir. Como por ejemplo: Número de Hijos, Peso en
Kg. , Talla en cm, etc.
DATO
Escala de Medición
Escala de medición Tipo de variable Ejemplos
Variable cualitativa Sexo, estado civil,
Escala Nominal lugar de procedencia,
etc.
Variable cualitativa Grado de instrucción,
Escala Ordinal orden de mérito, etc.
Variable cuantitativa Temperatura, presión,
Escala de Intervalo continua de origen coeficiente intelectual,
convencional. puntuaciones del nivel
de estrés, etc.
Variable cuantitativa Edad en años, peso
Escala de razón de origen natural. en kg, ingresos
mensual en soles,
número de hijos, etc.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
LABORATORIO Nº 01
a. Precio en soles.
b. Nº niveles de una vivienda.
d. Material de construcción.
e. Número de acciones.
f. Tipo de suelo.
g. Coeficiente intelectual.
RECOPILACIÓN DE DATOS
- La observación.
- La experimentación.
- La encuesta.
- La entrevista.
DISTRIBUCIÓN DE FRECUENCIAS
- Cuadro sobrecargado.
Ejemplo:
SOLUCIÓN:
Cuadro N° 01
Gráfico de Barras:
GRAFICO N° 01
LUGAR DE PROCEDENCIA
10
8
6
ni
4
2
0
Lambayeque Amazonas Cajamarca Piura
FUENTE: Cuadro N° 01
GRAFICO N° 02 LUGAR DE
PROCEDENCIA
Lambayeque
Amazonas
Cajamarca
Piura
FUENTE: Cuadro N° 01
- Barras.
- Bastones .
Ejemplo:
2 1 3 3 2
1 5 4 5 3
3 3 2 3 4
N° hernanos ni Ni hi Hi hi % Hi %
TOTAL -----
Fuente : _______________________________
y ´j 1 y ´j
y1 = Marca de clase = 2
• R’ – R >= 0
Solución:
Para elaborar el Cuadro estadístico primero construimos los intervalos de
clase semi abiertos.
Cuadro N° 03
Tiempo en microsegundos
Tiempo en
microsegundos yi ni Ni hi Hi hi % Hi %
1582-12615 7098.5 3 3 0.05 0.05 5,0 5,0
12615-23648 18131.5 4 7 0.07 0.12 7.0 12.0
23648-34681 29164.5 5 12 0.08 20.0 8,0 20,0
34681-45714 40197.5 36 48 0.60 80.0 60,0 80,0
45714-56747 51230.5 6 54 0.10 90.0 10,0 90,0
56747-67780 62263.5 4 58 0.07 97.00 7.0 97.0
67780-78813 73296.5 2 60 0.03 100.0 3,0 100,0
Total 60 --- 1 --- 100,0 -----
Fuente: Área de informática y Sistemas de la Empresa MC.
Gráfico N° 04
Tiempo en microsegundos
40
30
20
10
0
1582-12615 12615-23648 23648-34681 34681-45714 45714-56747 56747-67780 67780-78813
Tiempo
Gráfico N° 05
Se elabora la siguiente tabla para que sirva como ayuda para la ojiva “menor que
Tiempo en ni Ni
microsegundos
Menor que 12615 3 3
Menor que 23648 4 7
Menor que 34681 5 12
Menor que 45714 36 48
Menor que 56747 6 54
Menor que 67780 4 58
Menor igual que 78813 2 60
Total 60 ---
Gráfico N° 06
Tiempo en microsegundos
60
50
Frecuencia absoluta acumulada
40
30
20
10
Tiempo en ni Ni *
microsegundos
Mayor igual que 1582 3 60
Mayor igual que 12615 4 57
Mayor igual que 23648 5 53
Mayor igual que 34681 36 48
Mayor igual que 45714 6 12
Mayor igual que 56747 4 6
Mayor igual que 67780 2 2
Total 60 ---
Gráfico N° 07
Tiempo en microsegundos
70
60
50
40
30
20
10
0
[ 1582- [12615- [23648- [34681- [45714- [56747- [67780-
12615> 23648> 34681> 45714> 56747> 67780> 78813]
Fuente: Cuadro Nº03
MEDIDAS DE POSICIÓN:
- Centralización.
- Localización
Medidas de Posición
Son aquellas que describen la posición que ocupa la
distribución de frecuencia respecto a un valor de la variable.
Se distinguen dos tipos: Las medidas de tendencia central y
medidas de localización.
Medidas de centralización
Se llaman así porque sus valores tienden a ocupar
posiciones centrales o intermedias entre el menor y mayor
valor del conjunto de datos, a partir de la cual se calculan
estas medidas. Las medidas de tendencia central más
usadas son la medida aritmética, la medida geométrica,
medida armónica, medida ponderada mediana.
X1 X2 X3 ..... Xn X i
X i 1
n n
Ejemplo: Los ingresos mensuales en $ de 5 Trabajadores de
una Empresa maderera son: 320, 390, 330, 400, 372. Calcular
el ingreso medio de la muestra.
Solución:
X : Ingreso mensual en $.
Interpretación :
Y * n i i
Y i 1
n
Ejemplo: Calcular e interpretar la media aritmética de los
datos agrupados en la siguiente tabla de distribución de
frecuencias: Número de trabajadores por posta médica.
Nº de Nº de Postas
Trabajadores ni Yi ni
Yi
Y1 = 2 n1 = 1 Y1 n1 = 2
Y2 = 3 n2 = 3 Y2 n2 = 9
Y3 = 4 n3 = 7 Y3 n3 = 28
Y4 = 5 n4 = 6 Y4 n4 = 30
Y5 = 6 n5 = 3 Y5 n5 = 18
TOTAL n = 20 87
m
Y * n i i
87
Y i 1
4.35 Trabajadores por posta médica.
n 20
Como es variable discreta se puede interpretar como 4
trabajadores.
Interpretación : Se espera que cada posta médica tenga 4
trabajadores en promedio.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
b b b b ..... b nb
X
i 1
b
n n n
x y x y
Media Geométrica
MG =
n x1 x 2 x 3 .... x n
DatosTabulados
m
ni log y i
x anti log i 1
n
Ejemplos:
b)La tasa promedio del crecimiento del ahorro en los tres años.
Solución:
a)
Tasas Año Ahorro
SOLUCIÓN:
0.1004
0.0251
4
x anti log(0.0251) 1.0595
Media Armónica
Ejemplo:
3
52.17
0.0575
Media Ponderada
x w i i
xw i 1
n
w
i 1
i
Donde:
Xw = Símbolo para la media ponderada.
Ejemplo:
Encontrar el promedio obtenido por alumno de Ingeniería de
Sistemas de la UDCH en el ciclo 2005-I.
x w 12.8235
La Mediana (Me)
Calcular la mediana.
9, 7, 10, 8
Me = (8 + 9) / 2 = 8.5
1. Calcular n / 2
La mediana es igual al valor de la variable al cuál está referido Nj-1 más el valor
de la variable al cuál está referida Nj dividido por dos.
Ejemplo:
Solución:
TABLA Nº 3
Nº de
Trabajadores ni Ni
Yi
Y1 = 2 n1 = 1 N1 = 1
Nj-1
Y2 = 3 n2 = 3 N2 = 4
n/2 =10
Y3 = 4 n3 = 7 N3 = 11 Nj
Y4 = 5 n4 = 6 N4 = 17
Y5 = 6 n5 = 3 N5 = 20
TOTAL n = 20
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
Me = Yj = Y3 = 4
Me = 4
Interpretación: El 50 % de las postas médicas tienen 4 o menos
trabajadores, y el otro 50% de las postas tienen más de 4
trabajadores.
Variable Continua:
La mediana se calcula como sigue:
n
2 N j 1
Me Y ' j 1 C
N j N j 1
Donde :
I.Me = Intervalo Mediano al cuál está referido Nj
Nj = Frecuencia Absoluta Acumulada inmediata superior a n/2
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a n/2
n = Número de observaciones.
Y 'j1 = Límite inferior del intervalo Mediano (I.Me)
C = Amplitud del I.Me.
Edad Nº de
(años) Pacientes Ni
[ Li - Ls ) ni
26 – 35 n1 = 2 N1 = 2
35 – 44 n2 = 6 N2 = 8
44 – 53 n3 = 5 N3 = 13 Nj-1
I.Me 53 – 62 n4 = 15 N4 = 28
Nj
Li
62 – 71 n5 = 14 N5 = 42
71 – 80 n6 = 5 N6 = 47
80 – 89 n7 = 3 N7 = 50
TOTAL n = 50
50 13
Me 53 9 2
28 13
Me = 60.2 años
Interpretación :
Estadígrafos de localización
rn
4 N j 1
Q Y ' j 1 C
N j N j 1
r
Donde :
I.Qr = Intervalo que contiene al cuartil, r.
Nj = Frecuencia Absoluta Acumulada inmediata superior a
rn/4
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a rn/4
n = Número de observaciones.
Y' j1 = Límite inferior del intervalo que contiene al cuartil r.
C = Amplitud del intervalo cuartil.
a) Determinación de Q1:
TABLA Nº 3
Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 – 35 n1 = 2 N1 = 2
35 – 44 n2 = 6 N2 = 8
I.Q1
44 – 53 n3 = 5 N3 = 13
Li
53 – 62 n4 = 15 N4 = 28
62 – 71 n5 = 14 N5 = 42
71 – 80 n6 = 5 N6 = 47
80 – 89 n7 = 3 N7 = 50
TOTAL n = 50
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
rn
4 N j 1
Q Y ' j 1 C
N j N j 1
r
12.5 8
Q1 44 9
13 8
4.5
Q1 44 9 44 8.1 52.1
5
Q1 52.1
Interpretación:
Determinación de Q2.
Q2 = Me = 60.2 años
Determinación de Q3.
TABLA Nº 3
Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 – 35 n1 = 2 N1 = 2
35 – 44 n2 = 6 N2 = 8
44 – 53 n3 = 5 N3 = 13
53 – 62 n4 = 15 N4 = 28
I.Q3 62 – 71 n5 = 14 N5 = 42
Li
71 – 80 n6 = 5 N6 = 47
80 – 89 n7 = 3 N7 = 50
TOTAL n = 50
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
rn
4 N j 1
Q Y ' j 1 C
N j N j 1
r
37.5 28
Q3 62 9
42 28
9.5
Q3 62 9 62 6.1071 68.1
14
Q1 68.1
Interpretación:
DECILES (Dr)
rn
10 N j 1
D Y ' j 1 C
r
N j N j 1
Donde :
I.Dr = Intervalo que contiene al decil r.
Nj = Frecuencia Absoluta Acumulada inmediata superior a
r n / 10
Nj-1 = Frecuencia Absoluta Acumulada inmediata inferior a
r n / 10
n = Número de observaciones.
Y' j1 = Límite inferior del intervalo que contiene al decil r
C = Amplitud del intervalo que contiene al decil r.
TABLA Nº 3:
Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
ni
26 – 35 n1 = 2 N1 = 2
35 – 44 n2 = 6 N2 = 8
44 – 53 n3 = 5 N3 = 13
53 – 62 n4 = 15 N4 = 28
62 – 71 n5 = 14 N5 = 42
I.D9 71 – 80 n6 = 5 N6 = 47
Li 80 – 89 n7 = 3 N7 = 50
TOTAL n = 50
45 42 3
D9 71 9 71 9 71 5.4
47 42 5
D9 76.4 años
rn
100 N j 1
Pr Y ' j 1 C
N j N j 1
Donde :
TABLA Nº 3:
Edad (años) Nº de
[ Li - Ls ) Pacientes Ni
Ni
26 - 35 n1 = 2 N1 = 2
35 - 44 n2 = 6 N2 = 8
44 - 53 n3 = 5 N3 = 13
53 - 62 n4 = 15 N4 = 28
I.P70 62 - 71 n5 = 14 N5 = 42
Li
71 - 80 n6 = 5 N6 = 47
80 – 89 n7 = 3 N7 = 50
TOTAL n = 50
rn
100 N j 1
P Y ' j 1 C
N j
r
N j 1
35 28 7
P70 62 9 62 9 62 4.5
42 28 14
P70 66.5 años
Interpretación:
LA MODA (M0)
Determine la moda.
Solución:
Estas 9 medidas no definen una moda, por tanto la distribución es
Amodal.
Solución:
TABLA Nº 4
Nº de Nº de
Trabajadores Postas
Yi ni
Y1 = 2 n1 = 1
Y2 = 3 n2 = 3
Y3 = 4 n3 = 7
Y4 = 5 n4 = 6
Y5 = 6 n5 = 3
TOTAL n = 20
n
j n j 1
MoY 'j 1 c
n j n j 1 n j n j 1
Donde :
nj = Es la mayor Frecuencia Absoluta Simple.
nj-1 = Frecuencia Absoluta Simple inmediata anterior a nj.
nj+1 = Frecuencia Absoluta Simple inmediata posterior a nj.
I.Mo = Intervalo Modal que contiene a nj.
Y 'j1 = Límite Inferior del Intervalo Modal (I.Mo).
C = Amplitud del Intervalo modal.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
Solución:
TABLA Nº 3
Edad (años) Nº de
[ Li - Ls ) Pacientes
ni
26 - 35 n1 = 2
35 - 44 n2 = 6
44 - 53 n3 = 5
I.Mo 53 - 62 n4 = 15
62 - 71 n5 = 14
Li 71 - 80 n6 = 5
80 – 89 n7 = 3
TOTAL n = 50 n = 50
n
j n j 1
MoY 'j 1 c
n j n j 1 n j n j 1
14 14
M0 53 9 53 9 53 6.63 59.63
5 14 19
M0 59.63
(A) (B)
9 10 11 12 13 14 15 6 7 8 9 10 11 12 13 14 15 16 17 18
x 12, Me 12 x 12, Me 12
La varianza
Es la medida de dispersión más importante, y expresa el grado de
dispersión de las observaciones respecto a la Media Aritmética.
Varianza Poblacional.
Xi
2
2 i 1
N
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
x x x
n n
2 2
i i x
S
2 i 1 S2 i 1
n 1 n
y
m
2
i y ni
Para datos tabulados si n<30.
S
2 i 1
n 1
y
m
2
i y ni
S2 i 1
Para datos tabulados si n>=30.
n
Calculo de la Varianza:
Ejemplo: Las frecuencias cardiacas de 5 niños son:
130, 132, 127, 129, 132, pulsaciones por minuto.
Determinar la varianza de la frecuencia cardiaca de la muestra.
Lic. Carlos Daniel Gonzales Hidalgo
ESTADÍSTICA
Solución:
Se determina la Media aritmética de la muestra .
n
X i
650
x i 1
130
n 5
TABLA Nº 5
X X
2
Xi Xi X i
X1 = 127 -3 9
X2 = 129 -1 1
X3 = 130 0 0
X4 = 132 2 4
X5 = 132 2 4
5 5
Xi 650
2
Xi X 18
i1 i1
x x
n
2
i
S2 i 1
n 1
18
S 2
4,5
4
SOLUCION:
TABLA Nº 2
Nº de trabajadores
Nº de postas
Yi
Y1 = 2 n1 = 1
Y2 = 3 n2 = 3
Y3 = 4 n3 = 7
Y4 = 5 n4 = 6
Y5 = 6 n5 = 3
TOTAL n = 20
Solución: TABLA Nº 3
Edad(años) Marca de clase Nº de Pacientes
[ L i – Ls ) Yi ni
26 – 35 Y1 = 30.5 n1 = 2
35 – 44 Y2 = 39.5 n2 = 6
44 – 53 Y3 = 48.5 n3 = 5
53 – 62 Y4 = 57.5 n4 = 15
62 – 71 Y5 = 66.5 n5 = 14
71 – 80 Y6 = 75.5 n6 = 5
80 – 89 Y7 = 84.5 n7 = 3
TOTAL n = 50
S S 2
S² = 4.5
S S2 4.5 2.12132
S = 2.12132 pulsaciones por minuto
Interpretación:
Las frecuencias cardiacas de los niños varían en 2.12
pulsaciones por minuto respecto a la pulsación promedio.
El Coeficiente de Variación
El coeficiente de variación es el indicador relativo del grado de
dispersión de los valores respecto de su promedio, el mismo que
está expresado en tanto por ciento.
C.V. 1.63%
Interpretación:
Estadígrafos de Forma
Son medidas que dan información a cerca de la
dirección de las variaciones de la distribución.
Estas son las medidas de Asimetría y las medidas
de apuntamiento o Cúrtosis.
Coeficiente de Asimetría
El concepto de asimetría de una distribución
indica la de formación horizontal de las
distribuciones de frecuencia. Se tiene que:
fi fi fi
Media Moda Y M0
AS1
Desviación Estándar Sy
AS2
3 Media Mediana
3 Y Me
Desviación Estándar Sy
AS
Q3 Q2 Q2 Q1
Q3 Q1
Y M0 59.3 59.63
AS1 0.0249 0
Sy 13.237
AS2
3 Y Me 3 59.3 60.2 0.204 0
Sy 23.237
fi fi fi
Y´ Y´ Y´
a) LEPTOCURTICA b) MESOCURTICA c) PLATICURTICA
Q3 Q1
K
2 P90 P10