Documente Academic
Documente Profesional
Documente Cultură
DATOS Y AZAR I
Nombre : _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
Curso :________________
Profesor : _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
PÁGINA 1
Estadística
Definición
Es una rama de la matemática que se encarga del estudio de una o más características
de una población mediante métodos y técnicas que se emplean en la recolección,
ordenamiento, resumen, representación, análisis e interpretación de los datos
obtenidos para predecir o concluir acerca de los fenómenos y las leyes que los rigen.
La estadística puede ser dividida en dos ramas: la estadística descriptiva y la
estadística inferencial.
Estadística descriptiva: Realiza la recolección, descripción, síntesis y análisis de
los datos, calculando algunos parámetros que entreguen información global de
una población (medidas de posición y de variabilidad) o de un subconjunto de ella
(muestra), sin sacar conclusiones de esta última extensibles a toda la población.
Estadística inferencial: Realiza el estudio sobre un subconjunto de la población
(muestra) para luego extender las conclusiones a toda la población.
Presentación de datos
2.1 Tabla de distribución de frecuencias
E s una tabla que representa el número de elementos que pertenecen a cada una de
las categorías o clases en las que se divide el conjunto de datos.
Media Aritmética x
Es el cuociente entre la suma de todos los datos y el número de datos. Si se tienen n
datos: x1, x2, x3,…, xn, su media aritmética es
x1 + x2 + x3 + ... + xn
x =
n
Dato Frecuencia
x1 f1 x1 · f1 + x2 · f2 + x3 · f3 + ... + xn · fn
x2 f2 x =
f1 + f2 + f3 + ... + fn
x3 f3
⋮ ⋮
xn fn
Moda (Mo)
Es el dato que presenta la mayor frecuencia absoluta (dato que más se repite).
Intervalo Modal
Es el intervalo que presenta la mayor frecuencia absoluta .
DA
M0 LMo A
DB DA
Mediana (Me)
xn xn
+1
Si el número de datos es par, entonces la mediana es: Me 2 2
2
Cálculo de la mediana para datos agrupados en intervalos
N
2 Fi1
Me LMe A
fi
Medidas de Posición
L as medidas de posición dividen a un conjunto de datos en partes iguales y sirven
para clasificar a un individuo o elemento dentro de una determinada población o
muestra.
Las medidas de posición más utilizadas son: Cuartiles, Quintiles, Deciles y Percentiles.
Cuartiles
Los cuartiles son tres valores que dividen los datos ordenados en cuatro partes iguales.
Los cuartiles son datos bajos los cuales se acumula el 25%, 50% y el 75% de los datos
estudiados, se representan como Q1, Q2 y Q3, respectivamente.
Recorrido intercuartílico: es la diferencia positiva entre Q3 y Q1.
Quintiles
Los quintiles son cuatro valores que dividen los datos ordenados en cinco partes iguales.
Los quintiles son datos bajos los cuales se acumula el 20%, 40%, 60% y el 80% de los
datos estudiados.
Deciles
Los deciles son nueve valores que dividen los datos ordenados en diez partes iguales.
Los deciles son datos bajo los cuales se acumula el 10%, 20%, 30%, 40%, 50%, 60%,
70%, 80% y el 90% de los datos estudiados.
Percentiles
Los percentiles son los 99 valores, que dividen los datos ordenados en 100 partes
iguales.
Los percentiles son datos bajos los cuales se acumula el 1%, 2%, 3%,… y el 99% de los
datos estudiados.
PÁGINA 7
Medidas de Dispersión
Rango
Rango o recorrido es la diferencia entre el mayor y el menor de los datos.
f1 x1 x f2 x2 x fn x n x
2 2 2
f1 f2 f3 fn
Donde xi : dato
fi : frecuencia
x : media aritmética
PÁGINA 8
Varianza
Es otra medida de dispersión que corresponde al cuadrado de la desviación estándar.
x1 x x2 x xn x
2 2 2
2
n
f1 x1 x f2 x2 x fn xn x
2 2 2
2
f1 f2 f3 fn
Donde xi : dato
fi : frecuencia
x : media aritmética
Gráfico de barras
Se utiliza para variables de tipo cualitativas y cuantitativas discretas. Consiste en una
serie de barras cuyas alturas representan la frecuencia absoluta de estos.
A
X f
Frecuencia (f)
C
Dato 1 A
Dato 2 B D
Dato 3 C B
Dato 4 D E
Dato 5 E
Dato 1 Dato 2 Dato 3 Dato 4 Dato 5 Dato (x)
Gráfico circular
El gráfico circular es utilizado en variables de tipo cualitativa y cuantitativa discreta. El
gráfico consiste en un círculo dividido en secciones proporcionales al tamaño de la
muestra y la frecuencia de los datos.
Dato 5
X f fr Dato 1
Dato 1 a a% f x° Dato 4
=
Dato 2 b b% total 360°
Dato 3 c c% f fr
=
Dato 4 d d% total 100% Dato 3 Dato 2
Dato 5 e e%
Histograma
Se utiliza para representar a los datos agrupados en intervalos. El histograma se
elabora representando a los datos en el eje horizontal y a las frecuencias en el eje
vertical. Se trazan barras cuyas bases equivalen a los intervalos de clase y cuyas
alturas corresponden a las frecuencias de clase.
d
x f b
Frecuencia
Intervalo 1 a
c
Intervalo 2 b a
Intervalo 3 c
Intervalo 4 d 1 2 3 4
Intervalos
PÁGINA 10
Polígono de frecuencias
Al igual que el histograma, este gráfico, se utiliza en datos agrupados en intervalos.
Para confeccionarlo, debemos unir con una recta a los puntos donde se intersectan la
marca clase y la frecuencia de los intervalos. Para “anclar” el polígono al eje
horizontal, debemos agregar un intervalo de frecuencia cero, antes del primer
intervalo y después del último intervalo.
Frecuencia (f)
X C f a
Intervalo 1 Clase 1 a
b
Intervalo 2 Clase 2 b
c
Intervalo 3 Clase 3 c d
Intervalo 4 Clase 4 d
Clase Clase 1 Clase 2 Clase 3 Clase 4 Clase Clase (C)
a b c d e X (lim.sup.)
PÁGINA 11
Tipos de muestra
Muestra Simétrica: Los valores intercuartílicos están igualmente dispersos.
Valor Q1 Q2 Q3 Valor
mínimo máximo
Valor Q1 Q2 Q3 Valor
mínimo máximo
Valor Q1 Q2 Q3 Valor
mínimo máximo