Sunteți pe pagina 1din 59

Distribución de Frecuencias

 “La Estadística estudia métodos científicos


para recoger, organizar, resumir y analizar
datos, así como para sacar conclusiones
válidas y tomar decisiones razonables
basadas en tal análisis”
Murray R. Spiegel
1. Se realizan observaciones aleatorias de un
fenómeno que no se puede predecir con
anterioridad.
2. Se realiza un muestreo (se selecciona una
muestra representativa de la población).
3. Se recolectan datos de cada elemento
muestreado (por ejemplo a través de un
cuestionario).
4. El objetivo final es inferir estadísticamente
algo sobre la población, deseamos concluir
algo sobre alguna característica de la
población en la que se realiza el estudio.
 Estadística Descriptiva o Deductiva:
estudia los métodos para organizar,
sumarizar y describir un conjunto de datos
para que sus características se vuelvan
evidentes. Se divide en:
 Técnicas Gráficas
 Técnicas Numéricas.
 Estadística Inferencial o Inductiva: usa la
teoría de probabilidades para generalizar
las características de una población a partir
de las características de una muestra
representativa. Es decir, utiliza estadísticas
muestrales para obtener conclusiones
sobre los verdaderos parámetros de la
población.
 Población: es el conjunto de todas las
mediciones de interés al experimentador.
Su tamaño se denota con la letra N.
 Muestra: es un subconjunto de la
población. Generalmente esta selección se
hace aleatoriamente, cada individuo en la
muestra tuvo la misma posibilidad de
haber sido seleccionado. Su tamaño se
denota con la letra n.
 Parámetro Pobacional: es un valor
numérico que caracteriza cierta población.
 Estadístico Muestral: es un valor numérico
que caracteriza cierta muestra.
En Estadística se busca estimar el
verdadero valor del parámetro a través de
un estadístico.
 Lo más importante no está en lo que la
muestra nos dice sobre sus miembros
específicos, sino en cómo hacer inferencias
sobre los miembros de la población que no
fueron incluidos en la muestra.
 Un estadístico primero diseña la muestra y
el experimento para minimizar los costos
de obtener la información.
 Después busca el mejor método para
realizar la inferencia según el muestreo
dado.
 Finalmente mide la bondad de la
inferencia.
 A los diferentes fenómenos o
características que se miden en un estudio
estadístico se les denomina variables
aleatorias.
 La diferencia entre variables aleatorias y
variables algebraicas es que nos interesa
saber la probabilidad de ocurrencia de sus
posibles valores antes de que estos valores
sean observados.
 Cualitativos:
 Arrojan respuesta categóricas.
 Miden cualidades
 Se les puede asignar después un valor
numérico (codificarlas)
 Cuantitativos:
 Producen respuestas numéricas.
 Miden cantidades
 Podemos tratar un dato cuantitativo como
cualitativo (categorizando)
 Discretos:
 Si el número de posibles valores que puede
tomar es contable (número naturales).
 Generalmente resultan de un proceso de
conteo
 Continuos:
 Si sus posibles valores están en el continuo
(números reales).
 Generalmente resultan de un proceso de
medición
 Los datos que se asocian con las variables
aleatorias pueden medirse con diferentes
escalas dependiendo del tipo de dato que
se trate. Las distintas medidas son:
a) Medidas por Escala Nominal:
 Los datos de tipo cualitativo se agrupan en
varias categorías nominales.
 Generalmente se le asigna un valor
numérico a cada categoría nominal
(codificar los datos)
 Caso especial: dicótomos
b) Medidas por Escala Ordinal:
 Los datos de tipo cualitativo guardan un orden
natural.
 Son datos que pueden medirse con una escala
nominal, en donde además existe un orden
natural entre las categorías.
 Se pueden realizar operaciones aritméticas con
los números asignados a las categorías. El
resultado no indica nada.
c) Medidas por Escala de Intervalo:
 Los datos que se utilizan son cuantitativos y
guardan las características descritas en las
medidas ordinales.
 No existe un cero natural, es decir, el cero no
implica necesariamente la ausencia del atributo
en estudio.
 Implican la asignación de números de modo que
a iguales diferencias entre los grados del
atributo, correspondan iguales diferencias entre
los valores numéricos
d) Medidas por Escala de Razón:
 Datos que cumplen con las características
necesarias para medirse con una escala de
intervalo, y que además posee un cero
natural.
 Tener un cero natural implica que el punto
cero no es arbitrario y corresponde a una
total ausencia del atributo en estudio.
 Los datos recopilados en la muestra se
pueden organizar en Tablas de
Frecuencias.
 Estas tablas muestran:
 las clases o categorías de respuesta de donde
se obtuvieron los datos (o los intervalos de
clase si los datos son cuantitativos)
 El número o proporción de veces que la clase
se encontró en los datos recopilados.
Estado Civil Número de Porcentaje
(clase) ocurrencias (frecuencia
(frecuencia) relativa)
Soltero 22 22 %
Casado 45 45 %
Divorciado 20 20 %
Viudo 8 8%
Otro 5 5%
Total 100 personas 100 %
 Frecuencia (f): Resulta de contar el número de
observaciones que "entran" en una clase
 Frecuencia Relativa (fr): Es la proporción de
observaciones que "entran" en una clase:

fi
fr i 
n
 Con este tipo de datos se construyen
intervalos de clase.
 Los intervalos de clase constan de:
 un valor de inicio llamado Límite Inferior
(LI)
 un valor final llamado Límite Superior (LS)
 Amplitud de Intervalos:
 Se calcula restando dos límites superiores
consecutivos:
ci  LSi 1  LSi
 Marca de Clase: Es el punto medio del
intervalo de clase. Se usa en los métodos
estadísticos como valor estimado de las
observaciones que cayeron dentro de ese
intervalo
LI i  LSi
Xi 
2
 Frecuencia Acumulada (fa): Es el número de
observaciones acumuladas hasta la clase de
referencia:
i
fa i   f j
j 1
 Frecuencia Relativa Acumulada (fra): es la
proporción de observaciones acumuladas hasta
la clase de referencia:

fa i
fra i 
n
1. Cargar el módulo de Análisis de Datos:
 Herramientas
 Complementos
 Palomeo “Herramientas para Análisis”
2. Acceso la subrutina Histograma de módulo de
Análisis de Datos:
 Herramientas
 Análisis de Datos
 Histograma:
▪ Selecciono a los datos de la muestra como “rango de
entrada”
▪ OPCIONAL: Selecciono a los límites superiores como
“rango de clases”
 Se tabulan dos variables en una sola tabla.
 También se llaman tablas de cruce o de
contingencia.
Estado Civil Hombre Mujer Total por Estado Civil
Soltero 10 12 22
Casado 22 23 45
Divorciado 7 13 20
Viudo 2 6 8
Otro 4 1 5
Total por Sexo 45 55 100 personas
 Graficamos el contenido de la tabla de
frecuencia.
 Las más importantes gráficas:
 Pie
 Barras
 Histograma
 Polígono
 Se usa con datos cualitativos o cuantitativos.
 A través de una regla de tres , un círculo se divide
en sectores.

gradosi  fri  360


 Cada “rebanada” representa la proporción de
datos contenidos en una clase de la tabla de
frecuencia.
2%
5% 2%
2% 8%

17% clase 1
clase 2
clase 3
25%
clase 4
clase 5
clase 6
clase 7
clase 8

39%
 Selecciono la frecuencia de la tabla
 Llamo al asistente para gráficas
 Selecciono una gráfica circular
 Coloco los rótulos de categoría:
▪ categorías
▪ marcas de clase
 Coloco los rótulos de datos en “porcentaje”
 Se usa con datos cualitativos o cuantitativos.
 Se puede hacer con la frecuencia o con la
frecuencia relativa.
 Se grafican rectángulos sobre un eje cartesiano
en donde cada rectángulo representa a cada
clase en la tabla de frecuencia.
25
23

20

15
15

10
10

5
5
3
1 1 1
0
clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8
 Selecciono la frecuencia o frecuencia relativa de
la tabla
 Llamo al asistente para gráficas
 Selecciono una gráfica de columnas o de barras
 Coloco los rótulos de categoría:
▪ categorías
▪ marcas de clase
 Coloco los rótulos de datos
 Es exclusiva para datos cuantitativos.
 Se puede hacer con la frecuencia o con la
frecuencia relativa.
 Se grafican rectángulos sobre un eje cartesiano
en donde el área de cada rectángulo representa a
cada intervalo de clase en la tabla de frecuencia.
 Sirve para comparar las magnitudes
representadas en cada intervalo de clase.
25
23

20

15
15

10
10

5
5
3
1 1 1
0
clase 1 clase 2 clase 3 clase 4 clase 5 clase 6 clase 7 clase 8
 Selecciono la frecuencia de la tabla
 Llamo al asistente para gráficas
 Selecciono una gráfica de columnas
 Coloco los rótulos de categoría: marcas de clase
 Coloco los rótulos de datos
 Reduzco el “ancho del rango” a cero.
NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para
cualquier intervalo de clase.
 Acceso la subrutina Histograma de módulo de Análisis de
Datos:
 Herramientas
 Análisis de Datos
 Histograma:
▪ Selecciono a los datos de la muestra como “rango de entrada”
▪ OPCIONAL: Selecciono a los límites superiores como “rango
de clases”
▪ Selecciono la opción “Crear Gráfico”
 Ya en la gráfica, reduzco la distancia entre barras a cero.
NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para cualquier
intervalo de clase.
 Es exclusiva para datos cuantitativos.
 Se puede hacer con la frecuencia o con la
frecuencia relativa.
 Es una gráfica de punto y línea sobre el eje
cartesiano.
 Sirve para observar la forma de la distribución de
frecuencias.
 Lo importante en el polígono es mantener el
área bajo la curva igual al área acumulada en el
histograma.
 Añado una marca de clase anterior a la primera
(restándole la amplitud)
 Añado una marca de clase posterior a la última
(sumándole la amplitud)
 Les adjudico frecuencia igual a cero a estas
marcas de clase adicionales
 Grafico utilizando estas marcas de clase
adicionales.
25

23

20

15 15

10 10

5 5
3
1 1 1
0 0 0
0 2 4 6 8 10 12
 Selecciono la frecuencia o frecuencia relativa de
la tabla (ampliada)
 Llamo al asistente para gráficas
 Selecciono una gráfica de dispersión XY, que
muestre los puntos unidos por líneas.
 Coloco las marcas de clase como “rótulos de
categoría”
 Coloco los rótulos de datos
NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para
cualquier intervalo de clase.
 Realizo el histograma de frecuencias a través de
la subrutina de Análisis de Datos con la tabla
ampliada.
 Ya en la gráfica, cambio el tipo de gráfica a:
Dispersión XY.

NOTA: Este procedimiento es válido solo cuando la amplitud es la misma para


cualquier intervalo de clase.
Tabla de Distribución de
Frecuencias

Una tabla de distribución de


frecuencias es una tabla que nos
permite organizar los datos de tal
manera que nos sirvan para la toma
de decisiones.
Problema 1
Los siguientes datos representan el periodo de duración, en
años, de 30 componentes electrónicos iguales:
•Construye una tabla completa de distribución de frecuencias
para este conjunto de datos usando 5 clases.
•Dibuja su histograma y su polígono de frecuencias.
Usando la tabla de distribución de frecuencias.
•¿Qué porcentaje de los componentes tienen una vida de entre
1.45 y 2.75 años?
•¿Qué porcentaje de los componentes tienen una vida menor a
5.3 años?
2.0 3.0 0.3 3.3 1.3 0.5
0.7 6.0 5.8 6.6 0.2 2.3
1.5 4.0 5.8 1.9 4.8 0.7
4.5 0.9 1.5 0.7 2.8 5.3
1.3 6.2 5.7 6.3 1.5 0.4
Problema 2
Los siguientes datos representan el periodo de vida, en segundos,
de 50 mosquitos que están sujetos a un nuevo insecticida en un
experimento controlado de laboratorio:
•Construye una tabla completa de distribución de frecuencias para
este conjunto de datos, usando 6 clases.
•Dibuja su histograma y su polígono de frecuencias.
Usando la tabla de distribución de frecuencias.
•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia
del insecticida por arriba de los 29.5 segundos?
•¿Qué porcentaje de los mosquitos lograron una vida bajo la presencia
del insecticida entre 9.5 y 24.5 segundos?

18 20 10 8 25 14 13 19 18 24
12 17 8 9 12 14 7 9 15 22
14 18 17 14 16 31 8 7 15 12
13 8 18 7 10 5 28 17 14 15
10 12 15 19 6 8 13 14 18 21
k= 5.64 = 6 Clases
A= 4.33 = 5
Intervalo de Clase

Li Ls Frec
16
5 9 12 15

10 14 16 12

15 19 15
20 24 4
25 29 2
4
30 34 1
2 1

5 10 15 20 25 30

Media 14.27
Mediana 14
4.906890
En Excell….. K= 6 5
A= 1.28 1.3

Frecuen
Clases cia
0.2 1.4 10
1.5 2.7 6
2.8 4 4
4.1 5.3 3
5.4 6.6 7

15
10
5
0
1.4 2.7 4 5.3 6.6
 Quick Change Oil Company cuenta con varios talleres en el área metropolitana de
Seattle. Las cantidades diarios de cambios de aceite que se realizaron en el taller
de Oak Street los pasados 20 días son las siguientes:

65 98 55 62 79 59 51 90 72 56
70 62 66 80 94 79 63 73 71 85
 Los datos se van a organizar en una distribución de frecuencias.
 A)¿Cuántas clases recomendaría usted?
 B)¿Qué intervalo de clase sugeriría?
 C)¿Qué límite inferior recomendaría para la primera clase?
 D) Organice el número de cambios de aceite como distribución de frecuencias.
 C) Haga comentarios sobre la forma de la distribución de frecuencias. Determine,
asimismo, la distribución de frecuencias relativas.
 30.- Los siguientes datos proporcionan las cantidades semanales
que gasta en abarrotes una muestra de casas.

$271 $363 $159 $76 $227 $337 $295 $319 $250


279 205 279 266 199 177 162 232 303
192 181 321 309 246 278 50 41 335
116 100 151 240 474 297 170 188 320
429 294 570 342 279 235 434 123 325

 A) ¿Cuántas clases recomendaría?


 B) ¿Qué intervalo de clase sugeriría?
 C) ¿Cuál recomendaría como límite inferior de la primera clase?
 D) Organice los datos en una distribución de frecuencias.
 38.- Un estudio reciente de tecnologías domésticas informó el número de horas de uso
semanal de las computadoras personales en una muestra de 60 personas. Se excluyeron del
estudio personas que laboraban fuera del hogar y empleaban como parte de su trabajo.
9.3 5.3 6.3 8.8 6.5 0.6 5.2 6.6 9.3 4.3

6.3 2.1 2.7 0.4 3.7 3.3 1.1 2.7 6.7 6.5

4.3 9.7 7.7 5.2 1.7 8.5 4.2 5.5 5.1 5.6

5.4 4.8 2.1 10.1 1.3 5.6 2.4 2.4 4.7 1.7

2.0 6.7 1.1 6.7 2.2 2.6 9.8 6.4 4.9 5.2
4.5 9.3 7.9 4.6 4.3 4.5 9.2 8.5 6.0 8.1

 A) Organice los datos en una distribución de frecuencias. ¿Cuántas clases sugeriría? ¿Qué
valor sugeriría para un intervalo de clase?
 B) Elabore un histograma. Interprete el resultado que obtuvo.
 39.- Merril Lynch recién concluyó un estudio relacionado con el tamaño de las carteras de inversión en
línea (acciones,bonos, fondos mutuos y certificados de depósito) en una muestra de clientes de un grupo
de 40 a 50 años de edad. A continuación aparece el valor de las inversiones en miles de dólares para los
70 participantes.
$669.9 $7.5 $77.2 $7.5 $125.7 $516.9 $219.9 $645.2

301.9 235.4 716.4 145.3 26.6 187.2 315.5 89.2


136.4 616.9 440.6 408.2 34.4 296.1 185.4 526.3
380.7 3.3 363.2 51.9 52.2 107.5 82.9 63.0
228.6 308.7 126.7 430.3 82.0 227.0 321.1 403.4
39.5 124.3 118.1 23.9 352.8 156.7 276.3 23.5
31.3 301.2 35.7 154.9 174.3 100.6 236.7 171.9
221.1 43.4 212.3 243.3 315.4 5.9 1002.2 171.7
295.7 437.0 87.8 302.1 268.1 899.5
A) Organice los datos en una distribución de
frecuencias. ¿Cuántas clases sugeriría? ¿Qué
valor propondría para un intervalo de clase?
 B) diseñe un histograma. Interprete el
resultado que obtuvo.

S-ar putea să vă placă și