Documente Academic
Documente Profesional
Documente Cultură
DESCRIPTIVA
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a
conocer, con determinado grado de
confianza, a la población. Lo que nos
permite tomar decisiones.
Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Muestra:
Subconjunto de una población, que intenta
reflejar las características de la población lo
mejor posible.
El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.
Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos
que se desea estudiar y se puede medir o
calificar; cambia o varía con el tiempo en un
individuo dado, o cambia o varía de elemento
a elemento.
Ej. Edad, peso, sexo, estado civil, número de
hijos, etc.
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un
individuo.
Escalas de Medición
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritméticas entre sus
valores, pues éstos son únicamente
ETIQUETAS.
Ejemplo:
Pésimo – Malo – Regular – Bueno –
Excelente
Primaria – Secundaria – Preparatoria -
Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de
la variable y además una NOCIÓN DE
DISTANCIA aunque no se puedan realizar
operaciones.
El cero o punto de inicio no es único, es más
bien un punto de referencia.
Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Orden de datos
La ordenación es el proceso mediante el cual
los datos están acomodados de tal manera
que se establece un orden (ascendente o
descendente) entre ellos.
40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden ascendente
El proceso consiste en ordenarlos de
menor a mayor
Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)
42 40 48 51 49
40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45
55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno de
ellos se escribe, en fila, sólo el segundo dígito
(unidades) de cada uno de los datos que tengan
el mismo primer dígito.
Datos sin ordenar: Peso de 25 estudiantes (en kg)
4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
6 52 62 44 50 59
2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
Doble tallo
Una variante de este método es en lugar de
dividir en un grupo las decenas, se divide en dos
grupos. El primero abarcando los dígitos del 0 al
4 y el segundo del 5 al 9.
Nº de Nº de F fr
hijos familias
1 2
2 8
3 12
4 14
5 3
6 1
La Tabla de Distribución de Frecuencia con DATOS
ACUMULADOS ( o AGRUPADOS), es aquella que en la
variable los datos se presentan en intervalos también
llamados clases.
El término central de un intervalo se llama MARCA
DE CLASE, que es el representante de la clase.
Para determinar el tamaño de cada intervalo (ancho
de clase ), se divide el rango por la cantidad de intervalos
que se desea obtener.
Se forman, tantas clases hasta cubrir el dato mayor.
Intervalo de clase
En ocasiones es conveniente acomodar los datos en pequeños grupos
de igual tamaño, llamados intervalos de clase.
El punto medio o marca de clase “xi”, se obtiene con:
50 67 50 58 61 59 41 59 42 60
55 48 45 58 69 46 51 52 40 65
53 52 68 53 46 60 50 54 54 40
44 41 49 45 47 56 48 53 55 51
47 52 51 58 54 51 52 55 60 58
a)Ordenando de menor a mayor la tabla queda ordenada como se indica
enseguida:
40 44 47 50 51 52 54 56 59 65
40 45 47 50 51 53 54 58 59 66
41 45 48 50 52 53 55 58 60 67
41 46 48 51 52 53 55 58 60 68
42 46 49 51 52 54 55 58 61 69
b) Rango
Tamaño de clase = 5
40 - 44 42 6 0.12 12 6 12
45 - 49 47 9 0.18 18 15 30
50 - 54 52 17 0.34 34 32 64
55 - 59 57 10 0.20 20 42 84
60 - 64 62 3 0.60 60 45 90
65 - 69 67 5 0.10 10 50 100
Total 50 1.00 100%
Las marcas de clase nos servirán para
construir histogramas y polígonos de
frecuencia que será un tema que se verá
mas adelante. Lo importante por ahora es
conocer claramente como se construye una
tabla de frecuencias y las partes que se
originan después de dicha construcción.
Ejemplo
Límite inferior Límite superior Lím inf + Lim sup
2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65
Límite verdadero del intervalo
Frontera de clase o límite verdadero del
intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
Ejercicio n°3: Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de estudiantes de 4° años de
educación media.
Construya una tabla de distribución de frecuencia con datos
acumulados, usando 6 intervalos.
La tabla debe tener las siguientes columnas: variable, frecuencia
absoluta, Frecuencia acumulada, frecuencia relativa, marca de clase.
•¿De cuántos elementos consta la muestra?
•¿Cuánto es el rango?
•¿Cuánto es el ancho de la clase?
•¿Cuántos alumnos miden entre 1,75 m y 1,89
m.?
•¿Cuál es la marca de clase de 1,80 – 1,84?
•¿Qué frecuencia absoluta tiene 1,70 – 1,74?
Tabla de intervalos con
límites verdaderos
Usando símbolos de Usando
Está incluidoparéntesis y
No está incluido
Está incluido No está incluido
desigualdad corchetes
Intervalo de Punto Intervalo de Punto
clase medio clase medio
“xi” “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
El tamaño del intervalo es de 5
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
Tabla de distribución de frecuencias
para datos agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar
40 1 55 2 Intervalo Punto f
42 1 56 2 de clase medio “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
Se agregan las columnas de frecuencia
relativa “fr” y frecuencia acumulada “fa”:
Intervalo Punto f fr Fa
2/25
de clase medio
“xi” 4/25
0.08 2
38 – 42 40 2 8/25
0.16 6
43 – 47 45 4
0.32 14
48 – 52 50 8
0.20 19
53 – 57 55 5
0.12 22
58 – 62 60 3
0.12 25
63 - 68 65 3
1
Total 25
Por último se agregan las columnas:
◦ Frecuencia porcentual, “f%” ó “%f”, se
obtiene multiplicando la frecuencia relativa
“fr” x 100.
◦ Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas
anteriores a un dato dado.
◦ Frecuencia porcentual acumulada, “f%a”,
se obtiene sumando las frecuencias
porcentuales acumuladas a un dato dado.
Tablas de frecuencias absoluta,0.08 x
100
relativa y acumulada
0.08 x 2/25
100
Interval Punto f fr f% fa fra f%a
o de medio “xi”
clase 8 0.08 8
38 – 42 40 2 0.08 16 2 0.24 24
43 – 47 45 4 0.16 32 6 0.56 56
48 – 52 50 8 0.32 20 14 0.76 76
53 – 57 55 5 0.20 12 19 0.88 88
58 – 62 60 3 0.12 12 22 1 100
63 - 68 65 3 0.12 100 25
Total 25 1
Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
◦ Polígono de Frecuencias
◦ Histograma
Otros gráficos:
◦ Gráfica de barras
◦ Pictograma
◦ Gráfico Circular o de pastel.
Polígono de Frecuencias
Es la representación mediante un gráfico
de línea. En él se muestra la distribución
de frecuencias y está formado por
segmentos de línea que unen los puntos
correspondientes a la frecuencia de cada
una de las clases. 60
50
40
20
0
Ejemplo
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
El eje “y” puede ser sustituido por las
frecuencias relativas o porcentuales.
Polígono de Frecuencia Relativa
fr
xi
Polígono de Frecuencia Porcentual
%f
xi
Histograma
Es la representación gráfica de
14
12
10
de rectángulos.
4
Ejemplo 38 – 42 40 2
43 – 47 45 4
48 – 52 50 8
53 – 57 55 5
58 – 62 60 3
63 - 68 65 3
Total 25
También podemos usar la frecuencia
relativa y la frecuencia porcentual.
fr
xi
%f
xi
Pirámide Poblacional
Una variante en el histograma es colocar en
el eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias acumuladas de
los datos.
Intervalo Punto f fr fa
de clase medio
“xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
Usando la frecuencia acumulada y la
frecuencia porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Gráfico Circular
También es llamado gráfico de pastel.
43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2°
53 – 57 55 5 0.20 72°
58 – 62 60 3 0.12 43.2°
63 - 68 65 3 0.12 43.2°
Total 25 1 360°
Ejemplo 2
Color Frecuenci Conteo
a
IIII
Azul 4
IIII I
Blanco II I I 7
Café 3
IIII
Gris 4
II
Negro 2
IIII
Rosa 4
I
Verde 1
Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos. 60
50
Frecuencia absoluta
40
30
20
10
0
PERRO PAJARO HAMSTER GATO
Alumno
Carrera
s
Medicina 8
Mecánica 11
Civil 8
Agronomía 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
Pictograma
Similar al de barras, sólo que se
sustituyen por figuras, generalmente
relacionadas con la variable estudiada.