Sunteți pe pagina 1din 76

ELEMENTOS DE ESTADÍSTICA

DESCRIPTIVA

Srta. Yanira Castro Lizana


Introducción
La Estadística es una ciencia que
facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso
o evento.

 Nos permite inferir el


comportamiento de sucesos iguales
o similares sin necesidad de que
estos ocurran.
 Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo, así
como realizar proyecciones del
comportamiento del suceso.

 Sólo se realizan los cálculos y el


análisis con los datos obtenidos de
una muestra de la población y no
con toda la población.
Actualmente el INE es el encargado de
concentrar y publicar la información
estadística del estado y del país.
Conceptos básicos
 Estadística:
Es la ciencia que se encarga de recolectar, organizar,
resumir y analizar datos para después obtener
conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.

 Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a
conocer, con determinado grado de
confianza, a la población. Lo que nos
permite tomar decisiones.
 Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.

Al número de integrantes de la población se


llama tamaño de la población y se representa
con la letra N.

Las poblaciones pueden ser finitas o infinitas.


Población Estadística:
Conjunto de TODOS los DATOS que se
obtienen al realizar la medición de una variable
en los elementos de una población.

 Muestra:
Subconjunto de una población, que intenta
reflejar las características de la población lo
mejor posible.
El número de individuos que integran la
muestra, llamado tamaño de la muestra se
representa con la letra n.
 Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.

 Variable:
Característica o propiedad de los individuos
que se desea estudiar y se puede medir o
calificar; cambia o varía con el tiempo en un
individuo dado, o cambia o varía de elemento
a elemento.
Ej. Edad, peso, sexo, estado civil, número de
hijos, etc.
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o
multivariados.

La naturaleza de los datos pueden ser datos


cuantitativos o datos cualitativos.
Datos Cuantitativos
(números):
Valores obtenidos al medir
peso, estatura, temperatura,
número de hijos.
 Datos Cualitativos
(categorías):
Se obtienen al calificar la
característica en cuestión como
el sexo, estado civil, grado
máximo de estudios.
 Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre
– mujer, bueno – malo, encendido – apagado).

En la variable CUANTITATIVA se pueden


distinguir dos tipos: continua y discreta.
Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.

 Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un
individuo.
Escalas de Medición
Escala Nominal

 Escala Ordinal

 Escala de Intervalo

 Escala de Razón
Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritméticas entre sus
valores, pues éstos son únicamente
ETIQUETAS.

Ejemplo: sexo, código postal, estado civil,


número telefónico, número al correr en un
maratón, deporte favorito, carrera a estudiar,
etc.
Escala Ordinal:
Los valores de la variable que tienen un
ORDEN con un nivel específico, pero no se
pueden hacer operaciones aritméticas entre
ellas.

Ejemplo:
Pésimo – Malo – Regular – Bueno –
Excelente
Primaria – Secundaria – Preparatoria -
Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de
la variable y además una NOCIÓN DE
DISTANCIA aunque no se puedan realizar
operaciones.
El cero o punto de inicio no es único, es más
bien un punto de referencia.

Ejemplo: Escalas de temperatura, la edad de


la Tierra, la línea del tiempo de la
humanidad.
Escala de Razón:
La magnitud tiene SENTIDO FÍSICO,
existe el cero absoluto, existe orden, se
puede determinar cuántas veces es mayor
uno que otro.

Ejemplo: peso, estatura, edad, distancia,


dinero, etc.
Fuentes de información

Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.

 Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Fuentes de Información

 Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Orden de datos
La ordenación es el proceso mediante el cual
los datos están acomodados de tal manera
que se establece un orden (ascendente o
descendente) entre ellos.

Hay dos métodos comunes:


• Listado en orden ascendente
• Método de tallo y hojas
Ejemplo
Considera que la variable de estudio es el
peso de 25 estudiantes. Los pesos se
encuentran en la siguiente tabla:
Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
Listado en orden ascendente
El proceso consiste en ordenarlos de
menor a mayor
Peso de 25 estudiantes (en kg) Peso de 25 estudiantes (en kg)

42 40 48 51 49
40 42 43 44 44
56 44 43 55 52
45 48 49 50 50
52 62 44 50 59
51 51 52 52 55
63 50 56 55 45
55 56 56 57 58
57 66 63 51 58
59 62 63 63 66
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno de
ellos se escribe, en fila, sólo el segundo dígito
(unidades) de cada uno de los datos que tengan
el mismo primer dígito.
Datos sin ordenar: Peso de 25 estudiantes (en kg)
4 2,0,8,9,4,3,4,5 42 40 48 51 49
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
6 52 62 44 50 59
2,3,6,3
63 50 56 55 45
57 66 63 51 58
Datos ordenados:
4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
Doble tallo
Una variante de este método es en lugar de
dividir en un grupo las decenas, se divide en dos
grupos. El primero abarcando los dígitos del 0 al
4 y el segundo del 5 al 9.

Elejemplo anterior 4 0,2,3,4,4


queda: 4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
Caso de variables cualitatitivas
El procedimiento es:

◦ Se identifican todos los valores diferentes y se


acomodan en columna.

◦ Se agrega una segunda columna en donde se


van registrando, mediante una línea vertical, la
veces que aparece el valor dado.
Ejemplo
Considera que la variable de estudio es el
color de playera de 25 estudiantes.
Los colores se encuentran en la siguiente
tabla:

rosa azul blanco azul rosa


gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
Color Frecuenci
rosa azul blanco azul rosa a
IIII
gris blanco café negro blanco Azul
IIII I
rosa azul café blanco blanco Blanco II I I
gris azul blanco rosa gris Café
IIII
gris blanco café negro verde Gris
II
Negro
IIII
Rosa
I
Verde
Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.

La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
La frecuencia es el número de veces que
aparece cada dato.

Hay dos clases de tablas de frecuencias:


◦ Para datos NO agrupados.
◦ Para datos agrupados.
Tabla de frecuencias para
datos NO agrupados

Está formada por dos columnas: una para la


variable “xi” y la otra para su frecuencia
“f”, a esta frecuencia se le llama frecuencia
absoluta o frecuencia observada.
Ejemplo
Tabla de frecuencias de los pesos en kg
de 25 alumnos.
xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la
de la frecuencia relativa “fr” y la de la
frecuencia acumulada “fa”.
La frecuencia relativa se obtiene
mediante el cociente de la frecuencia y el
número total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene
sumando las frecuencias anteriores a las
frecuencias de un dato dado.
 Rango: es la diferencia entre el dato mayor
y el dato menor.
Ejemplo
1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 10 63 2 número
0.08 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Tot 25 1
al
Siempre es 1
Ejercicio nº1: En una muestra de 40 familias, el número
de hijos se distribuye según
la tabla:
Complete la tabla y responda.
•¿Cuántas familias tienen menos de 4 hijos?
•¿Cuántas familias tienen 5 hijos?
•¿Cuántas familias tienen 5 hijos o menos?
•¿Cuál es la frecuencia relativa de las familias de 2 hijos?

Nº de Nº de F fr
hijos familias
1 2
2 8
3 12
4 14
5 3
6 1
La Tabla de Distribución de Frecuencia con DATOS
ACUMULADOS ( o AGRUPADOS), es aquella que en la
variable los datos se presentan en intervalos también
llamados clases.
El término central de un intervalo se llama MARCA
DE CLASE, que es el representante de la clase.
Para determinar el tamaño de cada intervalo (ancho
de clase ), se divide el rango por la cantidad de intervalos
que se desea obtener.
Se forman, tantas clases hasta cubrir el dato mayor.
Intervalo de clase
 En ocasiones es conveniente acomodar los datos en pequeños grupos
de igual tamaño, llamados intervalos de clase.
 El punto medio o marca de clase “xi”, se obtiene con:

 El tamaño del intervalo se obtiene mediante la diferencia de los


límites superior e inferior.

Marca de clase = Límite inferior + límite superior


2
Ejemplo Estudiantes de una universidad
  La siguiente tabla muestra el peso de 50 estudiantes entrevistados.
 a) Ordenar los datos de menor a mayor.
 b) Determinar el rango.
 c) Construir los intervalos de clase con su respectiva frecuencia.
 d) Determinar las frecuencias relativas.
 e) Determinar las frecuencias relativas porcentuales.
 f) Determinar las frecuencias acumuladas
 g) Determinar las frecuencias acumuladas relativas.
 h) Determinar las marcas de clase de cada intervalo.

Peso de los estudiantes en kilogramos

50 67 50 58 61 59 41 59 42 60
55 48 45 58 69 46 51 52 40 65
53 52 68 53 46 60 50 54 54 40
44 41 49 45 47 56 48 53 55 51
47 52 51 58 54 51 52 55 60 58
a)Ordenando de menor a mayor la tabla queda ordenada como se indica
enseguida:

Peso de los estudiantes en


kilogramos

40 44 47 50 51 52 54 56 59 65
40 45 47 50 51 53 54 58 59 66
41 45 48 50 52 53 55 58 60 67
41 46 48 51 52 53 55 58 60 68
42 46 49 51 52 54 55 58 61 69

b) Rango

Rango = Valor mayor - valor menor = (69 - 40)kg = 29 kg


c) Para construir los intervalos de clase con su respectivas frecuencias se procede a
determinar primermanete el tamaño de las clases usando la siguiente fórmula:

Tamaño de clase = Rango/Número de clases = 29 kg / 6 kg = 4.83

Redondeando este valor se determina que el tamaño de las clases será


igual a 5. Para los 50 datos, utilizando la tabla de Ryan, se emplearán 6
clases.

Tamaño de clase = 5

Teniendo estos valores se procede a realizar la tabla de frecuencias. Se


empezará con el valor menor que es 40 y se toman 5 valores en orden
ascendente de acuerdo al tamaño de clase que obtuvimos anteriormente,
esto es: 40, 41, 42, 43 y 44. Por lo que el primer intervalo quedará como:
40-44, el segundo sería 45, 46, 47, 48, 49 (45-49), el tercero 50-54 y así
sucesivamente hasta completar la tabla que se muestra enseguida:
Las marcas de clase nos servirán para construir histogramas y polígonos de frecuencia que será un tema que se verá mas adelante. Lo
Clase Frec. Frec. Frec. relat. Frecuencia Frec. acum.
relativa porcentual acumulada relativa
40 - 44 6 0.12 12 6 12
45 - 49 9 0.18 18 15 30
50 - 54 17 0.34 34 32 64
55 - 59 10 0.20 20 42 84
60 - 64 3 0.60 60 45 90
65 - 69 5 0.10 10 50 100
Total 50 1.00 100%

Para la primera clase: (40+44) / 2 = 84 / 2 = 42;


Para la segunda clase: (45+49) / 2 = 94 / 2 = 47; etc.
Por lo que tabla completa quedará como se indica enseguida:

Marca de clase = (Límite inferior + Límite superior) / 2

Clase Marcas de Frec. Frec. Frec. relat. Frecuencia Frec. acum.


clase relativa porcentual acumulada relativa

40 - 44 42 6 0.12 12 6 12
45 - 49 47 9 0.18 18 15 30
50 - 54 52 17 0.34 34 32 64
55 - 59 57 10 0.20 20 42 84
60 - 64 62 3 0.60 60 45 90
65 - 69 67 5 0.10 10 50 100
Total 50 1.00 100%
   Las marcas de clase nos servirán para
construir histogramas y polígonos de
frecuencia que será un tema que se verá
mas adelante. Lo importante por ahora es
conocer claramente como se construye una
tabla de frecuencias y las partes que se
originan después de dicha construcción.
Ejemplo
Límite inferior Límite superior Lím inf + Lim sup
2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65
Límite verdadero del intervalo
Frontera de clase o límite verdadero del
intervalo:
Intervalo de clase Punto medio “xi”
37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
Ejercicio n°3: Consideremos los siguientes datos, expresados en metros,
correspondientes a las estaturas de estudiantes de 4° años de
educación media.
Construya una tabla de distribución de frecuencia con datos
acumulados, usando 6 intervalos.
La tabla debe tener las siguientes columnas: variable, frecuencia
absoluta, Frecuencia acumulada, frecuencia relativa, marca de clase.
•¿De cuántos elementos consta la muestra?
•¿Cuánto es el rango?
•¿Cuánto es el ancho de la clase?
•¿Cuántos alumnos miden entre 1,75 m y 1,89
m.?
•¿Cuál es la marca de clase de 1,80 – 1,84?
•¿Qué frecuencia absoluta tiene 1,70 – 1,74?
Tabla de intervalos con
límites verdaderos
Usando símbolos de  Usando
Está incluidoparéntesis y
No está incluido
Está incluido No está incluido
desigualdad corchetes
Intervalo de Punto Intervalo de Punto
clase medio clase medio
“xi” “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
El tamaño del intervalo es de 5
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
Tabla de distribución de frecuencias
para datos agrupados
Se elabora con los intervalos de clase, sus
puntos medios y las frecuencias
correspondientes para cada uno de los
intervalos.
xi f 52 2 Datos agrupados
Datos sin agrupar

40 1 55 2 Intervalo Punto f
42 1 56 2 de clase medio “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
Se agregan las columnas de frecuencia
relativa “fr” y frecuencia acumulada “fa”:
Intervalo Punto f fr Fa
2/25
de clase medio
“xi” 4/25
0.08 2
38 – 42 40 2 8/25
0.16 6
43 – 47 45 4
0.32 14
48 – 52 50 8
0.20 19
53 – 57 55 5
0.12 22
58 – 62 60 3
0.12 25
63 - 68 65 3
1
Total 25
Por último se agregan las columnas:
◦ Frecuencia porcentual, “f%” ó “%f”, se
obtiene multiplicando la frecuencia relativa
“fr” x 100.
◦ Frecuencia relativa acumulada “fra”, se
obtiene sumando las frecuencias relativas
anteriores a un dato dado.
◦ Frecuencia porcentual acumulada, “f%a”,
se obtiene sumando las frecuencias
porcentuales acumuladas a un dato dado.
Tablas de frecuencias absoluta,0.08 x
100
relativa y acumulada
0.08 x 2/25
100
Interval Punto f fr f% fa fra f%a
o de medio “xi”
clase 8 0.08 8
38 – 42 40 2 0.08 16 2 0.24 24
43 – 47 45 4 0.16 32 6 0.56 56
48 – 52 50 8 0.32 20 14 0.76 76
53 – 57 55 5 0.20 12 19 0.88 88
58 – 62 60 3 0.12 12 22 1 100
63 - 68 65 3 0.12 100 25
Total 25 1
Gráfica de Datos
Existen dos tipos de gráficas mas usuales:
◦ Polígono de Frecuencias
◦ Histograma

Otros gráficos:
◦ Gráfica de barras
◦ Pictograma
◦ Gráfico Circular o de pastel.
Polígono de Frecuencias
Es la representación mediante un gráfico
de línea. En él se muestra la distribución
de frecuencias y está formado por
segmentos de línea que unen los puntos
correspondientes a la frecuencia de cada
una de las clases. 60

50

40

El eje “x” representa el dato “xi”


30

20

y el eje “y” las frecuencias.


10

0
Ejemplo

Intervalo de Punto medio f


clase “xi”
38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
El eje “y” puede ser sustituido por las
frecuencias relativas o porcentuales.
Polígono de Frecuencia Relativa

fr

xi
Polígono de Frecuencia Porcentual

%f

xi
Histograma
Es la representación gráfica de
14

12

10

los datos mediante una sucesión


8

de rectángulos.
4

Está formado por rectángulos cuya


0,95 2,95 4,95

anchura representa a cada uno de los


intervalos y la altura corresponde a la
frecuencia.
En el eje “x” estarán los límites
verdaderos, los puntos medios y en el eje
“y” las frecuencias.
Intervalo de Punto medio f
clase “xi”

Ejemplo 38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
También podemos usar la frecuencia
relativa y la frecuencia porcentual.

fr

xi
%f

xi
Pirámide Poblacional
Una variante en el histograma es colocar en
el eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy común
en datos poblacionales.
Ojiva
Es la representación gráfica de las
frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias acumuladas de
los datos.

En el eje “x” estarán los puntos medios y


en el eje “y” las frecuencias acumuladas.
Ejemplo

Intervalo Punto f fr fa
de clase medio
“xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63 - 68 65 3 0.12 25
Total 25 1
Usando la frecuencia acumulada y la
frecuencia porcentual.
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63 - 68 65 3 0.12 12 25 1 100
Total 25 1 100
Gráfico Circular
También es llamado gráfico de pastel.

Sólo se representan datos de frecuencias


relativas o frecuencias porcentuales.

Sedebe dividir el área del círculo de


manera proporcional a las frecuencias.
13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%
Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la parte
proporcional de círculo medida en grados
que corresponde a cada intervalo.
Ejemplo 1
0.08 x
360°
Intervalo Punto f fr (fr ) (360°)
de clase medio “xi” 0.16 x
38 – 42 40 2 0.08 28.8° 360°

43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2°
53 – 57 55 5 0.20 72°
58 – 62 60 3 0.12 43.2°
63 - 68 65 3 0.12 43.2°
Total 25 1 360°
Ejemplo 2
Color Frecuenci Conteo
a
IIII
Azul 4
IIII I
Blanco II I I 7
Café 3
IIII
Gris 4
II
Negro 2
IIII
Rosa 4
I
Verde 1
Otros Gráficos
La gráfica de barras se traza similar al
Histograma, sólo que las barras se dibujan
separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos. 60

50
Frecuencia absoluta

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Alumno
Carrera
s
Medicina 8
Mecánica 11
Civil 8
Agronomía 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
Pictograma
Similar al de barras, sólo que se
sustituyen por figuras, generalmente
relacionadas con la variable estudiada.

S-ar putea să vă placă și