Sunteți pe pagina 1din 69

INTRODUCCIÓN

La Estadística es una ciencia que


facilita la solución de problemas
en los cuales necesitamos
conocer características sobre el
comportamiento de algún suceso
o evento.
Nos permite inferir el comportamiento de
sucesos iguales o similares sin necesidad de
que estos ocurran.
Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo,
así como realizar proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos de
una muestra de la población y no
con toda la población.
CONCEPTOS BÁSICOS
Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para después
obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística
descriptiva mediante técnicas que nos
ayuden a conocer, con determinado
grado de confianza, a la población. Lo
que nos permite tomar decisiones.
Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.

Al número de integrantes de la población se llama


tamaño de la población y se representa con la
letra N.
Las poblaciones pueden ser finitas o infinitas.
Muestra:
Subconjunto de una población, que intenta reflejar
las características de la población lo mejor posible.

El número de individuos que integran la muestra,


llamado tamaño de la muestra se representa con
la letra n.
Individuo:
Es el elemento de la población o de la muestra
que aporta información sobre lo que se estudia.

Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser
univariados,
bivariados
multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
Datos Cuantitativos (números):
Valores obtenidos al medir
peso, estatura, temperatura,
número de hijos.

Datos Cualitativos (categorías):


Se obtienen al calificar la
característica en cuestión
como el sexo, estado civil,
grado máximo de estudios.
Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1)
hombre – mujer,
bueno – malo,
encendido – apagado).

En la variable CUANTITATIVA se pueden distinguir


dos tipos: continua y discreta.
Variable Continua:
Si la variable puede tomar cualquier número
real entre dos valores dados (decimal o entero).
Ej. El peso de un individuo.

Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
ESCALAS DE MEDICIÓN

Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden
hacer operaciones aritméticas entre sus
valores, pues éstos son únicamente
ETIQUETAS.
Ejemplo: sexo, código postal, estado civil,
número telefónico, número al correr en una
maratón, deporte favorito, carrera a estudiar,
etc.
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel específico, pero no se pueden hacer
operaciones aritméticas entre ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno – Excelente
Primaria – Secundaria – Preparatoria - Licenciatura
Escala de Intervalo:
En ella existe un orden entre los valores de la variable
y además una NOCIÓN DE DISTANCIA aunque no se
puedan realizar operaciones.
El cero o punto de inicio no es único, es más bien un
punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la Tierra, la
línea del tiempo de la humanidad.
Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el
cero absoluto, existe orden, se puede
determinar cuántas veces es mayor uno que
otro.
Ejemplo: peso, estatura, edad, distancia, dinero,
etc.
FUENTES DE INFORMACIÓN
Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.

Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
FUENTES DE INFORMACIÓN
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
ORDEN DE DATOS
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.
Hay dos métodos comunes:
Listado en orden ascendente
Método de tallo y hojas
EJEMPLO

Considera que la variable de estudio es el peso


de 25 estudiantes. Los pesos se encuentran
en la siguiente tabla:
Peso de 25 estudiantes (en kg)

40 43 48 51 49
56 44 42 55 52
52 62 44 50 59
63 50 56 55 45
57 66 63 51 58
LISTADO EN ORDEN ASCENDENTE
El proceso consiste en ordenarlos de menor a mayor

Peso de 25 estudiantes (en kg)


Peso de 25 estudiantes (en kg)

42 40 48 51 49 40 42 43 44 44
56 44 43 55 52 45 48 49 50 50
52 62 44 50 59 51 51 52 52 55
55 56 56 57 58
63 50 56 55 45
59 62 63 63 66
57 66 63 51 58
MÉTODO DE TALLO Y HOJAS
Si los números de los datos están formados
por dos dígitos, se hace una columna con el
primer dígito (decenas) y a la derecha de
cada uno de ellos se escribe, en fila, sólo el
segundo dígito (unidades) de cada uno de
los datos que tengan el mismo primer dígito.
Datos sin ordenar:

Peso de 25 estudiantes (en kg)

4 2,0,8,9,4,3,4,5 42 40 48 51 49
Datos ordenados:
5 1,6,5,2,2,0,9,0,6,5,7,1,8 56 44 43 55 52
52 62 44 50 59
6 2,3,6,3
63 50 56 55 45
57 66 63 51 58

4 0,2,3,4,4,5,8,9
5 0,0,1,1,2,2,5,5,6,6,7,8,9
6 2,3,3,6
DOBLE TALLO
Una variante de este método es en lugar de dividir en un grupo las decenas, se divide en dos
grupos. El primero abarcando los dígitos del 0 al 4 y el segundo del 5 al 9.

El ejemplo anterior
queda: 4 0,2,3,4,4
4 5,8,9
5 0,0,1,1,2,2,
5 5,5,6,6,7,8,9
6 2,3,3
6 6
CASO DE VARIABLES CUALITATIVAS
El procedimiento es:

Se identifican todos los valores diferentes y se


acomodan en columna.

Se agrega una segunda columna en donde se


van registrando, mediante una línea vertical, la
veces que aparece el valor dado.
EJEMPLO
Considera que la variable de estudio es el color de playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:

rosa azul blanco azul rosa


gris blanco café negro blanco
rosa azul café blanco blanco
gris azul blanco rosa gris
gris blanco café negro verde
rosa azul blanco azul rosa
gris blanco café negro blanco
rosa azul café blanco blanco Color Frecuencia
gris azul blanco rosa gris Azul IIII
gris blanco café negro verde Blanco IIII II
Café III
Gris IIII
Negro II
Rosa IIII
Verde I
TABLA DE FRECUENCIA DE DATOS

Una vez que se tenga ordenados los datos, se


acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.

La tabla es básicamente una tabla de valores


x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
La frecuencia es el número de veces que aparece cada dato.

Hay dos clases de tablas de frecuencias:


 Para datos NO agrupados.
 Para datos agrupados.
TABLA DE FRECUENCIAS PARA
DATOS NO AGRUPADOS

Está formada por dos columnas: una para la variable “xi” y la otra para su frecuencia “f”, a
esta frecuencia se le llama frecuencia absoluta o frecuencia observada.
EJEMPLO
Tabla de frecuencias de los pesos en kg de 25 alumnos.

xi f xi f
Peso de 25 estudiantes (en kg)
40 1 52 2
42 1 55 2
40 42 43 44 44 43 56
1 2
45 48 49 50 50 44 2 57 1
51 51 52 52 55 45 1 58 1
55 56 56 57 58 48 1 59 1
59 62 63 63 66 49 62
1 1
50 2 63 2
51 2 66 1
Total 25
FRECUENCIA RELATIVA Y ACUMULADA
Por lo regular, se agregan dos columnas: la de la frecuencia relativa “fr” y la de la
frecuencia acumulada “fa”.
La frecuencia relativa se obtiene mediante el cociente de la frecuencia y el número
total de datos, esto es fr = f/n.
La frecuencia acumulada se obtiene sumando las frecuencias anteriores a las
frecuencias de un dato dado.
EJEMPLO

1/25
xi f fr fa xi f fr fa
40 1 0.04 1 52 2 0.08 14
42 1 0.04 2 55 2 0.08 16
43 1 3 2/25 56 2 0.08 18
0.04
44 2 0.08 5 57 1 0.04 19
45 1 0.04 6 58 1 0.04 20
48 1 0.04 7 59 1 0.04 21 Siempre
49 1 0.04 8 62 1 0.04 22 es el
50 2 63 2 número
0.08 10 0.08 24
total
51 2 0.08 12 66 1 0.04 25
Total 25 1

Siempre es 1
INTERVALO DE CLASE

En ocasiones es conveniente acomodar los


datos en pequeños grupos de igual tamaño,
llamados intervalos de clase.
El punto medio o marca de clase “xi”, se
obtiene con:
Marca de clase Límite inferior + límite superior
2
=
El tamaño del intervalo se obtiene mediante
la diferencia de los límites superior e
EJEMPLO

Límite inferior Límite superior Lím inf + Lim sup


2
Intervalo de clase Punto medio “xi”
38 – 42 40
43 – 47 45
48 – 52 50
53 – 57 55
58 – 62 60
63 – 67 65
LÍMITE VERDADERO DEL INTERVALO
Frontera de clase o límite verdadero del intervalo:

Intervalo de clase Punto medio “xi”


37.5 – 42.5 40
40 – 2.5 42.5 – 47.5 40 + 2.5 45
47.5 – 52.5 50
52.5 – 57.5 55
57.5 – 62.5 60
62.5 – 67.5 65
TABLA DE INTERVALOS CON
LÍMITES VERDADEROS

Usando símbolos de desigualdad


Usando
Está incluidoparéntesis y
No está incluido
Está incluido No está incluido
corchetes
Intervalo de Punto Intervalo de Punto
clase medio “xi” clase medio “xi”
37.5 ≤ x < 42.5 40 [37.5 , 42.5) 40
42.5 ≤ x < 47.5 45 [42.5 , 47.5) 45
47.5 ≤ x < 52.5 50 [47.5 , 52.5) 50
52.5 ≤ x < 57.5 55 [52.5 , 57.5) 55
57.5 ≤ x < 62.5 60 [57.5 , 62.5) 60
62.5 ≤ x < 67.5 65 [62.5 , 67.5) 65
El tamaño del intervalo es de 5
Si por alguna razón no es fácil decidir el ancho del intervalo y el número de ellos, se pueden
utilizar las siguientes fórmulas:

 K = 1 + 3.3 log (n)


 Donde K = número aproximado de clases

n = número de datos.
 Amplitud de los intervalos = Rango / K
 Donde Rango = diferencia entre el dato mayor
y el dato menor.
EJEMPLO
Para el ejemplo de los datos de los pesos de 25 alumnos, el valor de K:

Y la amplitud de los intervalos sería:


K = 1 + 3.3 log (n) = 1 + 3.3 log (25) = 5.6.
Por lo tanto se requieren aproximadamente 6
intervalos.

Amplitud = Rango / K = (66 – 40) / 5.6 = 4.64.


Aproximadamente 5 unidades es la amplitud de
los intervalos.
TABLA DE DISTRIBUCIÓN DE FRECUENCIAS
PARA DATOS AGRUPADOS

Se elabora con los intervalos de clase, sus puntos medios y las frecuencias
correspondientes para cada uno de los intervalos.

xi f 52 2 Datos agrupados
Datos sin agrupar

40 1 55 2 Intervalo de Punto medio f


42 1 56 2 clase “xi”
43 1 57 1 38 – 42 40 2
44 2 58 1 43 – 47 45 4
45 1 59 1 48 – 52 50 8
48 1 62 1 53 – 57 55 5
49 1 63 2 58 – 62 60 3
50 2 66 1 63 - 67 65 3
51 2 Total 25 Total 25
Se agregan las columnas de frecuencia relativa “fr” y frecuencia acumulada “fa”:

Intervalo Punto f fr Fa 2/25


de clase medio “xi”
4/25
38 – 42 40 2 0.08 2
8/25
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Por último se agregan las columnas:
Frecuencia porcentual, “f%” ó “%f”, se obtiene
multiplicando la frecuencia relativa “fr” x 100.
Frecuencia relativa acumulada “fra”, se obtiene
sumando las frecuencias relativas anteriores a
un dato dado.
Frecuencia porcentual acumulada, “f%a”, se
obtiene sumando las frecuencias porcentuales
acumuladas a un dato dado.
TABLAS DE FRECUENCIAS ABSOLUTA, RELATIVA0.08 x
Y ACUMULADA 100

0.08 x 2/25
100
Intervalo Punto medio f fr f% fa fra f%a
de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
GRÁFICA DE DATOS

Existen dos tipos de gráficas mas usuales:


Polígono de Frecuencias
Histograma

Otros gráficos:
Gráfica de barras
Pictograma
Gráfico Circular o de pastel.
POLÍGONO DE FRECUENCIAS

Es la representación mediante un gráfico


de línea. En él se muestra la distribución
de frecuencias y está formado por
segmentos de línea que unen los puntos
correspondientes a la frecuencia de
cada una de las clases.

El eje “x” representa el dato “xi”


y el eje “y” las frecuencias.
EJEMPLO

9 Polígono de Frecuencias
8
7
6
5
f 4
Intervalo de Punto medio “xi” f 3
clase 2
38 – 42 40 2 1
0
43 – 47 45 4
35 40 45 50 55 60 65 70
48 – 52 50 8 xi
53 – 57 55 5

58 – 62 60 3

63 - 68 65 3

Total 25
El eje “y” puede ser sustituido por las frecuencias relativas o porcentuales.

Polígono de Frecuencia Relativa


0.35

0.3

0.25
fr 0.2

0.15

0.1

0.05

0
35 40 45 50 55 60 65 70
xi
Polígono de Frecuencia Porcentual

35

30

25

% f 20

15

10

0
35 40 45 50 55 60 65
xi
HISTOGRAMA

Es la representación gráfica de 14

los datos mediante una sucesión


12

10

de rectángulos.
6

Está formado por rectángulos cuya


0
0,95 2,95 4,95

anchura representa a cada uno de los


intervalos y la altura corresponde a la
frecuencia.
En el eje “x” estarán los límites
verdaderos, los puntos medios y en el
eje “y” las frecuencias.
Intervalo de Punto medio “xi” f
EJEMPLO clase
38 – 42 40 2

43 – 47 45 4

48 – 52 50 8

53 – 57 55 5

58 – 62 60 3
Histograma
63 - 68 65 3
9
Total 25
8
7
6
5
f
4
3
2
1
0
35 40 45 50 55 60 65
xi
También podemos usar la frecuencia relativa y la frecuencia porcentual.

Histograma con frecuencias relativas


0.35
0.3
0.25
fr
0.2
0.15
0.1
0.05
0
35 40 45 50 55 60 65
xi
Histograma con frecuencias porcentuales
35

30

25

20
%f
15

10

0
35 40 45 50 55 60 65
xi
PIRÁMIDE POBLACIONAL

Una variante en el histograma es colocar en el


eje “x” de tal manera que las columnas
quedarán en forma horizontal, es muy
común en datos poblacionales.
OJIVA

Es la representación gráfica de las


frecuencias acumuladas mediante un
gráfico de línea. Se muestra la
distribución de frecuencias acumuladas
de los datos.

En el eje “x” estarán los puntos medios y


en el eje “y” las frecuencias
acumuladas.
EJEMPLO

Intervalo Punto f fr fa
de clase medio “xi”
38 – 42 40 2 0.08 2
43 – 47 45 4 0.16 6
48 – 52 50 8 0.32 14
53 – 57 55 5 0.20 19
58 – 62 60 3 0.12 22
63- 68 65 3 0.12 25
Total 25 1
Ojiva
30

25 25

22
20 19

fa 15 14

10
6
5
2
0 0
35 40 45 50 55 60 65
xi
Usando la frecuencia acumulada y la frecuencia porcentual.

Intervalo Punto medio f fr f% fa fra f%a


de clase “xi”
38 – 42 40 2 0.08 8 2 0.08 8
43 – 47 45 4 0.16 16 6 0.24 24
48 – 52 50 8 0.32 32 14 0.56 56
53 – 57 55 5 0.20 20 19 0.76 76
58 – 62 60 3 0.12 12 22 0.88 88
63- 68 65 3 0.12 12 25 1 100
Total 25 1 100
Ojiva con frecuencia relativa acumulada
1
0.9 0.88

0.8 0.76
0.7
0.6 0.56
fra 0.5
0.4
0.3
0.24
0.2
0.1 0.08

0 0

35 40 45 50 55 60
xi
Ojiva con frecuencia porcentual acumulada
100
90 88

80 76
70
60 56
f%a 50
40
30
24
20
10 8

0 0

35 40 45 50 55 60
xi
GRÁFICO CIRCULAR
También es llamado gráfico de pastel.

Sólo se representan datos de frecuencias relativas o frecuencias porcentuales.

Se debe dividir el área del círculo de manera proporcional a las frecuencias.

13% 13%
PERRO
17%
PAJARO
HAMSTER
GATO
57%
Agregaremos una columna a nuestra tabla de
frecuencias “Frecuencia relativa al círculo”,
multiplicando (fr)(360°), para mostrar la
parte proporcional de círculo medida en
grados que corresponde a cada intervalo.
EJEMPLO 1

0.08 x
360°
Intervalo Punto medio f fr (fr ) (360°)
de clase “xi” 0.16 x
38 – 42 40 2 0.08 28.8° 360°

43 – 47 45 4 0.16 57.6°
48 – 52 50 8 0.32 115.2
53 – 57 55 5 0.20 °72°
58 – 62 60 3 0.12 43.2°
63- 68 65 3 0.12 43.2°
Total 25 1 360°
Gráfico Circular 40
8%
60
12% 65
12% 45
16%

55
20% 50
32%
EJEMPLO 2

Color Frecuencia Conteo Color de Playera


Azul IIII 4 Azul Blanco Café Gris
Negro Rosa Verde
Blanco IIII II 7 4%
Café III 3 16% 16%

Gris IIII 4 8%
28%
Negro II 2 16%
Rosa IIII 4 12%
Verde I 1
OTROS GRÁFICOS

La gráfica de barras se traza similar al


Histograma, sólo que las barras se
dibujan separadas unas de otras.
La escala en el eje “x” es para mostrar
categorías o intervalos de números NO
consecutivos.
60
Frecuencia absoluta

50

40

30

20

10

0
PERRO PAJARO HAMSTER GATO
Carrera Alumnos
Elección de Carrera
Medicina 8
Mecánica 11 11 11
Civil 8 8 8
6
Agronomía 3 3 3
Físico - Matemáticas 3
Leyes 6
Contaduría 11
PICTOGRAMA
Similar al de barras, sólo que se sustituyen por figuras, generalmente relacionadas
con la variable estudiada.

S-ar putea să vă placă și