Sunteți pe pagina 1din 92

Describir o pronosticar el comportamiento de la

poblacin con base en informacin obtenida de


una muestra representativa de esa poblacin

Estadstica descriptiva
La rama de la estadstica que presenta tcnicas para describir conjuntos
de mediciones.
Grficas de barras
Grficas de pastel
Grficas de lneas presentadas por un candidato poltico
Tablas numricas en el peridico
Promedio de cantidad de lluvia informado por el pronosticador del
clima en la televisin local
Las grficas y resmenes numricos generados en computadoras son
comunes en nuestra comunicacin de todos los das

La estadstica descriptiva est formada por procedimientos


empleados para resumir y describir las caractersticas importantes de
un conjunto de mediciones.
La estadstica inferencial
Est formada por procedimientos empleados para hacer inferencias
acerca de caractersticas poblacionales, a partir de informacin
contenida en una muestra sacada de esta poblacin.
El objetivo de la estadstica inferencial
es hacer inferencias (es decir, sacar conclusiones, hacer predicciones,
tomar decisiones) acerca de las caractersticas de una poblacin a
partir de informacin contenida en una muestra.

Cmo puede hacer inferencias acerca de una poblacin


utilizando informacin contenida en una muestra?
1. Especifique las preguntas a contestar e identifique la poblacin de
inters.
2. Decida cmo seleccionar la muestra.
3. Seleccione la muestra y analice la informacin muestral.
4. Use la informacin del paso 3 para hacer una inferencia acerca de
la poblacin.
5. Determine la confiabilidad de la inferencia.

VARIABLES Y DATOS
Variable
Es una caracterstica que cambia o vara con el tiempo y/o para
diferentes personas u objetos bajo consideracin.

Unidad experimental
Es el individuo u objeto en el que se mide una variable.
Resulta una sola medicin o datos cuando una variable se mide en
realidad en una unidad experimental.

Poblacin
Es el conjunto de mediciones de inters para el investigador.
Muestra
Es un subconjunto de mediciones seleccionado de la poblacin de
inters.
Estudiante Promedio Genero
1
2.0 F
2
2.3 F
3
2.9 M
4
2.7 M
5
2.6 F

Ao
Primero
Pasante
Segundo
Primero
Graduado

Carrera
Psicologa
Matemticas
Ingles
Ingles
Negocios

Datos univariados
Cuando se mide una sola variable en una sola unidad experimental.
Datos bivariados
Cuando se miden dos variables en una sola unidad experimental.
Datos multivariados
Cuando se miden ms de dos variables.

TIPOS DE VARIABLES
Las variables cualitativas
Miden una cualidad o caracterstica en cada unidad experimental.
Gnero
Especialidad
Afiliacin poltica
Clasificacin de gusto: excelente, bueno, regular, malo, Color de
un dulce

TIPOS DE VARIABLES
Las variables cuantitativas
Miden una cantidad numrica en cada unidad experimental.
Producen datos numricos, por ejemplo estos:
x
x
x
x

= tasa preferencial de inters


= nmero de pasajeros en un vuelo de Los ngeles a Nueva York
= peso de un paquete listo para ser enviado
= volumen de jugo de naranja en un vaso

TIPOS DE VARIABLES
Variable discreta
Puede tomar slo un nmero finito o contable de valores.
Nmero de miembros de una familia
Nmero de ventas de autos nuevos
Nmero de llantas defectuosas devueltas para cambio son todos
ellos ejemplos de variables discretas

TIPOS DE VARIABLES
Variable continua
Puede tomar infinitamente muchos valores correspondientes a los puntos
en un intervalo de recta.
Pueden tomar valores en cualquier punto a lo largo de un intervalo de
recta

Estatura
Peso
Tiempo
Distancia
Volumen

Para cualesquier dos valores que se escojan, un tercer valor siempre puede
hallarse entre ellos.

TIPOS DE VARIABLES
Identifique cada una de las siguientes variables como cualitativas o
cuantitativas:
1. El uso ms frecuente de su horno de microondas (recalentar,
descongelar, calentar, otros).
2. El nmero de consumidores que se niegan a contestar una encuesta
por telfono.
3. La puerta escogida por un ratn en un experimento de laberinto (A,
B o C)
4. El tiempo ganador para un caballo que corre en el Derby de
Kentucky
5. El nmero de nios en un grupo de quinto grado que leen al nivel
de ese grado o mejor

Por qu deben preocuparse por diferentes clases de variables y los


datos que generan?
La razn es que los mtodos empleados para describir conjuntos de
datos dependen del tipo de datos que haya recolectado

GRFICAS PARA DATOS CATEGRICOS


Una vez recolectados los datos, stos pueden consolidarse y
resumirse para mostrar la siguiente informacin:
Qu valores de la variable han sido medidos?
Con qu frecuencia se presenta cada uno de los valores?
La frecuencia o nmero de mediciones en cada categora
La frecuencia relativa o proporcin de mediciones en cada categora
El porcentaje de mediciones en cada categora

GRFICAS PARA DATOS CATEGRICOS


=

= 100
Las categoras para una variable cualitativa deben escogerse de modo
que:
Una medicin pertenecer a una categora y slo a una
Cada medicin tiene una categora a la que se puede asignar

GRFICAS PARA DATOS CATEGRICOS


Grfica de pastel
Es la conocida grfica circular que muestra la forma en que estn
distribuidas las medidas entre las categoras.

ngulo = Frecuencia relativa X 360


Grfica de barras
Muestra la misma distribucin de medidas en categoras, con la altura
de la barra midiendo la frecuencia con la que se observa una categora
en particular.

GRFICAS PARA DATOS CATEGRICOS

GRFICAS PARA DATOS CATEGRICOS

GRFICAS PARA DATOS CATEGRICOS

GRFICAS PARA DATOS CATEGRICOS

GRFICAS PARA DATOS CATEGRICOS

GRFICAS PARA DATOS CATEGRICOS


Grfica de Pareto
Grfica de barras en la que las barras estn ordenadas de mayor a
menor.

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de pastel, Grficas de barras y Grfica de Pareto

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de lneas
Cuando una variable cuantitativa se registra en el tiempo a intervalos
igualmente espaciados (por ejemplo diario, semanal, mensual,
trimestral o anual), el conjunto de datos forma una serie de tiempo.
La idea es tratar de distinguir un patrn o tendencia que sea probable
de continuar en el futuro y luego usar ese patrn para hacer
predicciones precisas para el futuro inmediato.

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de lneas

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de puntos

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de tallo y hoja

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de tallo y hoja

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de tallo y hoja

GRFICAS PARA DATOS CUANTITATIVOS


Grficas de tallo y hoja

Interpretacin de grficas con ojo crtico


Una vez creada una grfica o grficas, para un conjunto de datos, qu
se debe buscar al tratar de describir los datos?
1. Verificar las escalas horizontales y verticales, de manera que haya
claridad respecto a lo que se mide.
2. Examinar el lugar de la distribucin de datos. Dnde est el centro
de distribucin del eje horizontal? Si se comparan dos
distribuciones, estn centradas en el mismo lugar?

Interpretacin de grficas con ojo crtico


3. Examinar la forma de la distribucin.
La distribucin tiene un pico, un punto que es ms alto que
cualquier otro?
Hay ms de un pico?
Hay un nmero aproximadamente igual de mediciones a la
izquierda y derecha del pico?
4. Buscar cualesquiera mediciones poco comunes o resultados

atpicos.
Hay mediciones mucho mayores o menores que todas las otras?

DISTRIBUCIONES SEGN SUS FORMAS


Distribucin simtrica
si los lados izquierdo y derecho de la distribucin, cuando se divide en el
valor medio, forman imgenes espejo.
Distribucin est sesgada a la derecha si una proporcin ms grande de las
mediciones se encuentra a la derecha del valor pico. Las distribuciones
sesgadas a la derecha contienen pocas mediciones anormalmente grandes.
Distribucin est sesgada a la izquierda si una proporcin mayor de las
mediciones est a la izquierda del valor pico. Las distribuciones sesgadas a
la izquierda contienen pocas mediciones anormalmente grandes.
Distribucin unimodal si tiene un pico
Distribucin bimodal tiene dos picos. Las distribuciones bimodales
representan a veces una combinacin de dos poblaciones diferentes del
conjunto de datos.

DISTRIBUCIONES SEGN SUS FORMAS

DISTRIBUCIONES SEGN SUS FORMAS

HISTOGRAMAS DE FRECUENCIA RELATIVA


Para un conjunto de datos cuantitativo es una grfica de barras en la
que la altura de la barra muestra con qu frecuencia (medida como
proporcin o frecuencia relativa) las mediciones caen en una clase o
subintervalo particular.
Las clases o subintervalos se grafican a lo largo del eje horizontal.

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA

HISTOGRAMAS DE FRECUENCIA RELATIVA


Cmo construyo un histograma de frecuencia relativa?

1. Escoja el nmero de clases, por lo general entre 5 y 12. Cuantos


ms datos se tengan, ms clases deben usarse.
2. Calcule el ancho aproximado de clase al dividir la diferencia entre
los valores mximo y mnimo entre el nmero de clases.
3. Redondee el ancho aproximado de clase hasta un nmero cmodo.
4. Si los datos son discretos, se puede asignar una clase para cada
valor entero tomado por los datos. Para un nmero grande de
valores enteros, puede que sea necesario agruparlos en clases.

HISTOGRAMAS DE FRECUENCIA RELATIVA


Cmo construyo un histograma de frecuencia relativa?

5. Localice las fronteras de clase. La clase ms baja puede incluir la


medicin ms pequea. A continuacin sume las clases restantes
usando el mtodo de inclusin izquierda.
6. Construya una tabla estadstica que contenga las clases, sus
frecuencias y sus frecuencias relativas.
7. Construya un histograma como una barra de grfi cas, grafi cando
intervalos de clase en el eje horizontal y frecuencias relativas como
las alturas de las barras.

MEDIDAS DE CENTRO
Una de las primeras mediciones numricas importantes es una medida
de centro, es decir, una medida a lo largo del eje horizontal que localiza
el centro de la distribucin

LA MEDIA ARITMTICA O PROMEDIO


La media aritmtica o promedio de un conjunto de n mediciones es
igual a la suma de las mediciones dividida entre n.
=
=

LA MEDIA ARITMTICA O PROMEDIO

MEDIANA
La mediana m de un conjunto de n mediciones es el valor de x que cae en la
posicin media cuando las mediciones son ordenadas de menor a mayor.
Encuentre la mediana para el conjunto de mediciones 2, 9, 11, 5, 6.
Encuentre la mediana para el conjunto de mediciones 2, 9, 11, 5, 6, 27
El valor 0.5(n + 1) indica la posicin de la mediana del conjunto ordenado de
datos. Si la posicin de la media es un nmero que termina en el valor .5,
usted necesita promediar los dos valores adyacentes.

MEDIDAS DE CENTRO
Cuando un conjunto de datos tiene valores extremadamente pequeos
u observaciones muy grandes, la media muestral se traza hacia la
direccin de las mediciones extremas

MODA
La moda es la categora que se presenta con ms frecuencia o el valor
de x que se presenta con ms frecuencia.
Cuando las mediciones en una variable continua se han agrupado como
histograma de frecuencia o de frecuencia relativa, la clase con el pico
ms alto o frecuencia se llama clase modal, y el punto medio de esa
clase se toma como la moda.

La moda por lo general se usa para describir conjuntos grandes de


datos, mientras que la media y la mediana se usan para conjuntos de
datos grandes y pequeos.

MODA

MEDIDAS DE VARIABILIDAD

RANGO
El rango R, de un conjunto de n mediciones se
define como la diferencia entre la medicin ms
grande y la ms pequea.

RANGO

RANGO
Hay una medida de variabilidad que sea ms sensible
que el rango?

Considere, como ejemplo, las mediciones muestrales


5, 7, 1, 2, 4,

RANGO

VARIANZA DE UNA POBLACION


La varianza de una poblacin de N mediciones es el promedio de los
cuadrados de las desviaciones de las mediciones alrededor de su media
.

2 para una varianza muestral y 2 para una varianza de poblacin


La varianza poblacional se denota con 2 y est dada por la frmula

VARIANZA DE UNA MUESTRA


La varianza de una muestra de n mediciones es la suma de las
desviaciones cuadradas de las mediciones alrededor la media
dividida entre (n - 1).
La varianza muestral se denota con 2 y est dada por la frmula

VARIANZA DE UNA MUESTRA

DESVIACIN ESTNDAR
La desviacin estndar de un conjunto de mediciones es igual a la raz
cuadrada positiva de la varianza.

FRMULA COMPUTACIONAL PARA CALCULAR s2

CALCULAR LA VARIANZA Y DESVIACIN ESTNDAR

VARIANZA Y DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR
Teorema de Chebyshev
Dado un nmero k mayor o igual a 1 y un conjunto de n mediciones, al
menos [1 (1/k2)] de las mediciones estarn dentro de k desviaciones
estndar de su media.

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA DESVIACIN ESTNDAR

Otra regla para describir la variabilidad de un


conjunto de datos no funciona para todos los
conjuntos de datos, pero funciona muy bien
para datos que se apilan en la conocida forma
de montculo

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

SOBRE LA SIGNIFICANCIA PRCTICA DE LA


DESVIACIN ESTNDAR

MEDICIONES DE POSICIN RELATIVA


El puntaje z muestral es una medida de posicin relativa definido

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

MEDICIONES DE POSICIN RELATIVA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

GRAFICA DE CAJA

S-ar putea să vă placă și