Documente Academic
Documente Profesional
Documente Cultură
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Estadistica Descriptiva
Introduccion
Estadstica 523210
Estadstica descriptiva
Gutierrez &
Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Departamento de Estadstica
Universidad de Concepcion
stica 523210
interes.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
de los datos
Clasificacion
tiene? y esta
contesta 2, entonces la variable es No de Hermanos
y el dato obtenido es 2.
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
de las variables
Clasificacion
Variables Cualitativas
stica 523210
de un arbol
variable Tamano
puede tener por resultado 1: Alto,
2:Mediano, 3:Bajo).
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
de los datos
Clasificacion
Datos Cuantitativos
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
de las variables
Clasificacion
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Muestreo - Definiciones
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Ejemplo
Poblacion
Conjunto de todos los individuos u objetos que tienen al menos una
en Chile).
caracteristica en comun.(Ej:
Peso de los ninos
Parametro
Medida resumen que describe alguna caracterstica del total de la
poblacion.(Ej:
Media, Varianza, Mediana, etc).
Muestra
y es obtenida por medio de un muestreo.
Subconjunto de la poblacion
Estadstico o Estadigrafo
Una medida que describe alguna caracterstica de la muestra.(Ej:
Estatura media da la muestra).
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Introduccion
de variables
Representacion
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
Metodos
Graficos.
Como
clasificara cada variable mencionada?.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
muestral n.
estas
frecuencias sera igual al tamano
Frecuencia absoluta acumulada (Ni ): Es el numero
de veces que se
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables continuas
valor maximo
de los datos de la muestra. Es decir, R = Xmax Xmin
de cada intervalo.
Amplitud (A): Es el tamano
stica 523210
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
Variables cuantitativas
Variables discretas
numerica,
la tabla de frecuencia anterior se complementa con
las frecuencias acumuladas respectivas.
En el caso de variables cuantitativas discretas, la tabla se
contruye considerando todos los valores de la variable posibles y
sus frecuencias absolutas:
Ejemplo: Construyamos la tabla de frecuencias para las
variables discretas encontradas en la base de datos de los
computadores Dell.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
Variables cuantitativas
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
Variables cuantitativas
Variables continuas
de tamano
clases (intervalos) debemos considerar?.
n = 10 k = 4, si n = 20 k = 5, si n = 30 k = 5.
general, segun
variando
el criterio de quien realiza el analisis,
entre 5 a 20 intervalos.
Aun
cuando la amplitud de cada intervalo puede ser diferente.
Nosotros trabajaremos con intervalos de la misma amplitud.
Luego, naturalmente la amplitud de cada intervalo queda
determinada por:
A = Rk .
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
grafica
Representacion
de variables
Variables continuas
Ejemplo
observaciones.
Construyamos la tabla de frecuencia para las variables
continuas de la base de datos de los computadores fabricados
por la empresa Dell.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
grafico
de tallo y hojas, boxplot.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
grafica
Representacion
de variables
Variables Cualitativas
Variables Cualitativas
Variables Cuantitativas
grafica
Representacion
de variables
grafica
Representacion
de variables
Variables Cuantitativas
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Estadsticos de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
resumir la informacion
de la muestra con pocos
tambien
alla de las frecuencias absolutas.
numeros,
mas
stica 523210
1
2
3
4
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
stica 523210
Promedio.
Mediana.
Moda.
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
n
n
impar
par
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Me
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Moda
esta
no necesariamente es unica
y se obtiene de forma natural
stica 523210
Nj1
Aj
nj
n
2
donde:
donde:
stica 523210
= Linf ,j +
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
= Linf ,j +
nj nj1
Aj
(nj nj1 ) + (nj nj+1 )
donde:
Linf ,j : lmite inferior de la clase modal.
nj : frecuencia absoluta de la clase modal.
Aj : amplitud de la clase modal.
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Medida de posicion
Percentiles
estan
Los percentiles se calculan de manera diferente si las
observaciones se encuentran agrupadas o no:
agrupadas, primero
En el caso que las observaciones NO esten
debemos ordenarlas de menor a mayor de la forma:
x(1) , x(2) , . . . , x(n)
x([ in ])
es fraccion
si 100
100
Pi =
in
x(in/100) + x(in/100+1) /2 si 100
es entero
donde:
Nj1 : frecuencia acumulada del intervalo anterior al que contiene
la mediana.
q.
Donde [q] es el entero proximo
mayor a la fraccion
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Percentiles
Percentiles
BoxPlot
= Linf ,j +
in
100
Nj1
Aj
nj
En este grafico
es posible observar caractersticas de los datos como
simetra y posibles observaciones atpicas.
Para construir un boxplot es necesario delimitar los lmites admisibles
tal que fuera de ellos consideraremos que los datos son atpicos (datos
outliers). Estos se calculan como:
Lmite Inferior (L.I.)= Q1 f (Q3 Q1 )
Lmite Superior (L.S.)= Q3 + f (Q3 Q1 ).
Donde, en general se considera f=0.75 o 1.5.
El boxplot entonces tendra la siguiente forma:
donde:
Linf ,j : lmite inferior del intervalo que contiene el Pi .
Nj1 : frecuencia acumulada del intervalo anterior al que contiene
el Pi .
nj : frecuencia absoluta del intervalo que contiene el Pi .
Aj : amplitud del intervalo que contiene el Pi .
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Medidas de dispersion
Medidas de Dispersion
Rango Intercuartil y Varianza
Rango
Rango Intercuartil
Varianza
estandar
Desviacion
Coeficiente de variacion
estandar
comentamos a continuacion.
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
Medidas de Dispersion
Medidas de Dispersion
estandar
Desviacion
Coeficiente de variacion
estandar
La desviacion
de una muestra se denota por s y se
obtiene como la raz cuadrada de la varianza s2 :
s
s2
estandar
definidas en la
Tanto el rango como la desviacion
estan
unidad de medida en que se mide la variable.
s
x
de
Dado que es adimensional, permite comparar la dispersion
dos conjuntos de datos que no tengan la misma unidad de
medida.
stica 523210
stica 523210
Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen
stica 523210