Sunteți pe pagina 1din 10

Universidad de concepcion

Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Estadistica Descriptiva

Introduccion
Estadstica 523210
Estadstica descriptiva

Gutierrez &
Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz

Dr. Bernardo Lagos Alvarez


1

Departamento de Estadstica

Universidad de Concepcion

March 10, 2016

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

La estadstica es una ciencia que nos facilita numerosas

herramientas para abordar de manera optima


todas las etapas
final buena de los datos,
necesarias, hasta una interpretacion
con el interes de nuestro estudio.
que a su vez guardan relacion
Las etapas a considerar se basan basicamente en reunir,
resumir y clasificar los datos para luego ser analizados e
interpretados.
En resumen es:
Obtenemos datos, Analizamos los datos y finalmente
referente a la informacion
de
presentamos conclusion

interes.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

de los datos
Clasificacion

En estricto rigor, un dato es un valor (o resultado) de una variable.


Por ejemplo, si preguntamos a una persona cuantos hermanos

tiene? y esta
contesta 2, entonces la variable es No de Hermanos
y el dato obtenido es 2.

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

de las variables
Clasificacion
Variables Cualitativas

Las variables cualitativas a su vez pueden ser clasificadas en


dos sub-grupos:
1

Los variables pueden ser clasificadas en dos grandes grupos:


1

Variables Cualitativas: Tal como lo indica su nombre, estas


de un arbol:

denotan una cualidad (Ej: Tamano


Alto, mediano, bajo
; Color de un vehculo: Verde, azul, rojo; etc...).

Variables Cuantitativas: Estas


variables por consiguiente denotan
cantidad (Ej: No de hermanos:0,1,2,... ; Peso; Estatura; etc...).

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Variables Cualitativas nominales: Sus resultados son


NO
representados por numeros
o letras y el orden de clasificacion

importa (Ej: La variable Color de un vehculo puede tener por


resultado V:Verde, A:Amarillo, R:Rojo).
Variables Cualitativas ordinales: Sus resultados son representados
SI importa (Ej: La
por numeros
o letras y el orden de clasificacion

de un arbol

variable Tamano
puede tener por resultado 1: Alto,
2:Mediano, 3:Bajo).

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

de los datos
Clasificacion
Datos Cuantitativos

Las variables cuantitativas a su vez pueden ser clasificadas en


dos sub-grupos:
1

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

de las variables
Clasificacion

A modo de resumen, las variables se clasifican de la siguiente


manera:

Variables Cuantitativas discretas: Sus resultados toman valores


enteros pues surgen de un procedimiento de conteo. (Ej: No de
hermanos).
Variables Cuantitativas continuas: Sus resultados toman valores

dentro de un intervalo y surgen de un procedimiento de medicion.


(Ej: Estatura; Peso).

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Muestreo - Definiciones

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Ejemplo

Poblacion
Conjunto de todos los individuos u objetos que tienen al menos una
en Chile).
caracteristica en comun.(Ej:
Peso de los ninos

de algunas variables medidas a


Se cuenta con informacion
a Dell.
computadores fabricados por la compan

Parametro
Medida resumen que describe alguna caracterstica del total de la

poblacion.(Ej:
Media, Varianza, Mediana, etc).
Muestra
y es obtenida por medio de un muestreo.
Subconjunto de la poblacion
Estadstico o Estadigrafo
Una medida que describe alguna caracterstica de la muestra.(Ej:
Estatura media da la muestra).
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Introduccion

de variables
Representacion

Las variables medidas son:


1
2

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

Pas: pas de origen de la compra


Demora: demora en la entrega del producto(consulta a los
compradores)
Tiempo Repara: cantidad de meses en que se realizo la primera
al computador.
reparacion
Cant. Acc.: cantidad de accesorios que se agregaron a la compra
del notebook.

En el ejemplo anterior disponemos de datos o valores (o

resultados) de cada variable ... Entonces como


podemos
que tenemos?.
resumir la informacion
Las opciones son:
Tablas de Frecuencias.

Metodos
Graficos.

Como
clasificara cada variable mencionada?.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

tabular de variables (Tabla de


Representacion
Frecuencias)

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

tabular de variables (Tabla de


Representacion
Frecuencias)
Para construir una tabla de frecuencias debemos tener en claro las
siguientes definiciones:

Suponga que se cuenta con n observaciones de la variable


de la muestra.
aleatoria X . Diremos que n es el tamano
tabular o bien tabla de frecuencias de las
La representacion
variables no es mas que un resumen en forma de tabla de la
de los datos obtenidos.
informacion

Frecuencia absoluta (ni ): Es el numero


de veces que se repite un valor

de una variable estadstica que llamaremos xi . Notemos que la suma de

muestral n.
estas
frecuencias sera igual al tamano
Frecuencia absoluta acumulada (Ni ): Es el numero
de veces que se

repite un valor menor o igual a xi de una variable estadstica.


en que esta representado el
Frecuencia relativa (fi ): Es la proporcion
valor xi sobre el total de n muestras. Es decir, fi = nni .
en que esta
Frecuencia relativa acumulada (Fi ): Es la proporcion
representado un valor menor o igual a xi sobre el total de n muestras.
Ni
Es decir, Fi = n
Frecuencia relativa porcentual o Porcentaje (%fi ): Es el porcentaje en
que esta representado el valor xi sobre el total de n muestras. Es decir,
%fi = 100 fi .

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables nominales y ordinales

La tabla de frecuencia para este tipo de variables muestra los


niveles o categoras de las variable nominal u ordinal, seguido
de la frecuencia absoluta, relativa y relativa porcentual de cada
categora. Al ser una tabla para variables cualitativas, no tiene
sentido especificar las frecuencias acumuladas.
Ejemplo: Construyamos la tabla de frecuencias para las
variables nominales y ordinales que encontramos en la base de
datos de los computadores fabricados por la empresa Dell.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables continuas

En el caso de variables cuantitativas continuas, dado que hay


muchos varoles posibles para la variable, agruparemos valores
en intervalos que llamaremos intervalos de clase.
de los intervalos de clase sera necesario
Para la construccion
considerar las siguientes definiciones:
2

Clase: Es el intervalo en que cae cada dato.


Marca de clase (xi ): Corresponde al punto medio de cada clase
(es el representante de cada clase).
Rango (R): Es la distancia que existe entre el valor mnimo y el

valor maximo
de los datos de la muestra. Es decir, R = Xmax Xmin
de cada intervalo.
Amplitud (A): Es el tamano

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

Variables cuantitativas
Variables discretas

Dado que las variables cuantitativas representan una cantidad

numerica,
la tabla de frecuencia anterior se complementa con
las frecuencias acumuladas respectivas.
En el caso de variables cuantitativas discretas, la tabla se
contruye considerando todos los valores de la variable posibles y
sus frecuencias absolutas:
Ejemplo: Construyamos la tabla de frecuencias para las
variables discretas encontradas en la base de datos de los
computadores Dell.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

Variables cuantitativas

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

Variables cuantitativas
Variables continuas

Ahora bien, es valido


preguntarse si dispongo de una muestra
n, cuantas

de tamano
clases (intervalos) debemos considerar?.

Uno de los tantos metodos


para determinar esto
es encontrar el
numero
de intervalos k tal que n 2k . Por ejemplo, si

n = 10 k = 4, si n = 20 k = 5, si n = 30 k = 5.

No obstante lo anterior, el valor de k se establece, por lo

general, segun
variando
el criterio de quien realiza el analisis,
entre 5 a 20 intervalos.

Aun
cuando la amplitud de cada intervalo puede ser diferente.
Nosotros trabajaremos con intervalos de la misma amplitud.
Luego, naturalmente la amplitud de cada intervalo queda
determinada por:
A = Rk .
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

grafica

Representacion
de variables

Variables continuas
Ejemplo

de los intervalos de clase debe ser tal que el


La construccion
primer intervalo de clase contiene al menor valor observado y el
ultimo
intervalo debe contener al mayor valor de las

observaciones.
Construyamos la tabla de frecuencia para las variables
continuas de la base de datos de los computadores fabricados
por la empresa Dell.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

de la variable con la que


Dependiendo de la clasificacion

estemos trabajando, graficamente


podemos representarlas de
diferentes maneras:
1
2

Variables Cualitativas: grafico


de torta, grafico
de barras.
Variables Cuantitativas: histograma, polgono de frecuencias, ojiva,

grafico
de tallo y hojas, boxplot.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

grafica

Representacion
de variables
Variables Cualitativas

Podemos realizar dos graficos


en el caso de variables
cualitativas:

Variables Cualitativas
Variables Cuantitativas
grafica

Representacion
de variables

grafica

Representacion
de variables
Variables Cuantitativas

Podemos realizar varios graficos


en el caso de variables
cuantitativas, siendo el histograma, polgono de frecuencias y
utilizados:
boxplot los mas

adelante una vez asimilado los


El boxplot sera visto mas
conceptos de percentiles y cuartiles.
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Estadsticos de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central

La tabla de frecuencia anterior y los graficos


asociados a cada
presente en la
una de ellas nos permiten resumir la informacion
muestra.

Las siguientes son medidas de tendencia central y las


adelante:
definiremos mas

Sin embargo, en el caso de variables cuantitativas sera util

resumir la informacion
de la muestra con pocos
tambien
alla de las frecuencias absolutas.
numeros,
mas

Esos valores que nos permiten resumir numericamente


la
de la muestra los llamaremos estadsticos: una
informacion
de la muestra.
funcion

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

1
2
3
4

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central


Promedio

La media o promedio de una muestra x1 , . . . , xn se define como:


(
Pn
1
Datos no tabulados (no agrupados)
nP i=1 xi
=
X
k
1
Datos tabulados (agrupados)
j=1 nj xj
n

Note que para el caso de datos tabulados (agrupados) SIN


intervalos, xj representa una clase (valor) en particular y para el
caso de datos tabulados (agrupados) CON intervalos, xj
representa la marca de clase.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Promedio.
Mediana.
Moda.

Percentil (medida de posicion).

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central


Mediana

La mediana de un conjunto de observaciones se define como


de la mitad de
aquel valor que no es superado ni supera a mas
las observaciones ordenadas de forma creciente (es el dato que
esta en el centro de los datos de la muestra). La mediana no es
afectada por valores extremos como sucede con el caso de la
media y se calcula de manera diferente si las observaciones se
encuentran agrupadas o no:
agrupadas, primero
En el caso que las observaciones NO esten
debemos ordenarlas de menor a mayor de la forma:
x(1) , x(2) , . . . , x(n)
Luego, la mediana se obtiene como

x( n+1 )
2

Me =
x(n/2) + x(n/2+1) /2
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

n
n

impar
par


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central


Mediana

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central


Mediana

Para el caso de datos tabulados CON intervalos la mediana la


calculamos de la siguiente manera:
Buscamos el intervalo que contiene al dato que ocupa la
n2 , esto de forma similar al procedimiento descrito para
posicion
datos tabulados sin intervalos. Luego calculamos la mediana
como:

agrupados en una tabla de


En el caso de que los datos esten
entre datos tabulados
frecuencias, habra que hacer distincion
CON o SIN intervalos.
Para el caso de datos tabulados SIN intervalos la mediana la
calculamos de la siguiente manera:

xj
si Nj1 < n2 < Nj
Me =
xj1 +xj
si n2 = Nj1
2

Me

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Moda

Porque esta de moda el uso de smartphones? Desde hace un


tiempo mucha gente comenzo a usar smartphone. Hoy la
mayora de la gente usa smartphones.
Este mismo concepto lo usamos en estadstica: la moda de un
se repite. Notemos que
conjunto de datos es el valor que mas

esta
no necesariamente es unica
y se obtiene de forma natural

tanto para el caso en que se tienen datos cualitativos como


cuantitativos no tabulados o tabulados SIN intervalos.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Nj1
Aj
nj

Linf ,j : lmite inferior del intervalo que contiene la mediana.


Nj1 : frecuencia acumulada del intervalo anterior al que contiene
la mediana.
nj : frecuencia absoluta del intervalo que contiene la mediana.
Aj : amplitud del intervalo que contiene la mediana.

Nj1 : frecuencia acumulada del intervalo anterior al que contiene


la mediana.

Medidas de tendencia central

n
2

donde:

donde:

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

= Linf ,j +

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central


Moda

En el caso que se tengan datos tabulados CON intervalos,


de la moda, la cual
debemos encontrar una aproximacion
calculamos de la siguiente manera:
Buscamos el (los) intervalo(s) que contiene(n) a la moda al que
llamaremos clase modal. Luego calculamos la moda como:
Mo

= Linf ,j +

nj nj1
Aj
(nj nj1 ) + (nj nj+1 )

donde:
Linf ,j : lmite inferior de la clase modal.
nj : frecuencia absoluta de la clase modal.
Aj : amplitud de la clase modal.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medida de posicion

Medidas de tendencia central


Percentiles

Percentiles

A los percentiles P25 , P50 , P75 los llamaremos cuartiles


(Q1 , Q2 , Q3 respectivamente) y a los percentiles
P10 , P20 , P30 , . . . , P90 los llamaremos deciles (D1 , D2 , D3 , . . . , D9
respectivamente).
agrupados en una tabla de
En el caso de que los datos esten
entre datos tabulados
frecuencias, habra que hacer distincion
CON o SIN intervalos.
Para el caso de datos tabulados SIN intervalos, el percentil Pi
sera calculado de la siguiente manera:

in
xj
si Nj1 < 100
< Nj
Pi =
xj +xj+1
in
si
=
N
j
2
100

En el concepto de percentiles se divide a la muestra ordenada

x(1) , x(2) , . . . , x(n) en 100 partes iguales y es tal que el i-esimo


percentil (Pi ) es un valor donde al menos un i% de los datos
bajo su valor y el restante (100 i)% por encima de el.

estan
Los percentiles se calculan de manera diferente si las
observaciones se encuentran agrupadas o no:
agrupadas, primero
En el caso que las observaciones NO esten
debemos ordenarlas de menor a mayor de la forma:
x(1) , x(2) , . . . , x(n)

Luego, el percentil i-esimo


se obtiene como
(
in

x([ in ])
es fraccion
si 100
100

Pi =
in
x(in/100) + x(in/100+1) /2 si 100
es entero

donde:
Nj1 : frecuencia acumulada del intervalo anterior al que contiene
la mediana.

q.
Donde [q] es el entero proximo
mayor a la fraccion

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de tendencia central

Percentiles

Percentiles

BoxPlot

Para el caso de datos tabulados CON intervalos el percentil Pi


sera calculado de la siguiente manera:
Buscamos el intervalo que contiene al dato que ocupa la
in
100
posicion
.
Pi

= Linf ,j +

in
100

Nj1
Aj
nj

En este grafico
es posible observar caractersticas de los datos como
simetra y posibles observaciones atpicas.
Para construir un boxplot es necesario delimitar los lmites admisibles
tal que fuera de ellos consideraremos que los datos son atpicos (datos
outliers). Estos se calculan como:
Lmite Inferior (L.I.)= Q1 f (Q3 Q1 )
Lmite Superior (L.S.)= Q3 + f (Q3 Q1 ).
Donde, en general se considera f=0.75 o 1.5.
El boxplot entonces tendra la siguiente forma:

donde:
Linf ,j : lmite inferior del intervalo que contiene el Pi .
Nj1 : frecuencia acumulada del intervalo anterior al que contiene
el Pi .
nj : frecuencia absoluta del intervalo que contiene el Pi .
Aj : amplitud del intervalo que contiene el Pi .
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de dispersion

Medidas de Dispersion
Rango Intercuartil y Varianza

El Rango Intercuartil (R.I.) es la longitud del intervalo donde


concentrados el 50% central de los datos. Es decir,
estan
R.I. = Q3 Q1 .
La varianza de una muestra, denotada por s2 , se define como la
media del cuadrado de las desviaciones de los datos con

respecto al promedio de estos.


En terminos
numericos,
se
obtiene de la siguiente manera:
(
Pn
1
2
Datos
no
agrupados
n1P i=1 (xi x )
s2 =
k
1
2 Datos agrupados
j=1 nj (xj x )
n1

Las medidas de dispersion:


1
2
3
4
5

Rango
Rango Intercuartil
Varianza
estandar

Desviacion

Coeficiente de variacion

Un posible inconveniente de la varianza es que las unidades de


medida quedan elevadas al cuadrado, por lo que esta
de dispersion
no es muy natural. Para resover
interpretacion

estandar

esto es que se introduce el termino


de desviacion
y
que tomar raz a la varianza, tal como
que no es mas

comentamos a continuacion.
stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Medidas de Dispersion

Medidas de Dispersion

estandar

Desviacion

Coeficiente de variacion

estandar

La desviacion
de una muestra se denota por s y se
obtiene como la raz cuadrada de la varianza s2 :
s

s2

estandar

definidas en la
Tanto el rango como la desviacion
estan
unidad de medida en que se mide la variable.

es una medida de dispersion


En el Coeficiente de variacion
que es adimensional pues esta definido por:
CV =

s
x

de
Dado que es adimensional, permite comparar la dispersion
dos conjuntos de datos que no tengan la misma unidad de
medida.

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez


Universidad de concepcion
Tipos de datos
de las variables
Representacion
Medidas de resumen

Gracias por su atencion

stica 523210

Gutierrez & Dr. Bernardo Lagos


Dr. Jorge Figueroa-Zu niga
& Mg. Francisco Munoz
Estad
Alvarez

S-ar putea să vă placă și