Sunteți pe pagina 1din 42

UNIDAD 1 (primera parte)

ESTADSTICA DESCRIPTIVA

Definiciones importantes
Clasificacin de variables
Tablas de frecuencias
Representaciones grficas
Medidas de tendencia
central
Medidas de posicin
Medidas de distribucin

Definiciones importantes:

Poblacin: Es un conjunto o coleccin


de personas o cosas (objetos reales o
conceptuales).
En estadstica se refiere principalmente a
conjuntos de nmeros, mediciones u
observaciones.
Objeto real: un automvil o una casa.
Conceptual: temperatura, un intervalo de

La poblacin puede ser segn su


tamao de dos tipos:
Poblacin finita:cuando el nmero de
elementos que la forman es
determinado, por ejemplo el nmero de
alumnos de un centro de enseanza, o
grupo clase.

Poblacin infinita:cuando el nmero


de elementos que la forman es infinito, o
tan grande que pudiesen considerarse
infinitos.
Ejemplo: si se realizase un estudio
sobre los productos que hay en el
mercado. Hay tantos y de tantas
calidades que esta poblacin podra
considerarse infinita.
Ahora bien, normalmente en un estudio
estadstico no se puede trabajar con

Muestra: Seleccin de un determinado


nmero de elementos de la poblacin.
Qu significa?:
Muestra aleatoria para poblacin
finita:
Muestra aleatoria para poblacin
infinita:

Tipos de variables: aquellas


caractersticas o cualidades que poseen
los individuos que componen una
muestra, identificando un elemento
dentro de un grupo el que puede variar,
siendo inconstante, inestable y mudable.
En la estadstica, el uso de variables
simplifica de cierta forma la recoleccin e
interpretacin de datos obtenidos. Ya que
lespermiten al analista agrupar la
poblacin de acuerdo a rasgos comunes
ypresentar mediante grficos y tablas de

Tipos de variables segn su


cuantificacin:
Variables Cualitativas: caractersticas
o cualidades en las cuales no existe una
escala de medicin (no se puede
cuantificar con nmeros).
Estas se dividen en:
Variables Nominales:son aquellas
variables queno siguen un orden o no
obedecen una ordenacin.
Variables Ordinales: son aquellas

Variables Cuantitativas: pueden ser


expresadas por medio de nmeros. Con
este tipo de variable se puede llevar a
cabo ciertas operaciones aritmticas.
Se tienen:
Variables Discretas:variables
compuestas por valores aislados o
enteros.
Variables Continuas:compuesta por
valores intermedios o fracciones de ellos.

esumen de tipos de variables:

Tablas de Frecuencia:
Primer paso: tabulacin de resultados,
es decir, recoger la informacin de la
muestra resumida en una tabla en la
que a cada valor de la variable se le
asocian determinados nmeros que
representan el nmero de veces que
ha aparecido, su proporcin con
respecto a otros valores de la variable,
etc.
A estos nmeros se

Frecuencia absoluta:
La frecuencia absoluta de una variable
estadstica es el nmero de veces que
aparece en la muestra dicho valor de la
variable, la representaremos porni
La frecuencia absoluta, es una medida
que est influida por el tamao de la
muestra, al aumentar el tamao de la
muestra aumentar tambin el tamao
de la frecuencia absoluta.
Esto hace que no sea una medida til

Frecuencia relativa:
Es el cociente entre la frecuencia
absoluta y el tamao de la muestra. La
denotaremos porfi

Frecuencia Absoluta Acumulada:


Para poder calcular este tipo de
frecuencias hay que tener en cuenta que
la variable estadstica ha de ser
cuantitativa o cualitativa ordenable. En
otro caso no tiene mucho sentido el
clculo de esta frecuencia. La frecuencia
absoluta acumulada de un valor de la
variable, es el nmero de veces que ha
aparecido en la muestra un valor menor
o igual que el de la variable y lo
representaremos porNi.

Frecuencia Relativa Acumulada:


Al igual que en el caso anterior la
frecuencia relativa acumulada es la
sumatoria de fi, se denomina Fi

Porcentaje Acumulado:
Es la frecuencia relativa acumulada
multiplicada por 100.
Anlogamente se define el Porcentaje
Acumulado y se denota porPi

Tablas de frecuencias para datos


desagrupados:
Para agrupar los datos por su frecuencia,
se deben seguir los siguientes pasos:
1) Se ordenan los datos en orden
creciente o decreciente.
2) Se cuenta la frecuencia absoluta de
cada valor (cuntas veces se repite
cada magnitud).

Tablas de frecuencias para datos


Agrupados:
1) Decidir cuantos intervalos
2) Buscar observacin menor y mayor
3) Calcular rango de datos
4) Calcular ancho de cada intervalo
5) Decidir el punto de partida, de modo
que la tabla incluya el nmero menor y
mayor

Representaciones grficas:
Los grficos se utilizan para ilustrar y
presentar un conjunto de datos
relacionados entre s, de manera que
facilite su comprensin, comparacin y
anlisis.
Hay distintos tipos de grficos, cada uno
de los cuales ayuda en menor o mayor
medida a visualizar la informacin que es
estudiada.
Grfica de sectores
Grfica de barras
Histograma

Cuando usar tipos de grficos:

Medidas de Tendencia Central


corresponden
a
valores
que
generalmente se ubican en la parte
central de un conjunto de datos que nos
ayudan a resumir la informacin en un
slo nmero.
Media Aritmtica: promedio de un
conjunto de datos (para datos tabulados
y sin tabular)
Moda: Valor que ms se repite en un
conjunto de datos

Medidas de Posicin: permiten conocer


otros puntos caractersticos de la
distribucin, que no son los valores
centrales.
Percentiles: una vez ordenados los
datos de menor a mayor, es el valor de la
variable por debajo del cual se encuentra
un%dado de observaciones en un grupo
de observaciones.
Por ejemplo, el percentil 20 es el valor
bajo el cual se encuentran el 20 por

Medidas de Posicin:
Cuartiles: son
tres valores de la
variable, que dividen a un conjunto de
datos ordenados en cuatro partes iguales.
Q1 Q2 Q3
Quintiles: es la quinta parte de una
poblacin estadsticaordenada de menor
a mayor en alguna caracterstica de esta.
Corresponde
a
dosdeciles,
o
a
veintepercentiles.
Deciles: En estadstica descriptiva, el
concepto decil refiere a cada uno de los 9
valores que dividen un juego de datos en

Medidas de dispersin (medidas de


variabilidad): Parmetros estadsticos
que indican como se alejan los datos
respecto de la media. Sirven como
indicador de la variabilidad de los datos.
Las medidas de dispersin ms
utilizadas son el rango, rango
intercuartil, la desviacin estndar y la
varianza.
Rango: Indica la dispersin entre los
valores extremos de una variable.

Rango intercuartlico: se trata de


unestadstico robusto (es una
aproximacin alternativa a los mtodos
estadsticos clsicos. El objeto es
producirestimadores que no sean
afectados por variaciones pequeas
respecto a las hiptesis de los modelos),
siendo una medida de variabilidad
adecuada cuando la medida de posicin
central empleada ha sido lamediana.
Se usa para construir loscajones con
bigotes que sirven para visualizar la

Medidas de dispersin:
Desviacin estndar: Nos dice cunto
tienden a alejarse los puntajes u
observaciones del promedio.
Varianza: sirve para identificar a
lamedia de las desviaciones cuadrticas
de unavariable de carcter aleatorio,
considerando el valor medio de sta. Es
el cuadrado de la desviacin estndar.
Ejemplo: en los casos en que la variable
mide una distancia en kilmetros, su

Medidas de dispersin:
Coeficiente de variacin: cuando se
desea hacer referencia a la relacin
entre el tamao de la media y la
variabilidad de la variable a medir.
***Grfico
Box
Plot
(caja
con
bigotes): es un instrumento que
permite
realizar
un
anlisis
ms
detallado respecto a la distribucin de
los datos observados. Adicionalmente un
Diagrama de Cajas permite determinar si

Ejercicio: En relacin a los datos de


emisin diaria de dixido de azufre
(toneladas) y su tabla de frecuencia
para datos agrupados, realizar:
1. Un grfico de barras en relacin a
los intervalos.
2. Un grfico de torta o sectores con
el 60% de los datos agrupados en
intervalos de emisin azufre.
3. Desarrollar
un
polgono
de
frecuencias.
4. Graficar una ojiva.

6. Sacar la media aritmtica para


datos agrupados.
7. Determinar la moda de los datos
agrupados.
8. Determinar la mediana de los
datos agrupados.
9. A que se refiere el percentil 33,
54 y 80 en los datos agrupados?
10.A que se refiere el cuartil 50 en
los datos agrupados?
11.qu
emisin
de
azufre
representa el cuartil 75 en los
datos agrupados?

13.Determine el rango de los datos


y describa.
14.A qu se refiere el rango
intercuartil obtenido?
15.Qu demuestra la desviacin
estndar respecto a la emisin de
azufre en toneladas?
16.cul es la relacin entre el
tamao
de
la
media
y
la
variabilidad de la emisin de
azufre?
17.Dibuje un box plox e interprete.

Frmulas:
Media
aritmtica
agrupados:

Moda:

para

datos

Frmulas:
Moda:
LiExtremo inferior del intervalo modal
(intervalo que tiene mayor frecuencia
absoluta).
fi Frecuencia absoluta del intervalo
modal.
fi-1 Frecuencia absoluta del intervalo
anterior al modal.
fi+1Frecuencia absoluta del intervalo
posterior al modal.
t Amplitud de los intervalos.

Mediana: La mediana se encuentra en


el intervalo donde la frecuencia
acumulada llega hasta la mitad de la
suma de las frecuencias absolutas.
Es decir tenemos que buscar el intervalo
en el que se encuentre.N / 2

Mediana:
Li-1 es el lmite inferior de la clase donde
se encuentra la mediana.
N / 2 es la semisuma de las frecuencias
absolutas.
Fi-1 es la frecuencia acumulada anterior
a la clase mediana.
fi es la frecuencia absoluta del intervalo
mediano.
ties la amplitud de los intervalos.

Percentiles: Lospercentilesson los99


valoresquedividenla serie
dedatosen100 partes iguales.
En primer lugar buscamos la clase donde
se encuentra

en la tabla de las frecuencias acumuladas.

Percentiles:

Lies el lmite inferior donde se encuentra


la clase medida.
N es la suma de las frecuencias
absolutas.
Fi-1es lafrecuencia
acumuladaanterior a la clase medida.
a es la amplitud de la clase.

Cuartiles: Q1, Q2y Q3


En primer lugar buscamos
laclasedonde se encuentra en latabla
de las frecuencias acumuladas

Cuartiles: Q1, Q2y Q3


Lies el lmite inferior donde se encuentra
la clase medida.
N es la suma de las frecuencias
absolutas.
Fi-1es lafrecuencia acumuladaanterior a
la clase medida.
aies la amplitud de la clase

Deciles:
En primer lugar buscamos
laclasedonde se encuentra en latabla
de las frecuencias acumuladas

Deciles:
Lies el lmite inferior donde se encuentra
la clase medida.
N es la suma de las frecuencias
absolutas.
Fi-1es lafrecuencia acumuladaanterior a
la clase medida.
aies la amplitud de la clase.

Rango: Permite obtener una idea de


ladispersin de los datos, cuanto mayor
es el rango, ms dispersos estn los
datos de un conjunto.
Rango= MXIMO - MNIMO
Rango Intercuartlico:

IQR= Q3- Q1

Desviacin Estndar:

X2: Marca de clase


fi: frecuencia absoluta
N: total de observaciones
CV: desviacin estndar /
promedio

Box plot:

S-ar putea să vă placă și