Sunteți pe pagina 1din 19

Unidad 1

Estadstica Descriptiva

ndice
Unidad 1: Estadstica Descriptiva ................................................................ 1
1.1 Definicin de Estadstica y conceptos bsicos: teora de decisin,
poblacin, muestra aleatoria, parmetros. ......................................................... 1
Estadstica ............................................................................................ 1
Teora de decisin .............................................................................. 2
Poblacin.............................................................................................. 3
Muestra aleatoria ................................................................................. 4
Parmetros ........................................................................................... 4
1.2 Datos no agrupados ........................................................................... 5
1.2.1 Medidas de tendencia central ...................................................... 5
1.2.2 Medidas de dispersin ................................................................. 5
1.2.3 Medidas de posicin .................................................................... 6
1.2.5 Ejercicios de aplicacin ................................................................... 8
Medidas de tendencia central ............................................................... 8
Medidas de dispersin .......................................................................... 8
Medidas de posicin ............................................................................. 9
1.3 Datos agrupados .............................................................................. 10
1.3.1 Medidas de tendencia central .................................................... 10
1.3.2 Medidas de dispersin ............................................................... 11
1.3.3 Medidas de posicin .................................................................. 12
1.3.5 Ejercicios de aplicacin ................................................................. 14
Medidas de tendencia central ............................................................. 14
Medidas de dispersin ........................................................................ 14
Medidas de posicin ........................................................................... 15
Conclusiones ............................................................................................. 16
Bibliografa ................................................................................................ 17

Unidad 1: Estadstica Descriptiva


1.1 Definicin de Estadstica y conceptos bsicos: teora de
decisin, poblacin, muestra aleatoria, parmetros.
Estadstica
La estadstica es una ciencia formal y una herramienta que estudia el uso y
los anlisis provenientes de una muestra representativa de datos, busca explicar
las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia
en forma aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta
fundamental que permite llevar a cabo el proceso relacionado con la investigacin
cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta
las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en reas de negocios o instituciones
gubernamentales.
La estadstica se divide en dos grandes reas:

La estadstica descriptiva, se dedica a la descripcin, visualizacin y


resumen de datos originados a partir de los fenmenos de estudio. Los
datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de
parmetros estadsticos son: la media y la desviacin estndar. Algunos
ejemplos grficos son: histograma, pirmide poblacional, grfico circular,
entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la poblacin bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas
numricas (estimacin),
pronsticos
de futuras observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones
entre variables (anlisis de regresin). Otras tcnicas de modelamiento
incluyen anova, series de tiempo y minera de datos.
Utilidad e Importancia

Los mtodos estadsticos tradicionalmente se utilizan para propsitos


descriptivos, para organizar y resumir datos numricos. La estadstica descriptiva,

por ejemplo trata de la tabulacin de datos, su presentacin en forma grfica o


ilustrativa y el clculo de medidas descriptivas.
Ahora bien, las tcnicas estadsticas se aplican de manera amplia en
mercadotecnia, contabilidad, control de calidad y en otras actividades; estudios de
consumidores; anlisis de resultados en deportes; administradores de
instituciones; en la educacin; organismos polticos; mdicos; y por otras personas
que intervienen en la toma de decisiones.

Teora de decisin
Es un estudio formal sobre la toma de decisiones. Los estudios de casos
reales, que se sirven de la inspeccin y los experimentos, se denominan teora
descriptiva de decisin; los estudios de la toma de decisiones racionales, que
utilizan la lgica y la estadstica, se llaman teora preceptiva de decisin. Estos
estudios se hacen ms complicados cuando hay ms de un individuo, cuando los
resultados de diversas opciones no se conocen con exactitud y cuando las
probabilidades de los distintos resultados son desconocidas.
Mtodos para decidir entre alternativas
Los mtodos parten generalmente de que todas las alternativas son
conocidas o se pueden conocer, por ello el mtodo es un procedimiento por el cual
obtenemos un resultado, para el caso de la decisin tenemos una diversidad de
mtodos tanto cualitativos como cuantitativos, de los cuales podemos mencionar:
1) Tcnicas de optimizacin bajo certeza: Asumen que todas las
alternativas y todos sus resultados son conocidos. Dentro de los cuales tenemos:
Sistema de ecuaciones, Programacin lineal, Programacin entera,
Programacin dinmica, Modelo de teora de colas, Modelos de inventarios,
Anlisis de presupuestos de capital, Anlisis de puntos de equilibrio.
2) Tcnicas de la teora de decisin estadstica: Son tcnicas que evalan
matemticamente los resultados potenciales de acciones alternativas en una
situacin de decisin dada. Todas las alternativas y resultados se asumen como
conocidos, y el decisor tiene como objetivo la maximizacin de utilidades. Cmo
mtodos de presentar los datos en la teora de decisin existen la matriz de pagos
y el rbol de decisin. El trabajar con matrices de pago y rboles de decisin
requiere el uso de las estimaciones de probabilidad.
3) Curva de utilidad e indiferencia: Los ejemplos de decisiones en la teora de
decisin estadstica han usado valores monetarios. Tambin es deseable ponderar
las condiciones no monetarias. Por ejemplo, una persona puede estar interesada
tanto en el tiempo de descanso como en el dinero y negociar el uno por el otro.
Este dilema se puede representar mediante las curvas de indiferencia de cada
nivel de utilidad total.

4) Teora de los juegos: Es otro medio de analizar una decisin en una


situacin de competencia, de tal suerte que cuando una unidad de decisin
(jugador) gana, la otra pierde.
5) Inferencia estadstica clsica: Las tcnicas de la inferencia estadstica clsica
pueden ser tiles en la preparacin de informacin para la toma de decisiones:
Muestreo, Distribucin de probabilidades, Anlisis de correlacin y regresin,
Prueba de hiptesis.
6) Hojas de balance decisional para la toma de decisiones bajo tensin: Para cada
alternativa se obtienen las anticipaciones positivas y negativas para cuatro
categoras de ganancias y prdidas y se colocan en una rejilla. Habiendo llenado
la rejilla, el decisor puede evaluar la fortaleza de las prdidas y ganancias y el
rango de las alternativas. Las categoras mencionadas antes son las siguientes:
Ganancias o prdidas tangibles para s mismo, Ganancias y prdidas para otros,
Autoconsentimiento o autodisentimiento, Consentimiento o disentimiento social.

Poblacin
En estadstica, tambin llamada universo o colectivo, es el conjunto de
elementos de referencia sobre el que se realizan unas de las observaciones.
Poblacin (population) es el conjunto sobre el que estamos interesados en
obtener conclusiones (hacer inferencia). Normalmente es demasiado grande para
poder abarcarlo.

Poblacin Finita: es el conjunto compuesto por una cantidad limitada de


elementos, como el nmero de especies, el nmero de estudiantes, el
nmero de obreros.
Poblacin Infinita: es la que tiene un nmero extremadamente grande de
componentes, como el conjunto de especies que tiene el reino animal.
Poblacin Real: es todo el grupo de elementos concretos, como las
personas que en Europa se dedican a actividades artsticas.
Poblacin Hipottica: es el conjunto de situaciones posibles imaginables en
que puede presentarse un suceso, como por ejemplo las formas de
reaccionar de una persona ante una catstrofe.
Poblacin estable: es aquella en que sus calores o cualidades no presentan
variaciones, o stas, por pequeas que sean, son despreciables, como la
rotacin de la tierra o la velocidad de la luz.
Poblacin inestable: es la que contienen los valores en constante cambio.
Prcticamente la totalidad de las poblaciones corresponden a este tipo. El
cambio de los valores se presentan en el tiempo o en el espacio.
Poblacin aleatoria: es la que presenta cambios en sus calores debidos al
azar, sin que exista una causa aparente, como las variaciones en el
contenido del producto.
Poblacin dependiente: es la que cambia sus valores debido a una causa
determinada y medida. La dependencia puede ser total, como las
variaciones obtenidas en una funcin matemtica, la regresin lineal, por

ejemplo. La dependencia es parcial cuando la causa influye en la variable


dependiente en una proporcin menor a la total, por ejemplo, el incremento
en las ventas proveniente de una mayor gasto publicitario. Esta ltima
influencia no es proporcional.
Poblacin binomial es aquella en la que se busca la presencia o ausencia
de una caracterstica, por ejemplo, la presencia de ozono en el aire.
Poblacin polinomial: es la que tiene varias caractersticas que deben ser
definidas, medidas o estimadas, como la obediencia, la inteligencia y la
edad de los alumnos de postgrado.

Muestra aleatoria
En estadstica, una muestra es la seleccin de un numero de observaciones
de a partir de una poblacin objeto de investigacin; una muestra aleatoria es
cuando la eleccin sigue un mtodo impredecible. El muestreo aleatorio puede
referirse tambin a tomar una serie de observaciones independientes de la misma
distribucin de probabilidad. Las muestras nos permiten mediante la inferencia
estadstica representar los resultados de la poblacin de donde haya extrado,
pero existiendo una potencial variacin al azar en los resultados que se denomina
error de muestreo. En el caso de muestras aleatorias, la estadstica dispone de
medidas para evaluar el error de muestreo. Por lo tanto, las estimaciones
obtenidas a partir de muestras aleatorias pueden ir acompaadas de medidas de
la incertidumbre asociada a la estimacin. Esto puede tomar la forma de un error
estndar, o si la muestra es lo suficientemente grande y mediante el teorema
central del lmite, podrn calcularse intervalos de confianza.
Muestreo aleatorio simple
Para obtener una muestra, se numeran los elementos de la poblacin y se
seleccionan al azar los n elementos que contiene la muestra.
Muestreo aleatorio sistemtico
Se elige un individuo al azar y a partir de l, a intervalos constantes, se
eligen los dems hasta completar la muestra.
Muestreo aleatorio estratificado
Se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un
nmero de individuos de cada estrato proporcional al nmero de componentes de
cada estrato.

Parmetros
En estadstica, un parmetro es un nmero que resume la gran cantidad de
datos que pueden derivarse del estudio de una variable estadstica. El clculo de
este nmero est bien definido, usualmente mediante una frmula aritmtica
obtenida a partir de datos de la poblacin.

Los parmetros estadsticos son una consecuencia inevitable del propsito


esencial de la estadstica: crear un modelo de la realidad.
El estudio de una gran cantidad de datos individuales de una poblacin
puede ser farragoso e inoperativo, por lo que se hace necesario realizar un
resumen que permita tener una idea global de la poblacin, compararla con otras,
comprobar su ajuste a un modelo ideal, realizar estimaciones sobre datos
desconocidos de la misma y, en definitiva, tomar decisiones. A estas tareas
contribuyen de modo esencial los parmetros estadsticos.

1.2 Datos no agrupados


Es el listado de los datos presentados en su forma primaria, es decir, tal
como fueron obtenidos durante el proceso observacin o medicin en la muestra o
poblacin.

1.2.1 Medidas de tendencia central


Las medidas de tendencia central se utilizan con bastante frecuencia para
resumir un conjunto de cantidades o datos numricos a fin de describir los datos
cuantitativos que los forman.
Ejemplos de ello, pueden ser: la edad promedio o la estatura promedio de
los estudiantes de la universidad o el peso promedio de las bolsas de cereal que
son llenadas por una determinada mquina en un proceso de produccin o las
ventas de un negocio.
Las medidas de tendencia central son tambin frecuentemente usadas para
comparar un grupo de datos con otro, por ejemplo: el promedio de ventas obtenido
por un grupo de vendedores de una zona comparado con el promedio de ventas
otro grupo de vendedores de otra zona, el promedio de reclamos de clientes de
una sucursal, comparado con el promedio de reclamos de otra sucursal.
Media: Medida de tendencia central usualmente llamada promedio, se
define como la divisin de la suma de todos los valores entre el numero de datos.
Mediana: Del conjunto de datos obtenidos es el valor que al organizar los
datos en orden ascendente o descenderte a la mitad o centro de los mismos.
Moda: Es el dato que ocurre con mayor frecuencia en un conjunto de
elementos estudiados. Del ejemplo anterior donde los datos recopilados son:
5,8,8,11,11,11,14,16; el dato que ocurre con mayor frecuencia es el valor 1, siendo
este valor la moda.

1.2.2 Medidas de dispersin


La dispersin o variacin es una caracterstica importante de un conjunto de
datos porque intenta dar una idea de cun esparcidos se encuentran stos.

Existen diversas medidas de dispersin, algunas de ellas son:

Rango
Desviacin media
Desviacin estndar
Varianza

A continuacin se explican cada una de ellas.


Rango
El rango de un conjunto de nmeros es la diferencia entre el mayor y el
menor de todos ellos.
Hay 2 maneras de expresar sta medida:
1) La diferencia entre los valores mayor y menor
2) Los valores mayor y menor del grupo
Desviacin media
es la media aritmtica de los nmeros y
es el valor absoluto de la
desviacin de xj respecto de . (El valor absoluto de un nmero es el nmero sin
signo y se denota con dos barras verticales).

Desviacin estndar
Se define como

Varianza

1.2.3 Medidas de posicin


Las medidas de posicin dividen un conjunto de datos en grupos con el
mismo nmero de individuos.

Para calcular las medidas de posicin es necesario que los datos estn
ordenados de menor a mayor.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al
75% de los datos.
Q2 coincide con la mediana.
Clculo de los cuartiles
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresin
.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9

Para Datos No Agrupados


Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las
siguientes frmulas:
El primer cuartil:
Cuando n es par:

Cuando n es impar:
Para el tercer cuartil
Cuando n es par:

Cuando n es impar:

1.2.5 Ejercicios de aplicacin


Medidas de tendencia central
La media aritmtica
Se tienen las edades de cinco estudiantes universitarios de 1er ao, a
saber: 18,23, 27,34 y 25., para calcular la media aritmtica (promedio de las
edades, se tiene que:

Medidas de dispersin
Desviacin media
Calcular la desviacin media de la distribucin: 3, 8, 8, 8, 9, 9, 9, 18
Solucin:
Se calcula la media aritmtica.

Se calcula la desviacin media.

Medidas de posicin
Vamos a utilizar la tabla de distribucin de frecuencias con los datos de la
estatura de los alumnos que vimos en la leccin 2.
Variable
(Valor)
x

Frecuencias absolutas
Simple
Acumulada
x

Frecuencias relativas
Simple
Acumulada
x

1,20

3,3%

3,3%

1,21
1,22
1,23

4
4
2

5
9
11

13,3%
13,3%
6,6%

16,6%
30,0%
36,6%

1,24
1,25
1,26
1,27
1,28
1,29
1,30

1
2
3
3
4
3
3

12
14
17
20
24
27
30

3,3%
6,6%
10,0%
10,0%
13,3%
10,0%
10,0%

40,0%
46,6%
56,6%
66,6%
80,0%
90,0%
100,0%

Vamos a calcular los valores de las distintas posiciones centrales:


1.- Media aritmtica:
(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)
Xm =

----------------------------------------------------------------------------------------30

Luego:
Xm =

1,253

Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.


2.- Media geomtrica:
X=

((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^ (1/30)

Luego:
Xm =

1,253

En este ejemplo la media aritmtica y la media geomtrica coinciden, pero


no tiene siempre por qu ser as.
3.- Mediana:
La mediana de esta muestra es 1,26 cm, ya que por debajo est el 50% de
los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de
frecuencias relativas acumuladas.

En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se


situara exactamente entre el primer y el segundo valor de este grupo, ya que
entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50%
superior.
4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por
lo tanto esta seria cuenta con 3 modas.

1.3 Datos agrupados


Es el ordenamiento de la informacin en tablas, denominadas tablas de
frecuencias o distribuciones de frecuencias, a partir de los datos primarios.
Cuando los datos se tabulan, o se organizan en las tablas de frecuencias, pueden
estar no agrupados, es decir, de manera que se leen directamente los valores
observados, o agrupados, esto es, se construyen intervalos para resumir la
informacin observada.

1.3.1 Medidas de tendencia central


Cuando se trabaja con datos que han sido agrupados en una distribucin de
frecuencias, no se sabe con certeza los valores individuales de cada dato. Por lo
que se utilizan mtodos alternos para aproximar los valores de las medidas
descriptivas.
Media para datos agrupados: Al calcular la media para datos agrupados,
se supone que las observaciones en cada clase son iguales al punto medio de la
clase.
Mediana: Primero se encuentra la clase mediana, la cual es la clase cuya
frecuencia acumulada es mayor o igual a n/2.

La moda es la observacin que ocurre con mayor frecuencia, por lo que es


necesario identificar la clase modal, esta se localiza encontrando la clase que
tenga ms frecuencia.

1.3.2 Medidas de dispersin


La dispersin o variacin es una caracterstica importante de un conjunto de
datos porque intenta dar una idea de cun esparcidos se encuentran stos.
Existen diversas medidas de dispersin, algunas de ellas son:

Rango
Desviacin media
Desviacin estndar
Varianza

A continuacin se explican cada una de ellas.


Rango
Hay dos formas para determinar el rango para datos agrupados:
1. Rango = punto medio de la clase ms altapunto medio de la ms baja

2. Rango = lmite superior de la clase ms altalmite inferior de la ms baja


Desviacin media
Si x1, x2, ..., xk ocurren con frecuencias f1, f2, ..., fk, respectivamente, la
desviacin media es:

Si x1, x2, , xk ocurren con frecuencias f1, f2, , fk, respectivamente, la


desviacin tpica se expresa como:

Dnde:

VARIANZA
Se define como el cuadrado de la desviacin estndar y se representa
como s2.

1.3.3 Medidas de posicin


Las medidas de posicin dividen un conjunto de datos en grupos con el
mismo nmero de individuos.

Para calcular las medidas de posicin es necesario que los datos estn
ordenados de menor a mayor.
Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de
datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al
75% de los datos.
Q2 coincide con la mediana.
Clculo de los cuartiles
1. Ordenamos los datos de menor a mayor.
2. Buscamos el lugar que ocupa cada cuartil mediante la expresin
.
Nmero impar de datos
2, 5, 3, 6, 7, 4, 9

Clculo de los cuartiles para datos agrupados

En primer lugar buscamos la clase donde se encuentra


en la tabla de las frecuencias acumuladas.

Li es el lmite inferior de la clase donde se encuentra la mediana.


N es la suma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase mediana.
ai es la amplitud de la clase.

1.3.5 Ejercicios de aplicacin


Medidas de tendencia central
La media aritmtica
Si se toman los datos del ejemplo resuelto al construir la tabla de
distribucin de frecuencia de las cuentas por cobrar de Cabreras y Asociados que
fueron los siguientes:
Clases 1 2 3 4 5 6
Puntos Medios (Xi) 14,628 29,043 43.458 57,873 72.288 86.703
Frecuencias (fi) 10 4 5 3 3 5
Al calcular la cuenta promedio por cobrar (media aritmtica) de estos datos
se tiene lo siguiente:

Medidas de dispersin
Calcular la desviacin media en base a la siguiente tabla sobre las
calificaciones de un estudiante en 12 asignaturas evaluadas sobre 10.
Calificacin

Cantidad de
asignaturas

10

Total

12

Solucin:
Se calcula la media aritmtica.

Medidas de posicin
Cuartiles
Calcular los cuartiles de la distribucin de la tabla:
fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer cuartil

Clculo del segundo cuartil

Clculo del tercer cuartil

Conclusiones
En esta primera unidad se recabo informacin muy importante acerca de la
estadstica descriptiva, as como definiciones de gran importancia a la hora de
estudiar temas posteriores. Dentro de estos temas investigados encontramos la
definicin de teora de decisin, muestra aleatoria y parmetros, tres temas de
vital importancia a la hora de realizar estudios en alguna poblacin. Igualmente se
estudiaron los datos agrupados y no agrupados, que son aquellos datos que se
utilizan ordenados o se utilizan tal y como se obtuvieron respectivamente. Adems
se analizaron las medidas de tendencia central de dispersin y de posicin para
estos dos tipos de datos.

Bibliografa

http://www.vitutor.com/estadistica/descriptiva/a_1.html
http://www.eumed.net/cursecon/libreria/drm/0.htm
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://www.oocities.org/es/karmen_quijada/TD/teoria.html
http://es.wikipedia.org/wiki/Poblaci%C3%B3n_estad%C3%ADstica
http://colposfesz.galeon.com/est501/suma/sumahtml/conceptos/estadistica.
htm
http://www.enciclopediafinanciera.com/definicion-muestra-aleatoria.html
http://www.vitutor.com/estadistica/inferencia/inferenciaContenidos.html
http://www.vitutor.com/estadistica/descriptiva/a_7.html
http://es.wikipedia.org/wiki/Par%C3%A1metro_estad%C3%ADstico
http://www.seduca2.uaemex.mx/ckfinder/uploads/files/21__medidas_de_tend.pdf
http://fec.uh.cu/CUGIO/1%20acciones/Contenidos/Asignaturas%20Maestria
/Estadistica/Curso%20breve%20de%20Estad%C3%ADstica.pdf
http://tratamientodedatos.wordpress.com/2011/03/07/medidas-detendencia-central-para-datos-no-agrupados-y-agrupados/
http://fcps.uaq.mx/descargas/prope2014/estadistica/4/medidas_dispersion.p
df
http://www.monografias.com/trabajos27/datos-agrupados/datosagrupados.shtml
http://www.ditutor.com/estadistica/medidas_posicion.html
http://www.monografias.com/trabajos43/medidas-tendenciacentral/medidas-tendencia-central2.shtml
http://www.monografias.com/trabajos89/medidas-de-dispersion/medidas-dedispersion.shtml

S-ar putea să vă placă și