Sunteți pe pagina 1din 15

ESTADISTICA

VARIABLE
Una variable es una característica que varía de un elemento a otro de la población o de la
muestra.
Clasificación de las variables según su naturaleza
Según su naturaleza las variables se clasifican en cualitativas y cuantitativas.
Son variables cualitativas aquellas que no son susceptibles de medición numérica.
Representan cualidades y atributos que se expresan en categorías, por eso, estas variables
también se llaman categóricas. Por ejemplo, son variables cualitativas el color de las flores,
cuyas categorías pueden ser rojo, ro-sado, blanco; el tamaño de las empresas, cuyas categorías
pueden ser pequeñas, medianas y grandes; los días de la semana, las estaciones del año, el
color del cabello y de los ojos de las personas, etc.

Son variables cuantitativas aquellas susceptibles de medición numérica. Sus valores provienen
de medir o de contar los elementos de la población o de la muestra. Según que se generen
contando o midiendo, estas variables se clasifican en discretas y continuas.
Son variables cuantitativas discretas aquellas cuyos valores provienen de contar, por
ejemplo, cantidad de hijos por familia, cantidad de alumnos por aula, número de errores de
facturación por mes, número de ausentes por día en una empresa. Sus valores asumen
números enteros.
Son variables cuantitativas continuas las que provienen de efectuar mediciones. Se
caracterizan porque entre dos valores cualesquiera de la variable, existen infinitos otros
valores. Por ejemplo, la altura y el peso de las personas, los valores monetarios en cualquier
tipo de moneda, la edad de las personas, el tiempo de espera para ser atendidos, los precios
de los artículos, y tantos otros ejemplos. Sus valores pueden asumir números con cifras
decimales.

Serie o Distribucion de frecuencias:


Para analizar los datos se los agrupa en una serie de frecuencias, para facilitar el análisis de un
grupo de muchos datos, y para obtener la información que brindan las distintas clases de
frecuencias y sus respectivas representaciones gráficas.

Si son pocos datos (30 o menos) se trata de una SERIE SIMPLE:


Una forma adecuada de representar y ordenar una serie simple es mediante el diagrama de
tallo y hojas.
Elemplo:
Es un diagrama donde cada valor de datos es dividido en una "hoja" (normalmente el último
dígito) y un "tallo" (los otros dígitos). Por ejemplo "32" sería dividido en "3" (tallo) y "2" (hoja).

1
Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda)
del los valores tallo. El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los
puntajes individuales dentro de cada grupo.

Cuando es conveniente agrupar en Intervalos? :


Se elabora una tabla de frecuencias con intervalos cuando la variable, sea discreta o continua,
presenta muchos valores diferentes entre sí repetidos muchas veces.
Ejemplo:

De lo contrario si la variable sea discreta o continua, presenta pocos valores diferentes entre
sí, repetidos muchas veces cada uno, se los agrupa SIN INTERVALOS

Sus respectivos graficos son:

Si piden graficar las Frecuencias Acumuladas:


Si se trata de datos agrupados SIN INTERVALOS:

2
Para frecuencias acumuladas (absolutas o relativas) “Menor que”

Y para las “mayor que”:

Si se trata de datos agrupados EN INTERVALOS:

3
Medidas descriptivas Nombre de la medida
Media aritmética
Moda o modo
De posición o tendencia central Mediana
Rango o recorrido
Varianza o variancia y desviación estándar
De dispersión o variabilidad
Coeficiente de variación
De asimetría Coeficiente de asimetría
De kurtosis o agudeza Coeficiente de kurtosis

Interpretación
Medidas de tendencia central: indican los valores centrales de la variable hacia los cuales
tienden a agruparse las observaciones. Comúnmente se los llama promedios.
Medidas de dispersión: miden la cantidad de variación, desperdigamiento o diseminación
de los datos alrededor de los valores centrales.
Medidas de asimetría: determinan si la distribución de los valores de la variable es simétrica
con respecto a los valores centrales, o si existe un sesgamiento hacia la derecha o hacia la
izquierda.
Medidas de kurtosis: miden el grado de apuntamiento o agudeza de la distribución de los
valores de la variable.

La media aritmética (MEDIA)


Es el promedio más conocido y de mayor uso. Se calcula sumando las observaciones y
dividiendo por el número de datos que se sumaron
Calculo para serie simple:

Calculo para datos agrupados (sin intervalos):


∑𝑘𝑖=1 𝑥𝑖 ∙ 𝑓𝑖
𝑥̅ =
𝑛
Calculo para datos agrupados (con intervalos)
∑𝑘𝑖=1 𝑥𝑛 ∙ 𝑓𝑖
𝑥̅ =
𝑛
Xn= Marca de clase

Propiedades de la media aritmética


1. Puede ser calculada en distribuciones con escala relativa e intervalar.
2. Todos los valores son incluidos en el cómputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy útil para comparar dos o más poblaciones.
5. Es la única medida de tendencia central donde la suma de las desviaciones de cada valor
respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el punto
de balance de una serie de datos.

4
6. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a la
media aritmética, es un mínimo. Esto significa que si se calcula esa suma tomando otro valor
cualquiera distinto de la media aritmética, el resultado siempre será mayor que cuando se
toman las desviaciones con respecto a la media.

7. Si a todos los valores de la variable se les suma una constante, la media aritmética queda
aumentada en dicho número.

Ventajas de la media aritmética


•Es la medida de tendencia central más usada.
•El promedio es estable en el muestreo.
•Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
•Se emplea a menudo en cálculos estadísticos posteriores.
•Presenta rigor matemático.
•En la gráfica de frecuencia representa el centro de gravedad.
Desventajas
•Es sensible a los valores extremos. Si alguno de los valores es extremadamente grande o
extremadamente pequeño, la media no es el promedio apropiado para representar la serie de
datos.
•No es recomendable emplearla en distribuciones muy asimétricas.
•Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede no
pertenecer al conjunto de valores de la variable.

La Mediana

5
Para obtener la mediana de una SERIE SIMPLE:
Lo primero que se requiere es ordenar los datos de menor a mayor, o de mayor a menor,
cualquiera de los dos criterios conduce al mismo resultado.
Sean ordenados lo datos en orden ascendente:

Si el número de valores es impar, la mediana es el valor medio, el cual corresponde al dato .


Ejemplo:

Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3, para la obtención de la


mediana se deberán de ordenar. Tomemos el criterio de orden ascendente con lo que,
tendremos:
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,
Por otro lado, el número de datos es igual a 15 datos, siendo el número de datos impar se elige
el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es Me = 1.
Cuando el número de valores en el conjunto es par, no existe un solo valor medio, si no que
existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la
mediana es numéricamente igual a

Si se tratara de datos agrupados SIN INTERVALOS:


La mediana es el valor de la variable al cual le corresponde la frecuencia acumulada, de la
forma “menor que”, inmediatamente superior a la mitad de las observaciones (n/2).

6
Si se trata de datos agrupados CON INTERVALOS:

7
Su calculo:
La moda de una serie simple (o datos no agrupados)
Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3, para la obtención de la moda
se debe detectar cual es el valor que se repite mayor cantidad de veces. En este caso es:
Mo = 1
Para datos agrupados sin intervalos
En este caso la Moda es el valor de la variable que tiene mayor frecuencia absoluta
Para datos agrupados con intervalos
En este caso habrá un intervalo al cual le corresponde la máxima frecuencia absoluta y/o
relativa, el intervalo modal. En ese intervalo se aplica la fórmula de interpolación para calcular
el valor modal.

Donde, fi es la frecuencia absoluta del intervalo modal; fi-1 es la frecuencia absoluta del
intervalo pre-modal; fi+1 es la frecuencia absoluta del intervalo postmodal; a es la amplitud del
intervalo modal y li es el límite inferior del intervalo modal.
Otras medidas :

IMPORTANTE!!
La media es el medida de tendencia central más usado y que mejor describe a la distribución,
cuando uno espera que la población tenga una distribución más o menos SIMETRICA (cuando
los datos no contienen valores extremos es decir muy grandes o muy pequeños).
En el caso de distribuciones muy asimétricas, con una cola muy larga, la mediana es la medida
de tendencia central que mejor describe a la distribución, porque la media suele estar
desplazada respecto al núcleo principal de observaciones de la variable y en estos casos, la
mediana es el valor que mejor expresa el punto donde se acumulan mayoritariamente las
observaciones de la variable.

MEDIDAS DE DISPERSION

8
El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un
grupo de números aleatorios. Se le suele simbolizar con la letra R y mide el recorrido total de
la variable.
Varianza:
es una medida estadística que mide la dispersión de los valores respecto a un valor central
(media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su
media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.

Propiedades de la Varianza y de la Desviación Estandar:


 La varianza es siempre positiva o 0:
 Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son
iguales a 0.
 Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de
valor será detectado.
 Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están
muy alejados de la media, el numerador de sus fórmulas será grande y la varianza y la
desviación típica lo serán.
 Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para
reducir a la mitad la desviación típica, la muestra se tiene que multiplicar por 4.
 Si a los datos de la distribución les sumamos una cantidad constante la varianza no se
modifica. Yi = Xi + k

 Si a los datos de la distribución les multiplicamos una constante, la varianza queda


multiplicada por el cuadrado de esa constante.
 Propiedad distributiva: V(X ± Y) = V(X) + V(Y)
Esta varianza muestral se obtiene como la suma de las diferencias de cuadrados y por
tanto tiene como unidades de medida el cuadrado de las unidades de medida en que se
mide la variable estudiada.

Desviación Estándar:
La varianza a veces no se interpreta claramente, ya que se mide en unidades al cuadrado. Para
evitar ese problema se define otra medida de dispersión, que es la desviación estándar, que se
halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la
dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos
estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que
es su inicial de su nominación en inglés.

Podemos conceptualizar diciendo que:


Mide la raíz cuadrada del promedio del cuadrado de las diferencias alrededor de la media. Es a
la medida de dispersión MÁS IMPORTANTE. Por que mide la dispersión promedio de como
varian los valores de la variable mayores que la media por encima de la media y como varian
los valores menores que la media por debajo de ella.

9
Coeficiente de Variación:
Esta medida se utiliza para comparar la dispersión de dos variables expresadas en distintas
unidades de medida.
Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica
muestral por la media y multiplicando el cociente por 100.

Es una medida de mucha utilidad porque permite comparar la dispersión o variabilidad de dos
o más grupos de datos, especialmente cuando las variables tienen distintas unidades de
medida. Porque como el CV queda expresado en porcentaje, son perfectamente comparables
dos o más cifras porcentuales.
Se considera que una estimación con un coeficiente de variación:
 Hasta del 7%, es precisa;
 Entre el 8 y el 14% significa que existe una precisión aceptable;
 Entre el 15% y 20% precisión regular y por lo tanto se debe utilizar con precaución;
 Mayor del 20% indica que la estimación es poco precisa y por lo tanto se recomienda
utilizarla sólo con fines descriptivos (tendencias no niveles).
Si tenemos dos Coeficientes de Variacion:
A= 10% y otro B= 7%
El coeficiente más chico es el que tiene una distribución más homogénea

Otras medidas de dispersión:

Asimetria:
Esta medida permite identificar si los datos se distribuyen de forma uniforme alrededor del
punto central (La Media). La asimetría presenta tres estados diferentes:
Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima
del valor de la media aritmética.
La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores
en ambos lados de la media.
Por ultimo hay asimetría negativa cuando la mayor cantidad de datos se aglomeran en los
valores menores que la media.

Coeficiente de Asimetría:
El Coeficiente de asimetría, se representa mediante la ecuación matemática,
As = ( x - Mo)/ S cuyo campo de variación es: -1  As  1

10
• (As = 0): Se acepta que la distribución es Simétrica
• (As > 0): La curva es asimétrica positiva, mientras mas se acerque a 1 la asimetría postiva es
mas ALTA y mientras mas se acerque a 0.5 es moderada, cualquier valor debajo de 0.5 se
puede decir que es asimetría positiva leve o baja
• (As < 0): La curva es asimétrica negativa, mientras mas se acerque a -1 la asimetría negativa
es mas ALTA y mientras mas se acerque a -0.5 es moderada, cualquier valor debajo de -0.5 se
puede decir que es asimetría negativa leve o baja

Kurtosis:
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución.
Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de
valores (Leptocúrtica); una concentración normal (Mesocúrtica); ó una baja concentración
(Platicúrtica).
Para calcular el coeficiente de Curtosis (K) se utiliza la ecuación:
½ (Q3 – Q1)
K= su campo de variación es 0  K  0,5
P90 – P10

 (K  0) la distribución es Platicúrtica
 (K  0,5) la distribución es Leptocúrtica
 (K  0,25) la distribución es Mesocúrtica

11
Números Índices

INDICES UNIVARIABLES
La función principal de un número índice univariable es transformar las magnitudes
absolutas de una variable (precios o cantidades) en un número relativo, para facilitar la
comparación de los cambios en la variable con el transcurso del tiempo.
Las fórmulas de cálculo son las siguientes:
P = (pn /po).100 y Q = (qn /qo).100

El producto por 100 es a efectos de expresar los resultados en cifras porcentuales.


Se debe calcular el cociente entre la cantidad o precios que se tengan en cada año, mes o dia y
las del periodo base dado.
Por ejemplo, si el índice fuera calculado mensualmente, y el periodo base seria enero. Si el mes
de febrero diera como resultado 95%, se interpreta diciendo que las ventas de febrero
representan el 95% de las ventas de enero.
El índice del período base es siempre igual a 100%. Si el índice de un período es menor que
100% significa que las ventas disminuyeron con respecto a las del período base, mientras que
si el índice de un período es mayor que 100%, significa que las ventas de ese período
aumentaron con respecto al período base.

VARIACION PORCENTUAL
Representa el cambio registrado en una variable entre dos períodos, en cifras porcentuales.
La fórmula para calcular la variación porcentual de un período con respecto al inmediato
anterior es la siguiente:
VP = [(pn / pn-1) - 1].100
Pero si se quiere obtener la variación porcentual respecto a un Periodo Base Fijo la fórmula es:
VP = [(pn / po) - 1].100

INDICES PONDERADOS
Los números índices mejoran sensiblemente cuando se introducen en su construcción sistemas
de ponderación apropiados.

Método de Laspeyres

12
Estos índices se calculan utilizando como ponderaciones las cantidades o los precios del
período base.
Las fórmulas para calcularlos son las siguientes:
 pni qoi  qni poi
PL = i .100 y QL = i .100
 poi qoi  qoi poi
i i

i = 1, 2, 3, . . . , k

La aplicación de la fórmula para calcular un índice de precios implica la realización de los


siguientes pasos:
1) Multiplique el precio de cada bien en cada período por la cantidad de dicho bien en el
período base. Así se obtiene poi qoi (valor para el período base) y pni qoi (valor para cada período
dado).
2) Calcule las sumas de los productos obtenidos en 1).
3) Divida el total de cada período por el total del período base.
4) Multiplique el resultado por 100.
Para calcular QL se procede igual, ponderando por los precios.

Interpretación:
En general, el índice de precios de Laspeyres indica el cambio en el valor agregado de la lista de
productos del período base, cuando son valuados a precios del período base y del período dado.
Si se usa la fórmula de Laspeyres para calcular el índice de precios al consumidor, el resultado
mediría la diferencia entre el costo en un período dado y el costo en el período base, de
mantener el nivel de vida del período base.
En general, el índice de cantidades de Laspeyres significa que, si se compra (o vende) distintas
cantidades de los mismos bienes en cada uno de los períodos, pero a los precios del período
base, cuánto se gastaría (o cobraría) en el período dado en relación con el período base.
Ventajas
Siempre pueden hacerse comparaciones de precios, no sólo desde cada período de tiempo con
el período base, sino también entre un período y otro.
El denominador es una cantidad que se mantiene constante durante varios períodos de
tiempo.
Inconvenientes
El inconveniente principal es que tiene un patrón estático de consumo o de producción, el cual
se desactualiza y se vuelve más irreal cuanto más tiempo transcurre.

Método de Paasche
Por este método, los índices ponderados agregados se calculan utilizando como ponderaciones
los precios o las cantidades del período dado, o actual.
Se aplican las siguientes fórmulas:
 pni qni  qni pni
PP = i .100 y QP = i .100
 poi qni  qoi pni
i i

i = 1, 2, 3, . . . , k

13
La aplicación de la fórmula para calcular un índice de precios implica la realización de los
siguientes pasos :
1) Multiplique el precio de cada bien en cada período por la cantidad de dicho bien en el
período base. Así se obtiene poi qni (valor para el período base) y pni qni (valor para cada
período dado).
2) Calcule las sumas de los productos obtenidos en 1).
3) Divida el total de cada período por el total del período base.
4) Multiplique el resultado por 100.
Para calcular Qp se procede igual, ponderando por los precios.

Interpretación:
En general, el índice de precios de Paasche indica el cambio en el valor agregado de la lista de
productos del período dado, cuando son valuados a precios del período base y del período
dado.
Si se usa la fórmula de Paasche para calcular un índice de precios al consumidor, compara el
costo en el período dado con el costo en el período base de mantener el nivel de vida en el
período dado.
En general, un índice ponderado agregado de cantidades calculado por este método, significa
que si se compra (o vende) distintas cantidades de los mismos bienes en cada período, pero a
los precios del período dado, ¿cuánto se gastaría (o cobraría) en el período actual en relación
con el período base?
Ventajas
Al cambiar las ponderaciones en cada período, se refleja mejor la importancia relativa de los
artículos, así como los cambios en las condiciones económicas de producción, ventas, compras.
Inconvenientes
Sólo pueden hacerse comparaciones apropiadas entre cada período y el período base, no
entre períodos cualesquiera.
Obtener una lista adecuada y detallada de ponderaciones en cada período sería muy laborioso
y de gran costo.
Comparación entre Laspeyres y Paasche
En general, al utilizar estas fórmulas para calcular índices de precios al consumidor, si los
consumidores alteran sus patrones de compra en respuesta a cambios relativos en los precios
de ciertos artículos, los índices de Laspeyres tenderán a exceder a los de Paasche.

Los índices ideales de Fisher


En un esfuerzo por cancelar los sesgamientos de precios inherentes en los índices de Laspeyres
y de Paasche, Fisher ideó un índice como el promedio geométrico de los dos índices.

PF = √ PL x PP . 100 y Q F = √ QL x Q P . 100

El índice de Laspeyres tiende a dar mayor peso a los artículos cuyos precios han aumentado;
mientras que el índice de Paasche tiende a restarle peso a los artículos cuyos precios han
aumentado. Con el índice ideal de Fisher se corrigen esas tendencias y se logra un índice más
real.

14
Cambio de base
Cuando se realiza el cambio de base se debe procurar que el nuevo período base elegido sea lo
más representativo posible, y no muy alejado del período actual. Y para saber si el nuevo
periodo elegido es bueno, el mismo no debe ser un periodo en el cual hayan variado en
cantidades extremas, ósea que sea muy grande o muy pequeño en comparación a los otros
periodos.
Cuando un período base pierde representatividad con el tiempo, es necesario cambiarlo por
uno más reciente. En ocasiones, también para tener dos índices con diferentes bases,
comparables.
Para obtener los números índices con el período base cambiado, se utiliza el método de la
regla proporcional, que consiste en: “dividir cada uno de los índices anteriores por el índice
correspondiente al nuevo período base, y multiplicando por 100”

Empalme de índices
Para empalmar, primero se debe establecer que la nueva serie de índices tenga un valor de
100 en el período base nuevo deseado, y se compara con el valor correspondiente a la serie de
índices antigua para el mismo período.
Ejemplo:

15

S-ar putea să vă placă și