Documente Academic
Documente Profesional
Documente Cultură
VARIABLE
Una variable es una característica que varía de un elemento a otro de la población o de la
muestra.
Clasificación de las variables según su naturaleza
Según su naturaleza las variables se clasifican en cualitativas y cuantitativas.
Son variables cualitativas aquellas que no son susceptibles de medición numérica.
Representan cualidades y atributos que se expresan en categorías, por eso, estas variables
también se llaman categóricas. Por ejemplo, son variables cualitativas el color de las flores,
cuyas categorías pueden ser rojo, ro-sado, blanco; el tamaño de las empresas, cuyas categorías
pueden ser pequeñas, medianas y grandes; los días de la semana, las estaciones del año, el
color del cabello y de los ojos de las personas, etc.
Son variables cuantitativas aquellas susceptibles de medición numérica. Sus valores provienen
de medir o de contar los elementos de la población o de la muestra. Según que se generen
contando o midiendo, estas variables se clasifican en discretas y continuas.
Son variables cuantitativas discretas aquellas cuyos valores provienen de contar, por
ejemplo, cantidad de hijos por familia, cantidad de alumnos por aula, número de errores de
facturación por mes, número de ausentes por día en una empresa. Sus valores asumen
números enteros.
Son variables cuantitativas continuas las que provienen de efectuar mediciones. Se
caracterizan porque entre dos valores cualesquiera de la variable, existen infinitos otros
valores. Por ejemplo, la altura y el peso de las personas, los valores monetarios en cualquier
tipo de moneda, la edad de las personas, el tiempo de espera para ser atendidos, los precios
de los artículos, y tantos otros ejemplos. Sus valores pueden asumir números con cifras
decimales.
1
Los valores del "tallo" se escriben hacia abajo y los valores "hoja" van a la derecha (o izquierda)
del los valores tallo. El "tallo" es usado para agrupar los puntajes y cada "hoja" indica los
puntajes individuales dentro de cada grupo.
De lo contrario si la variable sea discreta o continua, presenta pocos valores diferentes entre
sí, repetidos muchas veces cada uno, se los agrupa SIN INTERVALOS
2
Para frecuencias acumuladas (absolutas o relativas) “Menor que”
3
Medidas descriptivas Nombre de la medida
Media aritmética
Moda o modo
De posición o tendencia central Mediana
Rango o recorrido
Varianza o variancia y desviación estándar
De dispersión o variabilidad
Coeficiente de variación
De asimetría Coeficiente de asimetría
De kurtosis o agudeza Coeficiente de kurtosis
Interpretación
Medidas de tendencia central: indican los valores centrales de la variable hacia los cuales
tienden a agruparse las observaciones. Comúnmente se los llama promedios.
Medidas de dispersión: miden la cantidad de variación, desperdigamiento o diseminación
de los datos alrededor de los valores centrales.
Medidas de asimetría: determinan si la distribución de los valores de la variable es simétrica
con respecto a los valores centrales, o si existe un sesgamiento hacia la derecha o hacia la
izquierda.
Medidas de kurtosis: miden el grado de apuntamiento o agudeza de la distribución de los
valores de la variable.
4
6. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a la
media aritmética, es un mínimo. Esto significa que si se calcula esa suma tomando otro valor
cualquiera distinto de la media aritmética, el resultado siempre será mayor que cuando se
toman las desviaciones con respecto a la media.
7. Si a todos los valores de la variable se les suma una constante, la media aritmética queda
aumentada en dicho número.
La Mediana
5
Para obtener la mediana de una SERIE SIMPLE:
Lo primero que se requiere es ordenar los datos de menor a mayor, o de mayor a menor,
cualquiera de los dos criterios conduce al mismo resultado.
Sean ordenados lo datos en orden ascendente:
6
Si se trata de datos agrupados CON INTERVALOS:
7
Su calculo:
La moda de una serie simple (o datos no agrupados)
Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3, para la obtención de la moda
se debe detectar cual es el valor que se repite mayor cantidad de veces. En este caso es:
Mo = 1
Para datos agrupados sin intervalos
En este caso la Moda es el valor de la variable que tiene mayor frecuencia absoluta
Para datos agrupados con intervalos
En este caso habrá un intervalo al cual le corresponde la máxima frecuencia absoluta y/o
relativa, el intervalo modal. En ese intervalo se aplica la fórmula de interpolación para calcular
el valor modal.
Donde, fi es la frecuencia absoluta del intervalo modal; fi-1 es la frecuencia absoluta del
intervalo pre-modal; fi+1 es la frecuencia absoluta del intervalo postmodal; a es la amplitud del
intervalo modal y li es el límite inferior del intervalo modal.
Otras medidas :
IMPORTANTE!!
La media es el medida de tendencia central más usado y que mejor describe a la distribución,
cuando uno espera que la población tenga una distribución más o menos SIMETRICA (cuando
los datos no contienen valores extremos es decir muy grandes o muy pequeños).
En el caso de distribuciones muy asimétricas, con una cola muy larga, la mediana es la medida
de tendencia central que mejor describe a la distribución, porque la media suele estar
desplazada respecto al núcleo principal de observaciones de la variable y en estos casos, la
mediana es el valor que mejor expresa el punto donde se acumulan mayoritariamente las
observaciones de la variable.
MEDIDAS DE DISPERSION
8
El rango o recorrido estadístico es la diferencia entre el valor mínimo y el valor máximo en un
grupo de números aleatorios. Se le suele simbolizar con la letra R y mide el recorrido total de
la variable.
Varianza:
es una medida estadística que mide la dispersión de los valores respecto a un valor central
(media), es decir, la media de las diferencias cuadráticas de las puntuaciones respecto a su
media aritmética. Suele ser representada con la letra griega σ o una V en mayúscula.
Desviación Estándar:
La varianza a veces no se interpreta claramente, ya que se mide en unidades al cuadrado. Para
evitar ese problema se define otra medida de dispersión, que es la desviación estándar, que se
halla como la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la
dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos
estarán los datos. Esta medida viene representada en la mayoría de los casos por S, dado que
es su inicial de su nominación en inglés.
9
Coeficiente de Variación:
Esta medida se utiliza para comparar la dispersión de dos variables expresadas en distintas
unidades de medida.
Es una medida de dispersión relativa de los datos y se calcula dividiendo la desviación típica
muestral por la media y multiplicando el cociente por 100.
Es una medida de mucha utilidad porque permite comparar la dispersión o variabilidad de dos
o más grupos de datos, especialmente cuando las variables tienen distintas unidades de
medida. Porque como el CV queda expresado en porcentaje, son perfectamente comparables
dos o más cifras porcentuales.
Se considera que una estimación con un coeficiente de variación:
Hasta del 7%, es precisa;
Entre el 8 y el 14% significa que existe una precisión aceptable;
Entre el 15% y 20% precisión regular y por lo tanto se debe utilizar con precaución;
Mayor del 20% indica que la estimación es poco precisa y por lo tanto se recomienda
utilizarla sólo con fines descriptivos (tendencias no niveles).
Si tenemos dos Coeficientes de Variacion:
A= 10% y otro B= 7%
El coeficiente más chico es el que tiene una distribución más homogénea
Asimetria:
Esta medida permite identificar si los datos se distribuyen de forma uniforme alrededor del
punto central (La Media). La asimetría presenta tres estados diferentes:
Se dice que la asimetría es positiva cuando la mayoría de los datos se encuentran por encima
del valor de la media aritmética.
La curva es Simétrica cuando se distribuyen aproximadamente la misma cantidad de valores
en ambos lados de la media.
Por ultimo hay asimetría negativa cuando la mayor cantidad de datos se aglomeran en los
valores menores que la media.
Coeficiente de Asimetría:
El Coeficiente de asimetría, se representa mediante la ecuación matemática,
As = ( x - Mo)/ S cuyo campo de variación es: -1 As 1
10
• (As = 0): Se acepta que la distribución es Simétrica
• (As > 0): La curva es asimétrica positiva, mientras mas se acerque a 1 la asimetría postiva es
mas ALTA y mientras mas se acerque a 0.5 es moderada, cualquier valor debajo de 0.5 se
puede decir que es asimetría positiva leve o baja
• (As < 0): La curva es asimétrica negativa, mientras mas se acerque a -1 la asimetría negativa
es mas ALTA y mientras mas se acerque a -0.5 es moderada, cualquier valor debajo de -0.5 se
puede decir que es asimetría negativa leve o baja
Kurtosis:
Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución.
Por medio del Coeficiente de Curtosis, se puede identificar si existe una gran concentración de
valores (Leptocúrtica); una concentración normal (Mesocúrtica); ó una baja concentración
(Platicúrtica).
Para calcular el coeficiente de Curtosis (K) se utiliza la ecuación:
½ (Q3 – Q1)
K= su campo de variación es 0 K 0,5
P90 – P10
(K 0) la distribución es Platicúrtica
(K 0,5) la distribución es Leptocúrtica
(K 0,25) la distribución es Mesocúrtica
11
Números Índices
INDICES UNIVARIABLES
La función principal de un número índice univariable es transformar las magnitudes
absolutas de una variable (precios o cantidades) en un número relativo, para facilitar la
comparación de los cambios en la variable con el transcurso del tiempo.
Las fórmulas de cálculo son las siguientes:
P = (pn /po).100 y Q = (qn /qo).100
VARIACION PORCENTUAL
Representa el cambio registrado en una variable entre dos períodos, en cifras porcentuales.
La fórmula para calcular la variación porcentual de un período con respecto al inmediato
anterior es la siguiente:
VP = [(pn / pn-1) - 1].100
Pero si se quiere obtener la variación porcentual respecto a un Periodo Base Fijo la fórmula es:
VP = [(pn / po) - 1].100
INDICES PONDERADOS
Los números índices mejoran sensiblemente cuando se introducen en su construcción sistemas
de ponderación apropiados.
Método de Laspeyres
12
Estos índices se calculan utilizando como ponderaciones las cantidades o los precios del
período base.
Las fórmulas para calcularlos son las siguientes:
pni qoi qni poi
PL = i .100 y QL = i .100
poi qoi qoi poi
i i
i = 1, 2, 3, . . . , k
Interpretación:
En general, el índice de precios de Laspeyres indica el cambio en el valor agregado de la lista de
productos del período base, cuando son valuados a precios del período base y del período dado.
Si se usa la fórmula de Laspeyres para calcular el índice de precios al consumidor, el resultado
mediría la diferencia entre el costo en un período dado y el costo en el período base, de
mantener el nivel de vida del período base.
En general, el índice de cantidades de Laspeyres significa que, si se compra (o vende) distintas
cantidades de los mismos bienes en cada uno de los períodos, pero a los precios del período
base, cuánto se gastaría (o cobraría) en el período dado en relación con el período base.
Ventajas
Siempre pueden hacerse comparaciones de precios, no sólo desde cada período de tiempo con
el período base, sino también entre un período y otro.
El denominador es una cantidad que se mantiene constante durante varios períodos de
tiempo.
Inconvenientes
El inconveniente principal es que tiene un patrón estático de consumo o de producción, el cual
se desactualiza y se vuelve más irreal cuanto más tiempo transcurre.
Método de Paasche
Por este método, los índices ponderados agregados se calculan utilizando como ponderaciones
los precios o las cantidades del período dado, o actual.
Se aplican las siguientes fórmulas:
pni qni qni pni
PP = i .100 y QP = i .100
poi qni qoi pni
i i
i = 1, 2, 3, . . . , k
13
La aplicación de la fórmula para calcular un índice de precios implica la realización de los
siguientes pasos :
1) Multiplique el precio de cada bien en cada período por la cantidad de dicho bien en el
período base. Así se obtiene poi qni (valor para el período base) y pni qni (valor para cada
período dado).
2) Calcule las sumas de los productos obtenidos en 1).
3) Divida el total de cada período por el total del período base.
4) Multiplique el resultado por 100.
Para calcular Qp se procede igual, ponderando por los precios.
Interpretación:
En general, el índice de precios de Paasche indica el cambio en el valor agregado de la lista de
productos del período dado, cuando son valuados a precios del período base y del período
dado.
Si se usa la fórmula de Paasche para calcular un índice de precios al consumidor, compara el
costo en el período dado con el costo en el período base de mantener el nivel de vida en el
período dado.
En general, un índice ponderado agregado de cantidades calculado por este método, significa
que si se compra (o vende) distintas cantidades de los mismos bienes en cada período, pero a
los precios del período dado, ¿cuánto se gastaría (o cobraría) en el período actual en relación
con el período base?
Ventajas
Al cambiar las ponderaciones en cada período, se refleja mejor la importancia relativa de los
artículos, así como los cambios en las condiciones económicas de producción, ventas, compras.
Inconvenientes
Sólo pueden hacerse comparaciones apropiadas entre cada período y el período base, no
entre períodos cualesquiera.
Obtener una lista adecuada y detallada de ponderaciones en cada período sería muy laborioso
y de gran costo.
Comparación entre Laspeyres y Paasche
En general, al utilizar estas fórmulas para calcular índices de precios al consumidor, si los
consumidores alteran sus patrones de compra en respuesta a cambios relativos en los precios
de ciertos artículos, los índices de Laspeyres tenderán a exceder a los de Paasche.
PF = √ PL x PP . 100 y Q F = √ QL x Q P . 100
El índice de Laspeyres tiende a dar mayor peso a los artículos cuyos precios han aumentado;
mientras que el índice de Paasche tiende a restarle peso a los artículos cuyos precios han
aumentado. Con el índice ideal de Fisher se corrigen esas tendencias y se logra un índice más
real.
14
Cambio de base
Cuando se realiza el cambio de base se debe procurar que el nuevo período base elegido sea lo
más representativo posible, y no muy alejado del período actual. Y para saber si el nuevo
periodo elegido es bueno, el mismo no debe ser un periodo en el cual hayan variado en
cantidades extremas, ósea que sea muy grande o muy pequeño en comparación a los otros
periodos.
Cuando un período base pierde representatividad con el tiempo, es necesario cambiarlo por
uno más reciente. En ocasiones, también para tener dos índices con diferentes bases,
comparables.
Para obtener los números índices con el período base cambiado, se utiliza el método de la
regla proporcional, que consiste en: “dividir cada uno de los índices anteriores por el índice
correspondiente al nuevo período base, y multiplicando por 100”
Empalme de índices
Para empalmar, primero se debe establecer que la nueva serie de índices tenga un valor de
100 en el período base nuevo deseado, y se compara con el valor correspondiente a la serie de
índices antigua para el mismo período.
Ejemplo:
15