Sunteți pe pagina 1din 35

III

ANLISIS DESCRIPTIVO DE DATOS ESTADSTICOS

3.1. ANLISIS

DESCRIPTIVO

DE DATOS

ESTADSTICOS

MEDIANTE

TCNICAS

TABULARES Y GRFICAS

Una vez que se ha preparado un archivo de datos de una encuesta, en entorno de


EXCEL, SPSS o cualquier otro software especializado, estamos listos para seguir con
el anlisis estadstico con el propsito de alcanzar los objetivos de la investigacin. El
anlisis estadstico de datos depende absolutamente del tipo de investigacin que se
lleva acabo y ms precisamente, de los objetivos que se han formulado.
Una investigacin puede plantear la necesidad de realizar anlisis estadstico se
Si la investigacin es de tipo descriptivo, como es el caso de casi la totalidad de los
estudios que implican la realizacin de encuestas, el propsito del investigador es
describir situaciones, eventos, etc., es decir, se interesa por saber cmo es, cmo se
manifiesta determinado fenmeno, buscan especificar las propiedades importantes de
personas, grupos, comunidades o cualquier entidad o fenmeno que sea objeto de
anlisis. La Estadstica permite la medicin en trminos absolutos o relativos de
diversos aspectos, dimensiones o componentes del fenmeno o fenmenos. Desde el
punto de vista cientfico, describir es, fundamentalmente, medir.
ANLISIS DESCRIPTIVO MEDIANTE TCNICAS TABULARES Y GRFICAS
La descripcin estadstica de los fenmenos se logra a travs de un conjunto de tablas
estadsticas (otros los llaman cuadros estadsticos) o sus representaciones grficas,
acompaadas de las lecturas pertinentes de la informacin contenida en las mismas,
que son presentadas en forma sistemtica y coherente con los objetivos del estudio
Qu es una tabla estadstica?
Una tabla estadstica (llamada tabla de distribucin de frecuencias) es un arreglo
rectangular con una estructura que comprende un conjunto filas y columnas, que
permite presentar los datos correspondientes a una o ms variables (caractersticas del
fenmeno bajo estudio) en forma ordenada y resumida, de modo tal que posibilita la
comprensin de la informacin contenida en dichos datos.
Cmo se construye una tabla estadstica?
Las siguientes pautas pueden servir de ayuda para construir una tabla estadstica.
1 Definir el propsito especfico: En primer lugar, pregntese sobre la(s) variables(s)
del fenmeno respecto a la(s) cual(es) desea obtener informacin.

2 Diseo de la tabla: Disear la estructura (formato) de la tabla ms apropiada para el


propsito especfico a satisfacer. En muchos casos, estos formatos de tablas se
elaboran en la fase de la preparacin del Proyecto de Investigacin.
3 Determinar las frecuencias absolutas y/o relativas. En principio, las tablas se pueden
construir:
a) En forma manual, usando slo papel y lpiz. En este caso, las frecuencias se
determinan mediante en conteo usando las tarjas o palotes.
b) Empleando un programa como EXCEL u otros paquetes estadsticos, stos poseen
instrucciones especiales para la construccin de tablas.
TABLA PARA UNA VARIABLE CUALITATIVA

Cuando se trata de presentar los datos correspondientes a una variable cualitativa, la


tabla tiene el formato siguiente:

* En la primera columna, en el espacio donde aparece Variable, se escribe el nombre


de la variable para la cual se construye la tabla, en las filas siguientes se colocan las
categoras o modalidades de variacin de variable.
Las categoras se pueden ordenar segn el criterio ms conveniente para la
comprensin de la informacin. Los criterios de ordenacin de las categoras suelen
ser:
- Un orden alfabtico de las categoras. Algunos programas como el EXCEL presentan
las categoras segn este criterio de manera automtica.
- El orden creciente o decreciente de las frecuencias. La opcin Ordenar del men
Datos de EXCEL permite tambin manejar este criterio. Cualquiera sea el criterio de

ordenacin, si existe la categora Otro(a), sta deber aparecer como la ltima de las
categoras.
En la segunda columna, bajo el encabezado Nmero de casos se colocan las
frecuencias correspondientes de cada categora; en la ltima fila, fila del total, se pone
la suma de todas las frecuencias y es igual al nmero total de datos.
En la tercera columna se calculan y se ponen los porcentajes. El nmero de cifras
decimales en los porcentajes puede ser de uno o dos.
Ejemplo

Partes de una tabla estadstica.


Aprovechando la Tabla 01, en el siguiente esquema se sealan las partes que una
tabla estadstica cualquiera debe tener en forma general.

Numeracin: Por lo general un informe de investigacin contiene un conjunto de


tablas, las que deben ser numeradas en un orden correlativo. La numeracin permite
ubicar, hacer referencias y remisiones a la tabla desde cualquier parte del documento.
La numeracin puede ir arriba y al centro de la tabla o a la altura de la primera lnea del
ttulo, como en la tabla que se vuelve a reproducir y que aparece en la pgina 4.
Ttulo. El ttulo de la tabla, que siempre va en la parte superior de la misma, debe
informar en forma clara y breve acerca del qu?, quienes? Donde?, cuando?, de
la informacin que contiene la tabla.
Variable(s). En el caso una tabla de una sola variable, sea cualitativa o cuantitativa,
como es el caso presentado como ejemplo, en el encabezado de la primera columna
se ubica la variable.
Categoras de la variable. Debajo del nombre de la variable se ubican las categoras
correspondientes.

Cuando la variable es cualitativa se colocan las diferentes modalidades que la


variable puede contener, es el caso de nuestro ejemplo. El orden en el que
aparecen las categoras se puede manejar de acuerdo a algn criterio que

resulte ser ms conveniente para el objetivo al que sirve. Los programas como
EXCEL presenta las categoras en un orden alfabtico, a partir del cual se
pueden reordenar con otros criterios: forma ascendente o descendente de las
frecuencias, por ejemplo. En el ejemplo se presenta de acuerdo al orden
descendente de las frecuencias.

Si la variable es cuantitativa discreta con pocos valores diferentes, debajo del


nombre de la variable en la tabla se colocan los diferentes valores de la variable.

En caso de una variable cuantitativa continua, debajo del nombre de la


variable de ubican las categoras (clases o intervalos) como veremos ms
adelante.

Fila de encabezados. Adems del nombre de la variable, se colocan los encabezados


de los diferentes tipos de frecuencias.
En el ejemplo, el encabezado de la segunda columna Nmero de estudiantes, hace
referencia al nmero de casos que corresponden a cada una de las categoras (distritos
en este caso). Estas son las frecuencias absolutas. El encabezado de a tercera
columna Porcentaje, hace referencia a las frecuencias relativas (los porcentajes y las
proporciones son cantidades relativas).
Cuerpo de la tabla. Es la parte de la tabla que contiene a la informacin numrica, el
conjunto de las frecuencias absolutas y/o relativas.
Notas. Son las anotaciones que se ponen para hacer aclaraciones que permitan tener
una informacin ms precisa. Puede haber ms de una nota aclaratoria. Se colocan al
pie de la tabla. Obviamente, si no hay nada que aclarar se podr prescindir de esta
parte.
Fuente. Informa acerca del origen de la informacin. En muchas investigaciones se
recurre a las denominadas fuentes para obtener los datos que permiten alcanzar algn
objetivo, estas fuentes por lo general son publicaciones, (revistas, tesis, informes de
investigaciones, libros, diarios, etc.) o documentos preparados por otros investigadores
u organismos tales como el INEI, BCR, MEF, MED, Municipalidades, gobiernos
regionales, etc. Cuando los datos han sido obtenidos directamente por el investigador,
sea mediante una encuesta especial, un experimento, etc. se puede prescindir de la
fuente, pues se sobreentiende el origen de los datos.

En la Tabla 01 podemos observar que algo ms de las tras cuartas partes, 76%, de los
encuestados residen en el distrito de Chiclayo seguido mientras que el 10% residen en
otros distritos.

REPRESENTACIN GRFICA
Una distribucin de frecuencias puede representarse grficamente. Si no se cuenta con
un programa, los grficos se construyen manualmente empleando papel milimetrado,
regla, lpices de colores y, para los grficos circulares usando un transportador. Los
programas especiales, entre ellos EXCEL, permiten construir grficas de manera
cmoda.

Tipos de grficos.
Existe una amplia gama de grficos posibles para representar los datos de una variable
cualitativa.
La mayora de los grficos se construyen en el primer cuadrante del sistema
cartesiano. En este caso, en el eje horizontal (eje X) se ubica la variable con sus
respectivas categoras y en el eje vertical (eje Y) las frecuencias, absolutas o
porcentajes.

Como ejemplo vamos a representar la distribucin de frecuencias presentada en la


Tabla 01 con algunas de las formas posibles.
a) Grfico de frecuencias absolutas. Barras verticales en dos dimensiones.

b) Grfico de frecuencias porcentuales. Barras horizontales en dos dimensiones.

c) Grfico de frecuencias porcentuales. Barras verticales en tres dimensiones.

Otros tipos de grficos, como los circulares o de anillos, no se representan en un


cuadrante con ejes horizontal y vertical, como puede verse en los siguientes dos
grficos.
d) Grfico circular. Sectores circulares en tres dimensiones

e) Grfico circular. Sectores de anillos.

TABLA PARA DOS VARIABLES CUALITATIVAS

Una tabla que se construye para ver el comportamiento combinado de dos variables se
denomina tabla de contingencia, esta es una tabla de distribucin de frecuencias
conjunta de dos variables (otras denominaciones son: tablas bidimensionales,
bivariadas, tablas cruzadas, etc.).
Este tipo de tabla es la que se usa cuando la investigacin tiene como objetivo
determinar la relacin entre dos variables, pues permite calcular las medidas de
correlacin que cuantifican el grado o intensidad de la relacin entre dos variables y la
significacin de dicha relacin.
Consideremos dos variables cualitativas, una de las variables, simbolizada con la letra
A, que tiene r categoras (A1, A2,, Ai , , Ar ) que se encuentran en las filas. La otra
variable simbolizada por B posee c categoras (B1, B2 ,, Bj , , Bc ) que se
encuentran en las columnas.
La estructura general de una tabla de contingencia para las variables A y B es la
siguiente:

Es una tabla de contingencia de r filas y c columnas, (tabla rxc). Si la variable A tiene 4


categoras (r = 4) y la variable B tiene 3 categoras (c = 3), la tabla de contingencia
tendr 4 filas y tres columnas, o ms brevemente ser una tabla 4x3.
n11 es el nmero de casos que hay en la categora A1 de la variable A y la
categora B1 de la variable B
n12 es el nmero de casos que caen en la categora A1 de la variable A y la
categora B2 de la variable B

n21 es el nmero de casos que caen en la categora A2 de la variable A y la


categora B1 de la variable B
n22 es el nmero de casos que caen en la categora A2 de la variable A y la
categora B2 de la variable B,
y as, en general, nij es el nmero de casos que caen en la categora Ai de la
variable A y la categora Bj de la variable B
En la taba de contingencia observamos tambin las distribuciones marginales de cada
una de las variables. Aclaremos estos conceptos a travs de un ejemplo.
Ejemplo 1. Tabla estadstica para dos variables cualitativas.
Propsito especfico: Se requiere una tabla de contingencia que presente la
distribucin de frecuencias absolutas (nmero de casos) de las variables Grado de
satisfaccin y Sexo de los estudiantes.

Esta es una tabla que slo muestra las frecuencias absolutas y en la mayora de los
casos no es la ms apropiada para presentar en un informe de investigacin, son ms
apropiadas las tablas que presenten las frecuencias absolutas acompaadas con las
frecuencias porcentuales o las tablas que contienen slo las frecuencias porcentuales;
ms adelante ilustraremos estos casos.
Distribuciones marginales
Una tabla de contingencia muestra tambin las frecuencias marginales. En la Tabla 02
tenemos dos distribuciones marginales.

1) La distribucin marginal de la variable Grado de Satisfaccin con la formacin


proporcionada por la USAT: formada por la primera columna, donde se tiene la variable,
con la ltima columna, del Total.
2) La distribucin marginal de la variable Sexo: formada por las categoras respectivas
que aparecen en las columnas, con la fila del total.
Representacin grfica de frecuencias absolutas.

Cmo se calculan los porcentajes en una tabla de contingencia?


En el caso de la distribucin de la distribucin de una sola variable cualitativa el clculo
de los porcentajes se efecta de una manera nica, en cambio cuando se trata de la
distribucin de frecuencias conjunta que dan origen a las tablas de contingencia,
existen dos formas de computar los porcentajes los porcentajes.
Porcentajes respecto al gran total. En este caso cada frecuencia absoluta se divide
entre el nmero total de datos y se multiplica por 100. Ver la tabla siguiente que
muestra estos porcentajes junto con las respectivas frecuencias absolutas.

Puede tambin presentarse tablas conteniendo slo frecuencias porcentuales


como la siguiente.

Representacin grfica de frecuencias porcentuales 1.

Obsrvese que este grfico es idntico al grfico 02, la nica diferencia es que en el eje
vertical (eje Y) se han colocado los porcentajes.

Porcentajes respecto a los totales marginales. Esta manera de calcular los porcentajes se
presenta cuando una de las variables es considerada como independiente y la otra como
variable dependiente. La regla es calcular los porcentajes con los totales de las categoras
de la variable independiente, ejemplo.
- Se quiere una tabla que contenga la informacin que permita comparar, en trminos
absolutos y relativos, el Grado de Satisfaccin de los estudiantes mujeres con el de los
hombres respecto a la formacin proporcionada por la USAT.

Dado que el propsito es hacer la comparacin de hombres y mujeres respecto al


grado de satisfaccin con la formacin que les proporciona la USAT, los porcentajes se
han calculado con respecto a los totales de cada columna (porcentajes de mujeres con
relacin al total de mujeres y los porcentajes de hombres con respecto al total de
hombres encuestados).
Lectura: En la tabla 05 se observa que la manifestacin de las mujeres va desde
completamente satisfecho hasta insatisfecho, en cambio los hombres se concentran
casi en su totalidad en la categora de satisfechos; por otro lado tanto en mujeres como
en varones la mayor concentracin se da en la categora de satisfecho, con 67.6% y
92.3%, respectivamente.
Representacin grfica de frecuencias porcentuales 2.
El grfico de los porcentajes de la tabla 05 es el siguiente

TABLA PARA UNA VARIABLE CUANTITATIVA DISCRETA


Si x1 , x2 , , xn un conjunto de n valores de una variable discreta X, la tabla de
distribucin de frecuencias de estos n datos tiene la estructura siguiente:

En el encabezado de la primera columna se coloca el nombre de la variable y en las


filas siguientes los k valores diferentes de la variable; en las columnas 2 y 3 se
muestran las frecuencias absolutas y porcentuales simples, respectivamente.
En el caso de variables cuantitativas se suelen incluir las frecuencias acumuladas,
tanto absolutas como porcentuales, la tabla tiene la estructura de la figura que sigue:

Ejemplo de tabla de distribucin de frecuencias para una variable cuantitativa


discreta
1 Propsito especfico: Mostrar la distribucin de los estudiantes encuestados segn el
tamao del hogar.
2 Diseo de la tabla. La tabla deber mostrar tanto las frecuencias absolutas (el
nmero de estudiantes que residen en cada uno de los distritos considerados) como las
relativas (porcentajes).

Lectura: Se observa que las dos terceras partes, 66%, de los encuestados
provienen de hogares integrados de 4 a 6 miembros, se aprecia adems que no hay
hogares con ms de 9 personas.
Para ilustrar el significado de cada una de las frecuencias que aparecen en la tabla
anterior evaluemos las cifras de la quinta fila, que corresponde al valor 6 de la variable:
El valor 9 expresa que 9 estudiantes encuestados provienen de hogares con 6
miembros.
El valor 18 expresa que el 18% los encuestados provienen de hogares con 6 miembros.
El valor 41 expresa que 41 encuestados provienen de hogares con 2 a 6 miembros.
El valor 82 significa que el 82% de encuestados provienen de hogares 2 a 6 miembros.
Representacin grfica.
Para representar grficamente las tablas de frecuencias simples (no las acumuladas),
se usan las opciones que se tienen para las variables cualitativas, por ejemplo las
barras.

TABLA PARA UNA VARIABLE CUANTITATIVA CONTINUA


(o variable discreta con muchos valores diferentes)
La construccin de una tabla de frecuencias para el caso de datos de una variable
cuantitativa continua (o una variable discreta pero que posee muchos valores
diferentes) requiere del uso de categoras o clases (intervalos) en las que se agrupan
los casos. La estructura de una tabla de distribucin de frecuencias de este tipo es:

Clases o categoras. La tabla anterior comprende un conjunto de m clases o


categoras.
Cada clase tiene un lmite inferior y un lmite superior, as:
En la clase 1,

L0 - L1 , L 0 es el lmite inferior y L1 su lmite superior

En la clase 2,

L1 L2 , L1 es el lmite inferior y L2 su lmite superior

En forma general, en la clase i, Li-1 Li , Li-1 es el lmite inferior y Li su lmite superior


Finalmente, en la clase m, Lm-1 Lm, Lm-1 es el lmite inferior y Lm es el lmite superior.
Estas expresiones son las representaciones simblicas de los lmites, no son
operaciones aritmticas de diferencias.
El agrupamiento de datos en clases ocasiona la prdida de los detalles de la
informacin, los valores especficos de los datos se pierden, una distribucin de

frecuencias slo conserva los aspectos ms importantes de los datos. Una distribucin
que tiene muy pocas clases ocasionar mayor prdida de informacin, por su parte,
una distribucin con un gran nmero de clases conservar informacin muy detallada
que podra ser innecesaria para los objetivos que se persiguen con la investigacin.
Cuntas clases usar? No existen reglas nicas ni rgidas en cuanto al nmero de
clases a emplear para la distribucin de un conjunto de datos; algunos autores
sugieren el uso de ciertas frmulas para calcular el valor del nmero de clases m. Es
conocida la frmula de Sturges:
m = 1 + 3.3xlog(n) siendo n el nmero total de datos.
En todo caso, el resultado de sta o cualquier otra frmula se tomar como un valor
referencial, el nmero de clases a emplear podra ser mayor o menor que el dado por
la frmula.
La mayora de los autores recomiendan usar un 5 < m < 15, de acuerdo a este criterio
no es conveniente usar menos de 5 ni mas de 15 clases, sin embargo pueden haber
situaciones en las que, excepcionalmente, podra usarse un nmero de clases fuera de
este rango.
En general, el agrupamiento de datos en clases ocasiona siempre una prdida de
informaron, si se emplean muy pocas clases ocasiona una mayor la prdida de
informacin, y muchas clases pueden conservar informacin con un grado de detalle
innecesario.
Otro criterio, ms intuitivo y prctico es el de buscar simultneamente dos valores m y
c, que resulten adecuados, ms adelante ilustraremos esta alternativa por medio de un
ejemplo.
Amplitud (o ancho) de clase. Cada clase o categora tiene una determinada amplitud
y se define como la diferencia entre el lmite superior e inferior de dicha clase:
La amplitud de la clase 1 est dada por c1 = L1 L0
La amplitud de de la clase 2 est dada por c 2 = L2 L2 - 1, en general, la amplitud de la
clase i est dada por ci = Li Li 1 .
Se pueden construir distribuciones con amplitudes diferentes, sin embargo se prefieren
clases de amplitud constante, esto es, c1 = c2 = = cm = c.
Construccin de una tabla de distribucin de frecuencias para variable continua.
1- Calcular el rango R.
R = X mayor X menor
Donde x mayor es el mayor valor de los datos y x menor es el menor valor.
2- Decidir respecto al nmero de clases m, y la amplitud de clase c.
3- Construir las clases y determinar las frecuencias de cada clase
Al igual que en los casos anteriores, se puede elaborar una tabla de frecuencias en
forma manual o usando un paquete especializado. Presentaremos ejemplos de ambos
casos.
Ejemplo de distribucin de frecuencias para una variable cuantitativa continua
1 Propsito especfico: Mostrar la distribucin de las estaturas de los estudiantes
encuestados.

2 Diseo de la tabla. La tabla deber mostrar tanto las frecuencias absolutas (el
nmero de estudiantes que caen encada categora o clase), porcentajes. El formato
adecuado es el siguiente:

Tabla 07. Distribucin de los pesos de estudiantes encuestados de la USAT. Enero


del 2005
Talla (metros)
1.45 - 1.50
1.50 - 1.55
1.55 - 1.60
1.60 - 1.65
1.65 - 1.70
1.70 - 1.75
1.75 - 1.80
Total

Punto
medio
1.475
1.525
1.575
1.625
1.675
1.725
1.775

Frecuencia
2
8
12
13
7
4
4
50

Porcentaje
4.0
16.0
24.0
26.0
14.0
8.0
8.0
100.0

Acumulativa
Frecuencia Porcentaje
2
4.0
10
20.0
22
44.0
35
70.0
42
84.0
46
92.0
50
100.0

USO DE EXCEL PARA LA CONSTRUCCIN DE TABLAS

Y GRFICAS

ESTADSTICAS
En la presentacin en Power Point se explica el ptrecedimiento para construir tablas
para una variable cualitativa usando el complemento MegaStat de EXCEL

3.2. ANLISIS DESCRIPTIVO DE DATOS ESTADSTICOS MEDIANTE


TCNICAS NUMRICAS
Las tcnicas tabulares y grficas, como se ha visto, permiten resumir masas o
conjuntos grandes de datos en tablas y sus representaciones grficas, estos objetos
proporcionan informacin valiosa acerca de algunas de las caractersticas importantes
del conjunto de datos.
En esta seccin desarrollaremos las tcnicas numricas de anlisis de datos
estadsticos, stas permiten reducir masas de datos correspondientes a variables
cuantitativas a unos pocos valores numricos que contienen informacin acerca de
caractersticas relevantes de los datos.
Desde el punto de vista del anlisis descriptivo de datos cuantitativos univariantes son
importantes tres caractersticas: Posicin, Dispersin y Forma de la distribucin.
Dado que los conceptos de Posicin, Dispersin y Forma de distribuciones de
frecuencia constituyen conceptos bsicos, explicaremos con la ayuda de grficas en
qu consiste cada uno de ellos.
A qu se refiere la Posicin de un conjunto de datos o de su distribucin?
En la figura 01 se presenta la grfica de dos distribuciones de frecuencias, si
consideramos que la edad es una variable que toma valores positivos de la recta real,
se observa que la distribucin de las edades de los estudiantes se posiciona entre 16
y 25 aos, en cambio la distribucin de las edades de los profesores se posicionan
entre los valores de 28 a 51 aos. Un conjunto de datos correspondiente a una variable
siempre tendr un posicionamiento o ubicacin en la recta de nmeros reales.
A qu se refiere la Dispersin de un conjunto de datos o de su distribucin?
En la misma figura 01 se observa otra caracterstica importante, la de la dispersin:
Las edades de los estudiantes son ms homogneos, no varan mucho entre ellos,
pues los valores se encuentran dispersos entre 16 y 25 aos en un rango de 25 16 =
9 aos. En cambio las edades de los profesores son ms heterogneos, se dispersan
entre los valores de 29 y 51 aos, en un rango de 51 25 = 26 aos.

Distribucin de edades de estudiantes

Menor Dispersin
(Ms homogneos)

Distribucin de edades de profesores

Mayor Dispersin
(Ms heterogneos)

Figura 01. Posicin y dispersin de un conjunto de datos

A qu se refiere la Forma de la distribucin de un conjunto de datos?

Algunas de las diversas formas que puede tomar una distribucin de frecuencias de los datos de una
variable cuantitativa se muestran a continuacin:

( a ) Distribucin unimodal
Simtrica

( b )Distribucin unimodal
con Asimetra negativa

( c )Distribucin unimodal asimtrica


con Asimetra positiva

Figura 02. Simetra / Asimetra de la distribucin de un conjunto de datos

( d ) Distribucin unimodal
Mesocrtica

( e ) Distribucin unimodal
Leptocrtica

( f ) Distribucin unimodal asimtrica


Platicrtica

Figura 03. Apuntamiento de la distribucin de un conjunto de datos

( g ) Distribucin bimodal
unimodal asimtrica

( h ) Distribucin unimodal Asimtrica

( i ) Distribucin

Figura 04. Distribucin multimodal / unimodal de un conjunto de datos

3.2.1. MEDIDAS DE POSICIN CENTRAL DE UN CONJUNTO DE DATOS


Son valores de resumen de un conjunto de datos correspondientes a variables
cuantitativas, son valores alrededor del cual se agrupan los datos, son una especie de
ndices que sealan el posicionamiento de un conjunto de datos o su distribucin.
Existe un conjunto amplio de medidas de tendencia central, estudiaremos slo aquellas
que son de uso ms frecuente.
Conviene tener presente que el estudio de la metodologa estadstica tiene, en general,
tres aspectos:
1) Concepto

2) Clculo
3) Interpretacin
En los que sigue proporcionaremos una breve descripcin de los conceptos. En
principio, el clculo de cualquier medida estadstica descriptiva se puede realizar
manualmente, con la ayuda de una calculadora de bolsillo o mediante el uso de
programas especiales de cmputo.
En esta ocasin usaremos una vez ms las funciones especiales y el complemento
MegaStat del programa EXCEL de Microsoft. De modo que las frmulas, que
atemorizan a no pocos se presentarn para ser conocidas, pero dejaremos que EXCEL
use las frmulas, haga los clculos y nos muestre los resultados para centrar nuestra
atencin en las interpretaciones.
BASE DE DATOS PARA EJEMPLOS
Para ilustrar el clculo y la interpretacin de las medidas de tendencia central usaremos
dos bases de datos que se encuentran en el Aula Virtual
1) La base de datos correspondiente a la encuesta de estudiantes y egresados de
educacin secundaria
2) La base de datos Trabajo

MODA (Mo)

Concepto
La moda, que simbolizaremos por Mo, de un conjunto de datos estadsticos es el valor
que se presenta con mayor frecuencia. Un conjunto de datos puede no tener moda,
tener una moda (unimodal), tener dos modas (bimodal) o poseer ms de dos modas
(multimodal). La moda puede hallarse tambin para datos de variables cualitativas.
Clculo de la moda de un conjunto de datos.
1) Clculo de la moda de datos no agrupados
Si X1, X2, X3,, Xn son n valores de una variable cuantitativa X, y n relativamente
pequeo, entonces la moda o modas se determina por simple inspeccin de los
datos.
Ejemplo.

Calcular e interpretar la moda del ingreso familiar mensual de los estudiantes


encuestados
Solucin
Clculo de la moda usando la funcin Moda de EXCEL.
Dado un conjunto de datos no agrupados, la moda puede ser calculada usando la
funcin Moda de EXCEL
1 Abrir base de datos en EXCEL, que contiene los datos los datos de la variable
cuya moda se desea calcular

2 Ubquese una celda vaca de Excel, en la cual deseamos que aparezca la moda
de los datos, en nuestro caso, nos ubicamos en la columna V y la fila 10
3 escriba el signo = escriba de la palabra moda y dentro del parntesis seleccionar
el rango de los datos que contienen los datos del ingresa familiar mensual. Vase la
figura:

4 Presionar Enter. Como resultado aparece en la celda V10 el valor 1450, que es la
moda que se quera conocer.
Interpretacin: El ingreso familiar tpico o ms frecuente de los encuestados es
1450 nuevos soles.
Observacin, Si un conjunto de datos posee ms de dos modas, la funcin Moda
de EXCEL slo detecta la una de ellas.
Para ilustrar este hecho consideremos el siguiente conjunto de datos respecto al
nmero de mensajes de texto recibidos por 20 personas en un da:
5

10

10

13

10

0 12 10

Este conjunto de datos posee dos modas, los valores 6 y 10; sin embargo, si
usamos la funcin moda de EXCEL slo detecta la moda Mo = 10, obsrvese que
este valor aparece antes que 6 en el conjunto de datos. Si hacemos un pequeo
cambio en el orden de los datos de modo que el 6 aparezca antes que el 10, por
ejemplo permutando los valores de 8 y 6, como se muestra en seguida
5

10

10

13

10

0 12 10

La funcin Moda de EXCEL muestra Mo = 6.

2) Clculo de la moda con datos agrupados


Cuando los datos se encuentran en una tabla de frecuencias, para calcular el valor
de la moda:

1 El primer paso es identificar la clase o intervalo modal, que no es ms que la


clase que posee la mayor frecuencia absoluta simple, a esta clase la identificamos
como la clase i.
2 Calcular la moda usando la frmula siguiente

d1
d1 d 2

Mo Li 1

Donde
Li 1 : lmite inferior de la clase modal

d 1 ni ni 1 : diferencia entre las frecuencias de las clases modal y la anterior


d 2 ni ni 1 : diferencia entre las frecuencias de las clases modal y la posterior

Ejemplo. La tabla que sigue es la distribucin de los ingresos de una muestra de


122 jefes de hogar. Calclese e interprtese la moda
Ingreso
mensual
500 - 1000
1000 - 1500
1500 - 2000
2000 - 2500
2500 - 3000
3000 - 3500
3500 - 4000
Total

Frecuencia
(ni)
12
20
30
24
18
10
8
122

Solucin
-

En primer lugar identificamos la clase modal, La clase que tiene la mayor


frecuencia es la clase 3, por lo tanto moda se encuentra en la clase 1500
2000.

Luego identificamos las cantidades que intervienen en la frmula

Li 1 : 1500
d 1 ni ni 1 = 30 20 = 10

d 2 ni ni 1 = 30 24 = 6

c = 2000 1500 = 500


Remplazamos estos valores en la frmula y hacemos el clculo aritmtico implicado

d1
10
c 1500
x500
10 6
d1 d 2

Mo Li 1

Mo = 1812.5
El ingreso ms frecuente de los jefes de hogar encuestados es S/. 1812.50 nuevos
soles.

MEDIANA (Me)

Concepto
La mediana, que simbolizaremos por Me, de un conjunto de datos estadsticos es el
valor que se ubica en el centro de los datos ordenados en forma creciente (o
decreciente), este valor divide al conjunto de datos en dos grupos, de modo que 50%
de los datos sern menores o iguales que ma mediana y 50% mayores o iguales que la
mediana. Un conjunto de datos siempre tiene mediana y es nica.
Clculo de la mediana de un conjunto de datos.
1) Clculo de la Mediana de datos no agrupados
Si X1, X2, X3, , Xn son n valores de una variable cuantitativa X, para calcular la
mediana de estos datos proceda como sigue:
1. Ordene los datos de acuerdo a su magnitud, de menor a mayor. La
representacin simblica de los datos ordenados es:
X(1), X(2), ... , X(n)
2. Determine el valor de la mediana usando los siguientes criterios
a) Si el nmero de datos, n, es impar, la mediana es el dato que est en el
centro de los datos ordenados, esto es,
Me X

n 1
)
2

b) Si el nmero de datos, n, es par, la mediana es igual a la media aritmtica de


los dos datos centrales, esto es,
X
Me

n
( )
2

n
( 1)
2

Ejemplo
Calcular e interpretar la mediana del ingreso familiar mensual de los encuestados.
Solucin
Clculo de la mediana usando la funcin Mediana de EXCEL.

Proceda igual que en clculo de la moda, en el paso 2 ubquese en la celada V11,


(recuerde que puede usar cualquier celda vaca). 3 escriba el signo = escriba de la
palabra mediana y dentro del parntesis seleccionar el rango de los datos que
contienen los datos del ingresa familiar mensual. Vase la figura:

4 Presionar Enter, como resultado aparece en la celda V11 el valor 1410, que es la
mediana que se quera conocer.
Interpretacin: El ingreso familiar mediano de los encuestados es 1410 nuevos
soles. El 50% de los encuestados tienen ingreso familiar menor o igual a 1410
nuevos los y los restantes 50% tienen ingresos mayores o iguales a 1410 nuevos
soles.
2) Clculo de la mediana para datos agrupados
1 Hallar las frecuencias absolutas acumuladas Identificar la clase mediana
(intervalo mediano), que es aquella que contiene al dato que ocupa la posicin n/2,
Me Li 1

n
N i 1

2
ni

c.

Las cantidades que intervienen en esta frmula son:

Li 1 : Lmite inferior de la clase mediana

n: nmero total de datos


N i 1 : Frecuencia absoluta acumulada de la clase anterior a la clase

mediana

ni : Frecuencia absoluta simple de la clase mediana

c: Amplitud de la clase mediana

Ejemplo. La tabla que sigue es la distribucin de los ingresos de una muestra de


122 jefes de hogar. Calclese e interprtese la mediana
Ingreso
mensual
500 - 1000
1000 - 1500
1500 - 2000
2000 - 2500
2500 - 3000
3000 - 3500
3500 - 4000
Total

Frecuencia
Frecuencia Acumulada
(ni)
(Ni)
12
12
20
32
30
62
24
86
18
104
10
114
8
122
122

Solucin
-

En primer lugar identificamos la clase mediana,

El dato que ocupa la posicin n/2 = 122/2 = 161 se encuentra en la clase 3,


quiere decir que la mediana tambin se encuentra entre 1500 y 2000.
-

Luego identificamos las cantidades que intervienen en la frmula


n 122

Li 1 : 1500

N i 1 32

ni 30

c =20001500 = 500

Remplazamos estos valores en la frmula y hacemos el clculo aritmtico


implicado

Me Li 1

n
N i 1

2
ni

122

32

2
c 1500
x500
30

Me = 1983.33

El ingreso mediano de los jefes de hogar encuestados es S/. 1983.33 nuevos soles.

MEDIA ARITMTICA ( X )

Concepto
La mediana aritmtica o brevemente media, que se simboliza con X , de un conjunto
de datos estadsticos es el valor que expresa el centro de gravedad de la masa de

datos. Dado un conjunto de datos correspondientes a una variable cuantitativa, la


media aritmtica siempre existe y tambin es nica.
Clculo de la media aritmtica de un conjunto de datos.
1) Clculo de la media aritmtica para datos no agrupados.
Si X1, X2, X3, , Xn son n valores de una variable cuantitativa X, el clculo de la
media aritmtica, X , de estos datos se calcula con las siguientes frmulas:
N

Media de una poblacin:

x
i 1

Media de una muestra

x
i 1

La media aritmtica es la medida de tendencia central ms importante y la ms usada.


Ejemplo
Calcular e interpretar la media aritmtica del ingreso familiar mensual de los
encuestados.
Solucin
Clculo de la media aritmtica usando la funcin Promedio de EXCEL.
Proceda igual que en los casos anteriores (clculo de la moda y la mediana), en el
paso 2 ubquese en la celada V12, (recuerde que puede usar cualquier celda vaca).
3 escriba el signo = escriba de la palabra promedio y dentro del parntesis
seleccionar el rango de los datos que contienen los datos del ingresa familiar mensual.
Vase la figura:

4 Presionar Enter, como resultado aparece en la celda V12 el valor 1409.26


(redondeando a los centsimos), que es la media aritmtica que se quera conocer.
Interpretacin: El ingreso familiar medio de los encuestados es 1409.26 nuevos
soles.
2) Para datos no agrupados.
Cuando el conjunto de datos se encuentra agrupado en una tabla de distribucin de
frecuencias, la media aritmtica se calcula usando las frmulas:
m

Media de una poblacin:

n x
i 1

Media de una muestra

n x
i 1

N
n
Donde las xi son las marcas de clase (puntos medios) y las n i son las frecuencias
absolutas simples y N y n son los tamaos de poblacin y de la muestra,
respectivamente.
Ejemplo. La tabla que sigue es la distribucin de los ingresos de una muestra de
122 jefes de hogar. Calclese e interprtese la mediana
Ingreso
mensual
500 - 1000
1000 - 1500
1500 - 2000
2000 - 2500
2500 - 3000
3000 - 3500
3500 - 4000
Total

Frecuencia
(ni)
12
20
30
24
18
10
8
122

Marca de
clase (Xi)
750
1250
1750
2250
2750
3250
3750

Xi.ni
9000
25000
52500
54000
49500
32500
30000
252500

Solucin
Para calcular la media aritmtica de datos agrupados solo requerimos las marcas
de clase o puntos medios y las frecuencias simples, calculamos la suma de los
productos de las marcas de clase por sus respectivas frecuencias simples y
remplazamos en la frmula
n

n x

i i

i 1

n x
i

i 1

252500
2069.67213
122

Interpretacin: El ingreso medio mensual de los jefes de hogar entrevistados es S/.


2069.67 nuevos soles.

3.2.2. MEDIDAS DE DISPERSIN DE UN CONJUNTO DE DATOS


Como se ha hecho notar antes, otra caracterstica importante de un conjunto de datos
de variables cuantitativas. Como su nombre lo indica, estas expresan el grado de
dispersin o variabilidad de la distribucin de un conjunto de datos. Es interesante
conocer la ubicacin o posicin de los datos, que se consigue mediante las medidas de
tendencia central, sin embargo, si no se conoce qu tan dispersos son los datos, puede
no ser apropiado. De all la necesidad de cuantificar tambin la magnitud de la
dispersin de los datos, empleando justamente las medidas de dispersin.
Tambin existen diversas medidas de dispersin
El Rango o Recorrido
Es una medida de dispersin absoluta que se define como la diferencia entre los
valores mximo y mnimo de un conjunto de datos
Clculo del Rango o amplitud general: R = Xmayor - Xmenor
A mayor valor del rango mayor dispersin o variabilidad de los datos
Desviacin Estndar y Varianza
La desviacin estndar es una medida de dispersin absoluta de un conjunto de datos, es un
ndice que cuantifica la desviacin promedio de los datos con respecto a su media aritmtica. El
valor de la desviacin estndar est expresado en las mismas unidades en que estn expresados
los datos.
La varianza es tambin una medida de dispersin de un conjunto de datos, al igual que la
desviacin estndar mide el grado de dispersin de los datos con respecto a la media aritmtica, a
diferencia de la desviacin estndar, la varianza se expresa en unidades cuadradas. La varianza
es el cuadrado de la desviacin estndar.
A Clculo de la desviacin estndar para datos sin agrupar
Clculo de la Desviacin estndar
La Desviacin estndar de un conjunto de n datos cuantitativos se calcula mediante la siguiente frmula.

_
1

Xi X
n 1

2
i

X i / n
2

n 1

Clculo usando la funcin Desvest de EXCEL

=desvest(rango de datos)/ Enter

Clculo de la Varianza.
Como puede observarse, la varianza es el valor de la desviacin estndar elevada al cuadrado. La
frmula para calcularla es:
_
1

S
Xi X
n 1

2
i

X i / n
2

n 1

Clculo de la desviacin estndar y la varianza con EXCEL

= Var(rango de datos)
B Clculo de la desviacin estndar y la varianza para datos agrupados
Cuando los datos estn agrupados en una tabla de distribucin de frecuencias, la desviacin
estndar y la varianza se calcula con estas frmulas:
Clculo de la Desviacin estndar
_
1

Xi X
n 1

S2

ni

1
xi2 ni ( xi n.i ) 2 / n
n 1

Clculo de la Varianza

S2

_
1

Xi X
n 1

ni

1
xi2 ni ( xi n.i ) 2 / n
S2
n 1

Coeficiente de Variacin (CV)


El coeficiente de variacin es una medida de dispersin relativa, se expresa en unidades
abstractas, como proporcin o porcentaje.
Se usa generalmente para comparar las dispersiones de dos conjuntos de datos de la misma
variable o de variables diferentes, expresadas en unidades diferentes. La frmula para calcular el
coeficiente de variacin es:
CV

Desviacin estndar
S
x100
x100
X
Mediaaritmtica

A mayor valor del CV, mayor dispersin o variabilidad de los datos.


La media aritmtica de un conjunto de datos es una medida de resumen que pretende representar
al conjunto de datos, sin embargo, para que una media sea buen representante del conjunto de
datos depende del grado de variabilidad o dispersin que presentan dichos datos, si los datos son
homogneos, es decir, no presentan mucha variabilidad la media aritmtica ser una medida
representativa, por el contrario, si los datos presentan mucha dispersin, la media no ser una
medida adecuada para representar al conjunto de datos.

Una regla emprica entre los investigadores es

MEDIDAS DE DISTRIBUCIN
ASIMETRA
Algunas de las diversas formas que puede tomar una distribucin de frecuencias de los datos de una
variable cuantitativa se muestran a continuacin:

( a ) Distribucin unimodal
Simtrica

( b )Distribucin unimodal
con Asimetra negativa

( c )Distribucin unimodal asimtrica


con Asimetra positiva

La asimetra de un conjunto de datos o de su distribucin se evala a travs del Coeficiente de Asimetra,


cuya frmula es:

Con datos no agrupados

Con datos agrupados

g1

(1 / n)( ( xi x ) 3
i 1

g1

(1 / n)( ( xi x ) 3 ni
i 1

s3

Los resultados pueden ser los siguientes:

g1 = 0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y a la


izquierda de la media)

g1 > 0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la derecha de la


media que a su izquierda)

g1 < 0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la izquierda de


la media que a su derecha)

El valor del coeficiente de asimetra se calcula cmodamente con EXCEL.

=coeficiente.asimetria(Rango de datos)/ Enter


Ejemplo:
Calcular e interpretar el coeficiente de asimetra de los ingresos mensuales de los jefes de hogar
encuestados.

Solucin:

CURTOSIS
La curtosis hace referencia al apuntamiento o elevacin de la distribucin de frecuencias de una variable
cuantitativa

El Coeficiente de Curtosis analiza el grado de concentracin que presentan los valores alrededor
de la zona central de la distribucin.

Se definen 3 tipos de distribuciones segn su grado de curtosis:

La frmula del coeficiente de Curtosis es:

Con datos no agrupados

Con datos agrupados

g2

(1 / n)( ( xi x ) 4
i 1

g2

(1 / n)( ( xi x ) 4 ni
i 1

s4

Los resultados pueden ser los siguientes:

g2 = 0 (distribucin mesocrtica).

g2 > 0 (distribucin leptocrtica).

g2 < 0 (distribucin platicrtica).

( d ) Distribucin unimodal
Mesocrtica

( e ) Distribucin unimodal
Leptocrtica

( f ) Distribucin unimodal asimtrica


Platicrtica

S-ar putea să vă placă și