Sunteți pe pagina 1din 6

TEMA 2 TABLAS DE FRECUENCIAS Y REPRESENTACIONES GRAFICAS Se proporcionar un conjunto de herramientas o tcnicas estadsticas para el tratamiento de la informacin, tanto cualitativa

a como cuantitativa, que facilitan el manejo y anlisis de los datos. En la etapa de organizacin de los datos, nos referimos a la clasificacin y tabulacin de los mismos. Por lo tanto, luego que los tenemos, se dividir la informacin en clases previamente definidas, en funcin de una o ms caractersticas. Un elemento cualquiera del conjunto de datos pertenecer a una clase determinada, si cumple con las caractersticas de esa clase. De lo contrario, pertenecer a otra clase. Las clases deben ser excluyentes y exhaustivas, es decir que cada elemento del conjunto debe pertenecer a una sola clase y a su vez, todo elemento debe pertenecer a alguna clase. O sea que todo elemento debe quedar dentro de una clase pero no puede estar en dos clases a la vez. Cuando la divisin en clases se realiza en funcin de alguna caracterstica cualitativa, nos encontramos frente a datos cualitativos o atributos. Un atributo es una cualidad que nos permite diferenciar los individuos u objetos del conjunto segn posean o no dicha cualidad. Ejemplo: sexo, estado civil, profesin, color, etc. El nmero de clases en que puede agruparse la informacin depende del atributo elegido. Si clasificamos a las personas en funcin del sexo, este atributo admite dos clases: masculino, femenino. Nos encontramos frente a un caso de particin dicotmica. Si la clasificacin se realiza en funcin del estado civil, podemos establecer mas clases: soltero, casado, divorciado, viudo, etc. En esta situacin hablamos de particin mltiple. Todo atributo que admite una particin mltiple puede ser llevado a otra dicotmica, agrupando alguna de las clases en una sola. Si agrupamos todos los no casados, pasamos a dos clases: casados y no casados. Esta agrupacin puede ser til en algunas situaciones, pero se pierde informacin. La nomenclatura que utilizaremos para un dato cualitativo es A; B, etc. y para los elementos de su particin ser: a.- Particin dicotmica: a: pertenecer a una clase. : pertenecer a la otra clase b.- Particin mltiple: a1, a2, a3, ..................ai, donde el subndice i representa la cantidad de clases. Cuando la divisin en clases se realiza en funcin de alguna caracterstica cuantitativa, nos encontramos frente a datos cuantitativos o variables. Ejemplo: estatura, ingresos, cantidad de miembros de una familia, cantidad de libros en prstamo, etc y los valores que pueden tomar depender de la variable. Lo expresado anteriormente nos conduce a diferenciar dos tipos de variables: Discretas : son aquellas variables que solo pueden tomar un conjunto finito de valores, generalmente valores enteros. La cantidad de libros en prstamo es un caso tpico de variable discreta, pudiendo tomar los valores 0,1, 2, 3........n. Continuas : son aquellas variables que pueden tomar a priori un conjunto infinito de valores. Generalmente son las magnitudes vinculadas a longitudes, superficies, volumen, edad, duracin o peso. Pero por razones de medicin se discretizan y ese valor observable representa un valor dentro de un intervalo terico. Para este tipo de datos la nomenclatura que utilizaremos ser similar que para atributos, con la nica diferencia que se usar la letra X . 2.1.- Distribuciones de frecuencias. La distribucin de frecuencias es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Toda variable o atributo tiene asociada una distribucin de frecuencias, que implica una correspondencia biunvoca entre dos conjuntos. Por un lado, tenemos el conjunto formado por los valores que toma la variable o el atributo y por el otro el de las frecuencias relacionadas con ellos La asociacin existe en ambos sentidos, pues a cada valor de la variable o atributo, denominado clase, le corresponde una frecuencia y a su vez cada frecuencia se identifica con una clase de la variable 2.1.1.- Frecuencia absoluta y relativa. frecuencia absoluta : es la cantidad de datos que integran cada una de las clases, o sea que son las repeticiones que encontramos dentro de una misma clase. La notacin en atributos es: n (a i), siendo i el subndice asignado para referenciar las diferentes clases. La notacin en variables es: n (x i).

Las propiedades de las frecuencias absolutas son: a. - 0 n( a i ) n , 0 n( x i ) n

siendo n el tamao de la muestra. b. n (a i) = n , n(x i) = n

La correspondencia entre frecuencias absolutas

los valores de la variable y su frecuencia absoluta determina lo que denominamos distribucin de

frecuencia relativa : es la cantidad de repeticiones obtenidas para cada clase, en relacin al total de las observaciones. Resulta de dividir la cantidad de elementos de cada clase (frecuencia absoluta) por el tamao de la muestra. La notacin es h (a i) o h(x i), segn el tipo de variable. De acuerdo a la definicin : h (a i ) = n ( a i ) / n

Las propiedades de las frecuencias relativas son: a. - 0 h( a i ) 1 b. - h (a i) = 1 , , 0 h( x i ) 1 h(x i) = 1

Las frecuencias relativas son un porcentaje, ya que relacionan una parte del conjunto con el total La correspondencia entre los valores de la variable y su frecuencia relativa determina lo que denominamos distribucin de frecuencias relativas Trataremos por separado ejemplos para datos cualitativos y cuantitativos. En el caso de los atributos, estos ya vimos que pueden clasificarse en dicotmicos o mltiples. En el caso de variables tendremos 3 situaciones distintas, dependiendo del tipo de variable, el tamao de la muestra y el nmero de observaciones EJEMPLO N 1.ATRIBUTOS (particin mltiple)

El atributo analizado es A: lugar de procedencia del alumnado de la EUBCA. Supongamos que el alumnado es de 1600 alumnos y la distribucin por departamentos es: (luego de haber corregido y tabulado los datos) A i : Procedencia ): frec. absoluta : Montevideo 1000 100 80 45 50 40 285 1600 ): frec. relativa 0.625 0.063 0.05 0.028 0.031 0.025 0.178 1

: Tacuaremb : Paysand : Canelones TOTAL Esto da lugar a una particin mltiple. EJEMPLO N 2.ATRIBUTOS (particin dicotmica)

Si agrupamos como estudiantes de Montevideo y del Interior tendramos una clasificacin dicotmica. Procedencia Frec. Absoluta. 1000 600 1600 Frec. relativa 0.625 0.375 1

Total

La informacin tambin puede ser presentada en grficos, lo cual expondremos con posterioridad. Con cuadro y grfico estamos presentando la informacin y con las frecuencias relativas estamos analizando la misma.

EJEMPLO N 3.-

VARIABLES (cantidad de observaciones pequea)

La variable analizada es X: puntaje de una prueba de Estadstica. Supongamos que el total de alumnos que dieron la prueba es 7 y el puntaje de la prueba es de 0 a 5. Los resultados obtenidos fueron: 0, 2, 2, 1, 4, 5, 3. Se colocan todas las observaciones en forma separada, aunque algunas tengan el mismo valor, por lo tanto el nmero de clases es igual al de las observaciones, siendo la frecuencia de cada clase igual a 1. Esto dara lugar al siguiente cuadro: Puntaje 0 1 2 2 3 4 5 Frec. absolutas 1 1 1 1 1 1 1 7 Frec. relativas 1/7 1/7 1/7 1/7 1/7 1/7 1/7 1

El cuadro correspondiente no es nada significativo, ya que salvo el 2, todas las frecuencias son de uno. EJEMPLO N 4.VARIABLES (muestras relativamente grandes con pocos valores de la variable)

La variable es la misma que la analizada en el ejercicio anterior, con la diferencia que la muestra es de mayor tamao y por lo tanto cada valor se repite muchas veces, dando lugar a frecuencias mayores que 1. Generalmente estas situaciones se dan con mayor frecuencia en variables discretas. Los resultados obtenidos fueron: 2, 5, 1, 2, 0, 2, 1, 5, 1, 4, 3, 0, 5, 4, 4, 3, 3, 2, 4, 5.Si presentamos esta informacin estructurada obtendramos la siguiente tabla de frecuencias: Puntaje 0 1 2 3 4 5 Total Frec. absoluta 2 3 4 3 4 4 20 Frec. relativa 0.10 0.15 0.20 0.15 0.20 0.20 1

Existe una tercer situacin que la veremos en el punto 2.2.2.1.2.- Frecuencias acumuladas. Este concepto es aplicable solamente para variables, ya que para atributos no tiene sentido. La frecuencia acumulada es aquella que acumula frecuencias relativas hasta un determinado valor de la variable. Sumando las frecuencias de todos los valores inferiores a un lmite fijado, obtenemos la frecuencia relativa acumulada hasta ese valor. La correspondencia entre los valores de la variable y su frecuencia acumulada se denomina Funcin de distribucin acumulada y se expresa como F* (x i ). Esta funcin cumple con las siguientes propiedades: F* (x i ) = 1 cuando la distribucin alcanza su mximo. Al llegar al ltimo valor, la funcin no crece ms por no existir frecuencias para acumular. F* (x i ) = 0 cuando la distribucin alcanza su mnimo. Por debajo del primer valor, la funcin sigue valiendo cero porque tampoco existen frecuencias.

10

F* (x i ) es no decreciente, pues al crecer el valor de la variable, la funcin puede ir creciendo o mantenerse constante, ya que las frecuencias que se acumulan nunca son negativas y lo mnimo que pueden valer es cero. F* (x i ) es continua, y de acuerdo al tipo de distribucin , puede ser continua por la derecha o por ambos dados . 2.2.- Frecuencia de una variable agrupada en intervalos. Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencias muy extensa que aportara muy poco valor a efectos de sntesis. Este agrupamiento deliberado en intervalos hace perder informacin, pero a su vez permite manejar datos que por su volumen no podran ser analizados ni interpretados. El nmero de tramos en los que se agrupa la informacin es una decisin que debe tomar el analista. La regla es que mientras ms tramos se utiliza menos informacin se pierde, pero puede que menos representativa e informativa sea la tabla. Por lo tanto, lo primero que debemos observar es el recorrido total de la variable y dividirlo en tantos intervalos como sea conveniente, tratando de no superar los 15 y que no sean menos de 4 o 5. El siguiente ejemplo muestra el agrupamiento. EJEMPLO N 5.VARIABLES (muestras relativamente grandes con muchos valores de la variable)

Supongamos que nos encontramos con una prueba cuyo puntaje vara de 0 a 50 y tomamos una muestra de 45 alumnos. Los resultados individuales son:

Uno de los agrupamientos posibles sera en 5 intervalos, de amplitud 10 cada uno. Intervalos ( 0 10 ] ( 10 20 ] ( 20 30 ] ( 30 40 ] ( 40 50 ] n(x) 9 10 13 8 5 45 h(x) 0.20 0.22 0.29 0.18 0.11 1

2.3.- Representaciones Grficas. Estos cuadros de distribuciones generalmente van acompaados con grficas, especificas para cada caso, y que permiten una ms rpida comprensin de los datos. 2.3.1.- Diagrama de barras y de sectores. El grfico de barras, como su nombre lo indica, son barras del ancho que se desee, y de altura la frecuencia absoluta o relativa.
1200 1000 800 600 400 200 0

En cuanto al grfico de sectores, tambin denominado circular o de pastel, su forma es circular y cada frecuencia esta representada por un sector del crculo. Este grfico permite apreciar que parte representa cada clase dentro del total, pero a veces se hace difcil apreciar la diferencia entre una frecuencia y otra.

11

Mont.

3% 5%

3% 3% 6%

18% 62%

Rivera Colonia Tacuaremb Paysand

Ambos grficos son utilizados fundamentalmente para representar atributos. 2.3.2.- Diagrama de bastones y escalonado. El grfico de bastones es un grfico en barra, pero con una variante en la amplitud de la barra, ya que en estos casos sera una lnea (bastn), con una altura que sera la frecuencia absoluta o relativa. Se aplica fundamentalmente para las distribuciones de variables y en particular para las que se muestran en el ejemplo 4.5 4 3 2 1 0 0 1 2 3 4 5 0

(El bastn debera ser una lnea) En cuanto al grfico escalonado, es el que se utiliza para representar la funcin de distribucin de una variable en la situacin del ejemplo 4. Funcin de distribucin acumulada
1.2 1 frecuencias 0.8 0.6 0.4 0.2 0 Puntaje

2.3.3.- Histograma de frecuencias. En el caso de la variable que debe ser agrupada en intervalos, los valores que caen dentro de cada intervalo se consideran distribuidos uniformemente dentro del mismo., y las frecuencias ya no son alturas, sino reas, por lo que la representacin grfica son rectngulos, que tienen por base la amplitud del intervalo y por altura lo que denominaremos funcin de densidad y que se define de la siguiente manera: f*(x i )= frecuencia relativa / amplitud del intervalo La representacin grfica de esta funcin de densidad recibe el nombre de histograma. Los intervalos elegidos no tienen porque tener siempre la misma amplitud, en algunas situaciones se toman intervalos mayores donde no se necesita tanta precisin o en los extremos de la distribucin

12

Distribucion por puntaje


Funcion de densidad 0.04 0.03 0.02 0.01 0 Puntaje

En cuanto a la grfica de la funcin de distribucin acumulada, en esta situacin no es escalonada, sino que es lineal, ya que los valores no se encuentran agrupados en torno a un punto, sino que lo hacen en un intervalo. A continuacin se presenta la grfica mencionada anteriormente, en base a los datos del ejemplo N 5.

Funcion de distribucin acumulada


1.2 1 0.8 0.6 0.4

s a i n u c e r f

0.2 0 0 10 20 30 Puntaje 40 50

13

S-ar putea să vă placă și