Sunteți pe pagina 1din 4

Distribuciones de Frecuencias

Distribuciones de Frecuencias
Tema 3 Profesor Tevni Grajales G. Cuando los datos que deben analizarse son numerosos, como puede ser la edad o el salario mensual de una poblacin de tres mil personas, es conveniente agrupar los datos de manera ordenada por clases o categoras que muestran, para cada una de ellas, el nmero de elementos que contiene o frecuencia. A esto es lo que se denomina, distribucin de frecuencia. Como ejemplo tenemos a continuacin los datos relacionados con el CI de 110 estudiantes seleccionados al azar en una institucin. Tabla No.1 CI de 110 estudiantes seleccionados al azar 154 133 116 128 85 100 110 97 118 150 105 131 119 103 93 108 100 113 135 104 130 111 122 115 103 90 108 114 112 108 127 87 127 100 117 121 105 136 123 82 139 94 89 108 113 110 109 118 115 126 114 133 115 108 106 119 104 147 134 117 119 112 107 101 137 91 121 125 103 89 110 122 113 115 125 124 123 128 85 113 143 80 102 142 83 129 96 132 112 120 107 108 111 100 145 109 131 111 97 93 135 98 142 127 106 123 116 110 101 110

Como podemos notar, este conjunto de datos estn presentados de tal manera que resulta muy difcil poder visualizar su comportamiento, surge pues la necesidad de organizarlos o sistematizarlos para una mejor compresin. Un primer paso podra ser ordenar los valores de mayor a menor e identificar cuntas veces se repite cada valor. Eso como cuando realizamos votaciones en el aula de clase y ponemos una rayita al lado del nombre de cada candidato en la medida como consigue un voto. En la Tabla No. 2 se presentan estos mismos resultados organizados de mayor a menor. Cada valor esta ubicado bajo la columna X y la cantidad de casos por cada valor est representado bajo la columna f con una diagonal. Tabla No.2 Distribucin de frecuencias de CI de 110 estudiantes X 154 153 152 / f X 140 139 138 / f X 126 125 124 / // / f X 112 111 110 /// /// ///// f X 98 97 996 / // / f X 84 83 82 / / f

file:///A|/Distridefrecu.htm (1 of 4) [27/03/2000 11:01:11 a.m.]

Distribuciones de Frecuencias

151 150 149 148 147 146 145 144 143 142 141 / // / / /

137 136 135 134 133 132 131 130 129 128 127

/ / // / // / // / / // ///

123 122 121 120 119 118 117 116 115 114 113

/// // // / /// // // // /// // ////

109 108 107 106 105 104 103 102 101 100 99

// ////// // // // // /// / // ////

95 94 93 92 91 90 89 88 87 86 85 // / / / // / //

81 80 /

Tenemos pues una distribucin "simple" de frecuencias de resultados, se puede identificar que los datos estn dispersos, algunos valores no tienen frecuencias de ocurrencia. Aunque ahora es posible mejor entender los datos, estos todava parecen muy numerosos para observarlos. Por eso algunos investigadores acostumbran reagruparlos en lo que se denomina distribucin de frecuencias de "datos agrupados". La Tabla No. 3 nos presenta los mismos resultados presentados en distribucin de frecuencia en datos agrupados. Como usted puede notar, se establecen categoras o clases que agrupan un segmento de valores. Estos segmentos son denominados intervalos de clase, el tamao del intervalo de clase est determinado por la extensin de los valores, es decir si la diferencia entre ms grande sea la diferencia entre el mayor valor y el menor, ms grande debe llegar a ser el intervalo. Pero esta no es una regla, pues hay que tomar en cuenta que se debe conservar la capacidad de discriminacin proporcionada por la medida original, tampoco deben ser tan pequeos los intervalos al grado de que se pierda el propsito que tenemos de facilitar el manejo de los datos. En muchos casos se sugiere que no se establezcan hasta 15 intervalos de clase. Para calcular el tamao del intervalo, reste el valor ms bajo del ms alto y smele una unidad. En el caso de nuestro ejemplo (154 80) + 1 = 75 esto nos permite conocer el total de datos potenciales. Una vez realizada esta operacin, divida este resultado entre 15 suponiendo que vamos a tener 15 categoras o clases, de esa manera tendremos el tamao que corresponde a cada intervalo de clase. 75/15 = 5. Lo que significa que la amplitud del intervalo de clase ser de cinco (i = 5).

Tabla No 3 CI de los estudiantes presentado en distribucin de frecuencias agrupadas Intervalo de clase 150 - 154 145 - 149 140 - 144 135 - 139 130 - 134 f 2 2 3 5 7 Intervalo de clase 125 - 129 120 124 115 119 110 114 105 109 f 9 9 13 17 14 Intervalo de clase 100 104 95 99 90 94 85 89 80 84 f 12 4 5 5 3 N=110

file:///A|/Distridefrecu.htm (2 of 4) [27/03/2000 11:01:11 a.m.]

Distribuciones de Frecuencias

Su toma el valor ms bajo como lmite inferior del primer intervalo y se le suma el valor i y se le resta l. En este caso el valor ms bajo es 80 y se le suma i = 5 dando como resultado 85 y al restarle uno tenemos el lmite superior del intervalo que es 84. As es como resulta el intervalo 80 84 que aparece hacia el extremo inferior de la tercera (ltima) columna. Se sigue el mismo procedimiento para determinar los restantes intervalos de clase. Una vez concluido este proceso se identifica el nmero de casos o frecuencia de casos que estn incluidos en el intervalo correspondiente. Para ello puede hacer uso de la Tabla No. 2. Un detalle que se debe mencionar es que el "verdadero" valor de un nmero es igual a su valor aparente ms y menos la mitad de la unidad de medida. De manera que si queremos indicar los lmites verdaderos de los intervalos de clase se determinan con el valor aparente menos la mitad de la unidad de medida del valor ms bajo en el intervalo para determinar el lmite real inferior del intervalo y el valor aparente ms la mitad de la unidad de medida del valor ms alto para el lmite real superior. En el ejemplo anterior, para el primer intervalo tendremos 79.5 lmite real inferior y 84.5 lmite real superior. Las distribuciones de frecuencia en variables discretas dan lugar a otras informaciones valiosas. A fin de ilustrarlo a continuacin algunos datos recogidos entre un grupo de 25 alumnos a quienes se les pregunt cuntos hermanos tienen. Una vez determinada la cantidad de hermanos por cada alumno, se agrup en una distribucin de frecuencia simple segn aparece en la Tabla No. 4 En la primera columna se presenta el total de hermanos organizados en clase, luego la columna dos presenta el recuento y la columna tres la frecuencia absoluta de estudiantes que tienen un total de hermanos que coincide con la respectiva clase. Luego se calcul la frecuencia relativa (columna cuatro), dividiendo la frecuencia absoluta de cada clase entre el total de observaciones (casos), lo cual permite conocer qu proporcin de los alumnos tienen un nmero determinado de hermanos. Para ciertos propsitos resulta til acumular las frecuencias absolutas o relativas -. Esto puede hacerse sumndolas hacia abajo, para obtener una distribucin acumulada "menos de" o hacia arriba, lo que produce una distribucin acumulada "ms de" segn aparecen en las columnas cinco y siete para las absolutas, seis y ocho para las relativas.

Tabla 4 Datos agrupados, frecuencias absolutas y relativas a ms y menos de Nmero de hermanos 1 2 3 4 5 6 7 8 Recuento Frecuencia absoluta (f) 2 3 4 8 3 1 2 2 Frecuencia relativa (fr) 0,08 0,12 0,16 0,32 0,12 0,04 0,08 0,08 Acumulada absoluta "menos de" 2 5 9 17 20 21 23 25 Relativa "menos de" 0,08 0,20 0,36 0,68 0,80 0,84 0,92 1,00 Acumulada absoluta "ms de" 25 23 20 16 8 5 4 2 Relativa "ms de" 1,00 0,92 0,80 0,64 0,32 0,20 0,16 0,08

// /// //// //////// /// / // //

Si se suman las frecuencias absolutas de las clases 1, 2, 3, 4, se obtiene 2 +3 + 4 + 8 = 17, valor que representa la frecuencia acumulada "menos de" de la cuarta clase. Si se realiza la misma operacin con las frecuencias relativas se obtiene 0,68. Lo cual quiere decir que 17 estudiantes tienen 4 hermanos o menos (recurdese que se sumaron las categoras 1,2,3,4); aunque tambin sera correcto decir que 17 estudiantes tienen menos de 5 hermanos. La interpretacin del 0,68 es similar; 68% de los estudiantes tienen 4 hermanos o menos.

file:///A|/Distridefrecu.htm (3 of 4) [27/03/2000 11:01:11 a.m.]

Distribuciones de Frecuencias

Si la suma se realiza de abajo hacia arriba, partiendo de la ltima clase se obtiene una frecuencia acumulada "ms de". Los nmeros 5 y 0,20 de la sexta clase son ejemplos de ellas. Estos valores se obtuvieron de la forma siguiente. El nmero 5 se obtuvo sumando las frecuencias absolutas de las clases 8, 7, 6, o sea 2 + 2+ 1 = 5 y el nmero 0,20 sumando 0,08 + 0,08 + 0,04 = 0,20. Su interpretacin se deriva de su forma de clculo. El nmero 5 nos indica que 5 estudiantes tienen 6 hermanos o ms, aunque sera correcto decir que 5 estudiantes tienen ms de 5 hermanos. El nmero 0,20 se interpreta en forma similar: 20% de los estudiantes tienen 6 hermanos o ms. Este ejercicio nos lleva al concepto estadstico denominado centil (en este caso se divide la distribucin en centsimos), se trata de un punto en una escala de puntajes debajo del cual caen cierto porcentaje de casos. Por ejemplo, Pedro ha sido calificado en el centil 45 en una prueba de matemticas. Esto significa que el 45% de los puntajes obtenidos por los alumnos estn por debajo de l mientras que el restante 55% se ubica por encima de l. Si en el mismo caso Amelia obtuvo el centil 68, podemos decir que ella se ubica sobre el 68% de las personas que contestaron la prueba y que el 32% logr una calificacin superior a la que ella obtuvo. Tambin se utilizan trminos como "deciles" los cuales nueve puntos dividen la distribucin en diez partes y cuartiles son tres puntos que dividen la distribucin en cuatro porciones. De manera que el primer cuartil corresponde al centil 25 el segundo cuartil al centil 50 (tambin conocida como mediana), el tercer cuartil corresponde al centil 75. Se utiliza tambin el trmino distancia intercuartil para referirse a los valores que se ubican entre el primero y el tercer cuartil. Los centiles son utilizados con mucha frecuencia para interpretar los resultados de pruebas estandarizadas. Entre sus limitaciones se puede mencionar que no pueden ser utilizados para hacer sumas y obtener promedios entre dos o ms distribuciones a menos que sus medidas de tendencia central y variabilidad sean iguales. La diferencia real que puede existir entre los puntos obtenidos por una persona y otra puede ser mucho ms grande de lo que aparenta en una escala de percentiles. De manera que la diferencia en puntos que puedan tener las personas en centil 40 y 50 no necesariamente es la misma diferencia en puntos entre las personas que se ubican en el centil 60 y 70 de la misma distribucin. Lo que lleva a que los centiles tienden a minimizar las grandes diferencias entre los puntajes especialmente en los extremos de la distribucin y tiende al mismo tiempo a magnificar las diferencias pequeas entres los puntajes obtenidos al centro de la distribucin. Para calcular los centiles hay diferentes procedimientos dependiendo de las caractersticas de la distribucin. Cuando no hay puntajes y se trata de menos de 30 casos, se ordenan los casos por rango (valor 1 para el ms bajo) luego se calcula el centil restando al valor del rango de cada caso 0,5 y dividindo el resultado entre el nmero de casos. Cuando los casos son 30 o ms se divide el valor del rango entre el total de casos. Cuando hay ms de una persona que tiene el mismo puntaje se utiliza la frecuencia acumulada a menos de y se suma mitad de frecuencias en hay en la clase que se observa y se divide entre el total de casos.

file:///A|/Distridefrecu.htm (4 of 4) [27/03/2000 11:01:11 a.m.]

S-ar putea să vă placă și