Sunteți pe pagina 1din 11

Tomado de: Sector matemtica - www.sectormatematica.

cl

UNIDAD: ESTADISTICA
La estadstica se ocupa de recopilar datos, organizarlos en tablas y grficos y analizarlos con un determinado objetivo. La estadstica puede ser descriptiva o inferencial. La estadstica descriptiva tabula, representa y describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La estadstica inferencial infiere propiedades de gran n mero de datos recogidos de una muestra tomada de la poblaci!n. "osotros s!lo estudiaremos la estadstica descriptiva. #n ella debemos tener en cuenta las siguientes etapas$ a% &ecolecci!n de datos b% 'rganizaci!n de datos (%) *abulaci!n (%+ ,raficaci!n c% -nlisis y medici!n de datos a) Recoleccin de datos .ara esta etapa tomaremos los siguientes conceptos bsicos$ Po lacin$ conjunto de observaciones efectuadas Individ!o$ cada elemento de la poblaci!n. Atri !to$ caracterstica investigada en la observaci!n. #stos pueden ser cualitativos (se/o, religi!n, nacionalidad% o cuantitativos (estatura, peso, rea 0estos son continuos, se miden en n meros reales-1 n mero de 2ijos, n mero de goles 0discretos, se miden en n meros enteros-% .or ejemplo$ si se desea realizar un estudio estadstico de las estaturas de los alumnos de tercer a3o, .oblaci!n$ conjunto de estaturas 4ndividuo$ cada estatura -tributo$ la estatura *eniendo presente la clasificaci!n, clasifica los siguientes atributos ). -filiaci!n poltica de los 2abitantes de la 5apital de 52ile. +. 5antidad de ganado vacuno en las provincias de la &o 6ueno y La 7ni!n. 8. &eligi!n de los padres de familia de la comunidad educativa Santa 5ruz. 9. 4ngresos de los obreros. :. 5antidad de alumnos de las diferentes carreras de la ;acultad de 5iencias #/acta en la 7.L.-. <. Se/o de los alumnos de una escuela. =. #stado civil de los 2abitantes de la ciudad de &o 6ueno. >. 5antidad de pelculas nacionales estrenadas durante un a3o. ?. 5olor de cabellos de los alumnos de un curso. )@. .untaje obtenido por los alumnos que ingresan a la carrera de Aedicina. ) "r#ani$acin de los datos %&) Ta !lacin$ puede ser a travBs de una serie simple, con la presentaci!n de los datos recogidos en forma de tabla ordenada, o a travBs de la agrupaci!n de datos, este mBtodo se utiliza cuando el n mero de observaciones es muy grande.

#jemplo$ #n un curso de 9@ alumnos, se desea estudiar el comportamiento de registrndose los siguientes valores$ ),:+ ),<9 ),:9 ),<9 ),=8 ),:: ),:< ),:= ),:> ),:? ),:8 ),<@ ),<@ ),<) ),<) ),<: ),<8 ),=? ),<+ ),<@ ),<9 ),:9 ),<: ),<+ ),<< ),=< ),=@ ),=) ),=+ ),=+ ),:: ),=8 ),=8 ),=: ),<= ),=> i' Serie simple$ 5ompleta los cuadros siguientes, ordenando los datos obtenidos. -lumno *alla -lumno *alla -lumno *alla -lumno ) ),:+ )) +) 8) + ),:8 )+ ++ 8+ 8 ),:9 )8 +8 88 9 ),:9 )9 +9 89 : ),:: ): +: 8: < ),:: )< +< 8< = ),:< )= += 8= > ),:= )> +> 8> ? ),:> )? +? 8? )@ ),:> +@ 8@ 9@ ii.

la variable estatura, ),:> ),<8 ),<? ),<8

*alla

A#r!pacin de datos por serie o distri !cin de frec!encias $ se registra la frecuencia de cada valor de la variable. La frecuencia puede ser absoluta (f%, n mero que indica la cantidad de veces que la variable toma un cierto valor, relativa (fr%, cociente entre la frecuencia absoluta de cada valor de la variable y el n mero total de observaciones1 relativa porcentual que es el porcentaje de la fr1 frecuencia -cumulada la suma de la fi y la acumulada porcentual, que el la suma de frC .

Dolviendo al ejemplo anterior, completa la tabla de serie de frecuencias. / (tallas% -bsoluta &elativa &. .orcentual -cumulada -c. .orcentual fi fr E fFn ()@@.fr% C ;a ;a C ),:+ ) )F9@ E @,@+: +,: C ) +,:C ),:8 ) )F9@ E @,@+: +,:C + :C ),:9 + +F9@ E @,@: :C 9 )@C ),:: ),:< ),:= ),:> ),:? ),<@ ),<) ),<+ ),<8 ),<9 ),<: ),<<

),<= ),<> ),<? ),=@ ),=) ),=+ ),=8 ),=9 ),=: ),=< ),== ),=> ),=? G- cunto es igual el total de la columna de frecuencias absolutasH G.or quBH ................................................................................................................................... G- cunto es igual el total de la columna de frecuencias relativasH G.or quBH ................................................................................................................................... GI el total de la columna de porcentajesH ................................................................................................................................... A#r!pacin de datos por intervalos de clase $ intervalos iguales en los que se divide el n mero total de observaciones. #s conveniente utilizar los intervalos de clase cuando se tiene un gran n mero de datos de una variable continua' G5!mo saber cuntos intervalos considerarH G5!mo determinar su amplitudH .rimero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el menor de los valores obtenidos. Ran#o ( )m*) + )mn

5alcula el rango de los datos de nuestro ejemplo. ....................................................................................................................................

Luego debemos establecer el n mero de intervalos ("% y determinar la amplitud (-% de los mismos. A ( ran#o , N (" tu lo eliges, pero es conveniente que no sea muy peque3o% Si queremos trabajar con )@ intervalos, Gcul es, para nuestro caso, la amplitud de cada uno de ellosH Je ser necesario, podemos apro/imar el valor 2allado ...................................................................................................................................... Siendo el primer intervalo K),:+ 1 ).::% completa la tabla con todos los restantes. 'bserva que el e/tremo izquierdo del intervalo se usa un corc2ete L K L, lo que indica que tomamos este valor, en cambio en el derec2o usamos L % L que nos indica que el intervalo es abierto, o sea, no se toma este valor. La -arca de clase es el promedio aritmBtico de los e/tremos del intervalo. *allas K),:+ 1 ).::% K),:: 1 ),:>% K),:> 1 ),<)% Aarca de clase (A5% ),:8: ),:<: ),:?: fi fr frC ;a ;aC

*otales

4nvestiga sobre el n mero de 2ermanos de cada alumno de tu curso y dispone los datos obtenidos en una serie o distribuci!n de frecuencias.

#stas son las notas obtenidas por los )@@ candidatos que se presentaron a un concurso$ 8> :) 8+ <: +: +> 89 )+ +? 98 =) <+ :@ 8= > +9 )? 9= >) :8 )< <+ :@ 8= 9 )= =: ?9 < +: :: 8> 9< )< =+ <9 <) 88 :? +) )8 ?+ 8= 98 :> :+ >> += =9 << <8 +> 8< )? :< >9 8> < 9+ :@ ?> :) <+ 8 )= 98 9= :9 :> +< )+ 9+ 89 <> == 9: <@ 8) =+ +8 )> ++ =@ 89 : :? +@ <> :: 9? 88 :+ )9 9@ 8> :9 :@ )) 9) =< .resenta dic2os datos en una tabla de intervalos de clase.

#n una cierta ciudad de la provincia de Daldivia, se registra el n mero de nacimientos ocurridos por semana durante las :+ semanas del a3o, siendo los siguientes los datos obtenidos$ 9 )= )) > + )) = )@ > ? )+ ): )> )< : 8 )< )? ? + )@ )> )) )8 < )> ): ? = )< ? )) : )9 9 )= )+ )+ ) )8 > = < )+ ? )@ )) >

< )+ 8 =

5onfecciona una tabla de intervalos de clase. Las edades de veinte c2icos son )+, )8, )9, )@, )), )+, )), )8, )9, )+, )@, )+, )), )8, )+, )), )8, )+, )@ y):. 'rganiza los datos en una tabla de frecuencias. GMuB porcentaje de c2icos tienen )+ a3osH G5untos c2icos tienen menos de )9 a3osH

#n cada da del mes de enero, en el camping 4gl 2ubo la siguiente cantidad de turistas$ )+, )9, )=, )<, )?, ):, ):, +), +9, +<, +>, +9, +:, +<, +@, +), 89, 8:, 88, 8+, 89, 8>, 9@, 98, 9), 9:, :@, :8, :>. 5onstruye una tabla de frecuencias para estos datos.

%.) /r*ficos$ la recopilaci!n de datos y la tabulaci!n pueden traducirse grficamente mediante representaciones convenientemente elegidas$ barras, sectores circulares, mapas curvas, etc. Los grficos permiten visualizar e interpretar el fen!meno que se estudia, en forma ms clara. Las arras se utilizan generalmente para representar atributos cualitativos o cuantitativos discreto. La longitud es igual a la frecuencia de cada observaci!n. .ueden ser barras simples o m ltiples, seg n se trate de representar uno o ms atributos. Las barras pueden ser 2orizontales o verticales.

/r*f' de arras: Eval!acin del #o ierno :

ne!tra ne#ativa positiva

32

42

62

/r*fico de arras comp!esto: Rem!neraciones medias %a0o 1)

622 522 422 .22 322 &22 2 Enero 7e rero -ar$o Ind!strial 8ancario Adm' P9 lica Ed!cativo Comercio

Los #r*ficos circ!lares o #r*ficos de torta son tiles para comparar datos pues, en general, trabajan con porcentuales. #l rea de cada sector representa el porcentaje que corresponde a la frecuencia de un cierto valor de la variable. #sta representaci!n es conveniente cuando el n mero de sectores es peque3o y sus reas estn bien diferenciadas.

positiva ne#ativa ne!tra

positiva ne#ativa ne!tra

#valuaci!n del gobierno N

#l ;isto#rama se utiliza para representar una tabla de frecuencias de intervalos de clase. Sobre el eje 2orizontal se representan los intervalos de clase y sobre el eje vertical, las frecuencias de los intervalos. #l grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un intervalo de clase y cuya altura representa la frecuencia del intervalo. #l pol#ono de frec!encias se construye uniendo los puntos medios de los lados opuestos de las bases de cada rectngulo. Si se quiere cerrar el rectngulo, se agregan dos intervalos$ uno anterior y otro posterior al ltimo y se prolonga el polgono 2asta los puntos medios de estos intervalos. Las c!rvas se utilizan generalmente para representar la variaci!n de una variable a travBs del tiempo (a3os, meses, 2oras, etc.%. Sobre el eje 2orizontal figuran los perodos de tiempo. <ariacin del valor de las importaciones = e)portaciones de la Ar#entina en millones de dlares
&?22 &622 &422 &322 &222 ?22 622 422 322 2
65 66 6A 6? &@ 6@ &@ &@ &@ &@

importacin de la Ar#entina e)portacin de la Ar#entina

#stas son s!lo algunas de las formas posibles de graficaci!n y las que encontrars con ms frecuencia. 5onstruye el 2istograma y el polgono de frecuencias para la tabla del ejercicio de intervalos de clase, de la pgina 8, de las tallas... c) An*lisis = medicin de datos .ara describir un conjunto de datos, se calculan algunas medidas que resumen la informaci!n y que permiten realizar comparaciones. -edidas de posicin$ se utilizan para encontrar un valor que represente a todos los datos. Las ms importantes son$ la media aritm>tica, la moda y la mediana.

La media aritm>tica o promedio %

) de varios n meros se calcula como el cociente entre la suma de todos esos nmeros y la cantidad de nmeros que sumamos.

La moda %-o) es el valor que ms se repite. .uede suceder que 2aya ms de una moda o
ninguna (si todos los valores tienen igual frecuencia%.

La mediana %-e) es el valor que ocupa el lugar central al ordenar los datos de menor a mayor. Si
la cantidad de datos es par, la mediana es el promedio entre los dos valores centrales.

Los sueldos de cinco empleados de una empresa son$ O 9@@@@@, O:@@@@@, O9:@@@@, O<@@@@@ y O8:@@@@@. 5alcula el sueldo medio, la moda, si es que e/iste, y la mediana e indica cul representa mejor a los datos. #l entrenador de un equipo de nataci!n debe elegir a uno de sus integrantes para la pr!/ima competencia de estilo libre. Seg n los tiempos en segundos que obtuvieron los postulantes de las cinco ltimas carreras de )@@ m de estilo libre, GquB nadador le conviene elegirH <),= <),: <@,= <),= <+,? <+,9 <+,8 <+,? <+,= <+,? <8,= <+,= <8,) <8,= <8,+

Jiego *oms Sergio

.ara poder decidir, calcula las medidas de posici!n de cada uno. Jiego *oms Sergio promedio <+,89 moda <),= mediana <+,8

#n promedio, los nadadores ms rpidos son ................................ y ................................., pero esto no significa que 2ayan tenido el mismo rendimiento1 por eso necesitamos las otras medidas de posici!n$ de ellos dos, tanto la moda como la mediana indican que ................................ fue ms veloz. Sin embargo, para elegir el nadador adecuado, no basta con considerar las medidas de posici!n, ya que tambiBn es necesario que su rendimiento sea parejo, es decir, que los tiempos de sus )@@ m libres no tengan mucha dispersin. -edidas de dispersin$ nos informan c!mo estn distribuidos los datos. La ms importante es el desviacin est*ndar % )B que mide la dispersin de los datos con respecto al promedio . 5uanto menor es el desvo estndar, menos dispersos estn los datos con respecto al promedio. .ara calcular el desvo estndar, seguimos los siguientes pasos$

5alculamos la diferencia entre cada uno y el promedio. #levamos al cuadrado cada una de las diferencias anteriores.
7

Sumamos todos los valores 2allados en el paso anterior y dividimos el resultado por la cantidad
de datos. -s obtenemos la varian$a.

5alculamos el desviacin est*ndar %) como la ra$ c!adrada de la varian$a.


=

n i =1

x i x
n

n$ n mero de datos

Jiego y Sergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo promedio y sin embargo sus tiempos estn distribuidos de manera diferente. 5alcula los desvos estndares de los tiempos de los nadadores$

*iempos de Jiego /i <),= <),= <+,8 <+,? <8,) total (/i 0 /% -@,<9 -@,<9 -@,@9 @,:< @,=< (/i 0 /%+ /i

*iempos de Sergio (/i 0 /% (/i 0 /%+

total

Diego =
Entonces:

Sergio=

.odemos ver que el desvo estndar de ................................... es menor que el de ................................., lo cual indica que el promedio representa mejor los datos de ................................., porque sus tiempos fueron menos dispersos. #ntonces, aunque cinco datos son muy pocos para 2acer estadstica, si con esa informaci!n 2ay que elegir un nadador de ese equipo para la pr!/ima competencia, conviene que sea ....................................... CACCUC"S DE ESTADI/RA7"S EN DAT"S TA8UCAD"S Si los datos estn agrupados ya sea en tablas de frecuencias simples o en intervalos de clase, debemos utilizar un criterio diferente para calcular los distintos estadgrafos. -nalicemos el siguiente ejemplo$ 5onsideremos la siguiente distribuci!n de frecuencias que corresponden a los puntajes de :@ alumnos en una prueba. 4ntervalos A.5. fi fP/ ;a
8

K<@ 0 <:% K<: 0 =@% K=@ 0 =:% K=: 0 >@% K>@ 0 >:% K>: 0 ?@% *'*-L#S

(/% <+,: <=,: =+,: ==,: >+,: >=,:

: : > )+ )< 9 52

8)+.: 88=.: :>@ ?8@ )8+@ 8:@ .?.2

: )@ )> 8@ 9< :@

4ntervalo mediano 4ntervalo modal

La -edia Aritm>tica:

x=

f x f

x=

3830 =76 .6 ptos. == ptos. 50

.ara calcular Ca -ediana necesitamos la siguiente f!rmula$

n F a A 2 Me = L fi

Donde: L es el lmite inferior del intervalo mediano. Fa es la frec encia ac m lada !asta antes del intervalo mediano. fi es la frec encia a"sol ta del intervalo mediano. # es la #m$lit d del intervalo.

en el ejemplo, la cantidad de datos es :@, luego :@ $ + E +:, y la ;a +: se encuentra en el intervalo K=: 0 >@% ya que el +: esta aqu, en cambio en la anterior ()>% no esta. Luego el intervalo mediano es K=: 0 >@% #ntonces$ L E =: (lmite inferior% fi E > -E: (>@ 0 =: E :% ;a E )> (frecuencia acumulada del intervalo anterior%

50 18 5 2 7 5 Me=75 =75 =75 4 .375 =79. 375 8 8

=? ptos.

y finalmente, para calcular la -oda en datos agrupados, utilizamos la siguiente f!rmula, teniendo presente que la clase modal es la que tiene mayor frecuencia, y esta es la ;recuencia Aodal. Mo= L d1 d1 d2 A
L: Lmite real inferior de la clase modal. d1: es la diferencia entre la frec encia modal % la frec encia anterior. d2: es la diferencia entre la frec encia modal % la frec encia si& iente. #: am$lit d del intervalo

L E >@ (intervalo modal K>@ 0 >:%, ya que la frecuencia es )<, que es la mayor% d)E )< 0 )+ E 9 (diferencia con la frecuencia anterior% d+E )< 0 9 E )+ (diferencia con la frecuencia siguiente% -E:

Luego, Mo=80

4 20 5= 80 =81 , 25 4 12 16

puntos. >) puntos.

Se estima que el valor ms repetido de los puntajes de esta prueba fue el >). EDercicios )% Los siguientes datos numBricos corresponden a la cantidad de veces que cada alumno de un grupo 2a ido a un recital o concierto. +09080+0)0)0<080@080+090<0?080+0)0< 5alcula, sin tabular, Aedia, moda, mediana, desviaci!n, n, rango. +% #n un diagnostico de educaci!n fsica se pidi! a los alumnos de los cuartos medios que 2icieran abdominales durante 8 minutos. Se obtuvieron los siguientes resultados$ 9Q -$ 9: 88 9Q 6$ 98 9) 8> 9: 9: 9? 98 99 99 9@ +? 9) 8> 8= 89 89 89 89 <@ 8< 9< 99 :9 89 98 9) += 8+ 88 +8 89 89 +> :< <+ :< := 9: 9= 9> :9 :9 9+ 98 9: := 99 8> 8> 8= 98 <) 8> 8= 9: +> 9+ 98

Gcul de los dos cursos tiene el rendimiento ms parejoH GquB distribuci!n estadstico permite comparar la distribuci!n de este tipo de datosH 8% - continuaci!n se presentan los resultados de ambos cursos en la prueba de diagn!stico de salto largo. 9Q - $ 8.+ 8.: 9.? :.@ 8.) 9.) +.? +.> 8.> 9.: 9.8 9.: 9.) :.> 8.? 8.< 9.+ 9.< ).? +.> +.? 8.8 8.? 9.+ 9.) 9.8 9.< 9.9 8.> 8.< 9Q 6 $ 8.: +.? ).8 ).= 8.< :.< +.> :.+ :.8 9.) 9.) 9.9 ).< :.) 9.8 :.@ :.8 8.+ +.> +.< :.: :.9 9.> 9.? 9.8 +.? 8.? :.9 :.8 9.+ a% 5alcula el promedio de ambos cursos. b% 5onstruye una tabla de frecuencias para cada curso c% 5ul de los dos cursos tuvo un rendimiento mas parejoH 9% Se 2an medido =: alumnos, en centmetros, obteniBndose los siguientes datos$ )=: )<= )=9 )<? ):< )<? )<> )<: )=+ )>+ )<< )>@ ):? )=@ )=+ )<< )<) )<? )=+ )>9 )>: )<= ):> )>8 )>< )=@ ):? )=9 )?+ )<+ )<8 )=8 )=? )=+ )<8 )<+ )<8 )=) )<> )>: )<9 )=9 )=9 )>? )=@ )=) )=: )<? )<9 ):: ):@ )=8 )<= )=) ):9 )=) )<> )=9 )=+ )<> )=< )<< )=) )=@ ):= )=@ )=8 )=8 )=: )<@ )=: )== )=> )>@ )=8

-grupa estos resultados en > intervalos y confecciona una tabla de frecuencias y calcula las medidas de tendencia central y de dispersi!n. -dems, grafica esta tabla. :% - los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos 2an sido$ >= )@: >> )@8 ))9 )+: )@> )@= ))> ))9 )+? )@@ )@< ))8 )@: ))) ?9 )): >? >+
1

)9) ?+ )8+ ))+ ?= )8: )@) )@9 )8@ ?? ))9 ?) )9: ?: )@) )): )@9 >= )@> )): )@8 )8+ ))@ ))8 )@+ )@? )+9 ?> )9@ )@= ?8 )@> )++ ))= ))9 )9) ))< )@> )@+ )@) ))> )8> ?? )@: ))+ ?9 ?< )8+ ))> )+8 )@> )8) )+= )@@ ?) -grupa los datos en intervalos de amplitud >. y 2az lo mismo que en problema anterior.

S-ar putea să vă placă și