Documente Academic
Documente Profesional
Documente Cultură
- Estadstica I
- 160590117
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
Distribucin normal.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales,
desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de decisiones en reas
de negocios o instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, que se dedica a los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio. Los datos
pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros
estadsticos son: la media y la desviacin estndar. Algunos ejemplos grficos son:
histograma, pirmide poblacional, clsters, entre otros.
La estadstica inferencial, que se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de
las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca
de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas si/no (prueba de hiptesis), estimaciones de caractersticas numricas
(estimacin), pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras
tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.
Los comienzos de la estadstica pueden ser hallados en el antiguo Egipto, cuyos faraones lograron
recopilar, hacia el ao 3050 antes de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de riqueza y poblacin se hizo con
el objetivo de preparar la construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo reparto.
En el antiguo Israel la Biblia da referencias, en el libro de los Nmeros, de los datos estadsticos
obtenidos en dos recuentos de la poblacin hebrea. El rey David por otra parte, orden a Joab,
general del ejrcito hacer un censo de Israel con la finalidad de conocer el nmero de la poblacin.
Tambin los chinos efectuaron censos hace ms de cuarenta siglos. Los griegos efectuaron censos
peridicamente con fines tributarios, sociales (divisin de tierras) y militares (clculo de recursos
y hombres disponibles). La investigacin histrica revela que se realizaron 69 censos para calcular
los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.
Pero fueron los romanos, maestros de la organizacin poltica, quienes mejor supieron emplear los
recursos de la estadstica. Cada cinco aos realizaban un censo de la poblacin y sus funcionarios
pblicos tenan la obligacin de anotar nacimientos, defunciones y matrimonios, sin olvidar los
recuentos peridicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el
nacimiento de Cristo suceda uno de estos empadronamientos de la poblacin bajo la autoridad del
imperio.
Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir
la tcnica romana, los mtodos estadsticos permanecieron casi olvidados durante la Edad Media.
Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicols Coprnico,
Galileo, Neper, William Harvey, Sir Francis Bacon y Ren Descartes, hicieron grandes
operaciones al mtodo cientfico, de tal forma que cuando se crearon los Estados Nacionales y
surgi como fuerza el comercio internacional exista ya un mtodo capaz de aplicarse a los datos
econmicos.
Por el ao 1540 el alemn Sebastin Muster realiz una compilacin estadstica de los recursos
nacionales, comprensiva de datos sobre organizacin poltica, instrucciones sociales, comercio y
podero militar. Durante el siglo XVII aport indicaciones ms concretas de mtodos de
observacin y anlisis cuantitativo y ampli los campos de la inferencia y la teora Estadstica.
Los eruditos del siglo XVII demostraron especial inters por la Estadstica Demogrfica como
resultado de la especulacin sobre si la poblacin aumentaba, decreca o permaneca esttica.
En los tiempos modernos tales mtodos fueron resucitados por algunos reyes que necesitaban
conocer las riquezas monetarias y el potencial humano de sus respectivos pases. El primer empleo
de los datos estadsticos para fines ajenos a la poltica tuvo lugar en 1691 y estuvo a cargo de
Gaspar Neumann, un profesor alemn que viva en Breslau. Este investigador se propuso destruir
la antigua creencia popular de que en los aos terminados en siete mora ms gente que en los
restantes, y para lograrlo hurg pacientemente en los archivos parroquiales de la ciudad. Despus
de revisar miles de partidas de defuncin pudo demostrar que en tales aos no fallecan ms
personas que en los dems. Los procedimientos de Neumann fueron conocidos por el astrnomo
ingls Halley, descubridor del cometa que lleva su nombre, quien los aplic al estudio de la vida
humana. Sus clculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las
compaas de seguros.
Jacques Qutelect es quien aplica las Estadsticas a las ciencias sociales. Este interpret la teora
de la probabilidad para su uso en las ciencias sociales y resolver la aplicacin del principio de
promedios y de la variabilidad a los fenmenos sociales. Qutelect fue el primero en realizar la
aplicacin prctica de todo el mtodo Estadstico, entonces conocido, a las diversas ramas de la
ciencia.
Cada vez es mayor la proporcin de investigadores, en las ms diversas disciplinas cientficas, que
realizan anlisis estadsticos de datos como procedimiento formal para llegar a conclusiones o
apoyar procesos de decisin sobre las hiptesis de la investigacin.
Kendall y Buckland (citados por Gini V. Glas / Julian C. Stanley, 1980) definen la estadstica
como un valor resumido, calculado, como base en una muestra de observaciones que
generalmente, aunque no por necesidad, se considera como una estimacin de parmetro de
determinada poblacin; es decir, una funcin de valores de muestra.
"La estadstica es una tcnica especial apta para el estudio cuantitativo de los fenmenos de masa
o colectivo, cuya mediacin requiere una masa de observaciones de otros fenmenos ms simples
llamados individuales o particulares".
Murria R. Spiegel, (1991) dice: "La estadstica estudia los mtodos cientficos para recoger,
organizar, resumir y analizar datos, as como para sacar conclusiones vlidas y tomar decisiones
razonables basadas en tal anlisis.
"La estadstica es la ciencia que trata de la recoleccin, clasificacin y presentacin de los hechos
sujetos a una apreciacin numrica como base a la explicacin, descripcin y comparacin de los
fenmenos". (Yale y Kendal, 1954).
Cualquiera sea el punto de vista, lo fundamental es la importancia cientfica que tiene la estadstica,
debido al gran campo de aplicacin que posee.
A su vez, las ciencias sociales se han visto apabulladas en los ltimos aos por avances
vertiginosos en informtica y aplicaciones estadsticas (Manheim, 1982; Rossi y otros, 1983), y
muy especialmente en la psicologa (Judd y otros, 1995), lo que favorece una absorcin de poca
calidad por parte de los especialistas en reas no metodolgicas. Por otro lado, la adopcin de
procedimientos informticos para realizar tareas metodolgicas no parece ser una solucin
inmediata, considerando la ansiedad que generan los ordenadores, fenmeno muy generalizado.
La fusin de esta creciente complicacin de las herramientas de anlisis, junto con la discrepancia
entre los objetivos de formacin y la necesidad de uso de los recursos estadsticos, consigue
finalmente que el especialista en reas aplicadas tienda a descuidar aspectos muy bsicos, previos
a la aplicacin de estos recursos estadsticos complejos. Por otro lado, en muchas ocasiones, la
aplicacin de herramientas estadsticas se deja arrastrar por hiptesis de comodidad, en el sentido
de aplicarse para permitir la ejecucin de una prueba o el ajuste de un modelo, no porque son las
estrategias ms adecuadas, sino porque son las ms cmodas.
ESTADISTICA DESCRIPTIVA
ESTADSTICA
ANALISIS ESTADSTICO
DATOS Y VARIABLES
CLASIFICACIN DE VARIABLES
Las variables pueden clasificarse en: categricas o cualitativas (atributos), no tienen ningn grado
de comparacin numrica, ejemplo: sexo, estado civil; y numricas o cuantitativas, son
caractersticas factibles de expresar por medio de nmeros, estas pueden ser Discretas, que solo
pueden tomar ciertos valores aislados en un intervalo, y Continuas, que pueden tomar cualquier
valor en un intervalo.
REPRESENTACIN DE DATOS
Los datos son colecciones de un nmero cualquiera de observaciones relacionadas entre si, para
que sean tiles se deben organizar de manera que faciliten su anlisis, se puedan seleccionar
tendencias, describir relaciones, determinar causas y efectos y permitan llegar a conclusiones
lgicas y tomar decisiones bien fundamentadas; por esa razn es necesario conocer lo mtodos de
Organizacin y Representacin, la finalidad de stos mtodos es permitir ver rpidamente todas
las caractersticas posibles de los datos que se han recolectado.
Representacin Tabular:
Presenta la variable y las frecuencias con que los valores de stas se encuentran
presentes en el estudio.
Representacin Grfica :
Se llaman grficas a las diferentes formas de expresar los datos utilizando los medios de
representacin que proporciona la geometra.
Diagrama de Puntos. Muestra la frecuencia con que aparece cada uno de los valores.
Diagrama de Tallo y Hoja. Es til para realizar una exploracin preliminar del conjunto,
genera una imagen adecuada de ellos sin perder informacin.
Distribucin de Frecuencias. Es una forma de sintetizar los datos y consiste en valerse de
una tabla para clasificar los datos segn su magnitud, en ella se seala el nmero de veces
que aparece cada uno de los valores. Cuando se dispone de un gran nmero de valores
discretos o cuando las variables son continuas, tiene sentido formar una tabla que presente
la distribucin de frecuencias de los datos agrupados en intervalos o clases, de igual tamao
si es posible, sin embargo una tabla de este tipo supone una concentracin de datos que
produce prdida de informacin.
DISTRIBUCIN DE FRECUENCIAS
DEFINICIONES
Clases o intervalos de clase: Grupo de valores que describen una caracterstica. Deben
incluir todas las observaciones y ser excluyentes. Los intervalos contienen los lmites de
clase que son los puntos extremos del intervalo. Se denominan intervalos cerrados, cuando
contienen ambos lmites e intervalos abiertos si incluyen solo un lmite.
Limites Reales: Sirven para mantener la continuidad de las clases
Anchura o tamao del intervalo: es la diferencia entre los lmites reales de una clase
Nmero de clases: es el nmero total de grupos en que se clasifica la informacin, se
recomienda que no sea menor que 5 ni mayor que 15
Marca de Clase: Es el punto medio del intervalo de clase, se recomienda observar que los
puntos medios coincidan con los datos observados para minimizar el error.
Frecuencia: es el nmero de veces que aparece un valor
Frecuencia Acumulada: Indica cuantos casos hay por debajo o arriba de un determinado
valor o lmite de clase.
Frecuencia Relativa: Indica la proporcin que representa la frecuencia de cada intervalo
de clase en relacin al total, es til para comparar varias distribuciones con parmetros de
referencia uniformes.
Frecuencia Acumulada Relativa: Indica la proporcin de datos que se encuentra por
arriba o debajo de cierto valor o lmite de clase.
Polgono de Frecuencias: Se puede obtener uniendo cada punto medio (marca de clase)
de los rectngulos del histograma con lneas rectas, teniendo cuidado de agregar al inicio
y al final marcas de clase adicionales, con el objeto de asegurar la igualdad del reas.
Por otra parte, en ocasiones, el muestreo puede ser ms exacto que el estudio de toda la poblacin
porque el manejo de un menor nmero de datos provoca tambin menos errores en su
manipulacin. En cualquier caso, el conjunto de individuos de la muestra son los sujetos realmente
estudiados.
El nmero de sujetos que componen la muestra suele ser inferior que el de la poblacin, pero
suficiente para que la estimacin de los parmetros determinados tenga un nivel de confianza
adecuado. Para que el tamao de la muestra sea idneo es preciso recurrir a su clculo.
DISTRIBUCION DE FRECUENCIAS
1). RANGO.
Es una medida de dispersin que se obtiene como la diferencia entre el nmero mayor y el nmero
menor de los datos.
R = N_max - N_min
Ejemplo. Dados los nmeros: 5, 10, 12, 8, 13, 9, 15 R= 15- 5
2) AMPLITUD TOTAL.
Simplemente se obtiene sumndole 1 al rango. AT = (R+1)
3) LAS CLASES.
Estn formadas por dos extremos. El menor se llama lmite inferior el mayor se llama lmite
superior. Hay distintos tipos de clases.
Ej. Notas (20-26) Edades (20-26.5) Salarios (20-26.99)
Donde:
Nc es el nmero de clases. N es la cantidad de muestras tomadas.
Donde:
Vi es el valor de intervalo AT es la amplitud total Nc es el nmero de clase
MEDIDAS DE TENDENCIA CENTRAL MEDIA, MEDIANA Y MODA
Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las medidas de
posicin son de dos tipos:
a) Medidas de posicin central: informan sobre los valores medios de la serie de datos.
b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de
la serie.
Las principales medidas de posicin central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de
media, siendo las ms utilizadas:
a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite.
b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican
todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la
muestra).
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media
geomtrica.
La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin,
etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En
todo caso, la media aritmtica es la medida de posicin central ms utilizada.
Lo ms positivo de la media es que en su clculo se utilizan todos los valores de la serie, por lo
que no se pierde ninguna informacin.
Sin embargo, presenta el problema de que su valor (tanto en el caso de la media aritmtica como
geomtrica) se puede ver muy influido por valores extremos, que se aparten en exceso del resto de
la serie. Estos valores anmalos podran condicionar en gran medida el valor de la media,
perdiendo sta representatividad.
2.- Mediana: es el valor de la serie de datos que se sita justamente en el centro de la muestra (un
50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en
su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces
que se ha repetido).
3.- Moda: Es el valor que ocurre con mayor frecuencia; es decir, el valor ms frecuente. La moda
puede no existir, e incluso no ser nica en caso de existir; puede ocurrir que en una distribucin
haya dos o ms modas (aunque es poco comn que esto resulte en el trabajo experimental),
entonces, se dice que la distribucin es bimodal, trimodal, etc.
EJEMPLO DE LA HOJA DE TRABAJO No. 1
A continuacin se le presenta una serie de datos desordenados los cuales equivalen a los punteos
finales, obtenidos en la clase de estadstica I, del ciclo 2,015; el cual tiene un total de 25 Datos es
decir n=25.
n=25
K= 1+3.322 log 25
K= 1+3.322 *1.3979
K=1+4.6439
K= 5.64 = 6
Calculo del intervalo de clase.
I= D5 Di /K
I= 95-40
I=55/6
I=9.1666= 10
TABLA DE DATOS
FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA
ABSOLUTA RELATIVA
ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
PUNTEOS
f1 F1 h1 H1
FINALES
40 49 1 1 4.00% 4.00%
50 59 4 5 16.00% 20.00%
60 69 7 12 28.00% 48.00%
70 79 7 19 28.00% 76.00%
80 89 3 22 12.00% 88.00%
90 99 3 25 12.00% 100.00%
25 100.00%
HISTOGRAMA DE FRECUENCIA.
Punteos Finales
FRECUENCIA ABSOLUTA
7 7
4
3 3
49 59 69 79 89 99
40 50 60 70 80 90
POLIGONO DE FRECUENCIA
Punteos Finales
7 7
FRECUENCIA ABSOLUTA
4
3 3
49 59 69 79 89 99
40 50 60 70 80 90
OJIVA
CALCULO DE LA MARCA DE CLASE
FRECUENCIA FRECUENCIA
FRECUENCIA FRECUENCIA MARCA DE
ABSOLUTA RELATIVA
ABSOLUTA RELATIVA CLASE
ACUMULADA ACUMULADA
PUNTEOS
f1 F1 h1 H1 C CFi
FINALES
40 49 1 1 4.00% 4.00% 44.5 89
50 59 4 5 16.00% 20.00% 54.5 109
60 69 7 12 28.00% 48.00% 64.5 129
70 79 7 19 28.00% 76.00% 74.5 149
80 89 3 22 12.00% 88.00% 84.5 169
90 99 3 25 12.00% 100.00% 94.5 189
25 100.00% 834.00
MEDIA ARITMETICA.
Formula
=834/25
= 33.36
CALCULO DE LA MEDIANA.
Formula
Med=70+[(25/2-1)/7]4
Med= 70+.0714285 *4
Med=70.28
CALCULO DE LA MODA.
Formula
1 = 7-7 =0
2= 7-3=4
Moda= 70+[1/(0+4)]4
Moda= 70