Sunteți pe pagina 1din 8

Estadstica

La estadstica (la forma femenina del alemn Statistik, y este derivado del
italiano statista 'hombre de Estado')1 es una ciencia formal y una herramienta
que estudia usos y anlisis provenientes de una muestra representativa de
datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o
natural, de ocurrencia en forma aleatoria o condicional.
La estadstica matemtica es la escala previa en el estudio de la estadstica
desde un punto de vista puramente formal, usando la teora de la probabilidad
y otras ramas de la matemtica tales como lgebra lineal y anlisis
matemtico. La estadstica matemtica trata de la obtencin de informacin a
partir de los datos. En la prctica tales datos contienen cierta aleatoriedad o
incertidumbre. La estadstica trabaja con estos datos usando los mtodos de la
teora de la probabilidad.
La estadstica matemtica se divide en:
Estadstica descriptiva: parte que se encarga de describir los datos, esto es, de
realizar un resumen y describir sus propiedades tpicas.
Inferencia estadstica: parte que elabora conclusiones a partir de una muestra
de los datos, en otras palabras, comprueba el ajuste de los datos a
determinadas condiciones y proporciona una medida de la bondad de los
mismos en trminos probabilsticos.
La estadstica matemtica es la base terica para muchas prcticas en la
estadstica aplicada.
Medidas de tendencia central
Al describir grupos de diferentes observaciones, con frecuencia es conveniente
resumir la informacin con un solo nmero. Este nmero que, para tal fin, suele
situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin.
Cuando se hace referencia nicamente a la posicin de estos parmetros
dentro de la distribucin, independientemente de que est ms o menos
centrada, se habla de estas medidas como medidas de posicin.1 En este
caso se incluyen tambin los cuantiles entre estas medidas.
Entre las medidas de tendencia central tenemos:

Media aritmtica

Media ponderada

Media geomtrica

Media armnica

Mediana

Moda

Se debe tener en cuenta que existen variables cualitativas y variables


cuantitativas, por lo que las medidas de posicin o medidas de
tendencia se usan de acuerdo al tipo de variable que se est observando, en
este caso se observan variables cuantitativas.
Media (matemticas)
Para otros usos de este trmino, vase media.
Construccin geomtrica para hallar las medias aritmtica, geomtrica,
armnica y cuadrtica de dos nmeros a y b.
Comparacin de la media aritmtica, la mediana y la moda de dos
distribuciones log-normal con diferente asimetra.
En matemticas y estadstica una media o promedio es una medida de
tendencia central que segn la Real Academia Espaola (2001) [] resulta al
efectuar una serie determinada de operaciones con un conjunto de nmeros y
que, en determinadas condiciones, puede representar por s solo a todo el
conjunto. Existen distintos tipos de medias, tales como la media geomtrica,
la media ponderada y la media armnica aunque en el lenguaje comn, el
trmino se refiere generalmente a la media aritmtica.
Ejemplos de medias
Existen numerosos ejemplos de medias {\displaystyle \scriptstyle {\bar
{x}}=m_{i}(x_{1},\dots ,x_{n})} \scriptstyle {\bar {x}}=m_{i}
(x_{1},\dots ,x_{n}), una de las pocas propiedades compartidas por todas las
medias es que cualquier media est comprendida entre el valor mximo y el
valor mnimo del conjunto de variables:
{\displaystyle \min\{x_{1},x_{2},\dots x_{n}\}\leq {\bar {x}}\leq \max\
{x_{1},x_{2},\dots x_{n}\}} \min\{x_{1},x_{2},\dots x_{n}\}\leq {\bar
{x}}\leq \max\{x_{1},x_{2},\dots x_{n}\}
Adems debe cumplirse que:
{\displaystyle {\bar {x}}=x_{1},\quad {\mbox{si}}\ x_{1}=x_{2}=\dots
=x_{n}} {\bar {x}}=x_{1},\quad {\mbox{si}}\ x_{1}=x_{2}=\dots =x_{n}
Mediana (estadstica)
En el mbito de la estadstica, la mediana (del latn medinus 'del medio'1 )
representa el valor de la variable de posicin central en un conjunto de datos
ordenados.
Existen dos mtodos para el clculo de la mediana:
1. Considerando los datos en forma individual, sin agruparlos.
2. Utilizando los datos agrupados en intervalos de clase.
A continuacin veamos cada una de ellas:

Datos sin agrupar[editar]


Sean {\displaystyle x_{1},x_{2},x_{3},\ldots ,x_{n}} x_{1},x_{2},x_{3},\ldots
,x_{n} los datos de una muestra ordenada en orden creciente y designando la
mediana como {\displaystyle M_{e}} M_{e}, distinguimos dos casos:

a) Si n es impar, la mediana es el valor que ocupa la posicin {\displaystyle


(n+1)/2} (n+1)/2 una vez que los datos han sido ordenados (en orden
creciente o decreciente), porque ste es el valor central. Es decir:
{\displaystyle M_{e}=x_{(n+1)/2}} M_{e}=x_{{(n+1)/2}}.
Por ejemplo, si tenemos 5 datos, que ordenados son: {\displaystyle x_{1}=3}
x_{1}=3, {\displaystyle x_{2}=6} x_{2}=6, {\displaystyle x_{3}=7}
x_{3}=7, {\displaystyle x_{4}=8} x_{4}=8, {\displaystyle x_{5}=9} x_{5}=9
=> El valor central es el tercero: {\displaystyle x_{(5+1)/2}=x_{3}=7}
x_{{(5+1)/2}}=x_{3}=7. Este valor, que es la mediana de ese conjunto de
datos, deja dos datos por debajo ( {\displaystyle x_{1}} x_{1}, {\displaystyle
x_{2}} x_{2}) y otros dos por encima de l ( {\displaystyle x_{4}} x_{4},
{\displaystyle x_{5}} x_{5}).
b) Si n es par, la mediana es la media aritmtica de los dos valores centrales.
Cuando {\displaystyle n} n es par, los dos datos que estn en el centro de la
muestra ocupan las posiciones {\displaystyle n/2} n/2 y {\displaystyle n/2+1}
n/2+1. Es decir: {\displaystyle M_{e}=(x_{\frac {n}{2}}+x_{{\frac {n}{2}}
+1})/2} M_{e}=(x_{{{\frac {n}{2}}}}+x_{{{{\frac {n}{2}}}+1}})/2.
Por ejemplo, si tenemos 6 datos, que ordenados son: {\displaystyle x_{1}=3}
x_{1}=3, {\displaystyle x_{2}=6} x_{2}=6, {\displaystyle x_{3}=7}
x_{3}=7, {\displaystyle x_{4}=8} x_{4}=8, {\displaystyle x_{5}=9}
x_{5}=9, {\displaystyle x_{6}=10} x_{6}=10. Aqu dos valores que estn por
debajo del {\displaystyle x_{\frac {6}{2}}=x_{3}=7} x_{{{\frac {6}
{2}}}}=x_{3}=7 y otros dos que quedan por encima del siguiente dato
{\displaystyle x_{{\frac {6}{2}}+1}=x_{4}=8} x_{{{{\frac {6}{2}}}
+1}}=x_{4}=8. Por tanto, la mediana de este grupo de datos es la media
aritmtica de estos dos datos: {\displaystyle M_{e}={\frac {x_{3}+x_{4}}
{2}}={\frac {7+8}{2}}=7,5} M_{e}={\frac {x_{3}+x_{4}}{2}}={\frac
{7+8}{2}}=7,5.
Datos agrupados
Al tratar con datos agrupados, si {\displaystyle {\frac {n}{2}}} {{{\frac {n}
{2}}}} coincide con el valor de una frecuencia acumulada, el valor de la
mediana coincidir con la abscisa correspondiente. Si no coincide con el valor
de ninguna abscisa, se calcula a travs de semejanza de tringulos en el
histograma o polgono de frecuencias acumuladas, utilizando la siguiente
equivalencia:

{\displaystyle {\frac {N_{i}-N_{i-1}}{a_{i}-a_{i-1}}}={\frac {{\frac {n}{2}}N_{i-1}}{p}}\Rightarrow p={\frac {{\frac {n}{2}}-N_{i-1}}{N_{i}-N_{i-1}}}


(a_{i}-a_{i-1})} {\frac {N_{i}-N_{{i-1}}}{a_{i}-a_{{i-1}}}}={\frac {{\frac
{n}{2}}-N_{{i-1}}}{p}}\Rightarrow p={\frac {{\frac {n}{2}}-N_{{i-1}}}
{N_{i}-N_{{i-1}}}}(a_{i}-a_{{i-1}})
Donde {\displaystyle N_{i}} N_{{i}} y {\displaystyle N_{i-1}} N_{{i-1}} son
las frecuencias absolutas acumuladas tales que {\displaystyle N_{i-1}<{\frac
{n}{2}}<N_{i}} N_{{i-1}}<{{{\frac {n}{2}}}}<N_{{i}}, {\displaystyle
a_{i-1}} a_{{i-1}} y {\displaystyle a_{i}} a_{{i}} son los extremos, interior y
exterior, del intervalo donde se alcanza la mediana y {\displaystyle
M_{e}=a_{i-1}+p} M_{e}=a_{{i-1}}+p es la abscisa a calcular, la mediana.
Se observa que {\displaystyle a_{i}-a_{i-1}} a_{{i}}-a_{{i-1}} es la amplitud
de los intervalos seleccionados para el diagrama.
Ejemplos para datos sin agrupar
Ejemplo 1: Cantidad (N) impar de datos
xi

fi

Ni

13

21 > 19.5

30

33

37

39

Las calificaciones en la asignatura de Matemticas de 39 alumnos de una clase


viene dada por la siguiente tabla:
Calificaciones

Nmero de alumnos

Primero se hallan las frecuencias absolutas acumuladas {\displaystyle N_{i}}


N_{i}. As, aplicando la frmula asociada a la mediana para n impar, se obtiene
{\displaystyle X(39+1)/2=X20} X(39+1)/2=X20.
Ni-1< n/2 < Ni = N19 < 19.5 < N20
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar.En
este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo

que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra


mitad un 5 o ms.
Moda
La moda es la medida que se relaciona con la frecuencia con que se presenta
el dato o los datos con mayor incidencia, con lo que se considera la posibilidad
de que exista ms de una moda para un conjunto de datos. La notacin mas
frecuente es la siguiente: Mo y . Esta medida se puede aparecer tanto para
datos cualitativos como cuantitativos. Se dice que cuando un conjunto de
datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene mas de un dato repetido se dice que es
multimodal y un ltimo caso es cuando ningn dato tiene una frecuencia, en
dicho caso se dice que la muestra es amodal.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:

a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
la moda de este conjunto de datos es igual a 3 y si considera unimodal
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la mas
alta frecuencia, por lo que la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
La muestra no contiene ningn dato repetido por lo que se considera que la
muestra es amodal.
Grficamente eso se puede reflejar mediante el anlisis de un histograma de
frecuencias.
Moda para datos agrupados
Para determinar la moda de datos agrupados en clases de igual tamao su
clculo se puede realizar de la siguiente forma:

donde

En ocasiones la expresin para el clculo de la moda suele presentarse de la


siguiente forma:

donde

Aunque la expresin se ve un poco diferente en realidad se trata de una misma


ecuacin, ya que el exceso de la clase modal inferior se puede determinar
como:

y el exceso de la clase modal superior se determina como

por lo que basta sustituir estos valores en una de ellas para encontrar la otra
expresin.
Ejemplo:
Determinar a partir de la tabla presentada, en el ejemplo de la media, cual es
la moda:
Tabla de frecuencias reportadas por la clnica
Clases
(Datos en aos)

Punto
medio de
cada

Frecuencias de
cada clase

clase
15

25

20

35

14

45

55

65

75

1
55 enfermos
atendidos

Identificamos que

sustituyendo tenemos

Pese a que el valor de la moda no pueda constituir un dato real, para el


ejercicio, se puede asumir que ese es el parmetro de mayor ocurrencia.
Aportacin:
Hola Mi nombre es Pedro Francisco Fuentes Barrientos, soy alumno del ITESM
campus Monterrey. Solo escribo para hacerles saber que hay un error en los
calculos que publicaron en esta
liga: http://dieumsnh.qfb.umich.mx/estadistica/moda.htm , Mientras consultaba
su pagina como fuente de estudio note que en la ultima operacion que parece
ahi no multiplicaron el valor de la amplitud del intervalo correspondiente a 10.
La respuesta verdadera es 26.666666667 en lugar de solo 20.666666...

El conocimiento de la forma de la distribucin y del respectivo promedio de una


coleccin de valores de una variable, puede servir para tener una idea
bastante clara de la conformacin, pero no de de la homogeneidad de cada
una de los valores con respecto a la medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en trminos de
alguna escala de medida de igual intervalo, puede usarse un tipo de indicador
que permite apreciar el grado de dispersin o variabilidad existente en
el grupo de variantes en estudio.
A estos indicadores les llamamos medidas de dispersin, por cuanto que
estn referidos a la variabilidad que exhiben los valores de las observaciones,
ya que si no hubiere variabilidad o dispersin en los datos inters, entonces no

habra necesidad de la gran mayora de las medidas de


la estadstica descriptiva.
RANGO O RECORRIDO.
Es la diferencia entre dos valores entre los dos valores extremos mximo y
mnimo.
Evidentemente, la dispersin de los datos ser tanto mayor, cuando mayor sea
el recorrido.
El rango recorrido no es una buena medida de dispersin, puesto que basta
que un dato se aleje mucho de la media para que el rango recorrido resulte
muy afectado, ya que nicamente depende de dos valores, sin que influyan
para nada los datos distantes

S-ar putea să vă placă și