Sunteți pe pagina 1din 7

CLASE 31: ESTADÍSTICA

Rama de las matemáticas aplicadas, que estudia los hechos económicos, sociales y físicos a base
de datos numéricos; entre las estadísticas más antiguas cuentan los censos de población, el
cálculo de ganados y cosechas, etc.

La estadística es una ciencia, pues aplica el Método Científico al ocuparse de la toma,


organización, recopilación y análisis de datos, tanto para la deducción de conclusiones, para la
toma de decisiones razonables de acuerdo a tales análisis.

Población: Se le llama población o universo, al conjunto total de individuos u objetos que se


desean investigar.

Muestra: Es un grupo de una población. Se utiliza cuando la población es muy numerosa, infinita o
muy difícil de examinar.

Estadística Descriptiva: Es la parte de la estadística que trata solamente de describir y analizar


un grupo dado sin sacar conclusiones o inferencias de un grupo mayor, a partir de ella. La
estadística descriptiva incluye las técnicas que se relacionan con el resumen y la descripción de
datos numéricos. Estos datos pueden ser gráficos o pueden incluir análisis computacional.

Estadística Inferencial: Cuando una muestra es representativa de una población se pueden


deducir importantes conclusiones acerca de esta, a partir de su análisis. La inferencia estadística
comprende aquellas técnicas por medio de las cuales se toma decisiones sobre una población
estadística basadas solo en la muestra observada. Debido a que dichas decisiones se toman en
condiciones de incertidumbre, entonces estas serán confiables con cierto grado de probabilidad.
Considerando que las características medidas de una muestra se denominan estadísticas de la
muestra, las características medidas de una población estadística, o universo se llaman
parámetros de la población.

ANALISIS ESTADISTICO

Distribución de Frecuencias: Las distribuciones de frecuencias, son series estadísticas


ordenadas por intervalos de clases, y por lo tanto, corresponden a la clasificación de grupo de
datos, de acuerdo a una característica cuantitativa.

Esta distribuciones se elaboran cuando se tiene una masa de datos, para reducirla a grupos
homogéneos y poco numerosos, con fines de descripción, análisis y obtención de indicadores.

Serie simple o arreglo: Es un simple listado de la información obtenida de una fuente de datos.

Ejemplo: Sueldos mensuales, en pesos, pagados a 20 trabajadores de una empresa, ordenados en


forma ascendente:

210.000 – 250.000 – 250.000 – 280.000 – 280.000 – 300.000 – 300.000 – 350.000 – 350.000 –


400.000 – 400.000 – 450.000 – 450.000 – 500.000 – 550.000 – 550.000 – 600.000 – 600.000 –
700.000 – 750.000

Como el sueldo es mínimo es $210.000 y el máximo $750.000, el Rango de los salarios es:
750.000 – 210.000 igual a $540.000.

Como esta tabla no permite tener un idea de la distribución de los sueldos, hay que clasificarlos en
un cuadro de frecuencias.
Tabla de frecuencias sin clase (datos no agrupados):

Los datos de la tabla anterior se pueden resumir, al registrarse el número de trabajadores, de


acuerdo a su sueldo.

Sueldo ($) Número de Obreros (Frecuencias)


210.000 1
250.000 2
280.000 2
300.000 2
350.000 2
400.000 2
450.000 2
500.000 1
550.000 2
600.000 2
700.000 1
750.000 1

Tabla de frecuencias con clase (con datos agrupados):

Para ello debemos considerar cada intervalo con límites cerrado y abierto, o sea [210.000,300.000[
La tabla siguiente la vamos a elaborar con frecuencias absolutas, estas frecuencias son las que
se obtienen directamente del conteo, pero, también incorporaremos las frecuencias relativas que
corresponden a los porcentajes de cada frecuencia absoluta, en este caso, se determina con
respecto al total de trabajadores (20).

También incorporaremos a la tabla la frecuencia absoluta acumulada que corresponde a la


frecuencia absoluta del intervalo más la suma de las frecuencias absolutas de todos los valores
anteriores y la frecuencia relativa acumulada que corresponde al porcentaje de la frecuencia
relativa del intervalo más la suma de las frecuencias relativas de todos los valores anteriores.

La marca de clase corresponde al valor medio de cada intervalo.

Sueldo ($) Marca de recuenc Frecuencia Frecuencia Frecuencia


Clase ia Relativa % Absoluta Relativa
Absolut Acumulada Acumulada
a %
200.000 – 250.000 5 25 5 25
300.000
300.000 – 350.000 4 20 9 45
400.000
400.000 – 450.000 4 20 13 65
500.000
500.000 – 550.000 3 15 16 80
600.000
600.000 – 650.000 2 10 18 90
700.000
700.000 – 750.000 2 10 20 100
800.000

Representaciones Gráficas
Para hacer más clara y evidente la información que nos dan las tablas se utilizan los gráficos.
Existen múltiples tipos de gráficos, pero aquí trataremos solamente de los usados más
frecuentemente, que son: gráfico de barras, gráfico de sectores o circular (pastel), histograma,
polígono de frecuencias, la ojiva y el pictograma.

Gráfico de Barras: Se usa fundamentalmente para representar distribuciones de frecuencias de


una variable cualitativa o cuantitativa discreta y, ocasionalmente, en la representación de series
cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o
relativas (%), y el otro para la escala de clasificación utilizada.

Ejemplo:

Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias


relativas (%) de una variable cualitativa o cuantitativa discreta. En este gráfico se hace
corresponder la medida del ángulo de cada sector con la frecuencia correspondiente a la clase en
cuestión. Si los 360º del círculo representan el 100 % de los datos clasificados, a cada 1% le
corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para un sector dado bastaría con
multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).

Ejemplo:

Histograma: Este gráfico se usa para representar una distribución de frecuencias de una variable
cuantitativa continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje
X la variable
Ejemplo:

Polígono de frecuencias: Se utiliza, al igual que el histograma, para representar distribuciones de


frecuencias de variables cuantitativas continuas, pero como no se utilizan barras en su confección
sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se usa cuando se quiere
mostrar en el mismo gráfico más de una distribución.

Ejemplo:

Ojiva: Su objetivo, al igual que el histograma y el polígono de frecuencias es representar


distribuciones de frecuencias de variables cuantitativas continuas, pero sólo para frecuencias
acumuladas

Ejemplo:
Pictograma: Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de
frecuencias. Este tipo de gráfica atrae la atención por los dibujos, pero la desventaja es que se lee
en forma aproximada.

Medidas de Tendencia Central

La utilidad de las medidas de tendencia central se puede ver claramente cuando es necesario
determinar, por ejemplo, en qué lugar se ubica la persona promedio o típica de un grupo, para
comparar o interpretar cualquier puntaje en relación con el puntaje central o típico, para comparar
el puntaje obtenido por una misma persona en dos diferentes ocasiones, para comparar los
resultados medios obtenidos por dos o más grupos y otros casos.

Las medidas de tendencia central más comunes son:

La media aritmética: comúnmente conocida como media o promedio. Se representa por medio de
una letra M en otros casos por X .
La mediana: la cual es el puntaje que es ubica en el centro de una distribución. Se representa
como Md.
La moda: que es el puntaje que se presenta con mayor frecuencia en una distribución. Se
representa Mo.

Cómo calcular la mediana, la media y la moda.

Para determinar la mediana, se ordenan los valores de mayor a menor o lo contrario. Se divide el
total de casos entre dos, una vez el valor resultante corresponde al número del caso que
representa la mediana de la distribución. En muchas ocasiones, los casos son tan numerosos que
no se pueden ordenar uno tras otro sino que se agrupan por frecuencia de ocurrencia en cada
valor o por intervalos de clase cuando el rango de posibles valores de la variable es muy amplio.
En estos casos el proceso es un poco más complejo y requiere de la utilización de la siguiente
fórmula

N
− Fi −1
M = Li + c ⋅ 2
fi

Li = límite inferior de la clase mediana


c= amplitud del intervalo
N =número total de datos
Fi −1 =frecuencia absoluta acumulada de la clase anterior a la mediana
f i =frecuencia absoluta de la clase mediana
Para calcular la media aritmética de un conjunto de datos, se suma cada uno de los valores
y se divide entre el total de casos.
Sea X una variable estadística que toma los valores x1, x 2, x 3, ..., x n , con frecuencias
absolutas f 1, f 2, f 3, ..., f n , respectivamente, la media viene dada por:
n

x f + x f + ... + x n f n
∑x i ⋅ fi
x= 11 2 2 = i =1
f 1 + f 2 + ... + f n n

∑fi =1
i

Si la variable es continua, o aún siendo discreta si están los datos agrupados en clases, se toman
como valores x1, x 2, x 3, ..., x n , las marcas de clase.

La moda se identifica al observar el valor que se presenta con más frecuencia en la distribución.
Ahora bien, en el caso de datos agrupados en intervalos, es fácil determinar la clase modal (clase
con mayor frecuencia), pero el valor dentro del intervalo que se presume tenga mayor frecuencia
se obtiene a partir de la siguiente expresión:

D1
M o = Li + c ⋅
D1 + D2

Li = límite inferior de la clase modal.


c = amplitud de los intervalos.
D1 = diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
anterior.
D2 = diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase
siguiente.

Cuantiles

La mediana divide a la distribución en dos partes iguales, los cuantiles son parámetros que dividen
los datos de la distribución en partes iguales.

Los más usados son:

Cuartiles:
Se llaman cuartiles a tres valores que dividen a la serie de datos en cuatro partes iguales.
Q1 , Q2 y Q3 ( cuartil primero, cuartil segundo y cuartil tercero )

Quintiles:
Se llaman quintiles a cuatro valores que dividen a la serie en cinco partes iguales.
K 1 , K 2 , K 3 y K 4 ( quintil primero,... )

Deciles:
Nueve valores iguales que dividen la distribución en 10 partes iguales.
D1 , D2 , ... y D9 ( decil primero,...)
Percentiles:
Noventa y nueve valores que dividen la serie en 100 partes iguales.
P1 , P2 , ... y P99 ( percentil primero,... )

El cálculo es análogo al de la mediana.

S-ar putea să vă placă și