Conceptos Básicos y Medidas de Tendencia Central

1.
INTRODUCCION
La estadística es una de las herramientas más ampliamente utilizadas en la
investigación científica.
Su aplicación en instituciones gubernamentales y educativas, en los negocios y en la
industria, en la banca y en otros quehaceres diarios hace de la estadística una
herramienta indispensable. Sin embargo el término “Estadística” tiene varios
significados para diferentes personas; para la gente común y corriente la estadística
solamente significa números. En el periodo de la mañana se pueden encontrar la
estadística más reciente sobre los delitos de la ciudad; de asesinatos, de robos de
automóviles; de asaltos y demás delitos que hayan sido denunciados en determinado
periodo de tiempo; de los nacimientos y muertes que han ocurrido, o en relación con
el deporte, el número de partidos ganados y perdidos por equipos integrantes de la
liga de ese deporte. Para otras personas es un método para obtener, presentar y escribir
grandes cantidades de datos, y para otras es un método para tomar decisiones en
situaciones difíciles. El objetivo básico de este fascículo es aclarar los significados de
Estadística, definir sus conceptos básicos utilizados con frecuencia y analizar los usos
y abusos de los métodos estadísticos. Aunque los significados sean diferentes, todos
ellos forman parte del concepto total de “Estadística”. La palabra tiene su sentido más
amplio para aquellas personas cuyo trabajo requiere un conocimiento de los aspectos
más técnicos de la estadística. Para estas personas, la palabra tiene relación con
aquellos conceptos y técnicas que se utilizan en la recopilación, organización,
resumen, análisis, interpretación y comunicación de información numérica. Estos
conceptos y técnicas juegan un papel importante en las actividades que realizan los
profesionales de todas las ciencias.
1
2. OBJETIVOS
Definir adecuadamente cada uno de los temas presentados.
Aplicar las técnicas estadísticas adecuadamente para el manejo de datos que nos permitan
obtener gráficos, medidas de tendencia y calcular probabilidades.
Obtener diferentes medidas estadísticas a partir de dichas herramientas.
2
3. Conceptos básicos.
3.1.Datos: Son valores particulares de una variable.
3.2.Sujeto: Elemento individual de estudio, en probabilidad y estadística, de un

universo dado, limitado o infinito, de la que se forma la muestra.
3.3.Población: Una Población se define como la totalidad de valores posibles

(mediciones o conteos) de una característica particular de un grupo específico de
objetos. Al conjunto total de objetos se le denomina Universo.
3.4.Muestra: Es el subconjunto de elementos de una población. Se espera que la

muestra sea representativa de la población, es decir reproduzca las características
más importantes. El proceso de obtener la muestra de denomina MUESTREO.
3.5.Parámetro: Es una constante que describe una característica de una población.

Para poder calcular el valor de un parámetro, se requiere conocer a ciencia cierta
el estado de naturaleza de la población o realizar un censo.
3.6.Estadístico: Son valores análogos a los parámetros, pero que son calculados con
la información obtenida de la muestra. Los valores estadísticos son variables
porque pueden tomar diferentes valores al cambiar de muestra.
4. Medidas de tendencias central

4.1.Media muestral
La media es simplemente un promedio numérico.

Suponga que las observaciones en una muestra son 𝑥1 , 𝑥2 , … , 𝑥𝑛 . La media de la
muestra, que se denota con 𝑥̅ , es
3
𝑛
𝑥𝑖 𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛
𝑥̅ = ∑ =
𝑛 𝑛
𝑖=1
4.2.Mediana Muestral
El propósito de la mediana de la muestra es reflejar la tendencia central de la muestra

de manera que no sea influida por los valores extremos.
Dado que las observaciones en una muestra son 𝑥1 , 𝑥2 , … , 𝑥𝑛 , acomodadas en orden
de magnitud creciente, la mediana de la muestra es
𝑥(𝑛+1)/2
𝑠𝑖 𝑛 𝑒𝑠 𝑖𝑚𝑝𝑎𝑟
𝑥̅ = {1
(𝑥 + 𝑥𝑛/2+1 ), 𝑠𝑖 𝑛 𝑒𝑠 𝑝𝑎𝑟
2 𝑛/2
4.3.Moda muestral
Se define la moda 𝑀0 de una muestra como aquel valor de la variable que tiene una
frecuencia máxima. En otras palabras, es el valor que más se repite.
Para ello supongamos que sea (𝑎𝑗 , 𝑎𝑗+1 ) el intervalo con frecuencia máxima 𝑛𝑗. Si
𝑛𝑗−1 𝑦 𝑛𝑗+1 son las frecuencias de los intervalos anterior y posterior al modal,
definimos 𝛿1 = 𝑛𝑗 − 𝑛𝑗−1 𝑦 𝛿2 = 𝑛𝑗 − 𝑛𝑗+1. En este caso, el valor exacto de la moda
se puede calcular como
𝛿1
𝑀0 = 𝑎𝑗 + (𝑎 − 𝑎𝑗 )
𝛿1 + 𝛿2 𝑗+1
4
5. Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden

resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de
dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar,
Coeficiente de variación.
Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de
la variable a un cierto valor central, o que permiten identificar la concentración de los datos
en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables
cuantitativas.
5.1.Varianza muestral
La varianza o variancia (que suele representarse como 𝜎 2 de una variable aleatoria es

una dispersión definida como la esperanza del cuadrado de la desviación de dicha variable
respecto a su media.
Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los
valores respecto a su punto central (Media ).
Cuando hablamos de varianza muestral estamos teniendo en cuenta el cálculo de la

varianza a partir de una muestra y no a partir de toda la población total.
En este caso, tenemos que aplicar la siguiente fórmula matemática:
5
Se dice que la varianza muestral s 2 es un estimador sin sesgo de la varianza poblacional s2,
lo que significa que los valores de s 2 tienden a igualar el valor de s2, en lugar de tender, de
manera sistemática, a sobreestimar o subestimar s2. Por ejemplo, considere una prueba de
cociente intelectual (CI) diseñada de tal forma que tiene una varianza de 225. Si usted repite
el proceso de elegir aleatoriamente 100 sujetos, aplicarles la prueba y calcular la varianza
muestral s 2 en cada caso, las varianzas muestrales que obtendrá tenderá a concentrarse
alrededor de 225, que es la varianza de la población.
Donde ( ) representa la varianza, (Xi) representa cada uno de los valores, ( ) representa
la media poblacional y (N) es el número de observaciones o tamaño de la población
5.2.Desviación estándar muestral
La desviación estándar es la medida de dispersión más común, que indica qué tan dispersos
están los datos con respecto a la media. Mientras mayor sea la desviación estándar, mayor
será la dispersión de los datos.
Es posible identificar conjuntos de datos que, a pesar de ser muy distintos en términos de
valores absolutos, poseen la misma media. Una medida diferencial para identificar esos
conjuntos de datos es la concentración o dispersión alrededor de la media. Una manera de
evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas
las desviaciones sean positivas. La raíz cuadrada del promedio de estas cantidades recibe el
nombre de desvío estándar, o desviación típica y es representada por la siguiente fórmula: A
mayor valor del coeficiente del desvío estándar, mayor dispersión de los datos con respecto
a su media. Es un valor que representa los promedios de todas las diferencias individuales de
las observaciones respecto a un punto de referencia común, que es la media aritmética. O
sea que a menor dispersión mayor homogeneidad y a mayor dispersión, menor
homogeneidad. Una desviación estándar de una muestra estima la desviación estándar de una
población basada en una muestra aleatoria. La desviación estándar de la muestra, a diferencia
de la desviación estándar de la población, es una estadística que mide la dispersión de los
datos alrededor de la media de muestra.
6
Formula
5.3.CUARTILES
Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales.
Utilizando cuartiles puede evaluar rápidamente la dispersión y la tendencia central de un
conjunto de datos, que son los pasos iniciales importantes para comprender sus datos.
Cuartil Descripción
1er cuartil 25% de los datos es menor que o igual a este valor.
(Q1)
2do cuartil La mediana. 50% de los datos es menor que o igual a este valor.
(Q2)
3er cuartil 75% de los datos es menor que o igual a este valor.
(Q3)
7
Cuartil Descripción
Rango La distancia entre el primer 1er cuartil y el 3er cuartil (Q3-Q1); de

intercuartil esta manera, abarca el 50% central de los datos.
Formula
Como los cuartiles adquieren su mayor importancia cuando contamos un número grande de
datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una
tabla de frecuencia. La fórmula para el cálculo de los cuartiles cuando se trata de datos
agrupados es la siguiente:
k= 1,2,3
Donde:
Lk = Límite real inferior de la clase del cuartil k
n = Número de datos
Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.
fk = Frecuencia de la clase del cuartil k
c = Longitud del intervalo de la clase del cuartil k
Fórmula de Q1, para series de Datos agrupados:
8
5.4.Deciles
Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes
porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados
en diez partes iguales, son también un caso particular de los percentiles. Los deciles se
denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc.
Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el
aprovechamiento académico.
Para datos agrupados los deciles se calculan mediante la fórmula.
Donde:
Lk = Límite real inferior de la clase del decil k
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
Fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
Otra fórmula para calcular los deciles
9
Fórmulas Datos No Agrupados
Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes
fórmulas:
Cuando n es par:
Cuando n es impar:
5.5.Percentiles
Los percentiles son, tal vez, las medidas más utilizadas para propósitos de ubicación o
clasificación de las personas cuando atienden características tales como peso, estatura, etc.
Los percentiles son ciertos números que dividen la sucesión de datos ordenados en cien partes
porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el
conjunto de datos ordenados. Los percentiles (P1, P2,... P99), leídos primer percentil,...,
percentil 99.
Cuando los datos están agrupados en una tabla de frecuencias, se calculan mediante la
fórmula:
Donde:
Lk = Límite real inferior de la clase del decil k
Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.
fk = Frecuencia de la clase del decil k
c = Longitud del intervalo de la clase del decil k
10
6. TECNICAS DE MUESTREO
Es un término mayormente utilizado en el campo de la estadística, la cual

para poder realizar estudios a una población (que es el conjunto de elementos físicos,
que presentan alguna característica en común, situados en un espacio
geográfico determinado en un lapso de tiempo específico, y sobre los cuales se desea
investigar), es necesario tomar una muestra de esa población dada, debido a que estas
pueden ser finitas o infinitas, y aún en el caso en el que sean finitas estas pueden estar
formadas por una gran cantidad de elementos lo que hace imposible un análisis completo
6.1.Muestreo aleatorio simple:
Se caracteriza porque cada elemento de la población tiene la misma probabilidad de

ser escogido para formar parte de la muestra. Una vez censado el marco de la
población, se asigna un número a cada individuo o elemento y se elige aleatoriamente.
La aleatorización puede realizarse mediante listas de números aleatorios generados
por ordenador, aplicándolas para escoger de la población los individuos o sujetos que
coincidan con los números obtenidos. Este tipo de muestreo se caracteriza por su
simplicidad y fácil comprensión, aunque también posee algunas limitaciones, ya que
no siempre es posible disponer de un listado de todos los individuos que componen
la población, generalmente cuando son poblaciones grandes. Si se seleccionan
muestras pequeñas mediante este método pueden aparecer errores aleatorios, no
representando la muestra adecuadamente a la población.
Un ejemplo de muestreo aleatorio simple sería la elección de los individuos a través de

la elección realizada totalmente al azar de un cierto número de DNI.
6.2.Muestreo estratificado:
En este tipo de muestreo la población de estudio se divide en subgrupos o estratos,

escogiendo posteriormente una muestra al azar de cada estrato. Esta división suele
11
realizarse según una característica que pueda influir sobre los resultados del estudio.
Por ejemplo, en el caso de seleccionar una muestra para evaluar la altura, dada la
heterogeneidad entre hombres y mujeres, la variable de género podría ser una variable
de estratificación. Si la estratificación se realiza respecto un carácter se denomina
muestreo estratificado simple, y si se realiza respecto dos o más características se
denomina muestreo estratificado compuesto. Si tenemos constancia o suponemos a
priori que la población de estudio presenta variabilidad de respuesta con respecto a
alguna característica propia, deberemos tener en cuenta este tipo de muestreo, dado
que se producen estimaciones más precisas cuanto más homogéneos sean los
elementos del estrato y más heterogeneidad exista entre estratos. Así pues, entre las
ventajas de este tipo de muestreo es que tiende a asegurar que la muestra represente
adecuadamente a la población en función de la variable de estratificación
seleccionada, sin embargo, debe conocerse la distribución de la población en las
variables de estratificación, clara desventaja de este muestreo. Para obtener la muestra
en cada uno de los estratos pueden aplicarse diferentes fracciones de muestreo,
pudiendo ser proporcional al tamaño en relación a la población, es decir, la
distribución se realiza de acuerdo con el peso o tamaño de la población de cada
estrato. Por ejemplo, si de los 5 millones de hipertensos españoles hay un 35% de
pacientes que fuman, podemos estratificar de manera que en nuestra muestra queden
representados al igual que en el total de la población, la misma proporción de
hipertensos fumadores (35%) y de no fumadores (65%).
6.3.Muestreo sistemático:
El muestreo sistemático es muy similar al muestreo aleatorio simple. La
diferencia se obtiene en que en este tipo de muestreo se divide el total de la
población de estudio entre el tamaño de la muestra, obteniendo una constante de
muestreo (k). La primera unidad que formará parte de la muestra debe estar entre
1 y k y se elige al azar; a partir de esta unidad se van seleccionando
sistemáticamente uno de los k individuos siguiendo un orden determinado. Por
ejemplo, si obtenemos un valor de k=10 y seleccionamos al azar el número 6,
12
deberíamos elegir todas las historias clínicas que finalizaran en «6»: «006»,
«016», «026» .... Es un método de muestreo muy sencillo de realizar y que cuando
la población esta ordenada siguiendo una tendencia conocida, asegura una
cobertura de unidades de todos los tipos. La principal limitación es que si la
constante se asocia al fenómeno de interés puede cometerse un sesgo.
6.4.Muestreo por conglomerados
Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se

supone que contienen toda la variabilidad de la población, es decir, la representan
fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos
grupos o conglomerados para la realización del estudio.
Dentro de los grupos seleccionados se ubicarán las unidades elementales, por

ejemplo, las personas a encuestar, y podría aplicársele el instrumento de medición a
todas las unidades, es decir, los miembros del grupo, o sólo se les podría aplicar a
algunos de ellos, seleccionados al azar. Este método tiene la ventaja de simplificar la
recogida de información muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos individuos
para integrar la muestra, el diseño se llama muestreo bietápico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El primer
método funciona mejor cuanto más homogénea es la población respecto del estrato,
aunque más diferentes son éstos entre sí. En el segundo, ocurre lo contrario. Los
conglomerados deben presentar toda la variabilidad, aunque deben ser muy parecidos
entre sí.
7. DISTRIBUCIONES MUESTRALES
El estudio de determinadas características de una población se efectúa a través de diversas

muestras que pueden extraerse de ella.
13
El muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita
o finita. Una población finita en la que se efectúa muestreo con reposición puede considerarse
infinita teóricamente. También, a efectos prácticos, una población muy grande puede
considerarse como infinita... Para cada muestra podemos calcular un estadístico (media,
desviación típica, proporción, entre otras) que variará de una a otra. Así obtenemos una
distribución del estadístico que se llama distribución muestral.
7.1.DISTRIBUCIÓN MUESTRAL DE MEDIAS
La distribución de probabilidad de 𝑋̅ se llama distribución muestral de la media.

Cada muestra de tamaño 𝒏 que podemos extraer de una población proporciona una media. Si
consideramos cada una de estas medias como valores de una variable aleatoria podemos
estudiar su distribución que llamaremos distribución muestral de medias.
 Si tenemos una población normal y extraemos de ella muestras de tamaño 𝒏, la

distribución muestral de medias sigue también una distribución normal.
𝜎
𝑁( )
√𝑛
 Si la población no sigue una distribución normal pero 𝒏 > 𝟑𝟎 aplicando el llamado

Teorema central del límite, la distribución muestral de medias se aproxima también
a la normal anterior.
7.2.ISTRIBUCIÓN MUESTRAL DE PROPORCIONES
En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la

variable aleatoria toma solamente dos valores diferentes (éxito o fracaso), es decir sigue una
14
distribución binomial y cuando la extensión de la población es grande la distribución
binomial se aproxima a la normal.
Para muestras de tamaño, 𝒏 > 𝟑𝟎 la distribución muestral de proporciones sigue una
distribución normal
𝑝𝑞
𝑁 (𝑝√ )
𝑛
Donde 𝑝 es la proporción de uno de los valores que presenta la variable estadística en la

población y q = 1 − p.
7.3.DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
La varianza de la distribución muestral de la media se calcula con la siguiente fórmula:
2 𝜎
σ𝑥 = 𝑛
Esto es, la varianza de la distribución muestral de la media es la varianza de la población

dividida entre n, el tamaño de la muestra (el número de datos que se utilizaron para calcular
la media). Entonces, cuanto mayor sea el tamaño de la muestra, la varianza de la distribución
muestral de la media será menor.
Varianza de la distribución muestral de la media será menor. Esta expresión puede derivarse
fácilmente a partir de la Ley de la suma de las varianzas. La varianza de la distribución
muestral de la suma de tres números obtenidos por muestreo de la población con varianza
𝜎 2 , seria 𝜎 2 +𝜎 2 +𝜎 2 , En forma general, para n números la varianza sería 𝑛𝜎 2
Ya que la media es la suma por 1/n, la varianza de la distribución muestral de la media sería
la varianza de la suma por 1/𝑛2 , lo cual es igual a 𝜎 2
15
8. ESTIMACIÓN
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona información sobre el valor del parámetro.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la muestra, aunque
es necesario cuantificar el riesgo que se asume al considerarlos.
8.1.ESTIMACIÓN PARA LA MEDIA MUESTRAL
De una población desconocemos la media 𝜇 y deseamos estimarla a partir de la media 𝑋̅

obtenida en una muestra de tamaño 𝑛 .
Sabemos que si la población es normal 𝑁(𝜎, 𝜇) y extraemos de ella muestras de tamaño

𝑛, o sin ser la población normal es 𝒏 > 𝟑𝟎.
𝜎
La distribución muestral de medias es 𝑁 (𝜇 )
√𝑛
Por tanto si fijamos una probabilidad 1 − 𝛼, sabemos que la
𝜎 𝜎
𝑃 [𝜇 − 𝑧 𝛼⁄2 < 𝑋̅ < 𝜇 + 𝑧 𝛼⁄2 ]=1−𝛼
√𝑛 √𝑛
𝜎
Es decir, el (1 − 𝛼) % de las 𝑋̅ está a una distancia 𝜇 de inferior a 𝑧 𝛼⁄2
√𝑛
Entonces para un nivel de confianza (1 − 𝛼) pertenece al intervalo:

𝜎 𝜎
𝑋̅ − 𝑧 𝛼⁄2 𝑛
< 𝑋̅ < 𝑋̅ + 𝑧 𝛼⁄2 .
√ √𝑛
16
Donde 𝑧 𝛼⁄2 es el llamado valor crítico, valor tal que 𝑃(−𝑧 𝛼⁄2 ≤ 𝑧 ≤ 𝑧 𝛼⁄2) y la
𝑋̅ media de la muestra.
Si la desviación típica de la población es desconocida, lo que suele ocurrir en la práctica, la

aproximaremos por la de la muestra siempre que 𝒏 > 𝟏𝟎𝟎.
8.2.ESTIMACIÓN DE LA VARIANZA MUESTRAL
La varianza muestral es un estimador sesgado de la varianza de la población, ya que si

utilizamos como estimador de 𝜎 2 la varianza muestral 𝑆 2 es decir:
𝜎 2 (𝑥) = 𝑆 2
𝜎2 (𝑛−1)
Tendremos que 𝐸[𝜎 2 (𝑥)] = 𝐸[ 𝑆 2 ] = = 𝜎 2 (𝑛 − 1) ≠ 𝜎 2 , que es el parámetro a
𝑛
estimar .Por lo que existe un sesgo que será:
𝜎 2 (𝑛 − 1) 𝜎2
𝐵[𝜃̂ (𝑥)] = 𝐵[ 𝑆 2 ] = 𝐸[ 𝑆 2 ] − 𝜎 2 = − 𝜎2 =
𝑛 𝑛
No obstante, y dado que, cuando el tamaño de la muestra tiende a infinito el sesgo tiende a
cero, se dice que el estimador es asintóticamente encestado o asintóticamente centrado:
podemos establecer que:
2
𝜎2
lim 𝐵( 𝑆 ) = lim =0
𝑛→∞ 𝑛→∞ 𝑛
Por tanto la varianza muestral es un estimador sesgado pero asintóticamente insesgado de la

varianza de la población.
17
9. Conclusión
Con todo lo aprendido, se puede concluir que la estadística es una rama de las matemáticas,
la cual no se encuentra muy visible en lo cotidiano, pero en realidad es de mucha utilidad
para interpretar y ver desde un punto de vista muy general datos que se obtienen.
Cabe mencionar que está basada en la recopilación de datos los cuales son representados
mediante gráficos estadísticos. Otro beneficio que obtenemos de esta materia es que nos
permite realizar estudios reales, con poblaciones exactas; lo cual nos ayuda a mejorar
nuestros proyectos.
Además nos encontramos en un mundo altamente probabilístico, por lo tanto, se necesita de

ciertos conocimientos de probabilidades, para utilizar dicha materia en algún momento de
nuestras vidas. Actualmente la aplicación de la probabilidad es tan amplia que abarca campos
científicos, siendo de gran ayuda en la resolución de problemas como: la economía, biología,
psicología, ingeniería, entre otras.
18
10. Referencias
UNAM. (s.) CONCEPTOS BÁSICOS DE PROBABILIDAD Y ESTADÍSTICA.

Recuperado de
http://www.ingenieria.unam.mx/calyesd/Docs/docs_proEsd/Notas_proEsd/Concept
os_Proba_Est.pdf
S.A. (s.). Conceptos de Estadística. Recuperado de

https://tarwi.lamolina.edu.pe/~fmendiburu/index-
filer/academic/Estadistica/parte1.pdf
Gorgas, J; Cardiel, N y Zamorano, J. (2011). Estadística Básica para estudiantes de

ciencias. Recuperado de
http://webs.ucm.es/info/Astrof/users/jaz/ESTADISTICA/libro_GCZ2009.pdf
Córdova, Z. M. (2003). Estadística descriptiva e inferencial: Aplicaciones (5a Ed).

Lima, Perú: Librería MOSHERA S.R. L.
Mendenhall, W., Beaver, R. J. y Beaver, B. M. (2010). Introducción a la probabilidad

y estadística (13a Ed). México, D. F.: CENGAGE Learning.
Walpole, R. E., Myers, R. H., Myers, S. L. & Ye, K. (2012). Probabilidad y

estadística para ingeniería y ciencias (9a Ed). Estado de México, México: Pearson
Educación
19

Conceptos Básicos y Medidas de Tendencia Central

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Conceptos Básicos y Medidas de Tendencia Central

Încărcat de

Drepturi de autor:

Formate disponibile

1.

Definir adecuadamente cada uno de los temas presentados.

Obtener diferentes medidas estadísticas a partir de dichas herramientas.

3.1.Datos: Son valores particulares de una variable.

3.2.Sujeto: Elemento individual de estudio, en probabilidad y estadística, de un

3.3.Población: Una Población se define como la totalidad de valores posibles

3.4.Muestra: Es el subconjunto de elementos de una población. Se espera que la

3.5.Parámetro: Es una constante que describe una característica de una población.

4. Medidas de tendencias central

La media es simplemente un promedio numérico.

El propósito de la mediana de la muestra es reflejar la tendencia central de la muestra

Las medidas de dispersión entregan información sobre la variación de la variable. Pretenden

La varianza o variancia (que suele representarse como 𝜎 2 de una variable aleatoria es

valores respecto a su punto central (Media ).

Cuando hablamos de varianza muestral estamos teniendo en cuenta el cálculo de la

En este caso, tenemos que aplicar la siguiente fórmula matemática:

5.2.Desviación estándar muestral

Rango La distancia entre el primer 1er cuartil y el 3er cuartil (Q3-Q1); de

Lk = Límite real inferior de la clase del cuartil k

Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k.

fk = Frecuencia de la clase del cuartil k

c = Longitud del intervalo de la clase del cuartil k

Fórmula de Q1, para series de Datos agrupados:

Fórmula de Q3, para series de Datos agrupados:

Para datos agrupados los deciles se calculan mediante la fórmula.

Lk = Límite real inferior de la clase del decil k

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

Fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

Otra fórmula para calcular los deciles

Lk = Límite real inferior de la clase del decil k

Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k.

fk = Frecuencia de la clase del decil k

c = Longitud del intervalo de la clase del decil k

Es un término mayormente utilizado en el campo de la estadística, la cual

6.1.Muestreo aleatorio simple:

Se caracteriza porque cada elemento de la población tiene la misma probabilidad de

Un ejemplo de muestreo aleatorio simple sería la elección de los individuos a través de

En este tipo de muestreo la población de estudio se divide en subgrupos o estratos,

6.4.Muestreo por conglomerados

Se utiliza cuando la población se encuentra dividida, de manera natural, en grupos que se

Dentro de los grupos seleccionados se ubicarán las unidades elementales, por

El estudio de determinadas características de una población se efectúa a través de diversas

7.1.DISTRIBUCIÓN MUESTRAL DE MEDIAS

La distribución de probabilidad de 𝑋̅ se llama distribución muestral de la media.

 Si tenemos una población normal y extraemos de ella muestras de tamaño 𝒏, la

 Si la población no sigue una distribución normal pero 𝒏 > 𝟑𝟎 aplicando el llamado

7.2.ISTRIBUCIÓN MUESTRAL DE PROPORCIONES

En numerosas ocasiones se plantea estimar una proporción o porcentaje. En estos casos la

Donde 𝑝 es la proporción de uno de los valores que presenta la variable estadística en la

7.3.DISTRIBUCIÓN MUESTRAL DE LA VARIANZA

La varianza de la distribución muestral de la media se calcula con la siguiente fórmula:

Esto es, la varianza de la distribución muestral de la media es la varianza de la población

8.1.ESTIMACIÓN PARA LA MEDIA MUESTRAL

De una población desconocemos la media 𝜇 y deseamos estimarla a partir de la media 𝑋̅

Sabemos que si la población es normal 𝑁(𝜎, 𝜇) y extraemos de ella muestras de tamaño

Por tanto si fijamos una probabilidad 1 − 𝛼, sabemos que la

Entonces para un nivel de confianza (1 − 𝛼) pertenece al intervalo:

Si la desviación típica de la población es desconocida, lo que suele ocurrir en la práctica, la

8.2.ESTIMACIÓN DE LA VARIANZA MUESTRAL

La varianza muestral es un estimador sesgado de la varianza de la población, ya que si

estimar .Por lo que existe un sesgo que será:

Por tanto la varianza muestral es un estimador sesgado pero asintóticamente insesgado de la

Además nos encontramos en un mundo altamente probabilístico, por lo tanto, se necesita de