Documente Academic
Documente Profesional
Documente Cultură
Programa de la asignatura:
Estadística básica
Clave:
ESAD
Noviembre, 2010
A. Ficha de identificación
B. Descripción
C. Propósito
III. Temario 5
V. Evaluación 7
A. Ficha de identificación
B. Descripción
En un mundo cada vez más competitivo, tanto en las áreas comerciales, financieras,
tecnológicas y científicas, y donde invariablemente el flujo de información es mayor a cada
momento, se hace indispensable no sólo la correcta descripción de los datos sino también su
análisis e interpretación. Es aquí donde la estadística juega un papel preponderante, al ser una
de las herramientas más poderosas para comprender la variabilidad inherente a los datos
observados y se constituye como la mejor herramienta para la toma de decisiones.
El tronco básico se conforma de varias asignaturas comunes que promueven, por un lado, la
formación integral de los estudiantes, integrando asignaturas de distintas áreas del
conocimiento, y por otro lado, desarrollan en el estudiante competencias transversales
necesarias para la investigación, el análisis crítico, el manejo y la sistematización de
información y datos, así como una serie de valores que le permitan conducirse con ética y
responsabilidad durante su trayectoria académica y su desempeño profesional.
Las materias que forman el tronco básico son: Contexto socioeconómico de México, Desarrollo
humano, Estadística básica y Fundamentos de investigación; estas materias a simple vista
parecen desarticuladas, pero se interrelacionan para contribuir a la formación integral de los
estudiantes.
Los propósitos de la asignatura en relación al tronco básico son que los estudiantes:
De manera particular, la materia pone especial énfasis en el enfoque práctico del material y los
contenidos que se presentan, tratando siempre de relacionar los conceptos, técnicas y casos de
estudio con el quehacer cotidiano de las diferentes disciplinas, esperando despertar en los
estudiantes el deseo de adentrarse cada vez más a la teoría de la probabilidad y estadística, al
ver lo importante que resulta su utilización en las diferentes áreas de trabajo.
C. Propósito
La asignatura tiene como propósito introducir al estudiante con los conceptos y técnicas básicas
de la estadística aplicada a la licenciatura e ingeniería. El curso tiene un nivel matemático
elemental, con la intención de que el estudiante comprenda la metodología y su aplicación, y no
tanto la teoría matemática detrás de ella.
III. Temario
1. Fundamentos de la estadística
Como estrategia de evaluación se utiliza un proyecto integrador, donde el estudiante haga uso
de todo lo que se trabajó en el curso. A lo largo del curso, se les presentarán a los estudiantes
varias autoevaluaciones de carácter lúdico, esto con el fin de que puedan observar e identificar
cuáles son sus avances y las dificultades que presentan en el aprendizaje de los temas.
Estas autoevaluaciones contarán con una retroalimentación que sirva para reforzar los temas
que se evalúan.
El facilitador juega un papel muy importante dentro del curso, pues se espera que sea quien
dirija y oriente todo el proceso de aprendizaje.
V. Evaluación
En el marco del Programa de la ESAD, la evaluación se conceptualiza como un proceso
participativo, sistemático y ordenado que inicia desde el momento en que el estudiante ingresa
al aula virtual. Por lo que se le considera desde un enfoque integral y continuo.
Por lo anterior, para aprobar la asignatura, se espera la participación responsable y activa del
estudiante así como una comunicación estrecha con su facilitador para que pueda evaluar
objetivamente su desempeño. Para lo cual es necesaria la recolección de evidencias que
permitan apreciar el proceso de aprendizaje de contenidos: declarativos, procedimentales y
actitudinales.
Cabe señalar que para aprobar la asignatura, se debe de obtener la calificación mínima
indicada por la ESAD.
Bibliografía complementaria:
Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. (2010). Estadística
Matemática con Aplicaciones. Séptima Edición. México: Cengage Learning.
Ferris Ritchey. (2008). Estadística aplicada a las ciencias sociales. Segunda Edición.
México: Mc Graw Hill.
Douglas L., William M., Samuel W. (2008). Estadística aplicada a los negocios y la
economía. Decimotercera Edición. México: Mc Graw Hill.
Castillo Manrique, Isabel (2006). Estadística descriptiva y cálculo de probabilidades,
Primera Edición. Pearson Education de México.
En esta unidad:
Identificarás los conceptos básicos relacionados con la Estadística.
Reconocerás la utilidad e importancia de la Estadística.
Aplicarás el procedimiento para obtener una muestra aleatoria simple.
Competencia específica
Aplica la metodología estadística para obtener información de una muestra aleatoria simple,
identificando los elementos que intervienen en un problema estadístico.
Introducción
Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas,
una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la
palabra estadística, en primer término se usa para referirse a la información estadística
descripción de parámetros; también se utiliza para referirse al conjunto de técnicas y métodos
Utilidad e importancia
La estadística resulta muy útil no sólo para recopilar y describir datos, sino también para
interpretar la información obtenida, que puede ser aprovechada para demostrar la evolución de
un fenómeno a través de cierto tiempo.
1.2.1. Población
Conjunto de todos los elementos que permiten resolver un problema y que presentan una
característica común determinada, observable y medible. Por ejemplo, si el elemento es una
persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los
elementos que integran una población pueden corresponder a personas, objetos o grupos (por
ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).
1.2.2. Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la población.
Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por
ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada
negocio, que está formado por varias personas, es un individuo de la población.
1.2.3. Muestra
Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso
que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de
esta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto
presenta el mismo comportamiento y características que la población. En general el tamaño de
la muestra es mucho menor al tamaño de la población.
1.2.4. Muestreo
Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción
reducida y representativa de la población.
1.2.5. Dato
El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por
ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara,
cruz.
1.2.6. Variable
Se llama variable a una característica que se observa en una población o muestra, y a la cual
se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo.
Las variables se pueden clasificar en cuantitativas y cualitativas:
b) Elaboración de un modelo
Se establece un modelo teórico de comportamiento de las variables de estudio. En
ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los
posibles modelos son Normal, Binomial, Poisson, Uniforme, Cuando es difícil
estudiar la población debido a su gran tamaño o que provenga de un proceso que no
se detiene (como la producción de un bien) , se debe analizar un subconjunto o
parte de esta que la represente, etc.
c) Extracción de la muestra
Se usa alguna técnica de muestreo o un diseño experimental para obtener
información de una pequeña parte de la población.
Introducción
Los estudios estadísticos normalmente se hacen con una parte de la población, ya que
realizarlos sobre la totalidad resultaría demasiado complicado. Para que la información obtenida
tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones
específicas, relacionadas con el método para determinar el tamaño y características de la
muestra y los individuos que la componen.
Para que la información obtenida tenga validez y confiabilidad es necesario que cumpla con
algunas condiciones específicas. Los métodos de muestreo se pueden clasificar en:
Muestreo probabilístico: en él, todos los elementos de una población y, por lo tanto,
todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras
obtenidas a través de este tipo de muestreo son confiables porque aseguran la
condición de representatividad que es muy importante para hacer generalizaciones.
Muestreo no probabilístico: en este tipo de muestreo los elementos de la población no
comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no
cumplen con la condición de representatividad, por lo que no es confiable hacer
generalizaciones a toda la población.
Una vez que hemos definido nuestra población y las variables a estudiar, es
necesario asignar un número de identificación a cada individuo de la población.
Siguiendo con el ejemplo de la relaciones de género en el noviazgo en los
estudiantes de química, lo que sigue es numerar a los 386 estudiantes un número
del 1 al 386.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
Para evitar un costo muy alto se busca un porcentaje de confianza menor, comúnmente
es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningún
cálculo) para poder acertar al valor verdadero de la población. Este dato se obtiene a
partir de la distribución normal estándar (esto se considerará en la unidad 4).
Porcentaje de error: Este error es una distancia alrededor del valor que deseamos
estimar y nos da un margen de aproximación. Al igual que en el caso de la confianza, si
se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del
mismo tamaño que la población, por lo que conviene correr un cierto riesgo de
equivocarse. Comúnmente se aceptan entre el 4% y el 6% como error, tomando en
cuenta de que no son complementarios la confianza y el error.
n es el tamaño de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
E es la precisión o error
Ejemplo:
En un lote grande de medicinas, se desea verificar que la proporción de los ingredientes
activos sea el adecuado. Se debe determinar el tamaño de la muestra para un nivel de
confianza del 95% con un error del 5%. Supongamos que la variabilidad p=q=0.5.
Solución:
Para el nivel de confianza sea igual al 95%, tenemos que P(Z)=0.95 si Z=1.96.
Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en
el caso necesario, hay que convertir esos valores a proporciones.
Sustituyendo:
n es el tamaño de la muestra
Z es el nivel de confianza
p es la variabilidad positiva
q es la variabilidad negativa
N es el tamaño de la población
E es la precisión o error
Ejemplo:
En un lote de 25,000 cajas de medicina, se desea verificar que la proporción de los
ingredientes activos sea el adecuado. Se debe determinar el tamaño de la muestra para
un nivel de confianza del 95% con un error del 5%. Supongamos que la variabilidad
p=q=0.5.
Solución:
Para el nivel de confianza sea igual al 95%, tenemos que p(Z)=0.95 si Z=1.96.
Sustituyendo:
Ejemplo:
Suponga que tenemos la siguiente tabla de 100 datos, numerados del 00-99.
0 1 2 3 4 5 6 7 8 9
0 61 21 15 68 79 63 81 84 73 28
1 78 73 10 4 40 20 87 1 46 84
2 83 26 21 49 30 71 69 45 25 29
3 64 74 1 83 74 98 24 25 91 65
4 29 46 29 34 46 38 25 23 81 17
5 79 34 24 77 23 1 44 31 29 99
6 93 39 73 64 66 93 92 61 25 69
7 58 39 34 88 88 33 5 79 58 51
8 67 64 52 56 18 51 30 16 68 29
9 32 7 72 88 48 28 30 22 74 39
Por lo que nuestra muestra quedaría con los valores 93, 68, 56, 69, 61, 34, 23, 17 ,45 , 52.
En esta unidad se trabajará con lecturas de apoyo y se resolverán problemas como ejercicios
para reforzar el aprendizaje.
Tendrás que participar en una encuesta con la cual se generará una base de datos, este
material lo utilizarás a lo largo del curso para que elabores las evidencias de aprendizaje de
cada unidad.
Referencias:
Propósitos
En esta unidad:
Identificarás algunos conceptos que se utilizan en estadística descriptiva.
Organizarás datos en diferentes tipos de tablas y elaborarás varios tipos de gráficas.
Competencia específica
Utiliza las técnicas de representación numérica y gráfica para representar información a través
de la organización de los datos obtenidos de una muestra o población.
Introducción
En la unidad anterior vimos que existen dos grandes divisiones de la estadística: la que se
dedica a la recolección, presentación y categorización de datos, llamada estadística descriptiva,
y la que se dedica a realizar hipótesis en base a dichos datos, llamada inferencial. También
aprendimos a determinar el espacio de estudio, es decir la población, y las variables que se van
a estudiar de acuerdo al problema planteado.
Cuando se realiza un trabajo que requiere de la estadística, las personas que realizan el trabajo
diseñan sus instrumentos para recolectar la información y obtener los datos que necesitan.
Existen muchos métodos para recolectar información, pero los más frecuentes son:
Censos
Es una técnica de recolección de datos que se aplica a la totalidad de los elementos que
componen la población o universo que se estudia. Un censo debe cumplir dos condiciones:
Universalidad: esto es, se debe tomar en cuanta a todos los elementos de la población.
Simultaneidad: debe realizarse dentro de un periodo de tiempo limitado.
Experimento
Otra de las técnicas más recurridas en estadística para recolectar información son los
experimentos, veamos en qué consisten.
Un experimento, también se define como el proceso que se realiza para verificar una serie
de hipótesis relacionadas con un determinado fenómeno, en el cual se determinan las
características o comportamientos del fenómeno que se analiza. Por ejemplo, un experimento
para determinar la velocidad de la luz en el vacío; donde se está determinando la velocidad de
la luz.
En el primer ejemplo, experimento los sabores de los alimentos sin antes predecir cuál pienso
que me sabrá más salado. En el segundo ejemplo, mi hipótesis, a partir de estudios anteriores,
es que la velocidad de la luz en el vacío es de 300 000 km/seg.
Mi experimento verifica si esta hipótesis es cierta o no y en él cabe un margen de error
experimental.
La descripción estadística organiza los datos y los presenta en forma de tablas y gráficas. Esta
área sólo describe, resume, organiza y representa los datos obtenidos de una población o
muestra de dicha población, sin elaborar inferencias ni obtener conclusiones.
La organización de datos se realiza a través de tablas que se utilizan para simplificar la
presentación y distribución de estos datos. A continuación veremos que existen diferentes tipos
de presentación de datos y con base en ellos distintas clasificaciones de frecuencia, como:
frecuencia relativa, frecuencia acumulada y frecuencia absoluta.
Dentro de los conceptos básicos para la organización de datos están los que conciernen a la
frecuencia:
Podemos encontrar las frecuencias organizadas en tablas que estudiaremos más adelante. Por
ahora veamos cómo se representan los tipos de frecuencia que vimos anteriormente,
supongamos que tenemos la siguiente distribución de datos:
18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18,
23, 52, 7, 18, 52, 23.
Intervalo o rango: Conjunto de números comprendidos entre otros dos números dados,
conocidos estos últimos como límites del intervalo.
Amplitud del intervalo: Es la diferencia del límite superior menos el límite inferior (Ls -
Li).
Fronteras de clase: Son los puntos medios entre los límites de intervalos consecutivos.
Las fronteras de clase se utilizan para recuperar los datos entre el límite superior de un
intervalo y el límite inferior del siguiente.
Ejemplo de intervalos
Veamos cómo se representan los conceptos relacionados con los intervalos.
Dados los números 15 y 25, tendríamos que:
El intervalo corresponde a todos los números que se encuentran entre el 15 y el
25. El intervalo de clase sería: 15-25
Límite inferior = 15
Límite superior = 25
La frontera de clase no debe coincidir con los datos límites del intervalo, porque
sería complicado identificar el intervalo al que pertenece dicho dato.
Ejemplo: Con en base las fronteras dadas se construyen los nuevos intervalos
3.5-14.5, 14.5-25.5 y 25.5-36.5. Si se tiene el dato 25.5 no se sabría si ponerlo
en el segundo o en el tercer intervalo.
Es recomendable que la marca del intervalo coincida con alguno de los datos.
Esto no es necesario y no siempre se logra, sobre todo cuando los intervalos
tienen la misma amplitud.
1. Calcular el rango:
Para esto, se identifica el número mayor (Xn) y el número menor (X1) en los datos. El rango es
el resultado de la resta, esto es:
R= Xn – X1
Por ejemplo:
Si en una serie de datos que van desde el 18 hasta el 56, tendríamos lo siguiente:
Xn= 56 y X1= 18, por lo tanto:
R= Xn – X1= 56 – 18= 38
Esta será la amplitud de los intervalos. Cuando no es un número entero, se escoge el entero
más cercano, como en este caso, tomamos el rango igual a 5.
Cuando la cantidad de datos es tal que no alcanza para acumular un intervalo más, entonces
se divide entre el número de intervalos que se quieren.
1. Calcular el rango:
R= Xn – X1= 60-20=40
Existen diferentes tipos de tablas para presentar los datos, las más utilizadas son: Tabla de
datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada.
Ejemplo:
Supongamos que la medición de temperatura a lo largo del día da como resultado los
siguientes valores en grados Celsius: 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7. Entonces
construimos una tabla como la siguiente:
Temperatura
20.4 21.2 22.1 23.9 25.3 26.9 27.7
(Celsius)
Esta nos aporta mayor información pues está formada por categorías de la variable que se esté
midiendo y su frecuencia (es decir, el número de ocurrencias de un valor dado).
Ejemplo:
suponga que un experimento da los siguientes valores medidos:
1,2,2,2,1,1,5,4,3,2,2,1,3,4,5,6,2,3,4,5,5,4,3,3,2
Valor de la
Frecuencia
Variable medida
1 4
2 7
3 5
4 4
5 5
6 1
En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores
correspondientes a cada variable.
Ejemplo:
En una encuesta sobre el desempleo en el Área Metropolitana de la Ciudad de México, se
organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de
cada intervalo, teniendo un total de 23,700 desempleados.
Estas tablas proporcionan información referente a dos variables o eventos relacionados entre
sí. Se forma poniendo en los renglones de la tabla la información de una de las variables y en
las columnas la información de la otra variable.
Suponga que se miden el número de cirugías realizadas por edades en una muestra de 100
personas, encontrándose lo siguiente:
Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables
relacionadas son los rangos contra el valor de las variables en dicho rango.
Por ejemplo:
Podríamos considerar la tabla como una tabla de frecuencias o como una tabla de doble
entrada:
Tiempo Temperatura
(min) (°C)
1-5 36
6-10 44
11-15 67
Introducción
Este tipo de gráfica se utiliza para datos de tipo ordinal, nominal y discreto. En estas se
muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura de la barra y
no por el área de la barra. Esta gráfica muestra las discontinuidades en las mediciones por
medio de espacios vacios entre las barras.
La gráfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:
Barras verticales:
Barras horizontales:
Un histograma y una gráfica de barras son muy semejantes, la diferencia radica en que el
histograma no presenta separación entre las barras.
Para trazar la gráfica, se hace una distribución proporcional de las frecuencias del problema
con respecto a la circunferencia determinando sectores circulares para cada categoría.
Ejemplo:
Medición en Frecuencia
Frecuencia Porcentaje
cm acumulada
30 3 3 3%
30.1 7 10 6%
30.2 12 22 10%
30.3 18 40 15%
30.4 23 63 19%
30.5 21 84 18%
30.6 17 101 14%
30.7 11 112 9%
30.8 5 117 4%
30.9 1 118 1%
En esta unidad se trabajará con dos problemas diferentes que permitirán practicar a
elaboración de tablas de datos y gráficas, además de participar en un foro sobre el uso
cotidiano de la estadística descriptiva. La evidencia de aprendizaje se generará a partir de la
muestra que se obtuvo en la unidad uno. Consiste en la elaboración de tablas de datos y
gráficas de diferentes tipos.
Referencias:
1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadística
aplicadas a la ingeniería. Cuarta edición. México: McGraw-Hill.
2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadística para
Ingeniería y ciencias. Octava edición. México: Pearson Educación.
3. Intervalos de clase. Consultado el 26 de abril de 2010 en:
http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadistica_descrip
tiva_2/estadistica_descriptiva_2.htm
4. Censo y entrevista. Consultados el 26 de abril de 2010 en:
http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc.
http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf
Propósitos
En esta unidad:
Competencia específica
Utiliza las medidas de tendencia central y dispersión para describir un conjunto de datos
mediante la representación numérica y gráfica de la información obtenida en una muestra o
población.
Introducción
Para cualquier conjunto de datos estudiados es importante tener información resumida de sus
características. Esta información nos indica cómo se comporta la población de datos que
tenemos. Para resumir la información se utilizan dos tipos de valores que en lugar de
representar cada dato, representan conjuntos de datos. Estos dos tipos de indicadores
estadísticos son: las medidas de tendencia central, que nos muestran hacia qué valores se
agrupan o acumulan los datos, y las medidas de dispersión, que, de forma contraria a las
anteriores, muestran cómo se dispersan o separan los datos.
Las medidas de tendencia central son los valores que representan un conjunto de datos de
forma tal que nos ayudan a saber dónde están acumulados los datos pero sin indicar como se
distribuyen. Se llaman así porque tienden a ubicarse en la parte central del conjunto de datos.
Las medidas de tendencia central más comunes son: la media aritmética, comúnmente
conocida como media o promedio, la mediana y la moda.
La media aritmética o, simplemente, media, se denota por o por la letra μ según se calcule en
una muestra o en la población, respectivamente. La media es resultado de dividir la suma de
todos los valores (xi) entre el número total de datos (N).
Los datos no agrupados son aquellos datos que organizamos en una tabla de datos, es decir,
cada valor se representa de manera individual. Las fórmulas para calcular la media son:
En estas fórmulas la diferencia radica en que, el total de la población se representa con la letra
N y el total de la muestra se representa con la letra n.
Las fórmulas para calcular la media con los datos organizados de esta manera son:
Las fórmulas para calcular la media con los datos organizados de esta manera son:
3.1.2. Mediana
La mediana es el valor que divide a la mitad la serie de datos que se tienen. Es decir, la
mediana queda en medio de todos los datos cuando los acomodas ya sea en orden creciente o
decreciente, entonces, el número de datos que queda a la izquierda de la mediana es igual al
número de datos que queda a la derecha.
Si n es impar hay un dato que queda en medio de todos, éste será igual a la mediana. Si n es
par hay dos datos que quedan en medio de todos, en este caso la mediana es el promedio de
esos dos datos, es decir, su suma dividida entre dos.
Por ejemplo:
Supongamos que tenemos los siguientes valores:
2, 4, 0, 8, 6, 4, 7, 1, 1, 0, 8, 6, 9
1. Ordenamos:
0, 0, 1, 1, 2, 4, 4, 6, 6, 7, 8, 8, 9
Por ejemplo:
Supongamos que tenemos los siguientes valores:
5, 7, 2, 3, 1, 6, 9, 8, 6, 4, 7, 1, 3, 2
1. Ordenamos
1, 1, 2, 2, 3, 3, 4, 5, 6, 6, 7, 7, 8, 9
3. Promediamos:
En donde:
La moda es el valor del dato que más veces se repite, esto es, el valor cuya frecuencia absoluta
es mayor, y se denota como Mo. Algunas veces el valor que más se repite puede no ser único,
es decir, puede haber dos o más datos que aparezcan con la misma frecuencia absoluta,
siendo ésta la mayor. En esas ocasiones podemos hablar de poblaciones o muestras
bimodales si existen dos modas o multimodales si existen más de dos.
Por ejemplo si tomamos una muestra de hombres y mujeres y medimos sus estaturas
tendremos dos modas.
En donde:
A diferencia de las medidas de tendencia central, que miden acumulaciones, mediante un solo
punto, las medidas de dispersión miden el grado de separación o alejamiento que tiene una
variable estadística en torno a una medida de posición o tendencia central. Dicho grado de
separación nos indica lo representativa que es la medida de posición con respecto al conjunto
total de datos. A mayor dispersión menor representatividad de la medida de posición y
viceversa.
Las medidas de dispersión más comunes son: el recorrido, la varianza y la desviación estándar.
El recorrido representa la distancia que hay entre el primero y el último valor de la variable,
también se le conoce como rango y se denota por Re.
Donde:
Por ejemplo:
Supongamos que tenemos la siguiente distribución de datos: 69, 68, 52, 57, 69, 71, 78, 52, 74,
74, 69, 52, 76.
Re=78-52=26
3.2.2. Varianza
La varianza mide la mayor o menor dispersión de los valores de la variable respecto a la media
aritmética. Siempre es mayor o igual que cero y menor que infinito. Se define como la media de
los cuadrados de las diferencias del valor de los datos menos la media aritmética de estos.
La desviación típica muestra qué tan alejado está un dato del valor de la media aritmética, es
decir, la diferencia que hay entre un dato y la media aritmética. Se denota como S o, según se
calcule en una muestra o en toda la población, respectivamente.
Se define como la raíz cuadrada positiva de la varianza. Se expresa mediante las siguientes
fórmulas:
En datos no agrupados:
En una población:
En una muestra:
En una población:
En una muestra:
Se contará con dos foros de uso general, uno para las medidas e tendencia central y otro para
las medidas de dispersión. El objetivo de estos foros es que los alumnos planteen sus dudas a
todo el grupo o compartan información que pueda ser de utilidad para el estudio de los temas.
Cuenta con una actividad que debe ser enviada al facilitador como tarea, además de la
autoevaluación y la evidencia de aprendizaje. Esta última consiste en la presentación de las
medidas de tendencia central y dispersión de los datos obtenidos de la muestra de la unidad
uno, además de incluir, a manera de conclusión, una reflexión sobre el uso y las aplicaciones
de la estadística descriptiva.