La inferencia estadística o estadística inferencial se refiere a un
conjunto de métodos mediante los cuales podemos hacer afirmaciones con respecto a una población completa a partir únicamente de la observación de una parte de ella (muestra)
Se denomina muestreo al proceso por el que generamos las
muestras. Una muestra es una parte (un subconjunto) de la población, y se desea que la muestra sea lo más representativa posible de la población de la que procede. Sin embargo, por muy cuidadosa que sea la selección de la muestra difícilmente será una representación exacta de la población. Esto significa que su tendencia central, variabilidad, etc., aproximarán las de la población, pero habrá cierta diferencia, que interesa sea lo menor posible. Un concepto clave de muestreo es el de representatividad: Los procedimientos de muestreo tienen por objeto generar muestras lo más representativas posible de las poblaciones dados los objetivos de la investigación y las circunstancias que afectan al muestreo.
Desde un punto de vista aplicado, se denomina muestreo el
proceso de selección de la muestra o muestras a utilizar para la investigación. Esto supone generar una o pocas muestras. Actualmente es de interés la selección de muestras para la simulación informática de los procesos de muestreo, particularmente para la obtención de distribuciones muéstrales.
Desde un punto de vista teórico, el concepto de muestreo es
fundamental para la Inferencia Estadística. El hecho de que las muestras no sean exactamente representativas de las poblaciones significa que las inferencias presentan cierto margen de incertidumbre. Para cuantificarlo y definir técnicas inferenciales es necesario conocer cómo se comportan los estadísticos obtenidos en las muestras, esto es, cómo son las distribuciones muéstrales de los estadísticos habitualmente utilizados para la inferencia. Las muestras singulares generadas para investigación con sujetos suelen utilizarse para obtener algunos estadísticos (Media, proporción, cuasi varianza, etc.) con los que se realiza el proceso de inferencia. En cambio, las muestras simuladas por ordenador suelen ser utilizadas para obtener distribuciones muéstrales y realizar inferencia. Esto es de interés cuando se dan circunstancias especiales que no aconsejan utilizar los procedimientos habituales. Las distribuciones muéstrales son las distribuciones de estadísticos de muestras que pertenecen a la misma población. Por ejemplo, la distribución muestral de la Media es la distribución de las Medias de muestras de un mismo tamaño extraídas de la misma población.
El número de datos n (tamaño de muestra) es casi siempre
elegido de antemano (a través del muestreo) en problemas de estimación y prueba de hipótesis.
Las medidas descriptivas pueden ser calculadas a través de la:
media, la varianza, la proporción etc. Cuando se calculan estas medidas en una muestra, suelen identificarse como: estadísticos y cuando hablamos de los mismos en una población los identificamos como parámetros.
O sea x s son estadísticos y
Son parámetros
OBJETIVO GENERAL:
Proporcionar las herramientas necesarias para poder determinar
buenas aproximaciones (a lo que llamaremos estimaciones) a aquellos valores desconocidos en la población (a los que técnicamente se les denomina parámetros) y que estamos interesados en conocer.
OBJETIVOS ESPECIFOS:
Calcular los parámetros de la distribución de medias o
proporciones muéstrales de tamaño n, extraída de una población media y varianza conocida.
Utilizar distintos tamaños muéstrales para controlar la confianza
y el error admitido.
Contrastar los resultados obtenidos a partir de muestras.
VARIANZA
La varianza de las variables aleatorias, por lo tanto consiste en
una medida vinculada a su dispersión. Se trata de la esperanza del cuadrado de la desviación de esa variable considerada frente su media y se mide en una unidad diferente.
Por ejemplo en los casos en que la variable mide una distancia
en kilómetros, su varianza se expresa en kilómetros al cuadrado.
La varianza como medida de dispersión es el promedio de las
diferencias cuadráticas de las diferencias individuales respecto de la media.