Sunteți pe pagina 1din 8

Introduccin a la estadstica.

La palabra estadstica tambin se utiliza para referirse a la informacin estadstica (descripcin de parmetros); es decir, a series de datos, tablas y grficas que presentan resultados. Por ejemplo, cuando leemos las estadsticas de los equipos o escuchamos la estadstica muestra que el ndice de reprobacin en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodologa de anlisis. Los mtodos estadsticos se utilizan en investigaciones de todas las reas del conocimiento en el mbito acadmico, profesional y laboral. La finalidad es resolver un problema, entendiendo ste como la diferencia entre lo real y lo deseado, donde la estadstica muestra la realidad para que el investigador la analice y tome una decisin. Divisin de la estadstica La estadstica, por su aplicacin se divide en:

1) Estadstica descriptiva. La funcin descriptiva de la estadstica se enfoca en la presentacin y clasificacin de los datos obtenidos de la poblacin que se analiza. 2) Estadstica inferencial. Esta aplicacin de la estadstica busca plantear y resolver problemas especficos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difcil estudiar a la poblacin completa. Conceptos bsicos de estadstica Los conceptos ms utilizados en estadstica son los que a continuacin se presentan. Poblacin: Conjunto de todos los elementos que permiten resolver un problema, que presentan una caracterstica comn determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las caractersticas edad, peso, nacionalidad, sexo, etc. Los elementos que integran una poblacin pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).

Individuo: Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin. Nota que un individuo en estadstica puede ser distinto a un individuo como persona. Por ejemplo, en los censos econmicos se obtienen datos de los negocios. En este caso cada negocio, que est formado por varias personas, es un individuo de la poblacin. Muestra: Cuando es difcil estudiar la poblacin debido a su gran tamao o que provenga de un proceso que no se detiene (como la produccin de un bien), se debe analizar un subconjunto o parte de sta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y caractersticas que la poblacin. En general el tamao de la muestra es mucho menor al tamao de la poblacin. Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporcin reducida y representativa de la poblacin. Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadstico. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Variable: Se llama variable a una caracterstica que se observa en una poblacin o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en dos tipos: 1. Variable cuantitativa. Puede ser escala continua o discreta. 2. Variable cualitativa. Puede ser escala nominal u ordinal.

La metodologa para solucionar un problema estadstico comprende los siguientes pasos: 1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la poblacin, las caractersticas a estudiar (las variables), si es necesario establecer una hiptesis, entre otros. En este punto tambin se analizan los medios de los que se dispone y el procedimiento a seguir. 2. Elaboracin de un modelo. Se establece un modelo terico de comportamiento de las variables de estudio. En ocasiones no es posible disear el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geomtrico. 3. Extraccin de la muestra. Se usa alguna tcnica de muestreo o un diseo experimental para obtener informacin de una pequea parte de la poblacin. 4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos de la estadstica descriptiva. Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de la informacin.

5. Estimacin de los parmetros. La estadstica inferencial nos proporciona herramientas para la prediccin o estimacin de los parmetros de la poblacin que nos ayudarn a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hiptesis que se obtienen del anlisis de los datos y los intervalos de confianza. 4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que sern necesarios en pasos posteriores, como la media y la varianza de la muestra. Los mtodos de esta etapa corresponden a los mtodos de la estadstica descriptiva. Algunas de las etapas de esta fase son: recopilacin, clasificacin y presentacin de la informacin.

5. Estimacin de los parmetros. La estadstica inferencial nos proporciona herramientas para la prediccin o estimacin de los parmetros de la poblacin que nos ayudarn a resolver el problema.

Un ejemplo de estas herramientas son las pruebas de hiptesis que se obtienen del anlisis de los datos y los intervalos de confianza. Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones especficas. Estas condiciones estn relacionadas con el mtodo para determinar el tamao y caractersticas de la muestra y los individuos que la componen. Los mtodos de muestreo se pueden clasificar en:

Muestreo aleatorio simple El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple. Una muestra aleatoria simple es la que resulta de aplicar un mtodo por el cual todos los elementos de la poblacin tienen la misma probabilidad de ser elegidos.

A continuacin, conocers cules son los pasos para obtener una muestra aleatoria simple.

Paso 1. Definir la poblacin de estudio y el parmetro a estudiar. Paso 2. Enumerar a todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identidad o identificacin. Paso 3. Determinar el tamao de la poblacin, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar. Paso 4. Determinar el tamao ptimo de la muestra para el estudio. Paso 5. Seleccionar los sujetos dela muestra usando nmeros aleatorios.

Ahora, una descripcin de para qu sirve cada uno de estos pasos. 1.-Recuerda que la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qu se estudiar. Ejemplo Un investigador realiza un estudio sobre las relaciones de gnero en el noviazgo, su objeto de estudio son las manifestaciones de violencia fsica y psicolgica entre los (las) estudiantes del ltimo ao de la carrera de qumica. Su poblacin es el total de estudiantes del ltimo ao de ingeniera qumica que tengan novio o novia; el total de individuos con esta caracterstica es de 386. Por lo que, la poblacin es de 386 individuos y las variables son: violencia fsica y violencia psicolgica. 2.- Una vez que has definido la poblacin y las variables a estudiar, es necesario asignar un nmero de identificacin a cada individuo de la poblacin. Siguiendo con el ejemplo de la relaciones de gnero en el noviazgo de los (las) estudiantes de qumica, lo que sigue es numerar a los 386 estudiantes un nmero del 1 al 386. 3.- Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis.

Ahora veamos una definicin de los conceptos implicados en el paso 3.

Definir el tamao de la poblacin. Significa determinar el nmero de individuos que la constituyen; la variable N representa el tamao de la poblacin. N=X Porcentaje de confianza. Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningn clculo) para poder acertar al valor verdadero de la poblacin. Este dato se obtiene a partir de la distribucin normal estndar. Porcentaje de error. Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximacin. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. Variabilidad. Es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere comprobar. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y se indica con p (tambin llamada probabilidad de xito), y el porcentaje con el que se rechaz la hiptesis es la variabilidad negativa, identificada por q (tambin llamada probabilidad de fracaso y se obtiene 1p). Variabilidad positiva=p= a la probabilidad de que suceda el evento Variabilidad negativa=q=a la probabilidad de que no suceda el evento La variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1.Cuando no se tienen antecedentes sobre la investigacin, entonces los valores de variabilidad sonp=q=0.5 4.-Una vez que la poblacin, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamao de la muestra. Puedes calcularlo mediante alguna de las dos frmulas que examinars: una para los casos en que se conoce el tamao de la poblacin y la otra para cuando este dato se desconoce.
Frmula para cuando no se conoce el tamao de la poblacin Frmula para cuando se conoce el tamao de la poblacin

n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa E es la precisin o error Ejemplo: En un lote grande de medicinas, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que P(Z)=0.95 si Z=1.96. Debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, en el caso necesario, hay que convertir esos valores a proporciones.

Sustituyendo: Es decir, se ocupar una muestra de aproximadamente 384 unidades ------------------------------------------------------------------------------------------------------------------------------------.

n es el tamao de la muestra Z es el nivel de confianza p es la variabilidad positiva q es la variabilidad negativa N es el tamao de la poblacin E es la precisin o error Ejemplo: En un lote de 25,000 cajas de medicina, se desea verificar que la proporcin de los ingredientes activos sea el adecuado. Se debe determinar el tamao de la muestra para un nivel de confianza del 95% con un error del 5%. Supn que la variabilidad p=q=0.5. Solucin: Para el nivel de confianza sea igual al 95%, tienes que p(Z)=0.95 si Z=1.96. Sustituyendo:

En otras palabras, se ocupar una muestra de aproximadamente 378 cajas.

5.- El ltimo paso para obtener la muestra es saber qu individuos especficos de la poblacin se tomarn. Para hacer esto debes: 1. Numerar a los individuos de la poblacin del 1 a N (donde N es el tamao de la poblacin). 2. Generar nmeros aleatorios para seleccionar los individuos de la muestra. 3. Tomar los individuos correspondientes a los nmeros elegidos.

Los nmeros aleatorios se pueden generar por diversos mtodos, por ejemplo mediante programas computaciones (por ejemplo en Excel con la funcin =aleatorio()), funciones en calculadora, sacando nmeros de una urna o lanzando una moneda al aire, o bien utilizando tablas de nmeros aleatorios

S-ar putea să vă placă și