Sunteți pe pagina 1din 13

2010

UniversidaddeLaHabana. FacultaddeEconoma. Departamentode EstadsticaeInformtica.


Profesora: MSc. Mirielys Miranda Iglesias.

[ELEMENTOSDE ESTADSTICAPARALA INVESTIGACIN.]

ElementosdeEstadsticaparalaInvestigacin.

MATERIAL DE ESTUDIO DE LA ASIGNATURA: Curso Propedutico, Maestra en Gestin de la Informacin.

INTRODUCCIN Este documento tiene el objetivo de brindar los elementos didcticos preliminares al estudiante de la Maestra en Gestin de la Informacin para el curso introductorio, a partir del estudio posterior y a profundidad, de las bondades existentes de modelos matemticos para la medicin de intangibles partiendo sobre la base de la interrelacin de la Teora Cientfica, la inferencia estadstica y el anlisis matemtico.

El mdulo constar de 5 temas fundamentales los cuales se desglosan a continuacin: 1. Mtodos Descriptivos: Donde se analizarn los conceptos relacionados con: Poblacin y muestra. Datos y variables. Clasificacin de las variables: cualitativas, cuantitativas continuas, cuantitativas discretas. Organizacin de los datos y presentacin de la informacin: tablas de frecuencia, diagramas de pastel, grficos de barras, histogramas, ojivas, tablas de contingencia, diagramas de dispersin. 2. Estadgrafos o medidas descriptivas fundamentales. Medidas de posicin: media aritmtica y geomtrica, mediana, moda. Medidas de dispersin: varianza, desviacin estndar, coeficiente de variacin. Medidas de correlacin: covarianza, coeficiente de correlacin. Medidas de porcin: proporcin, tasa. 3. Probabilidades. Definicin clsica y frecuencial de probabilidad. Reglas de clculo de probabilidades asociadas a diferentes sucesos. Eventos excluyentes, exhaustivos, complementarios e independientes. Variables aleatorias y

distribuciones de probabilidad. Valor esperado y varianza de una variable aleatoria. 4. Distribuciones probabilsticas de amplio uso estadstico. Distribuciones de variables discretas: Bernoulli, binomial, hipergeomtrica, binomial negativa y Poisson. Distribuciones de variables continuas: uniforme, normal, exponencial, Chi cuadrado, tStudent y F de Fisher.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina2

ElementosdeEstadsticaparalaInvestigacin.
5. Muestreo y estimacin. Marco muestral. Muestreos probabilsticas v.s muestreos opinticos. Muestreo aleatorio simple, con y sin reposicin. Muestreo estratificado. Muestreo por conglomerados. Estimador y estimacin: Estimacin puntual. Error de estimacin. Distribuciones muestrales. Estimacin por intervalos e intervalos de confianza. Error mximo admitido. Tamao mnimo de muestra. En los ejercicios a utilizar en cada tema se escogern ejemplos temticos del campo de la Gestin de Informacin con el objetivo de evidenciar la gran aplicacin de los contenidos impartidos, as como se utilizar el Excel como software para la interpretacin de los resultados. Por otra parte, el estudiante deber asistir a todas las conferencias para que logre el dominio necesario de todas las herramientas brindadas en el curso, as como desaparezcan las dificultades encontradas a lo largo, de la travesa.

Saludos:

Los profesores: MSc. Manuel Ernesto Acosta Aguilera. MSc. Mirielys Miranda Iglesias.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina3

ElementosdeEstadsticaparalaInvestigacin.
Tema I: Mtodos Descriptivos. El objetivo de este tema es caracterizar y organizar la informacin a partir de la

organizacin, recoleccin, tabulacin, presentacin y reduccin de la informacin, convirtindola de esta manera en datos estadsticos. El estudio de la Estadstica, como ciencia comienza a surgir en el siglo XVI paralelo al desarrollo de las probabilidades. Sus mtodos de anlisis se clasifican en: Mtodos Descriptivos e Inferencia estadstica.

CONCEPTOS BSICOS. 1. Poblacin: Recoleccin del total de individuos o elementos que se presentan en el objeto de estudio, en general se consideran todas las unidades de inters (seres vivos o no). 2. Censo: Estudio y anlisis de todos los elementos que componen la poblacin. 3. Muestra: Cualquier subconjunto de la poblacin, la cual debe escogerse de manera representativa segn las caractersticas propias de la poblacin correspondiente. 4. Muestreo: Procedimiento mediante el cul se extrae una muestra de la Poblacin. 5. Caracterstica: Es el aspecto de inters o el objeto de estudio en la poblacin. Puede clasificarse en Cualitativa o Cuantitativa. i. Cualitativas: Tambin llamadas atributos, y se refieren a cualidades tales como: el color del pelo, de los ojos, el estado civil, nivel escolaridad etc. ii. Cuantitativos: Se refiere a cantidades tales como estatura, peso, ingresos, nmeros de hijos etc. 6. Variables: Es la medicin de la caracterstica cuantitativa, las cuales se pueden clasificar en Discretas y Continuas. i. Variables discretas: Son valores, determinados, definidos y que generalmente representan a observaciones susceptibles de conteo y son valores enteros.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina4

ElementosdeEstadsticaparalaInvestigacin.
ii. Variables continuas: Las que generalmente representan a observaciones susceptibles de medicin y por tanto pueden tomar cualquier valor en un cierto intervalo de los nmeros reales. A partir de la definicin de los conceptos claves se describen a continuacin, los mtodos y estadgrafos descriptivos, objetos de estudio en el siguiente curso, dando inicio al programa a partir de la recoleccin de la informacin y la tabulacin u organizacin de esta, en tablas de frecuencias.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina5

ElementosdeEstadsticaparalaInvestigacin.
PROCESO DE RECOLECCIN, TABULACIN Y ORGANIZACIN DE LA

INFORMACIN A PARTIR DE LA DISTRIBUCIN DE FRECUENCIAS. Para comprender el procedimiento a realizar con los datos recolectados se proceder de la siguiente manera: 1. Clasificar la recoleccin realizada de los datos. Puede clasificarse en Organizada y No organizada atendiendo a: i. Recoleccin simple o no organizada: es decir listado de los datos, presentacin en su forma primaria. ii. Organizados: ordenamiento en tablas: es decir, se leen directamente los valores observados. 2. Construir las tablas de frecuencias atendiendo a la clasificacin de la variable en estudio Discreta o Continua. De esta forma, se determina que en el caso de que las variables sean continuas su tabulacin se realizar a travs de la construccin de clases o intervalos de la propia variable. 3. Determinar el Recorrido y las Frecuencias de la Variable: se entiende en este procedimiento los siguientes objetivos; i. Recorrido: Constituyen los valores que toma la variable objetivo en el caso de la variable discreta constituyen todos lo valores recorridos por la variable y en el caso de las continuas, se denota como R y se calcula a travs, de la diferencia entre el valor mximo y el mnimo obtenido de la variable objetivo. ii. Frecuencias: Constituyen los elementos de anlisis de la informacin. Se clasifican en Frecuencias: Absolutas, Relativas y Acumuladas en dependencia de la informacin que se agrupe. 1. Frecuencias Absolutas: Es el nmero de veces ni que se repite el valor en la variable cumplindose que ni = n, donde n corresponde al total de elementos dentro de una muestra. 2. Frecuencias Relativas: Se denota como fi y constituye el cociente de la Frecuencia Absoluta sobre el Total de la

TemaI.MtodosDescriptivos.ClaseUno.

Pgina6

ElementosdeEstadsticaparalaInvestigacin.
Muestra, en este caso: fi = ni / n. Por lo cual su interpretacin nos brinda la proporcin de veces que se repite el valor de la variable correspondiente en el total de la muestra recogida y siempre se cumple que: fi = 1. Representacin Grfica: Para las frecuencias absolutas y relativas simples, se utiliza como representacin grfica el Histograma y Polgono de frecuencias considerando en la ordenada: ni fi y en la abscisa: los lmites de clases. 3. Frecuencias Acumuladas: Se denotan en letra mayscula y en dependencia de la informacin agrupada debido a que pueden acumularse tanto las frecuencias absolutas como las relativas. Por lo que si se agrupan las frecuencias absolutas entonces se denota la acumulada como Ni y cumple que: N1 = n1, N2 = n1 + n2, N3 = n1 + n2 + n3 y as, sucesivamente hasta Nk=n. Interpretndose como: el nmero de observaciones menores o iguales al Xi. En el caso del las frecuencias relativas se denota como Fi y cumple que: F1 = f1, F2 = f1 + f2, F3 = f1 + f2 + f3, y as sucesivamente hasta Fk = 1 y se interpreta como el % o la proporcin de valores que son menores o iguales al Xi.

Propiedades de las Frecuencias Acumuladas: 1. ni 0 2. 3. 4. , Ni 0 =n =1 0 fi 1; 0 Fi 1

5. Nk = n 6. Fk = 1 7. N1 = n1 por lo cual n1 = N1 < N2 < N3 ...< Nm 8. F1 = f1 por lo cual f1 = F1 < F2 < F3 ...< Fm

TemaI.MtodosDescriptivos.ClaseUno.

Pgina7

ElementosdeEstadsticaparalaInvestigacin.

Representacin Grfica: Para las frecuencias absolutas y relativas acumuladas, se utiliza como representacin grfica la Ojiva, considerando en la ordenada: Ni Fi y en la abscisa: los lmites de clases.

Procedimiento Adicional para la construccin de tablas de Frecuencias para Variables Continuas: Se les denomina intervalos de clases a: las agrupaciones parciales del recorrido de la variable. Generalmente se agrupan las observaciones correspondientes a variables continuas, ya que estas son aquellas que pueden tomar cualquier valor en un intervalo, y prcticamente es imposible considerar todos y cada uno de los valores que toma la variable, como es el caso de la variable discreta. Especficamente, al ser variables continuas su medicin y recoleccin es ms compleja por lo que se regulan seis pasos para el manejo de esta informacin en una tabla de intervalos o clases. 1. Determinar el Recorrido de la variable, R. 2. Definir la cantidad de clases o intervalos pertinentes para la interpretacin de la informacin, el cual se denota k y generalmente, se expresa en funcin de R y n. 3. Determinar la amplitud de las clases, la cual se denota c y se calcula a travs de la razn, c = R / k. En el caso de que k sea una fraccin se aproxima siempre a la unidad inmediata superior. 4. Conformacin de los intervalos o clases: Se forman cada clase comenzando siempre por el X mnimo + c, e incluyendo siempre el lmite superior de cada clase como el lmite inferior de la clase posterior y as sucesivamente hasta que la totalidad de los Xi estn recogidos en intervalos. Ntese que slo se incluirn en una ocasin los valores de Xi iguales a cualquier lmite superior y siempre se agruparan en este intervalo, con el objetivo de no inducir errores de medicin por omisin o duplicidad de la informacin recogida.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina8

ElementosdeEstadsticaparalaInvestigacin.
5. Tarjado: Inclusin de las observaciones en los intervalos correspondientes en cantidades exactas. 6. Determinacin de la marca de la clase: la cual se denota como x y constituye el valor promedio de cada intervalo, es la magnitud a relacionar posteriormente en las medidas descriptivas para el caso de las variables continuas concretamente. Posteriormente de realizar la tabla de intervalos se proceder sin distincin a realizar la correspondiente tabla de Frecuencias.

RESUMEN DE LAS HABILIDADES A EVALUAR:


DISTINGUIR ENTRE UNA OBSERVACIN DISCRETA Y
CONTINUA.

SABER

CONSTRUIR UNA TABLA DE FRECUENCIA

PARA DATOS SIN AGRUPAR

CONOCER

QUE ES UNA CLASE, LMITE DE CLASE, MARCA DE CLASE.

TAMAO DEL INTERVALO

CONSTRUIR UNA TABLA DE FRECUENCIA PARA DATOS AGRUPADOS.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina9

ElementosdeEstadsticaparalaInvestigacin.

A continuacin se realizar un ejemplo para la comprensin de los conceptos brindados hasta el momento, haciendo distincin entre los distintos niveles de organizacin de los datos y la clasificacin de la variable objetivo:

EJEMPLO #1 Se tiene los datos recopilados acerca de la variable X: nmero de visitantes que accedieron diariamente durante 20 das, a la pgina web de la Maestra de GI. 0 10 20 20 10 30 20 10 40 20

40 30 20 00 00 20 20 30 00 30 Generalmente los datos que se organizan en tablas pero no se agrupan, slo a partir de la interpretacin de sus Frecuencias se pueden desglosar la importancia de los mismos. TABLA DE FRECUENCIA O DISTRIBUCION DE FRECUENCIAS. Xi: # de Visitantes Xi 0 10 20 30 40 tarjado //// /// //// /// //// // ni: # de das con similares caractersticas ni 4 3 7 4 2 fi 0.20 0.15 0.35 0.20 0.10 Ni 4 7 14 18 20 Fi 0.20 0.35 0.70 0.90 1.00

Se definir entonces por ejemplo para la interpretacin de las frecuencias absolutas: Interpretacin: "ni" indica las veces que se repite el valor de la variable, as: n1 = 4 indica que hay 4 das de los escogidos para la muestra donde la pgina web de la MGI no fue visitada. n3 = 7 indica que hay 7 das de los escogidos para la muestra donde la pgina web de la MGI fue accedida exactamente por 20 visitantes.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina10

ElementosdeEstadsticaparalaInvestigacin.

Se definir entonces por ejemplo para la interpretacin de las frecuencias relativas: Interpretacin: fi: indican las veces que se repite el valor de la variable pero en porciento. f3 = 0.35 indica que slo en el 35% de los das escogidos en la muestra, la pgina fue accedida por 20 visitantes. f5= 0.10 indica que slo en el 10% de los das escogidos en la muestra, la pgina fue accedida por 40 visitantes. Se definir entonces por ejemplo para la interpretacin de las frecuencias absolutas y acumuladas: Interpretacin: Ni: indican el nmero de observaciones menores o iguales al -esimo valor de la variable. N3 = 14 indica que en 14 das de los escogidos para la muestra, la pgina web de la MGI fue accedida hasta los 20 visitantes. (Como se observa, va acumulando) N5 = 20 indica que en los 20 das escogidos para la muestra, la pgina web de la MGI fue accedida hasta los 40 visitantes. (Como se observa, va acumulando) Se definir entonces por ejemplo para la interpretacin de las frecuencias relativas y acumuladas: Interpretacin: Fi: indican el % del nmero de observaciones menores o iguales al -esimo valor de la variable. H3 = 0.35 indica que en el 35% de los das escogidos para la muestra, la pgina web de la MGI fue accedida hasta 20 visitantes. H5 = 1.00 indica que en el 100% de los das escogidos para la muestra, la pgina web de la MGI fue accedida hasta 40 visitantes.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina11

ElementosdeEstadsticaparalaInvestigacin.

EJEMPLO #2 Los siguientes valores corresponden al presupuesto destinado para I+D en miles de unidades monetarias reflejado en una encuesta realizada en Internet para 50 instituciones. 46 39 34 33 32 36 41 26 32 36 43 28 30 27 32 42 30 31 34 41 28 30 26 21 37 39 25 33 47 28 26 23 30 43 40 36 20 38 38 31 29 30 48 47 23 31 24 38 35 36 A partir de la informacin anterior se puede afirmar que la variable objetivo es CONTINUA, por lo tanto debe agruparse por intervalos para su correcta interpretacin. Condiciones a cumplir: 1. Construir los intervalos de clases, considerando por el investigador a priori la cantidad de intervalos a considerar (K). En este caso se utiliza K=4 2. Determinar el Recorrido de la Variable R= Xmx Xmn= 48-20=28 3. Amplitud de la Clase (C)= R/K = 28 / 4 = 7. 4. Delimitar los Lmites de los Intervalos, Se designar, como lmite inferior del intervalo, por Li-1 y como lmite superior Li. 5. Organizar los datos a partir de la nueva distribucin de intervalos. Se debe comenzar por el menor valor e incluir todos los valores de la variable. 6. Hallar la Marca de la Clase (Xi): Es el promedio de los lmites de las clases. Y ya se est en condiciones de construir la tabla de frecuencia. RECORDAR: cuando una observacin coincide con un lmite de clase, se AGRUPA donde se encuentre dicho valor como el lmite superior. Lj-1 20 27 34 Li 27 34 41 Tarjado IIIII IIIII IIIII IIIII IIIII IIII IIIII IIIII III Xi 23.5 30.5 37.5 ni 10 19 14 fi 10/50 19/50 14/50 Ni 10 29 43 Fi 10/50 29/50 43/50

TemaI.MtodosDescriptivos.ClaseUno.

Pgina12

ElementosdeEstadsticaparalaInvestigacin.
41 48 IIIII II 44.5 7 7/50 50 50/50

Se definir entonces por ejemplo para la interpretacin de las frecuencias: acumuladas n2 = 19. Indica que hay 19 instituciones del total encuestada que destinan como presupuesto para I+D entre 27 y 34 mum.; que 19 instituciones del total encuestada utilizaron como promedio 30.5 mum para el presupuesto de I+D. f2 = 0.20. Indica que el 20% de las instituciones encuestadas destinan como presupuesto para I+D entre 27 y 34 mum.; que el 20% de las instituciones encuestadas utilizaron como promedio 30.5 mum para el presupuesto de I+D.

RECORDATORIO: las frecuencias acumuladas slo se interpretan utilizando el lmite superior del intervalo, nunca se utiliza la marca de la clase. N2 = 29. Indica que 29 de las instituciones encuestadas destinan como presupuesto para I+D HASTA 34 mum. H2= 0.58. Indica que el 58% de las instituciones encuestadas destinan como presupuesto para I+D HASTA 34 mum.

TemaI.MtodosDescriptivos.ClaseUno.

Pgina13

S-ar putea să vă placă și