Sunteți pe pagina 1din 11

La estadstica, instrumento de investigacin cientfica

Antonio Ramrez Ramrez Doctor en Educacin. Profesor normalista. Ingeniero Industrial. Profesor titular de tiempo completo en la Universidad Pedaggica Nacional, Unidad 141. Profesor de la Normal Superior de Jalisco. Coordinador acadmico del programa de Doctorado en Administracin del Centro de Posgrado en Administracin e Informtica. Especialista en control de calidad y procesos estadsticos. Asesor de tesis de licenciatura, maestra y doctorado en las reas de educacin, ingeniera y administracin. Asesor en el rea de calidad del Consejo Tcnico Estatal de Educacin. Autor de cinco libros en el rea de estadstica, matemticas y calidad. Conferencista a nivel nacional y profesor invitado en diversas universidades del pas. Resumen La estadstica, instrumento de investigacin cientfica tiene como propsito fundamental presentar a los investigadores en todas las ramas del quehacer cientfico, la importancia de la estadstica en los procesos de investigacin. Este trabajo muestra cmo la estadstica apoya el trabajo del investigador desde el planteamiento del problema, la formulacin de la hiptesis y el diseo del tamao de la muestra, as como las tcnicas estadsticas univariables, bivariables, multivariables, y las tcnicas estadsticas no paramtricas para el anlisis de los datos obtenidos en el trabajo de campo. Asimismo, se hace mencin del software estadstico disponible para su aplicacin. Tambin se argumenta cmo el mtodo cientfico encuentra en los mtodos estadsticos una herramienta fundamental para alcanzar sus objetivos. Y cmo la estadstica aporta informacin valiosa a los datos obtenidos de un proceso de investigacin cualitativa con el fin de obtener conclusiones ms asertivas.

Palabras clave: Estadstica, investigacin cientfica, ciencia, tecnologa.

Desarrollo La ciencia y la tecnologa caracterizan el desarrollo de nuestra sociedad actual, debido a que la ciencia es una actividad social principalmente. El desarrollo de la ciencia y la tecnologa ha contribuido a mejorar los niveles de vida, a eliminar epidemias, como: la peste, la polio, la tuberculosis, entre otras enfermedades. La tecnologa es anterior a la ciencia porque sta requiere instrumentos para su desarrollo, como lo son: los telescopios, el microscopio, los calibradores, los micrmetros, el transportador, el gonimetro, entre otros. Actualmente la ciencia y la tecnologa se presentan en una estrecha relacin simbitica. La tecnologa necesita de la ciencia para seguir desarrollando sus mtodos, y la ltima necesita de la primera para la construccin de sus instrumentos. El vnculo entre una y otra aparece claramente al considerar que los avances cientficos y tecnolgicos van de la mano: unos son imposibles sin los otros (Wiesskopf F. V. ,1987:57). Para Bunge (1987), la ciencia es conocimiento racional, sistemtico, exacto, verificable y, por consiguiente, falible. La ciencia tiene como objeto buscar continuamente la demostracin, el argumento, las razones, las cosas y las pruebas de que lo asentado por ella corresponde con la realidad. El mtodo cientfico segn, Alvira (1992: 62) es una referencia y patrn sobre el cual se analizan los problemas y fases de la investigacin. El mtodo cientfico est integrado por la: Teora. Hiptesis. Observacin. Generalizaciones empricas. Y se presenta desde dos perspectivas: a. Desde el aspecto emprico se refiere al uso de los sentidos, tanto en la observacin de los fenmenos como de la experimentacin o manipulacin fsica de ellos. b. El aspecto racional del mtodo cientfico se refiere tanto al uso de la razn en el diseo de hiptesis como a la inferencia de las conclusiones. La investigacin cientfica tiene como finalidad la descripcin, explicacin y prediccin de los fenmenos. Una de las herramientas matemticas fundamentales en la aplicacin del mtodo cientfico es la estadstica.

La estadstica se define como la aplicacin del mtodo cientfico en el anlisis de datos numricos con el fin de tomar decisiones racionales (Berenson y Levine 1987). La estadstica se divide en: a. Estadstica descriptiva. Se define como los mtodos que implican recopilacin, caracterizacin y presentacin de un conjunto de datos con el fin de describir varias de las caractersticas. b. Estadstica inferencial. Se define como aquellos mtodos que permiten hacer estimacin de una caracterstica de la poblacin o de toma de decisiones con respecto a una poblacin basada solo en los resultados obtenidos de la muestra. La ciencia y la tecnologa requieren de la aplicacin del mtodo cientfico para su desarrollo, y la estadstica es una de las herramientas matemticas fundamentales, apoya al investigador en su proceso de indagacin desde la perspectiva de la filosofa analtica en el diseo del: 1. Planteamiento del problema. 2. Operacionalizacin del problema. 2.1 . Formulacin de hiptesis. 2.2 . Operativizacin de conceptos tericos. 2.3 . Definicin de unidades de anlisis. 3. Diseo muestral. 4. Tcnicas de anlisis de datos. El planteamiento del problema de investigacin. Permite al investigador la descripcin de los hechos o situaciones que pueden constituirse en el objeto de estudio para su verificacin o comprobacin. La identificacin del problema de investigacin implica formular las variables e indicadores que lo constituyen con el fin de disear objetivos e hiptesis de investigacin. Un buen planteamiento del problema requiere: a. b. Una relacin entre dos o ms variables. El problema y su formulacin implica la posibilidad de comprobacin emprica.

La estadstica aporta al investigador, en su fase de formulacin del problema, la definicin y clasificacin de los tipos de variables aleatorias que conforman la problematizacin de la investigacin. Una variable aleatoria es aquella en la que sus valores numricos surgen de un proceso de azar o cuando no se puede determinar su valor o no se puede predecir exactamente con anticipacin. Un ejemplo de variable aleatoria es el siguiente: a un investigador de mercados le interesa conocer las preferencias de los jvenes de quince a veinte aos, de ambos sexos, respecto a los programas de televisin. Al investigador no le interesa el nombre de los jvenes, si estudia o no, sino que solamente le

concierne una variable: la preferencia respecto a los programas de televisin. El anlisis estadstico de la informacin se realiza sobre los atributos de las personas, objetos o entidades. Es necesario, en un problema de investigacin, conocer qu tipo de valores tienen las variables en un estudio, porque de esto depende la tcnica estadstica que se aplique al analizar la informacin. Las variables aleatorias se clasifican en dos tipos: variables cualitativas y cuantitativas. Las variables cualitativas reciben el nombre de categricas. Las variables categricas se dividen en nominales y ordinales. Las variables nominales permiten al investigador clasificar o ubicar a cada individuo u objeto en una categora sin importar el orden de los valores de la variable, por ejemplo: el sexo de las personas, su nacionalidad, su origen social, su oficio. Este tipo de variable casi siempre es solicitada por el investigador por medio de un cuestionario. Las variables categricas ordinales se caracterizan porque sus valores tienen un orden, por ejemplo: un investigador desea conocer el orden de preferencia de los jvenes de ambos sexos de los programas de televisin, en este caso los valores que adquiere la variable programas preferidos son: las telenovelas, los musicales, la entrevista, las pelculas y los programas de concursos con las iniciales respectivas: TN, MU, EN, PE, PC. Esta variable programas de preferencia clasifica a los jvenes en cinco categoras. Otro ejemplo es el siguiente: un investigador social requiere conocer la opinin de los ciudadanos respecto al desempeo de sus gobernantes, les aplica un cuestionario que permita conocer la opinin de las personas y les pregunta: est de acuerdo en que el gobierno ha combatido la delincuencia? Las respuestas son las siguientes: Muy en desacuerdo. En desacuerdo. Ni de acuerdo ni en desacuerdo. De acuerdo. Muy de acuerdo

Esta variable clasifica a los ciudadanos que contestaron la pregunta segn la opcin elegida. Las variables cuantitativas se denominan numricas y se clasifican en discretas y continuas. Las variables numricas discretas son aquellas que solo pueden asumir ciertos valores dentro de un intervalo, surgen de un proceso de conteo y solamente pueden tomar valores en la escala de nmeros enteros. Ejemplos de variables numricas discretas son: el nmero de mesas y sillas que se encuentran en un saln de clases, el nmero de accidentes automovilsticos en una ciudad determinada por da, el nmero de estudiantes aceptados en la universidad en un semestre.

Las variables numricas continuas asumen tericamente cualquier valor en algn intervalo de nmeros reales. Ejemplo de este tipo de variables son: la estatura y el peso de las personas. Otro proceso importante en la operacionalizacin de las variables es el proceso de medicin. Se entiende por medicin la asignacin de nmeros a objetos segn determinadas reglas (Glass y Stanley: 1980). Es el proceso de vincular conceptos abstractos a indicadores empricos (Carmines y Zeller, 1979). A continuacin se presenta un esquema de las escalas de medicin utilizadas en un proceso de investigacin.
Escala nominal Caractersticas de medicin Se clasifican los Ejemplos: objetos y las clases se Estado civil. enumeran. Sexo. Lugar de nacimiento Establece una relacin Escala brinell ordenada entre Calificaciones objetos y escolares. acontecimientos. Rangos militares. Orden en las preferencias. Permite colocar los La medicin de la datos en una escala temperatura. numrica continua, en Actitudes. la cual los intervalos Opiniones. entre las partes son iguales. El punto cero de la escala de intervalo es arbitrario y no refleja la ausencia del atributo. Tienen todas las Altura. propiedades de una Peso. escala de intervalo. Temperatura en una Una puntuacin cero escala de grados indica la ausencia de kelvin. la propiedad que se Edades. mide. Tcnicas estadsticas. Porcentajes. Moda. Ji cuadrada. Percentiles. Mediana. Correlacin por rangoorden.

Escala ordinal

Escala de intervalo

Rango. Media. Desviacin estndar. Correlacin de Pearson...

Escala de razn

Todas las tcnicas estadsticas paramtricas.

La operacionalizacin del problema se realiza desde dos vertientes: la tericaanaltica (concepto, constructos y variables de estudio) y la vertiente poblacional que implica el tipo de poblacin en estudio y el diseo del tamao de la muestra representativa. Este proceso de la operacionalizacin del problema de investigacin comprende la formulacin de hiptesis, la operacionalizacin de conceptos tericos y la definicin de unidades de anlisis. Las hiptesis son explicaciones previas acerca de las relaciones entre dos o ms variables sustentadas en la teora y sujetos a su comprobacin emprica. Una hiptesis estadstica es una proposicin sobre los parmetros de una o ms poblaciones.

Una prueba de hiptesis es un procedimiento que conduce a una decisin sobre una hiptesis determinada. El proceso de la prueba de hiptesis depende del uso de la informacin obtenida en una muestra aleatoria de la poblacin objeto de estudio. Si esta informacin es consistente con la hiptesis se concluye que esta es verdadera, en cambio, si la informacin es inconsistente con la hiptesis, se concluye que es falsa. Es necesario destacar que la verdad o falsedad de una hiptesis nunca puede conocerse con certidumbre, al menos que pueda analizarse a toda la poblacin objeto de estudio. En un proceso de prueba de hiptesis estadsticas se establece la hiptesis nula y la hiptesis alternativa. La hiptesis nula siempre expresa el estado actual en la que asegura que no hay diferencias. Esta hiptesis se identifica con el smbolo HO. La hiptesis alternativa se establece como el opuesto de la hiptesis nula y representa la conclusin que se apoya si la hiptesis nula se rechaza, y se identifica con el smbolo H1. La estadstica inferencial cuenta con una serie de pruebas de hiptesis, las ms utilizadas en la investigacin cientfica son: 1. Prueba de hiptesis con una muestra. 1.1. Prueba de hiptesis Z para la media. 1.2. Prueba de hiptesis t para la media. 1.3. Prueba de hiptesis para la proporcin. 2. Prueba con dos muestras y c muestras de datos numricos. 2.1. Comparacin de dos muestras independientes: prueba t para las diferencias entre dos medias. 2.2. Prueba F para las diferencias en dos varianzas. 2.3. Comparacin de dos muestras relacionadas: prueba t para la diferencia en la media. 2.4. Modelo totalmente aleatorio; anlisis de varianza de un factor. La operacionalizacin de conceptos tericos consiste en pasar las variables generales conceptuales a indicadores o ndices. Su objetivo es transformar el concepto terico en un observable. Estos indicadores o ndices se expresan con variables categricas o numricas, las cuales determinan la escala de medicin correspondiente. Con relacin a la definicin de unidades de anlisis o de observacin, se define primero el concepto de poblacin como un conjunto de unidades en las que se desea obtener cierta informacin (Snchez Crespo, 1971). Las unidades de anlisis u observacin pueden ser: personas, familias, escuelas, tornillos y dems objetos o personas. Para obtener el tamao de la muestra de una poblacin determinada se requiere tomar en cuenta los siguientes factores:

1. 2. 3. 4. 5. 6.

El tiempo y los recursos disponibles. Las tcnicas de muestreo. Las tcnicas de anlisis de datos. La estimacin de la varianza. El margen de error mximo posible. El nivel de confianza.

Existen modelos matemticos para obtener el tamao de la muestra, en este caso solo se presentan las ms utilizada. n= n = tamao del a muestra Z =intervalo de confianza. e = error de muestro aceptable. = desviacin estndar. Esta formula se utiliza cuando se desconoce el tamao de la poblacin. Tamao de la muestra para estimar proporciones poblacionales. Cuando el muestreo se hace en una poblacin infinita o en una poblacin finita con reemplazamiento. n= Z2P(1-P) e2 Z22 e2

n = tamao de la muestra Z = nivel de confianza. e = error de muestreo aceptable. P = proporcin del a poblacin que tiene la caracterstica de inters. Cuando el muestreo se realiza sin reemplazamiento en una poblacin finita se utiliza la siguiente formula: n= NZ2Pq (N-1)e2 + Z2Pq

n = tamao de la muestra. N = tamao de la poblacin. p = la proporcin de la poblacin que tiene la caracterstica de inters. q = la proporcin de la poblacin que no tiene la caracterstica de inters. e = error de muestreo aceptable. Z = nivel de confianza deseado. Al terminar el trabajo de campo y la recogida de la informacin se inicia la fase de anlisis e interpretacin de los datos. Actualmente para esta etapa del proceso de investigacin se cuenta con paquetes estadsticos, los ms comunes son: Statistical Package For The Social Sciences (SPSS), el Statistical Anlisis System (SAS), el Biomedical Computer Programs (BMPD), el Minitab y el Statgraphics.

Entre las tcnicas que se usan para sistematizar los datos obtenidos del trabajo de campos se tiene: el diagrama de barras, el histograma, las grficas Steam and Leaf, el diagrama de caja, el polgono de frecuencia, la ojiva, la grfica de sectores, entre otros. Con el fin de describir cmo se agrupan los atributos de una variable alrededor de un valor tpico, se tienen las medidas denominadas de tendencia central, las ms utilizadas son: la media aritmtica, la mediana y la moda. Una vez que se ha calculado el valor tpico de una serie de datos, el investigador desea saber el grado en que los valores difieren de este valor tpico. Para esta situacin se utiliza el trmino de dispersin para describir el grado en que una serie de valores varan respecto a este valor tpico. Las medidas de dispersin ms comunes son: rango, varianza, desviacin estndar y el coeficiente de variacin. El investigador tambin suele utilizar medidas de tendencia no central como los cuartiles, los cuales representan valores que dividen a la distribucin en partes iguales, las ms utilizadas son: Los cuartiles dividen la distribucin en cuatro partes iguales. Los deciles en diez partes iguales. Los percentiles en cien partes. El anlisis bivariante implica la relacin entre dos variables. Las tcnicas ms comunes son el: 1. 2. 3. 4. 5. 6. 7. 8. 9. Anlisis de regresin lineal simple. Medidas de variacin en la regresin. El coeficiente de determinacin. Error estndar de la estimacin. Anlisis residual. Prueba t para la pendiente. Prueba F para la pendiente. Estimacin de intervalos de confianza. Coeficiente de correlacin.

El anlisis multivariable permite el anlisis de ms de dos variables en una muestra de observaciones. Las tcnicas del anlisis multivariante se clasifican en tcnicas de dependencia y tcnicas de interdependencia. Las tcnicas de dependencia permiten al investigador valorar el grado de relacin entre variables dependientes e independientes. Las tcnicas ms utilizadas son: 1. 2. 3. 4. 5. 6. Regresin mltiple. Anlisis conjunto. Anlisis discriminante. Anlisis multivariante de la varianza. La regresin logstica. Correlacin cannica.

Las tcnicas de interdependencia permiten al investigador identificar las estructuras entre una serie de variables, observaciones u objetos definidos. La identificacin de las estructuras entre las observaciones o varias variables permite establecer nuevas relaciones entre ellas, as como analizar la existencia, asociacin o relacin mutua entre variables, sin establecer la diferencia entre las dependientes e independientes, las ms utilizadas son: 1. Anlisis factorial. 2. Anlisis cluster. 3. Anlisis multidimensional. Tambin el investigador tiene a su disposicin las tcnicas de estadstica no paramtricas para el anlisis de los datos. Las pruebas no paramtricas toman solamente en cuenta si ciertos puntajes son ms altos o ms bajos que otros. Una ventaja de estas tcnicas es que pueden usarse cuando los datos experimentales se pueden medir solo a nivel ordinal, es decir, cuando solamente se pueden establecer rangos en orden de magnitud. Adems se aplican a muestras pequeas (se considera muestras pequeas a las menores de 30 datos). Las pruebas no paramtricas ms comunes son: 1. Prueba de Wilcoxon para dos condiciones (datos ordinales y diseos relacionados). 2. Prueba de Mann-Whitney para diseos no relacionados con dos condiciones. 3. La prueba de Friedman, cuando se utiliza tres o ms condiciones en diseos relacionados. 4. La prueba de tendencia L de Page. Cundo se examina la tendencia en tres o ms condiciones en un diseo relacionado. 5. La prueba de Kruskal-Wallis. Cuando se tienen tres o ms condiciones en diseos no relacionados. 6. La prueba de Tendencia de Jonckheere, se utiliza cuando se examina las tendencias en tres o ms condiciones. Se utiliza para diseos no relacionados. Todas las tcnicas estadsticas mencionadas se pueden aplicar utilizando el software estadstico en el anlisis de los datos obtenidos del trabajo de campo. Es indudable que los mtodos estadsticos paramtricos y no paramtricos aportan a la labor del investigador una herramienta valiosa en la aplicacin del mtodo cientfico. El mtodo se caracteriza por: 1. La verificacin del conocimiento puede lograr el establecimiento de la asociacin entre variables por medio de las pruebas de hiptesis. 2. El relativismo del conocimiento. Los resultados de una prueba estadstica solo son vlidos para datos contenidos en la muestra y su posible generalizacin probabilstica a la poblacin de donde se obtuvo la muestra.

3. Acumulacin de conocimiento. El conocimiento cientfico se desarrolla tomando en cuenta el conocimiento previamente construido, por lo que cada nueva investigacin utiliza la estructura tcnica y los datos estadsticos ya existentes. 4. Explicacin y prediccin en el conocimiento. El conocimiento cientfico aporta la posibilidad de explicar los hechos, fenmenos y/o realidad. Tales explicaciones forman parte de la teora. La estadstica por medio de sus tcnicas inferenciales y el diseo experimental coadyuva a la explicacin y prediccin de los fenmenos naturales y sociales. 5. Aplicacin del conocimiento. La utilidad prctica de la ciencia es posible por medio de la tecnologa, la cual construye instrumentos para la solucin de problemas de la vida social y natural. En este aspecto la estadstica tambin contribuye con la aplicacin de los mtodos estadsticos en todas las reas de la ciencia y de la actividad humana en general, por ejemplo: la mercadotecnia, la contabilidad, la ingeniera, la medicina, la educacin, la sociologa y la mejora constante de los procesos industriales para lograr la calidad total, la confiabilidad, la productividad y rentabilidad. Adems en la aplicacin de los procesos administrativos como lo son: la reingeniera, benchmarking, entre otros. Conclusin Es necesario que el investigador de las ciencias sociales y naturales aplique las tcnicas estadsticas en sus procesos de investigacin con el fin de obtener mejores conclusiones al complementarlos con los datos obtenidos de la aplicacin de los mtodos de la investigacin cualitativa.

Bibliografa
Berenson, M et al 2001 Estadstica para administracin. Mxico. Pearson Educacin. Camacho, J. 2003 Estadstica con SPSS para Windows. Mxico. Alfaomega. Catena, A. et al. 2005 Anlisis multivariado. Madrid. Biblioteca Nueva. Cea, M. A. 2001 Metodologa cuantitativa. Madrid. Sntesis. Sociologa. Greene, J. y M. D Oliveira. 1984 Pruebas estadsticas para psicologa y ciencias sociales. Bogot. Norma. Hernndez, R. et al. 2006 Metodologa de la investigacin. Mxico. Mc Graw Hill. Mardones J. 1988 Filosofa de las ciencias humanas y sociales. Mxico. Fontamara. Maxim, P. 2002 Mtodos cuantitativos aplicados a las ciencias sociales. Mxico. Oxford.

S-ar putea să vă placă și