Sunteți pe pagina 1din 49

ANLISIS

DE DATOS CUANTITATIVOS |

Decidir el programa de anlisis de datos que se utilizara Explorar los datos obtenidos en la recoleccin Analizar descriptivamente los datos por variable Visualizar los datos por variable Evaluar la confiabilidad, validez y objetividad de los
instrumentos de medicin utilizados Analizar e interpretar mediante pruebas estadsticas las hiptesis planteadas (anlisis Estadstico Inferencial) Realizar anlisis adicionales Preparar los resultados para presentarlo

Qu Procedimiento se sigue para analizar cuantitativamente los datos?


En la actualidad el anlisis de datos se lleva a cabo por computadora? Se centra en la interpretacin de los resultados de los mtodos de anlisis cuantitativo y no en los procedimientos de calculo?

Esto incluye dos partes o segmentos : -Definiciones de Variables, que a su vez explican los datos (Los elementos de la codificacin tem por tem). -La Matriz de datos. Una vez recolectados los datos, es definir los parmetros de la matriz de datos en el programa e introducir los datos en la matriz.

Seleccionar un programa de anlisis.

Ejemplo de matriz de datos con tres variables Caso 1 2 1 1 Columna 1: (Gnero) 1 1 Columna 2: (color de pelo) Columna 3: (edad) 35 29

3
4

2
2

1
4

28
33

Genero ( 1=masculino y 2 = femenino) Color de cabello ( 1=negro, 2=castao, 3=pelirrojo, 4=rubio) Edad ( dato bruto o crudo en aos)

Statistical Package for the Social Sciences (Paquete Estadstico para las Ciencias Sociales (SPSS)
Es un programa desarrollado por la universidad de Chicago, es uno de los ms difundidos. Contiene todos los anlisis estadisticos y facilita al investigador la recoleccion de datos. El SPSS contiene dos partes que son: a) Vista de variables (definicion de variables y de los datos) b) Vista de los datos (matriz de datos)

Es un paquete que goza de popularidad por su relativamente bajo costo. Incluye un para aprender a utilizarlo y prctico considerable nmero de pruebas estadsticas, y cuenta con un tutorial car; adems, es muy sencillo de manejar. Tipos de estadsticas: Bsicas: descriptivas, correlacin, covarianza, chi-cuadrada Regresin lineal y mltiple Anlisis de varianza (ANOVA) Diagramas de dispersin, pareo, causa-efecto Anlisis multivariado; conglomerado, anlisis factores(validacin), Anlisis distante de correspondencia

Paso 1:
.

Las variables de la matriz de datos son columnas o tems. Las variables de investigacin son las propiedades medidas y que forman parte de la hiptesis o que se pretende describir. En ocasiones las variables de la investigacin requieren un nico tem para ser medidas, pero en otras necesitan varios tems. Cuando solo se precisa de un tem, las variables de la investigacin ocupan una sola columna de la matriz(una variable de la matriz) No confundir las variables de la matriz de datos con las variables del estudio, estn vinculadas pero son distintas

Paso 2:
Ejecutar el Programa En el caso de SPSS y Minitab, ambos paquetes son fciles de usar, pues lo nico que hay que hacer es solicitar los anlisis requeridos seleccionando las opciones apropiadas. Obviamente antes de tales anlisis, se debe verificar que el programa corra o funcione en nuestra computadora.

Paso 3: Explorar los Datos


1. 2. 3. 4. 5. 6. Formulamos la pregunta de investigacion que pretendemos contestar Visualizamos un alcance (exploratorio, descriptivo, correlacional y/o explicativo). Establecemos nuestras hiptesis (o estamos conscientes de que no las tenemos). Definimos las variables Elaboramos un instrumento (conocemos que items miden que variables y que nivel de medicin tiene cada variable). Recolectamos los datos.

Estadstica Descriptiva para cada Variable


La primera tarea es describir los datos, los valores o las puntuaciones obtenidas para cada variable. Por ejemplo si aplicamos a 2112 nios el cuestionario sobre los uso y las gratificaciones que la televisin tiene para ellos.. Para describir estos datos se hace la distribucin de las puntuaciones o frecuencias de cada variable

Qu es una frecuencias?

distribucin

de

Conjunto de puntuaciones ordenadas en sus respectivas categoras. Ejemplo en un estudio entre 200 personas latinas que viven en el estado de california, EE.UU. Se le pregunto: como prefiere que se refieran a usted en cuanto a su origen tnico.

Qu otros elementos contiene una distribucin de frecuencias?


Las distribuciones de frecuencias pueden completarse agregando los porcentajes de casos en cada categora. El porcentaje acumulado constituye lo que aumenta en cada categora de manera porcentual y progresiva (en orden descendente de aparicin de las categoras), tomando en cuenta los porcentajes validos. Las columnas porcentaje y porcentaje valido son iguales (mismas cifras o valores) cuando no hay valores perdidos; pero si tenemos valores perdidos, la columna porcentaje valido presenta los clculos sobre el total menos tales valores.

De qu otra manera pueden presentarse las distribuciones de frecuencias? Especialmente cuando utilizamos los porcentajes,
pueden presentarse en forma de histogramas o graficas de otro tipo.

GRFICO CIRCULAR Cooperacin de todo el personal (o la mayora) para el proyecto de calidad (122= 100%)

Polgono de Frecuencia

Valores medios o centrales de una distribucin que sirven para ubicarla dentro de la escala de medicin. Las principales medidas de tendencia central son tres: Moda, Mediana y media.

Moda: Categora o puntuacin que se presenta con mayor frecuencia. Mediana: Valor que divide la distribucin por la mitad. Mediana refleja la posicin intermedia de la distribucin. Por ejemplo, si los datos obtenidos fueron: 24 31 35 35 38 43 45 50 57 La mediana es 38, porque deja cuatro casos por encima (43, 45, 50 y 57) y cuatro casos por debajo (35, 35, 31 y 24). simplemente se aplica la frmula:

Es el promedio aritmtico de una distribucin y es la medida de tendencia central ms utilizada. Se simboliza como X, y es la suma de todos los valores dividida entre el nmero de casos. Es una medida sensible a valores extremos. Si tuviramos las siguientes puntuaciones: 8 7 6 4 3 2 6 9 8 El promedio sera igual a 5.88.

Medidas de la variabilidad Son intermediacin intervalos que indican la dispersin de los datos en la escala de medicin. Las medidas de la variabilidad ms utilizadas son rango, desviacin estndar y varianza.
Rango Indica la extensin total de los datos en la escala. El rango, tambin llamado recorrido, es la diferencia entre la puntuacin mayor y la puntuacin menor, e indica el nmero de unidades en la escala de medicin que se necesitan para incluir los valores mximo y mnimo.

Se calcula as: XMXm, (puntuacin mayor, menos puntuacin menor). Si tenemos los siguientes valores: 17 18 20 20 24 28 28 30 33 el rango ser: 33 17 = 16. Cuanto ms grande sea el rango, mayor ser la dispersin de los datos de una distribucin.

Promedio

de desviacin de las puntuaciones con respecto a la media que se expresa en las unidades originales de medicin de la distribucin. La desviacin estndar se interpreta como cunto se desva, en promedio, de la media un conjunto de puntuaciones. Varianza Se utiliza en anlisis inferenciales. Es la desviacin estndar elevada al cuadrado y se simboliza S2.

Asimetra y curtoss Estadsticas que se usan para conocer cunto se parece una distribucin a la distribucin terica llamada curva normal o campana de Gauss.
La asimetra es una estadstica necesaria para conocer cunto se parece nuestra distribucin a una distribucin terica llamada curva normal y constituye un indicador del lado de la curva donde se agrupan las frecuencias. La curtosis es un indicador de lo plana o picuda que es una curva.

Una razn es la relacin entre dos categoras. Por ejemplo: Categoras Frecuencia Masculino 60 Femenino 30 La razn de hombres a mujeres es de = 2. Es decir, por cada dos hombres hay una mujer.
Tasa: Es la relacin entre el nmero de casos de una categora y el nmero de observaciones. Una tasa es la relacin entre el nmero de casos, frecuencias o eventos de una categora y el nmero total de observaciones, multiplicada por un mltiplo de 10, generalmente 100 o 1000.

La frmula es: Tasa=

Anlisis estadsticos inferencial


En este paso se analizan las hiptesis a la luz de pruebas estadsticas.

Estadstica inferencial: de la muestra a la poblacin.


Para qu es til la estadstica inferencial?

Con frecuencia, el propsito de la investigacin va ms all de describir las distribuciones de las variables: se pretende probar hiptesis y generalizar los resultados obtenidos en la muestra a la poblacin o universo.
Los datos casi siempre se recolectan de una muestra y sus resultados estadsticos se denominan estadgrafos;

la media o la desviacin estndar de la distribucin de una muestra son estadgrafos. A las estadsticas de la poblacin se les conoce como parmetros.

Estos no son calculados, porque no se recolectan datos de toda la poblacin, pero pueden ser inferidos de los estadgrafos, de ah el nombre de estadstica inferencia.

Recoleccin de los datos en la muestra

Calculo de estadigrafos

Inferencia de los parametros mediante tcnicas estadsticas apropiadas

Poblacin o Universo

Procedimiento de la estadstica inferencial.

Entonces, la estadstica inferencial se utiliza fundamentalmente para dos procedimientos vinculados (Wiersma y Jurs, 2008; Asadoorian, 2008):
a) Probar hiptesis poblacionales. b) Estimar parmetros

Prueba de hiptesis: consiste en determinar si la hiptesis poblacional es congruente con los datos de la muestra.
Una hiptesis se retiene como un valor aceptable del parmetro, si es consistente con los datos. Si no lo es, se rechaza (pero los datos no se descartan).

Distribucin muestral: Es un conjunto de valores sobre una estadstica calculada todas las muestras posibles de una poblacin.

Nivel de significancia: Es un nivel de la probabilidad de equivocarse y que fija de manera a priori el investigador.
Segn Wiersma y Jurs (2008)La probabilidad de que un evento ocurra oscila entre cero (0) y uno (1), donde cero implica la imposibilidad de ocurrencia y uno la certeza de que el fenmeno ocurra. Ejemplo

El nivel de significancia se expresa en trminos de probabilidad (0.05 y 0.0 1) y la distribucin muestral tambin como probabilidad (el rea total de sta como 1.00).

Los resultados posibles al probar hiptesis seran:


1. Aceptar una correcta). hiptesis verdadera (decisin

2. Rechazar una hiptesis falsa (decisin correcta).


3. Aceptar una hiptesis falsa (conocido como error del Tipo II o error beta). 4. Rechazar una hiptesis verdadera (conocido como error del Tipo I o error alfa).

Hay dos tipos de anlisis estadsticos que pueden realizarse para probar hiptesis: los anlisis paramtricos y los no paramtricos.
En una misma investigacin es posible llevar a cabo anlisis paramtricos para algunas hiptesis y variables, y anlisis no paramtricos para otras.

Cules son los supuestos o las presuposiciones de la estadstica paramtrica? 1. El universo tiene una distribucin normal. 2. El nivel de medicin de las variables es por intervalos o razn. 3. Cuando dos o ms poblaciones son estudiadas, tienen una varianza homognea: las poblaciones en cuestin poseen una dispersin similar en sus distribuciones (Wiersma y Jurs, 2008).

Coeficiente de correlacin de Pearson y regresin lineal.


Prueba t. Prueba de contraste de la diferencia de

proporciones.
Anlisis

de varianza unidireccional (ANOVA en un de varianza factorial (ANOVA). de covaranza (ANCOVA).

sentido o oneway).
Anlisis Anlisis

Qu es el coeficiente de correlacin de Pearson? Es una prueba estadstica para analizar la relacin entre dos variables medidas en un nivel por intervalos o de razn. Se simboliza: r. Qu es la regresin lineal? Es un modelo estadstico para estimar el efecto de una variable sobre otra. Est asociado con el coeficiente r de Pearson.

Es una prueba estadstica para evaluar si dos grupos difieren entre s de manera significativa respecto a sus medias en una variable.
Se simboliza: t.

Hiptesis: de diferencia entre dos grupos. La hiptesis de investigacin propone que los grupos difieren de manera significativa entre s y la hiptesis nula plantea que los grupos no difieren signifitivamente. Variables: la comparacin se realiza sobre una variable (regularmente y de manera terica: dependiente). Clculo e interpretacin: el valor t es calculado por el programa estadstico, ya prcticamente no se determina manualmente. La prueba t se basa en una distribucin muestral o poblacional de diferencia de medias conocida como la distribucin t de Student que se identifica por los grados de libertad, los cuales constituyen el nmero de maneras en que los datos pueden variar libremente.

Consideraciones: La prueba t se utiliza para comparar los resultados de una preprueba con los resultados de una posprueba en un contexto experimental.

Al comparar grupos, en este caso con la prueba t es importante determinar el tamao del efecto, que es una medida de la fuerza de la diferencia de las medias u otros valores considerados (Cresweil, 2005; Alhija y Levy, 2009). Resulta ser una medida en unidades de desviacin estndar.

Es una prueba estadstica para analizar si dos proporciones o porcentajes difieren significativamente entre s.
Hiptesis: de diferencia de proporciones en dos grupos. Variable: la comparacin se realiza sobre una variable. Si hay varias, se efectuar una prueba de diferencia de proporciones por variable. Procedimiento e interpretacin: este anlisis puede realizarse muy fcilmente en el programa STATS, subprograma: Diferencia de dos proporciones independientes.

Es una prueba estadstica para analizar si ms de dos grupos difieren significativamente entre s en cuanto a sus medias y varianzas. Hiptesis: de diferencia entre ms de dos grupos. La hiptesis de investigacin propone que los grupos difieren significativamente entre s y la hiptesis nula propone que los grupos no difieren significativamente.
El hecho de que la variable independiente sea categrica significa que es posible formar grupos diferentes. Puede ser una variable nominal, ordinal, por intervalos o de razn (pero en estos ltimos dos casos la variable debe reducirse a categoras).

Por ejemplo: Religin. Nivel socioeconmico (muy alto, alto, medio, bajo y muy bajo). Antigedad en la empresa (de cero a un ao, ms de un ao a cinco aos, ms de cinco aos a 10, ms de 10 aos a 20 y ms de 20 aos).

Anlisis de varianza Prueba estadstica para analizar si ms de dos grupos difieren entre s de manera significativa en sus medias y varianzas. EJEMPLO Hi: Los nios que se expongan a contenidos de elevada violencia televisiva exhibirn una conducta ms agresiva en sus juegos, respecto de los nios que se expongan a contenidos de mediana o baja violencia televisada. Ho: Los nios que se expongan a contenidos de elevada violencia televisiva no exhibirn una conducta ms agresiva en sus juegos, respecto de los nios que se expongan a contenidos de mediana o baja violencia televisada.

Anlisis no paramtricos Cules son las presuposiciones de la estadstica no paramtrica? Para realizar los anlisis no paramtricos debe partirse de las siguientes consideraciones: 1. La mayora de estos anlisis no requieren de presupuestos acerca de la forma de la distribucin poblacional. Aceptan distribuciones no normales. 2. Las variables no necesariamente tienen que estar medidas en un nivel por intervalos o de razn; pueden analizar datos nominales u ordinales. De hecho, si se quieren aplicar anlisis no paramtricos a datos por intervalos o razn, stos necesitan resumirse a categoras discretas (a unas cuantas). Las variables deben ser categricas.

S-ar putea să vă placă și