Sunteți pe pagina 1din 66

ANÁLISIS DE

LA
INFORMACIÓN

SEMINARIO DE TÍTULO
.
Según Hernández Sampieri( 2014):
Los propósitos centrales del análisis cualitativo son:
1) explorar los datos, 2) imponerles una estructura
(organizándolos en unidades y categorías), 3)
¿Cuál es el describir las experiencias de los participantes según
su óptica, lenguaje y expresiones; 4) descubrir los
propósito del conceptos, categorías, temas y patrones presentes
en los datos, así como sus vínculos, a fin de
analizar? otorgarles sentido, interpretarlos y explicarlos en
función del planteamiento del problema; 5)
comprender en profundidad el contexto que rodea a
los datos, 6) reconstruir hechos e historias, 7)
vincular los resultados con el conocimiento
disponible y 8) generar una teoría fundamentada en
los datos . (p.418)
Hernández Sampieri, R., Fernández Collado, C., & Baptista Lucio, P. (2014). Metodología de la investigación: Roberto Hernández Sampieri, Carlos Fernández Collado y Pilar Baptista Lucio (6a. ed. --.). México D.F.:
McGraw-Hill.
¿Qué es una análisis de información?
•Identificación de información desde los datos
obtenidos, los cuales son relevantes para la información

Cuestionamientos •Estructuración
•Proceso
¿qué me dicen los datos? ¿Cuáles son de datos no
Complejo
las ideas generales? estructurados

•Profundización -> Rol del


en la comprensión Investigador –
de los fenómenos Investigadora
¿Cómo se analizan?

HERMENÉUTICA

SISTEMATIZACIÓN DE LOS DATOS

(1) Osses Bustingorry, Sonia, Sánchez Tapia, Ingrid, & Ibáñez Mansilla, Flor Marina. (2006). INVESTIGACIÓN CUALITATIVA EN EDUCACIÓN: HACIA LA GENERACIÓN DE TEORÍA A
TRAVÉS DEL PROCESO ANALÍTICO. Estudios pedagógicos (Valdivia), 32(1), 119-133. https://dx.doi.org/10.4067/S0718-07052006000100007

(2) Bonilla-García, Miguel Ángel, & López-Suárez, Ana Delia. (2016). Ejemplificación del proceso metodológico de la teoría fundamentada. Cinta de moebio, (57), 305-
315. https://dx.doi.org/10.4067/S0717-554X2016000300006
(Más utilizada) Abierta
este tipo de codificación proporciona investigador la posibilidad de
TEORÍA(STRAUSS
FUNDAMENTADA
Y CORBIN, 2002)
analizar y establecer códigos primarios, los cuales se van agrupando
en la medida que se van conociendo más fenómenos del contexto
(Flick, 2004).

• Relación del Investigador con el contexto de Teórica


investigación (Interpretación – Subjetividad) según la interpretación de Cuñat (S/A), busca establecer vínculos
entre códigos de carácter sustantivo para posteriormente agruparlos
• Técnica Flexible ( Re-flexión –No lineal) en otros de carácter teórico global.

(Interacción de los datos)


Axial
• Hallazgos nacen desde los datos recogidos para Flick (2004). en esta etapa el investigador se puede posicionar
para el análisis de los datos en las categorías de corte deductivas,
como también inductivas para establecer relaciones entre las
(sistematización) unidades ya existentes de la primera etapa de codificación abierta,
basándose en el fundamento epistemológico paradigmático de esta
• Construcción de Teoría investigación

• Recolección – Codificación – Análisis


Selectiva
en este caso se clasifican las categorías bajo unidades de análisis
superiores o globales, que permiten describir a grandes rasgos la
orientación de los resultados (Flick, 2004).
¿Cómo se analizan?
CODIFICACIÓN
(descriptivos-
Sistematización interpretativos-
de la Información Inferenciales
(posterior a los
…Trabajo de ( anteriores))
Analizar…
campo Capturar Códigos Previos
Transcribir y/o Códigos
ordenar )
Inductivos)
Creación de
esquemas
Obtención de la
información

Capturar,
transcribir y
ordenar la
¿Cómo
información
procesar la
Unidades de
información?
Análisis

Categorización
Codificación
Generación de
teorías, hipótesis ,
explicaciones.
Integrar la
información
¿Qué es la codificación?

Agrupación de información
Ideas y conceptos
Construcción de categorías
similares

El reto es simplificar y encontrarle


sentido a toda la complejidad
Simplificación Complejidad contenida en las notas de campo y
las transcripciones textuales
(Patton, 2002)
Tipos y Creación de Códigos
Descriptivos
Interpretativos Inferenciales
TIPOS (Descripción
(Tipo de (Razones de la
de la
motivación) motivación)
motivación)

CREACIÓN Inductivos Deductivos


¿Cómo
genero
categorías
o códigos ?
Revidar
página 423
Figura 14.7
Hernández Sampieri, R., Fernández Collado, C., &
Baptista Lucio, P. (2014). Metodología de la
investigación: Roberto Hernández Sampieri, Carlos
Fernández Collado y Pilar Baptista Lucio (6a. ed. --
.). México D.F.: McGraw-Hill.
Presentación de
los datos
https://www.qsrinternational.com/nvivo/trial/trial-spanish

PRUEBA DE 14 DÍAS
https://www.youtube.com/watch?v=ac9pat0lrwY&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=1
https://www.youtube.com/watch?v=wjn8B-aSFaE&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=2
https://www.youtube.com/watch?v=N27LAd906yM&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=3
https://www.youtube.com/watch?v=DjEj-i0dcUs&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=4
https://www.youtube.com/watch?v=neci7LTwH_8&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=5
https://www.youtube.com/watch?v=neyEPrRH_oQ&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=6
https://www.youtube.com/watch?v=930FCVu9_7M&list=PLqa9sWT4AAMdfN85YBmvjiUoqsVs9rt5m&index=
7
RÚBRICA DE ANÁLISIS CUALITATIVO
Ejercicio a

Explica la sistematización de la información de acuerdo a autores (ESQUEMA DE PROCESO CON EL CUAL 2: Logrado
DESARROLLASTE EL ANÁLISIS- DEBES CONTEXTUALIZAR) 1: Medianamente logrado
0: No logrado
Organiza y prepara la información para el análisis Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 2: Logrado
1: Medianamente logrado
0: No logrado
Identifica unidades de análisis 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Desarrolla la codificación de la información: categorías y códigos 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Describe las categorías y códigos 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Realiza una codificación axial de las categorías 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Describe las relaciones entre categorías y códigos 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Genera una hipótesis, explicaciones y teoría (fundamentada en autores pertinentes a la temática de análisis) 2: Logrado
Y RESPONDE A LA SIGUIENTE PREGUNTA ¿Cómo lo hice? 1: Medianamente logrado
0: No logrado
Ejercicio b
Explica los principios de la teoría Fundamentada 4: Logrado
2: Medianamente logrado
0: No logrado
Explica los procesos de análisis de la teoría Fundamentada 4: Logrado
2: Medianamente logrado
0: No logrado
https://www.researchgate.net/publication/259009027_Metodos_y_
tecnicas_cuantitativas_de_analisis_en_la_investigacion_educativa
Estadística

Introducción
Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

ORGANIZAR Y RESUMIR

Tema de Investigación ESTADÍSTICA DESCRIPTIVA


-Antecedentes Previos (Tablas, Gráficos, Medidas
-Objetivos Descriptivas, etc.)
-Preguntas de Investigación
-Posibles Hipótesis INTERPRETACIÓN
-Unidad de Análisis
-Población Muestra
¿Población o Muestra?
-Variables
INFERENCIA ESTADÍSTICA
Población

CONCLUSIONES

Probabilidad
INFORMACIÓN

28
Estadística

Introducción
Ejemplos de algunos problemas a estudiar

1) Se quiere estudiar si en cierto colectivo existe discriminación salarial debida al sexo de


la persona empleada.

2) Se quiere determinar el perfil de los trabajadores en términos de condiciones


económicas y sociales en diferentes comunidades.

3) Se quiere estudiar el consumo de las personas de una zona determinada en cuanto a


vestuario, alimentación, ocio y vivienda.

4) Se quiere determinar las tallas estándar en vestuario para mujeres españolas.

5) Se quiere determinar el tiempo que dedican al trabajo y a la familia los trabajadores de


distintas empresas del país.

6) Se quiere determinar el perfil sociodemográfico de los estudiantes de una Universidad.

7) Se quiere estudiar el gasto en teléfono móvil mensual de los estudiantes de una


Universidad, y si éste tiene alguna relación con su edad u otras características.

29
Estadística

Resumen de algunos conceptos planteados en la Introducción

• VARIABLE: es lo que se va a medir y representa una característica de la UNIDAD DE ANÁLISIS.


• ¿QUIÉNES VAN A SER MEDIDOS?: Los sujetos u objetos o Unidades de Análisis de una
Población o una Muestra

• POBLACIÓN : Es el total de unidades de análisis que son tema de estudio.

• MUESTRA: Es un conjunto de unidades de análisis provenientes de una población.

Población: Muestra
“Las personas que trabajan
en empresas de
Muestra: 60 trabajadores de empresas de comunicación
comunicación” Unidad de análisis: Trabajador de empresa de comunicación
Variables: sexo, edad, salario, Nº de horas de trabajo, etc.

30
Estadística

Variable: corresponde a la característica de la Unidad de Análisis

TIPOS DE VARIABLES
Variables Cuantitativas Variables Cualitativas
CONTINUA DISCRETA NOMINAL ORDINAL
Intervalo

Toma valores enteros Característica o cualidad


Ejemplos: Número de Hijos, Número de cuyas categorías no tienen
empleados de una empresa, Número de un orden preestablecido.
asignaturas aprobadas en un semestre, etc. Ejemplos: Sexo, Deporte
Favorito, etc.
Toma cualquier valor dentro de un intervalo
Ejemplos: Peso; Estatura; Temperatura, etc. Característica o cualidad cuyas
categorías tienen un orden
preestablecido.
Ejemplos: Calificación (S, N, A);
Grado de Interés por un tema, etc.

Unidad de Medida: Gramos o Kilos para la variable Peso; Grados C o F para Temperatura 31
Estadística

Frecuencia: desde un conjunto de unidades, corresponde al Número o Porcentaje de veces que se


presenta una característica.

Variable Variable Variable Variable


Cuantitativa Cualitativa Cualitativa Cuantitativa

CONTINUA NOMINAL NOMINAL CONTINUA

DISCRETA ORDINAL ORDINAL DISCRETA

Frecuencia Absoluta (F) Frecuencia Relativa (f)


TIPO FRECUENCIA
Frecuencia Absoluta Frecuencia Relativa
Acumulada (FAA) Acumulada (fra)

32
Estadística

Problema de Investigación: Se quiere establecer el perfil de las industrias de


EJEMPLO conserva en función de algunas características.
Unidad de Análisis: Industria de Conserva
Población: Industrias de Conservas del país

Variables
- Tipo de Industria: se clasifica en industria tipo A, B, C o D. (cualitativa nominal)
- Nº de Empleados: se refiere al número de empleados en las líneas de producción. (cuantitativa discreta)
- Superficie: se refiere a los metros cuadrados (unidad de medida) disponibles para las áreas de
producción. (cuantitativa continua)
- Calificación: calificación realizada por una institución pública sobre cumplimiento de ciertos estándares
(Muy Bien, Bien, Regular, Mal). (cualitativa ordinal)

Datos
Industria nº Tipo Nº Empleados Superficie Calificación
1 A 100 1000,6 Muy Bien
2 B 150 1200,4 Bien
. . . . .
. . . . .
. . . . .
299 D 250 800,3 Mal
300 C 300 4000,2 Regular

33
Estadística

Problema de Investigación: Se quiere establecer el perfil de las industrias de conserva en


EJEMPLO función de algunas características.
Unidad de Análisis: Industria de Conserva
TABLAS DE Población: Industrias de Conservas del país
FRECUENCIA

Tipo de Frecuencia Frecuencia Porcentaje Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Industria Absoluta (Fj) Relativa (fj) (%) Calificación Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
A Muy Bien
B Bien
C Regular
D Mal 300 1 (o 100)
Total 300 1 100 Total 300 1 (o 100) (2)
(1) Numero de Frec. Frec.Relativa Frec. Absol. Frec. Relat.
Empleados Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<100
[100-150[
. (3)
.
[950-1000] 300 1 (o 100%)
Total 300 1 (o 100%)
Superficie Frec. Frec.Relativa Frec. Absol. Frec. Relat.
(mt2) Absoluta (Fj) (fj) o % Acum. (FAAj) Acum. (fraj) o %
<200
(4) [200-400[
.
.
[50000-5200] 300 1 (o 100%)
Total 300 1 (o 100%)
34
Estadística

Elementos de una tabla de frecuencia cuando la variable es continua (x)

Centro
Intervalo de clase Amplitud F f FAA fra
[LI1 ; LS1 [
I1 c1 a1
[LI2 ; LS2 [ I2 c2 a2
.
.
[LIk ; LSk] Ik ck ak n 1
Total n 1

cj = (LIj) + LSj )/2 aj = (LSj – LIj))

35
Estadística

Ejercicio: confección de una tabla de frecuencia para una variable continua

Los datos corresponden a la edad de los hijos de los


trabajadores de una empresa
10,5 10,7 9,5 10,5 11,8 11,2 Realice la siguiente actividad
12,0 10,3 13,5 12,3 10,6 9,8 1) Construya un Diagrama de Tallo y Hoja
10,7 11,5 11,1 10,6 9,3 12,9 2) ¿Cuál es la variable?; ¿Cuál es la Unidad de
10,4 7,5 10,2 8,7 10,9 9,9 análisis?; ¿Cuánto vale n?; ¿Cuál es el rango
11,7 10,3 10,6 10,5 11,9 11,0 de la variable?.
13,9 10,6 10,0 10,8 10,6 -
3) Sobre una Tabla de frecuencia: ¿Cuántos
intervalos podría construir?; ¿Cuál es la
7,3 8,0 8,5 12,5 9,7 -
amplitud de cada intervalo?; ¿Cuántas
Datos ordenados de menor a mayor medidas de frecuencia puede obtener para
cada intervalo?.
7,3 9,7 10,4 10,6 11,1 12,3 4) Construir tabla de frecuencia para la
7,5 9,8 10,5 10,6 11,2 12,5 variable: Intervalos, centro de clase,
8,0 9,9 10,5 10,7 11,5 12,9 amplitud, frecuencias.
8,5 10,0 10,5 10,7 11,7 13,5
8,7 10,2 10,6 10,8 11,8 13,9
9,3 10,3 10,6 10,9 11,9 - Diagrama de Tallo y Hoja: permite organizar los
9,5 10,3 10,6 11,0 12,0 -
datos de una variable medida sobre un conjunto de
individuos. Su utilidad viene dada cuando no
contamos con herramientas automáticas para
ordenar los datos.

36
Estadística

TIPOS DE GRÁFICOS 1. Gráfico de Sectores Circulares (de Torta)

Distribución de las unidades de


análisis de acuerdo a variable 1
Distribución de las unidades de análisis de
acuerdo a variable 1 D
10% A
20%

C
D A 40% B
10% 20% 30%

Distribución de las unidades de


análisis de acuerdo a variable 1
C B
40% 30%
D A
10% 20%

C
B
40%
30%

37
Estadística

TIPOS DE GRÁFICOS 2. Gráfico de Barras

Numero de unidades de análisis Proporción de unidad de análisis de acuerdo a


variable 1
de acuerdo a variable 1

D
500

variable 1
400 C
300

B
200

100 A

0
0 0,2 0,4 0,6 0,8 1
A B C D
Proporción de unidad de análisis
variable 1
-Este tipo de gráfico se utiliza generalmente para
Porcentaje de unidad de análisis de acuerdo a representar la frecuencia de las categorías de una
variable 1
variable cualitativa.
-Cuando una variable es cuantitativa se puede utilizar
D
este tipo de gráfico sólo si la variable se ha
variable 1

C transformada en categorías.
B
-Hay distintas versiones de estos gráficos (por ejemplo
en Excel), y en algunos casos son muy útiles para
A
describir el comportamiento de una variable en distintos
0 20 40 60 80 100 grupos.
% unidad de análisis

38
Estadística

TIPOS DE GRÁFICOS 3. Histograma


Histograma
Distribución de los hijos de trabajadores de Histograma
la empresa de acuerdo a edad - Permite la representación de
15
la frecuencia de una variable
Cuantitativa.
- El eje x se refiere a la

Frecuencia
10

variable.
5
- El eje y se refiere a la
frecuencia (Nº , %).

0
- Cada barra representa la
7 8 9 10 11 12 13 14 frecuencia de la variable en la
edad
edad población en estudio (o la
muestra).
Ejemplo
En el gráfico se puede observar el número de -El histograma se puede
hijos , de menor edad (7-8 años), las de mayor construir desde los datos de la
edad (13-14 años); y además que la mayoría de tabla de frecuencia de la
hijos de los trabajadores están entre los 10 y 12 variable en estudio.
años.

39
Estadística

TIPOS DE GRÁFICOS 5. Polígono de Frecuencia

Distribución de los hijos de trabajadores de


la empresa de acuerdo a edad
15
-Esta representación se basa en
el Histograma.
Nº Frecuencia -Sólo es útil para variables
10

edad
cuantitativas.
-El eje x se refiere a la
5
variable.
- El eje y se refiere a la
0 frecuencia (Nº , %).
7 8 9 10 11 12 13 14
-Los puntos que permiten la
edad
unión de las líneas representa
el centro de clase (o marca de
clase).

40
Estadística

TIPOS DE GRÁFICOS 5. Diagrama de Caja

Edad de las personas que se realizaron


angioplastía entre 1980 y 2000
100

90

80

70

60 - Permite identificar gráficamente la


mediana, los cuartiles 1 y 3
Edad

50
(percentiles 25 y 75), mínimo y
40 máximo de una variable.
30 - Sólo es útil para variables
cuantitativas.
20 -El eje x permite identificar la
10 poblacion en estudio.
0 - El eje y representa los valores de la
N= 584 1473 variable en estudio.
Mujeres Hombres

41
Estadística

TIPOS DE GRÁFICOS 6. Otros

Número de alumnos matriculados en la Número de alumnos matriculados en la


Carrera A según año de ingreso Carrera B según año de ingreso

100 100
Nº de alumnos

Nº de alumnos
80 80
60 60
40 40
20 20
0 0
1998 1999 2000 2001 2002 2003 1998 1999 2000 2001 2002 2003
año de ingreso año de ingreso

Número de alumnos matriculados en las Carreras


según año de ingreso
Nº de alumnos
200

Nº de alumnos
año de ingreso Carrera A Carrera B
1998 60 80 150
1999 55 70
100
2000 80 50
2001 40 60 50
2002 68 50
2003 70 75 0
1998 1999 2000 2001 2002 2003

Carrera B año ingreso


Carrera A
42
Estadística

-Media Aritmética (Promedio)


-Mediana
MEDIDAS DE TENDENCIA CENTRAL
-Moda

Datos Cuantitativos Datos Cuantitativos ordenados de menor a mayor


x x Mediana
x1 x(1)
Media Aritmética o Promedio M E  x( k ) Si n es impar
x2 n x( 2)
 xi ME 
x( k )  x( k 1) Si n es par
 x i 1  2
xn n x (n )
x( k )  dato del centro

Datos Moda
Cualitativos y Cuantitativos M o " el dato que más se repite"

43
Estadística

-Percentil (ejemplo: 25, 50, 75)


Percentiles, Deciles o Cuartiles -Decil (ejemplo: 4, 5, 8)
-Cuartil (ejemplo: 1, 2, 3)

Percentil, Decil o Cuartil: corresponde al valor que toma la variable (cuantitativa), cuando los n datos
están ordenados de Menor a Mayor
El Percentil va de 1 a 100
El percentil 25 (25/100): es el valor de la variable que reúne al menos el 25% de los datos
Ejemplo: Si N=80, el 25% de 80 es 20; por lo tanto, se busca el dato que este en la posición 20.
Si N=85, el 25% de 85 es 21,25; por lo tanto se busca el dato que este en la posición 22.

El Decil va de 1 a 10
El Decil 4 (4/10): es el valor de la variable que reúne al menos el 40% de los datos
Ejemplo: Si N=80, el 40% de 80 es 32; por lo tanto, se busca el dato que este en la posición 32.
Si N=85, el 40% de 85 es 34; por lo tanto se busca el dato que este en la posición 34.

El Cuartil va de 1 a 4
El Cuartil 3 (3/4): es el valor de la variable que reúne al menos el 75% de los datos
Ejemplo: Si N=80, el 75% de 80 es 60; por lo tanto, se busca el dato que este en la posición 60.
Si N=85, el 75% de 85 es 63,75; por lo tanto se busca el dato que este en la posición 64.

44
Estadística

-Rango
-Varianza
MEDIDAS DE DISPERSIÓN
-Desviación Estándar

Datos Cuantitativos Varianza


x Rango n n
1 n
x1 
R  max( xi )  min( xi ) s 2  i 1
( xi  x )  2
x  ( xi ) 2
2
i
1 n 2
  xi  x 2
n i 1
 i 1
x2 n n n i 1

Desviación Típica o Estándar
xn
s  s2

Comparación entre Variables


Se refiere al comportamiento de las variables cuantitativas en un Coeficiente de Variación
grupo. Por ejemplo: Si se tiene un conjunto de personas a las que se s
les mide Estatura, Peso, Edad: Entre estas variables ¿cuál presenta cv 
mayor variación? x
45
Estadística

-Asimetría
Otras medidas o Coeficientes -Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis.

 (x
i 1
i  x)3 Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA  Si CA>0 si la distribución es asimétrica a la derecha
n  s3

 ( xi  x ) 4
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
i 1
Coeficiente de Apuntamiento CAp  nombre de mesocúrtica.
n  s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

46
Estadística

-Asimetría
Otras medidas o Coeficientes -Kurtosis o Apuntamiento

Ejemplos Histogramas con distinta asimetría y apuntamiento

14 30 6

12 5

10
20 4

8
3

10 2
4

1 Desv. típ. = 2,42


2 Desv. típ. = 1,67 Desv. típ. = ,64
Media = 3,9 Media = 0,0 Media = 5,2

N = 30,00 N = 30,00 0 N = 28,00


0 0
1,0 2,0 3,0 4,0 5,0 6,0 7,0 -1,0 0,0 1,0 2,0 1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0

V2 V4 V5

47
Estadística

-Asimetría
Otras medidas o Coeficientes -Kurtosis o Apuntamiento

Ejemplos

Datos Histograma Medidas descriptivas


16

1 4 4 Media 3,9
14
1 4 4 Mediana 4

1 4 5
12 Moda 4

2 4 5 10
Desviación estándar 1,67

2 4 6 Varianza de la muestra 2,78


8
2 4 6 kurtosis -0,43
6
2 4 6 Coeficiente de asimetría -0,02

3 4 6 4 Rango 6

3 4 7 Desv. típ. = 1,77 Mínimo 1


2
Media = 5,4
4 4 7 Máximo 7
0 N = 66,00
1,0 2,0 3,0 4,0 5,0 6,0 7,0 8,0 9,0 Cuenta 30

V1

48
Estadística

Media, Desviación típica, Coeficientes de Asimetría y Apuntamiento para


datos Agrupados (tabla de frecuencias)

Tabla de frecuencia (para variable cuantitativa) 2) La Desviación típica para datos


Centro agrupados esta dada por:
Intervalo de clase Amplitud F f FAA fra
k

 (c
n1 f1
I1 c1 a1
sc  j  xc ) 2 f j
I2 c2 a2 n2 f2 j 1
.
.    
Ik ck ak nk fk n 1 3) El Coeficiente de Asimetría para datos
Total n 1
agrupados esta dado por:
k

Sea cj la marca de clase (o centro de clase) y fj la  (c


j 1
j  xc ) 3 f j
frecuencia relativa de la clase j, donde j=1, 2,…, k. CAc 
s c3
1) La Media para datos agrupados es igual a la
suma de los productos de las marcas de clase 4) El Coeficiente de apuntamiento para
por sus frecuencias relativas, de la forma: datos agrupados esta dada por:
k

 (c  xc ) 4 f j
k
Media c  xc   c j f j j 1
j
j 1 CApc 
s c4

49
Estadística

Descripción de 2 variables cualitativas

Problema Distribución conjunta


Interesa estudiar cual es el Tabla 1 Actividad
principal medio de transporte Transporte Estudia Pensionado Trabaja
preferido por un grupo de
personas a la hora de dirigirse Autobus 5 7 0
al centro comercial. Bicicleta 3 3 2
Caminar 2 5 2
Para esto se consultó a cada
Coche 5 4 5
persona sobre la actividad a la
que se dedicaba y el medio de Metro 6 7 4
transporte preferido.
Transporte Nº %
Autobus 12 20,0 Actividad Nº %

Bicicleta 8 13,3
Estudia 21 35,0

Caminar 9 15,0
Pensionado 26 43,3

Coche 14 23,3
Trabaja 13 21,7

Metro 17 28,3
TOTAL 60 100

TOTAL 60 100

50
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas

Tabla 2 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
Bicicleta 3 3 2 8
Caminar 2 5 2 9
Coche 5 4 5 14
Metro 6 7 4 17
TOTAL 21 26 13 60

Actividad: confeccionar tabla con porcentajes respecto del total de personas (n=60)

51
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Transporte

Tabla 3 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 41,7 58,3 0 100
Bicicleta 3 3 2 8
% 37,5 37,5 25 100
Caminar 2 5 2 9
% 22,2 55,6 22,2 100
Coche 5 4 5 14
% 35,7 28,6 35,7 100
Metro 6 7 4 17
% 35,3 41,2 23,5 100
TOTAL 21 26 13 60
% 35 43,3 21,7 100

52
Estadística

Descripción de 2 variables cualitativas

Distribución conjunta
Nº de personas y % respecto de tipo de Actividad

Tabla 4 Actividad

Transporte Estudia Pensionado Trabaja TOTAL


Autobus 5 7 0 12
% 23,8 26,9 0 20
Bicicleta 3 3 2 8
% 14,3 11,5 15,4 13,3
Caminar 2 5 2 9
% 9,5 19,2 15,4 15
Coche 5 4 5 14
% 23,8 15,4 38,5 23,3
Metro 6 7 4 17
% 28,6 26,9 30,8 28,3
TOTAL 21 26 13 60
% 100 100 100 100

53
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL - Correlación Cuantitativos

x
x1 Recordemos que: Hasta ahora hemos estudiado las medidas tendencia
central (Media, Mediana, Moda) y dispersión
x2 (Varianza y Desviación Estándar) para una Variable
 Cuantitativa (x).
xn

Covarianza: Es una medida de Variabilidad Conjunta entre dos variables (x1 , x2) o bien (x , y)

1 n
x y cov( x , y )   ( xi  x )( yi  y )
y( 1 )
n i 1
x(1)
Si Cov(x,y) es positiva: la asociación entre x e y es directamente proporcional, es
x( 2 ) y( 2 )
decir que cuando x aumenta y también aumenta; y viceversa.
  Si Cov(x,y) es negativa: la asociación entre x e y es inversamente proporcional,
x(n ) y( n ) es decir que cuando x aumenta y disminuye; y viceversa.
Si Cov(x,y) es cero: no existe asociación entre x e y.

54
Estadística

- Covarianza Datos
MEDIDAS DE ASOCIACIÓN LINEAL - Correlación Cuantitativos

Correlación: Se refiere al grado de asociación entre dos variables (x1 , x2) o bien (x , y)
Coeficiente de Correlación de Pearson (r): Mide el grado de Asociación Lineal entre
dos variables Cuantitativas
n
 xi yi  nxy
x y
cov( x , y )
x(1) y( 1 ) r 1  r  1
sx s y r  i 1
x( 2 ) y( 2 ) ( n  1 )s x s y
  Si r es positivo: la asociación entre x e y es directamente proporcional, es decir que
x(n ) y( n ) cuando x aumenta y también aumenta; y viceversa. Si r=1: la asociación lineal es
perfecta.
Si r es negativo: la asociación entre x e y es inversamente proporcional, es decir
que cuando x aumenta y disminuye; y viceversa. Si r=-1: la asociación lineal es
perfecta.
Si r es cero: no existe asociación entre x e y.

55
Estadística

EJEMPLO : Representación gráfica de las variables x e y

r=1 r=-1

56
Estadística

Datos Cuantitativos

REGRESION LINEAL SIMPLE


Objetivo 1 Objetivo 2
Determinar si dos variables están x y Estudiar si los valores de una
asociadas y en qué sentido se da la x(1) y( 1 ) variable pueden ser utilizados para
asociación. predecir el valor de la otra
x( 2 ) y( 2 )
 
x(n ) y( n )
Determinar si existe relación Estudiar la dependencia de una
entre las variables x e y: variable respecto de la otra:
Coeficiente de Correlación Modelo de Regresión
Términos
Variable Respuesta (=variable dependiente)
Variable Explicativa (=variable Independiente)
Relación Lineal (modelo lineal)
Parámetros (intercepto y pendiente)
Intercepto (respuesta media)
Pendiente (efecto de la variable explicativa sobre la respuesta)
Error (residuo)
57
Estadística

Datos Cuantitativos
REGRESION LINEAL SIMPLE
x y
x(1) y( 1 ) Notación
x( 2 ) y( 2 ) Variable Respuesta: y
Variable Explicativa: x
 
y( n ) Modelo de Regresión Lineal Simple: yi=+xi+ei
x(n )
Intercepto: 
Pendiente: 
Error: e
Modelo Estimado
(recta de regresión) Método de Estimación: Mínimos Cuadrados
a  y  bx
n n n
yˆ  a  bx
Residuos o Errores
n xy   xi  y i ei  y i  yˆ i
b i 1 i 1 i 1
2
n
 n 
n  x    xi 
2

i 1  i 1 
58
Estadística

REGRESION LINEAL SIMPLE

MODELO DE REGRESIÓN LINEAL SIMPLE


yi=+xi+ei

DATOS MODELO ESTIMADO


x y
y( 1 )
yˆ  a  bx
x(1)
x( 2 ) y( 2 )
ESTIMADORES ERRORES
 
x(n ) y( n ) a  y  bx ei  y i  yˆ i
n n n
n xy   xi  y i
b i 1 i 1 i 1
2
n
 n

n  x 2    xi 
i 1  i 1 
59
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.
niño edad (meses) talla (cm)
i xi yi
y=talla / x=edad / n=14
1 3 55
2 6 68
14
3
4
5
5
64
66  yi  956 y  68,3 s y  5,6
i 1
5 3 62
14
6
7
4
9
65
74
 xi  84 x  6 sx  2
i 1
8 8 75 cov( x, y )  9,07 rxy  0,88
9 9 73
10 7 69 14 14
11 6 73  xi y i  5863  xi2  556
12 5 68 i 1 i 1
13 8 73
14 6 71

60
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

Modelo Estimado
yˆ  a  bx

b  2,44 a  53,64

yˆ  53,64  2,44 x

Interpretación de los resultados


- Existe asociación o dependencia entre la Talla del niño y la edad (r=0,88); a
medida que la edad aumenta la talla aumenta.
- Desde los resultados del modelo de regresión lineal simple, se tiene que la talla
media de un niño es de 53,64 cm. Cuando la edad del niño (meses) aumenta en
una unidad la talla se incrementa en 2,44 cm.

61
Estadística

REGRESION LINEAL SIMPLE

EJEMPLO: Aplicación del Modelo de Regresión Lineal Simple


Problema 1: Se cuenta con las mediciones sobre la edad y la talla de 14 niños, y estamos
interesados en determinar si existe algún tipo de relación entre la talla del niño y su edad.

niño edad (meses) talla (cm) Talla estimada error


i xi yi ŷi ei 14

1 3 55 61,0 -6,0  ( yi  yi ) 2  402,86


i 1
2 6 68 68,3 -0,3 14 14
3 5 64 65,8 -1,8  ( yi  yˆ i ) 2   ei2 92,7
4 5 66 65,8 0,2 i 1 i 1
5 3 62 61,0 1,0
6 4 65 63,4 1,6
7 9 74 75,6 -1,6 Bondad de Ajuste del Modelo
8 8 75 73,2 1,8 R2 = 0,77
9 9 73 75,6 -2,6
10 7 69 70,7 -1,7 De acuerdo al coeficiente de
11 6 73 68,3 4,7 determinación, el modelo ajustado
12 5 68 65,8 2,2 a los datos es adecuado (R2
13 8 73 73,2 -0,2
cercano a 1)
14 6 71 68,3 2,7

62
Estadística

NOTACION
Variables Cuantitativas

x  variable x  valor de la variable en el individuo i


i
OBSERVACIONES
y variable i  1,..., n
* El Tipo de Gráfico  valor deva
yiseleccionado la avariable
dependeren
de el
la variable en estudio.
individuo i
* El Gráfico debe contener un Título General y la identificación de cada eje
(variable en estudio y frecuencia).a, b, c : constantes
* En ocasiones resulta más ilustrativo un gráfico que una tabla de frecuencia.
n
* Al igual que las tablas, nlos gráficos deben ser auto-explicativos.
n n
 c  c    c  nc  cxi  cx1    cx n  c  xi 2
 xi2
 x1    x n2
i 1 i 1 i 1 i 1

n n n
 (axi  b) (ax1  b)    (axn  b)  a xi  b ( xi ) 2  ( x1    x n ) 2
i 1 i 1 i 1

n
 ( xi  yi )  ( x1  y1 )    ( xn  y n )
i 1

n
 ( xi yi )  ( x1 y1 )    ( xn y n )
i 1
63
Indicador Presente (1 punto) Ausente (0 puntos) Puntaje Puntaje por ítem
Hipótesis
verificable
Variable 1
Variable 2
Variable 3
Variable 4
Propuesta de
análisis indicada
Propuesta de
análisis explicada
TOTAL

S-ar putea să vă placă și