Sunteți pe pagina 1din 30

Mdulo IV

PROCESAMIENTO DE LA INFORMACIN

Pgina 1 de 30

NDICE

MDULO 4: PROCESAMIENTO DE LA INFORMACIN

INTRODUCCIN .................................................................................................................. 3
1. MEDICIN ESTADSTICA.............................................................................................. 4
1.1. Tcnicas para el Anlisis Univariable ..................................................................... 5
2. MEDIDAS DE TENDENCIA CENTRAL ......................................................................... 6
2.1. Media Aritmtica ( X ) .............................................................................................. 6
2.2. Mediana (Me) .......................................................................................................... 8
2.3. Moda (Mo) ............................................................................................................ 11
3. MEDIDAS DE VARIABILIDAD O DISPERSN ........................................................... 13
3.1. Amplitud o Rango (R) ........................................................................................... 13
3.2. Desviacin Estndar (S) ........................................................................................ 14
3.3. Varianza (S2) ......................................................................................................... 15
4. ANLISIS CON PRUEBAS ESTADSTICAS .............................................................. 18
4.1. Paramtricas ........................................................................................................ 18
4.2. No paramtricas ................................................................................................... 19
4.3. Tcnicas para el Anlisis Bivariable ..................................................................... 20
ANEXOS ............................................................................................................................ 26

Pgina 2 de 30

PROYECTO DE INVESTIGACIN EN COMPUTACIN EDUCATIVA II

MDULO 4
PROCESAMIENTO DE LA INFORMACIN

INTRODUCCIN

Consiste

en

procesar

los

datos

(dispersos,

desordenados,

individuales) obtenidos de la poblacin objeto de estudio durante el


trabajo de campo, y tiene como fin generar resultado (datos
agrupados y ordenados), a partir de los cuales se realizar el anlisis
segn los objetivos de hiptesis de la investigacin realizada. En el
procesamiento de datos se aplican las herramientas estadsticas.
Como lo menciona Hernndez (2003) debe decidir qu tipo de anlisis de los datos se llevar
a cabo: cuantitativo, cualitativo o mixto.
a) En caso de que el anlisis sea cuantitativo, seleccionar las pruebas estadsticas
apropiadas para analizar los datos, dependiendo de las hiptesis formuladas y de los niveles
de medicin de las variables.
b) En caso de que el anlisis elegido sea cualitativo, predisear el esquema de anlisis de
los datos.
c) En el caso de que hayamos obtenido datos cuantitativos y cualitativos a cada tipo de
datos le aplicamos el anlisis correspondiente.
El anlisis de datos es una tcnica que consiste en el estudio de los hechos y el uso de sus
expresiones para lograr informacin, la cual debe ser vlida y confiable. Pretende hacer
explicitas las propiedades, notas y rasgos de todo tipo que, en relacin a las variables
estudiadas se derivan de las tablas en las se condensa la clasificacin (PUCP), mientras que
la interpretacin intenta precisar la significacin y alcance de las propiedades y rasgos.
De acuerdo a los objetivos que se persiguen se utilizan las tcnicas estadsticas (Tafur, 1995):

Pgina 3 de 30

Objetivos del anlisis

Tcnicas estadsticas

Cmo estn distribuidos los datos

Frecuencia

Hallar qu hay en los datos

Media, mediana, moda

Conocer qu tanto varan los datos

Desviacin estndar, rango varianza y


desviacin promedio

Qu relacin existe entre variables

Correlacin y medidas de asociacin

Describir
variables

diferencias

entre

grupos

Prueba de T, Z y anlisis de varianza

Demostrar causalidad

Prueba de T, Z y anlisis de varianza

Estimaciones y predicciones

Estimacin de punto e intervalor, Regresin


y serie de tiempo

Los anlisis de datos segn el nmero de variables pueden ser univariable, bivariable y
multivariable.

1. MEDICIN ESTADSTICA

Precisar las clases de variables es importante en el anlisis de datos, porque estas van a
determinar las tcnicas estadsticas que se van emplear.

Variables

Tcnicas estadsticas

NOMINALES

Distribucin de frecuencias
Coeficiente de contingencia
Prueba de Chi cuadrado
Moda

ORDINALES

Coeficiente de rango
Mediana
Gamma

INTERVALARES

Mediana
Media aritmtica
Desviacin estndar
Correlacin mltiple
Coeficiente de correlacin de Pearson

PROPORCIONALES

Admiten todas las anteriores

Pgina 4 de 30

1.1. TCNICAS PARA EL ANLISIS UNIVARIABLE

En el anlisis de una sola variable se puede emplear tcnicas estadsticas que nos describan
las propiedades de una variable: posicin, dispersin y forma.

a) Posicin.
ubicacin

de

Es la caracterstica que permite describir la


un

grupo

de

datos,

son

expresados

estadsticamente como medidas de tendencia central (media


aritmtica, mediana y moda) y medidas no centrales (cuartiles).
b) Dispersin. Caracterstica que expresa la cantidad de
variacin o disminucin expresada en los datos. Las medidas
que ms se utilizan para expresar la magnitud de la dispersin
son: el rango (recorrido), varianza, desviacin estndar,
coeficiente de variacin.
c) Forma. Propiedad que expresa la manera en que se distribuyen los datos. Los tipos de
medida que se usa para expresar la forma de los datos son la simetra, modalidad y curtosis.

En la siguiente tabla se resume los estadsticos que se emplean para describir las
propiedades de las variables.

Propiedad
Posicin

Tipo de medida
Tendencia central
Tendencia no central

Dispersin

Medidas de dispersin o
variabilidad
Simetra

Forma

Modalidad
Curtosis

Estadsticos

Media aritmtica
Mediana
Moda
Cuartiles
Recorrido
Varianza
Desviacin estndar
Coeficiente de variacin
Asimtrica
Simtrica
Modos de una distribucin
Razn de momentos de
Pearson

Pgina 5 de 30

2.

MEDIDAS DE TENDENCIA CENTRAL

Se denominan medidas de tendencia central a aquellas medidas que describen la localizacin


de los valores de las variables que se estudian.

El objetivo de las medidas de tendencia central es, determinara los valores que pueden ser
considerados como representativos de un conjunto de datos buscando siempre el punto
medio de los datos. Las medidas que se usan con mayor frecuencia son la media aritmtica,
mediana y moda.

2.1. MEDIA ARITMTICA ( X )


Es la medida que caracteriza a un grupo de estudio con un solo valor y
se define como la suma de todas las observaciones divididas entre los
nmeros de datos.
El empleo de la media aritmtica en la investigacin sirve para:

Expresar globalmente la informacin que se presenta en los datos.


Expresar una medida estable.
Obtener un dato fundamental para otros estadsticos.

a) Media aritmtica para datos no agrupados


Dependiendo de la informacin disponible (poblacin o muestra). Se tiene las siguientes
formulas:

Media o promedio poblacional:

==

=1
=1

X =

=1

Media o promedio muestral:

Pgina 6 de 30

= Sumatoria de los datos a considerarse


Xi = Valor de la i-sima observacin
n = Nmero de datos a considerarse en la muestra
N = Nmero de datos de la poblacin

Ejemplo: Se tiene que en un grupo de seis alumnos el nmero de horas acceso semanal al
internet es el siguiente: 2- 3- 4- 4- 6 5

=1

=
2 + 3 + 4 + 4 +6 + 5
24
X =
=
4
6
6
Los resultados sealan que en promedio los alumnos acceden 4 horas a la semana al
Internet.

b) Media aritmtica para datos agrupados en intervalos


Estas se aplican cuando los datos se encuentran agrupadas en tablas de frecuencias con
intervalos.

=1
=

=1 ()

X =

= Sumatoria de los productos de fi(xi)


Xi = Valor de la marca de clase
n = Nmero de datos a considerarse en la muestra
fi = Frecuencia de la clase i-sima

Ejemplo: Se tiene que en un grupo de alumnos el nmero de horas acceso semanal al


internet es el siguiente:

Pgina 7 de 30

(hi)

Frecuencia
relativa
acumulada
(Hi)

Frecuencia
relativa
porcentual
(hi%)

Frecuencia
relativa
acumulada
porcentual
(Hi%)

0.25

0.25

25.0

25.0

10

16

0.67

0.92

67.0

92.0

24

0.33

1.00

33.0

100.0

Marca
de clase
(xi)

Frecuencia
absoluta
(fi)

Frecuencia
acumulada
(Fi)

Frecuencia
relativa

1-3

4-6

7-9

Intervalo

24

1.00

100.00

En la siguiente tabla auxiliar vamos a determinar la sumatoria del producto de la marca de


clase con la frecuencia de la clase.

Intervalo

(Xi)

(fi)

Xi (Fi)

1-3

12

4-6

10

50

7-9

64

n = 24

= 116

X =

=1

=1
()
=
116

24

= 4.83

Los resultados sealan que en promedio los alumnos acceden 4.83 horas a la semana al
Internet.

2.2. MEDIANA (ME)

La mediana es una serie de datos ordenados de la acuerdo a su magnitud, es el valor de la


observacin que ocupa la posicin central de dicho conjunto.
La mediana se emplea en la investigacin cuando los valores estn muy sesgados o hay
datos con valor extremo. La mediana no es afectada por el hecho de que los valores

Pgina 8 de 30

apareados aparezcan cargados en un extremo, se trata de un valor que esta entre 50% de
unos y 50% de otros.

a) Mediana para datos no agrupados


Para casos en lo que los datos ordenados son impares, se considera el valor central.
Se tiene que en un grupo de siete alumnos el nmero de horas acceso semanal al internet es
el siguiente: 2 - 3 - 4 - 4 - 6 - 5 7

Ordenando los datos se tiene: 2 - 3 - 4 - 4 - 5 - 6 - 7

Se observa fcilmente que el valor central es 4, ubicado en la posicin 4 de 7 datos.


Para casos en lo que los datos ordenados son pares, se considera el promedio de los dos
valores centrales

Se tiene que en un grupo de siete alumnos el nmero de horas acceso semanal al internet es
el siguiente: 2- 3 - 4 - 4 - 5 - 6 5 - 7

Ordenando los datos se tiene: 2 - 3 - 4 - 4 5 - 5 - 6 - 7

Se observa que los valores centrales son el 4 y 5, siendo el promedio 4.5. Por lo tanto, la
mediana es 4.5

4+5
9
= = 4.5
2
2
b) Mediana para datos agrupados
Para casos de datos agrupados por clases se calcula de la siguiente forma:
Tenemos las edades de un grupo de pobladores de la comunidad X.

Pgina 9 de 30

Frecuencia
absoluta
(fi)

Frecuencia
acumulada
(Fi)

Frecuencia
relativa
(hi)

Frecuencia
relativa
porcentual
(hi%)

12

0.03

3.00

14

0.07

7.00

15

0.20

20.00

16

14

0.17

17.00

17

21

0.24

24.00

18

25

0.13

13.00

19

29

0.13

13.00

23

30

0.03

3.00

1.00

100.00

Clase

n=30

Para calcular la mediana, utilizaremos la frecuencia acumulada.


Como n = 30, utilizaremos la posicin p = (30/2) = 15, el primer valor mayor a 15
corresponde a la clase 17.
La mediana entonces es 17.
Para casos de datos agrupados en intervalos se calcula de la siguiente forma:
Tenemos las edades de un grupo de pobladores de la comunidad X.

Frecuencia
acumulada
(Fi)

Frecuencia
relativa

Intervalo

Frecuencia
absoluta
(fi)

(hi)

Frecuencia
relativa
porcentual
(hi%)

[60, 63)

0.05

3.00

[63, 66)

18

23

0.18

7.00

[66, 69)

42

65

0.42

20.00

[69, 72)

27

92

0.27

17.00

[72, 75)

100

0.08

24.00

1.00

100.00

N=100

Pgina 10 de 30

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad


de la suma de las frecuencias absolutas. Es decir debemos buscar el intervalo en el que

encuentre ( )
2

1
= 2
.

es el lmite inferior de la clase donde se encuentra la mediana.

es la semisuma de las frecuencias absolutas.

1 es la frecuencia acumulada anterior a la clase mediana.


es la amplitud de la clase.

100/ 2 = 50
Clase de la mediana (66 - 69)
= 66 +

50 23
3 = 67.93
42

2.3. MODA (MO)

Se define como el valor, clase o categora que ocurre con mayor frecuencia en los datos, es
decir, es el valor que ms se repite.
La moda se puede hallar par variables cualitativas y cuantitativas, trabaja preferentemente
con las escalas nominales, se orienta a solo a casos en los cuales se pretende ofrecer una
idea aproximada a cerda de donde est la mayor concentracin de observaciones.

a) Moda para datos no agrupados


Ejemplo: Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5

Mo = 4

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la
mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.

Pgina 11 de 30

Ejemplo: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9

Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda.

Ejemplo: 2, 2, 3, 3, 6, 6, 9, 9

b) Moda para datos agrupados

Se calcula aplicando la siguiente formula cuando los intervalos tienen la misma amplitud.

( 1 ) ( +1 )

es el lmite inferior de la clase modal.


es la frecuencia absoluta de la clase modal.
1 es la frecuencia absoluta inmediatamente inferior a la clase
modal.
+1 es la frecuencia absoluta inmediatamente posterior a la clase
modal.
es la amplitud de la clase.

Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.

Frecuencia
absoluta
(fi)

Frecuencia
acumulada
(Fi)

Frecuencia
relativa

Intervalo

Frecuencia
absoluta
(fi)

(hi)

Frecuencia
relativa
porcentual
(hi%)

[60, 63)

0.05

3.00

[63, 66)

18

18

23

0.18

7.00

[66, 69)

42

42

65

0.42

20.00

[69, 72)

27

27

92

0.27

17.00

[72, 75)

100

0.08

24.00

N=100

N=100

1.00

100.00

Pgina 12 de 30

= 66 +

(4218)
(4218)+(4227)

3 = 67.8

La moda de los datos es 67.8

3. MEDIDAS DE VARIABILIDAD O DISPERSIN

Estas determinan el grado de acercamiento o distanciamiento de los valores de una


distribucin frente a su promedio de localizacin, sobre la base de que entre ms grande sea
el grado de variacin menor uniformidad tendrn los datos (sinnimo de heterogeneidad) y
por lo tanto menor representatividad o confiabilidad del promedio de tendencia central o
localizacin por haber sido obtenido de datos dispersos. Por el contrario, si este valor es
pequeo (respecto a la unidad de medida) entonces hay una gran uniformidad entre los datos.
Cuando es cero quiere decir que todos los datos son iguales.

3.1 AMPLITUD O RANGO (R)

Es el lmite dentro del cual estn comprendidos todos los valores


de la serie de datos, en otras palabras, es el nmero de diferentes
valores que toma la variable entre el valor mximo y el valor
mnimo en una investigacin cualquiera.

El rango es el tamao del intervalo en el cual se ubican todos los valores que pueden tomar
los diferentes datos de la serie de valores, desde el menor de ellos hasta el valor mayor
estando incluidos ambos extremos. El rango de una distribucin de frecuencia se designa con
la letra R.
Permite obtener una idea de la dispersin de los datos, cuanto mayor es el rango, ms
dispersos estn los datos de un conjunto.

Pgina 13 de 30

a) Datos No Agrupados:
R = max min
Ejemplo, el rango de la siguiente distribucin es: 25, 36, 64, 20, 48, 59.
R = 64 - 20 = 44

b) Datos Agrupados:
R = Lmite superior del ltimo intervalo Lmite inferior del primer intervalo
Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.
Frecuencia
absoluta
(fi)

Frecuencia
acumulada
(Fi)

Frecuencia
relativa

[60, 63)

0.05

3.00

[63, 66)

18

23

0.18

7.00

[66, 69)

42

65

0.42

20.00

[69, 72)

27

92

0.27

17.00

[72, 75)

100

0.08

24.00

1.00

100.00

Intervalo

N=100

(hi)

Frecuencia
relativa
porcentual
(hi%)

R = 75 60 = 15

3.2 DESVIACIN ESTNDAR (S)

Es una medida de dispersin para variables de razn (variables cuantitativas o cantidades


racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la variable.
La desviacin estndar nos dice cunto tienden a alejarse los puntajes del promedio o media
aritmtica. De hecho especficamente la desviacin estndar es "el promedio de lejana de
los puntajes respecto del promedio".

1( X )2
1

Pgina 14 de 30

Donde:
S = representa la desviacin estndar,
Xi = representa cada uno de los valores,

X = representa la media de la muestra y


n = es el nmero de observaciones tamao de la muestra.

Ejemplo: Para los siguientes datos: 9, 3, 8, 8, 9, 8, 9, 18

9+3+8+8+9+8+9+18
8

=9

(9 9)2 + (3 9)2 + (8 9)2 + (8 9)2 + (9 9)2 + (8 9)2 + (9 9)2 + (18 9)2


=
81

= 17.1428
= 4.140

La desviacin estndar es 4.14039

Como se puede apreciar la desviacin estndar viene a ser la ra cuadra de la varianza y la


varianza es el cuadrado de la desviacin estndar, entonces:

2 = (4.14039)2 = 17.1428 Varianza muestral

Para el caso de datos agrupados primero hallamos la varianza y luego sacamos la raz
cuadrada y obtenemos la desviacin estndar.

3.3. VARIANZA (S2)

La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de


una distribucin estadstica. Se simboliza por S2.

Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los
valores respecto a su punto central (Media ).

Pgina 15 de 30

a)

Para datos no agrupados:

2 =

1(
1

)2

Donde
S2 = representa la varianza,
Xi = representa cada uno de los valores,

X = representa la media de la muestra y


n = es el nmero de observaciones tamao de la muestra.

Ejemplo: Para los siguientes datos: 9, 3, 8, 8, 9, 8, 9, 18

9+3+8+8+9+8+9+18

=9

(9 9)2 + (3 9)2 + (8 9)2 + (8 9)2 + (9 9)2 + (8 9)2 + (9 9)2 + (18 9)2


81

2 =

120
= 17.1428
7

b) Para datos agrupados

2 =

1(

)2

Ejemplo: Para los datos de las edades de un grupo de pobladores de una comunidad.

Pgina 16 de 30

Frecuencia
acumulada
(Fi)

Frecuencia
relativa

(xi)

Frecuencia
absoluta
(fi)

(hi)

Frecuencia
relativa
porcentual
(hi%)

[60, 63)

61.5

0.05

3.00

[63, 66)

64.5

18

23

0.18

7.00

[66, 69)

67.5

42

65

0.42

20.00

[69, 72)

70.5

27

92

0.27

17.00

[72, 75)

73.5

100

0.08

24.00

1.00

100.00

Punto
medio
Intervalo

N=100

Clculo de la media aritmtica

Intervalo

(Xi)

(fi)

Xi (fi)

[60, 63)

61.5

307.5

[63, 66)

64.5

18

1161.0

[66, 69)

67.5

42

2835.0

[69, 72)

70.5

27

1903.5

[72, 75)

73.5

588.0

N=100

= 6795

=1 ()
6795
X =
=
= 67.95

100
Calculo de la varianza

Intervalo

(Xi)

(fi)

(Xi- X )2. fi

[60, 63)

61.5

208.01

[63, 66)

64.5

18

62.10

[66, 69)

67.5

42

8.50

[69, 72)

70.5

27

175.57

[72, 75)

73.5

246.42

N=100

= 7006

Pgina 17 de 30

2 =

4.

7006
100

= 7.006

PRUEBAS ESTADSTICAS PARA EL ANLISIS

4.1 Paramtricas

Las pruebas paramtricas son un tipo de pruebas de significacin estadstica que cuantifican
la asociacin o independencia entre una variable cuantitativa y una categrica. Las pruebas
paramtricas exigen ciertos requisitos previos para su aplicacin: la distribucin normal de la
variable cuantitativa en los grupos que se comparan, la homogeneidad de varianzas en las
poblaciones de las que proceden los grupos y una n muestral no inferior a 30. Su
incumplimiento conlleva la necesidad de recurrir a pruebas estadsticas no paramtricas. Las
pruebas paramtricas se clasifican en dos: prueba t (para una muestra o para dos muestras
relacionadas o independientes) y prueba ANOVA (para ms de dos muestras
independientes).

a. Prueba t para una muestra. Contrasta si la media de una poblacin difiere


significativamente de un valor dado conocido o hipotetizado.

b. Prueba t para dos muestras independientes. Esta opcin debe utilizarse cuando la
comparacin se realice entre las medias de dos poblaciones independientes (los individuos
de una de las poblaciones son distintos a los individuos de la otra) como, por ejemplo, en
el caso de la comparacin de las poblaciones de hombres y mujeres. Por lo tanto, compara
las medias de una variable para dos grupos de casos.

c. Prueba t para dos muestras relacionadas. Existe una segunda alternativa para contrastar
dos medias. Esta se refiere al supuesto caso en el que las dos poblaciones no sean
independientes, es decir, el caso en el que se trate de poblaciones relacionadas. Esta
situacin se encuentra, por ejemplo, en los diseos apareados, diseos en los que los
mismos individuos son observados antes y despus de una determinada intervencin, o
en los diseos en los que las muestras son emparejadas de acuerdo a una serie de
variables para controlar su efecto (como, por ejemplo, en los diseos de casos y controles).

Pgina 18 de 30

d. Prueba ANOVA para ms de dos muestras independientes. ANOVA es el acrnimo de


anlisis de la varianza. Es una prueba estadstica desarrollada para realizar
simultneamente la comparacin de las medias de ms de dos poblaciones. A la asuncin
de Normalidad debe aadirse la de la homogeneidad de las varianzas de las poblaciones
a comparar. Esta condicin previa de aplicacin se verificar estadsticamente.

4.2.

NO PARAMTRICAS

Las pruebas no paramtricas son aquellas en las que no existen supuestos sobre la
distribucin de los parmetros de la poblacin. Por esta razn es comn referirse a ellas como
pruebas de distribucin libre. Se aplican con mayor frecuencia a los datos nominales y
ordinales, si bien pueden emplearse tambin para analizar datos continuos transformados a
una escala ordinal.

a) Prueba para una sola muestra (Chi-cuadrado). La


prueba se usa para variables de distintos niveles de
medicin, incluyendo las de menor nivel, que son las
nominales. Sirve para determinar si los datos
obtenidos de una sola muestra presentan variaciones
estadsticamente significativas respecto de la hiptesis
nula.

b) Prueba para dos muestras con datos independientes (U de Mann-Whitney). La prueba se


emplea en aquellos casos en los que deseamos contrastar si existen diferencias entre las
poblaciones de donde se extrajeron dos muestras, que han de ser aleatorias e
independientes. La utilidad de esta prueba es la misma que la de la prueba t, pero no parte
de supuestos y puede ser aplicada a datos medidos en escala ordinal.

c) Prueba para dos muestras con datos relacionados (T de Wilcoxon). Esta prueba se utiliza
cuando queremos averiguar si dos tratamientos o niveles de la variable independiente se
diferencian entre s (prueba bilateral) o uno es mejor que otro (prueba unilateral). En este
caso, los sujetos han de ser los mismos sujetos o estar apareados en los dos tratamientos.

Pgina 19 de 30

Puesto que no se cumplen ciertos supuestos paramtricos (homogeneidad de varianzas,


escala de medida, normalidad de la poblacin), no es posible utilizar la prueba t de Student,
siendo la recomendable la prueba de Wilcoxon.
La nica condicin que debemos tener en cuenta para aplicar, esta prueba es que tenemos
que conocer cul de las dos puntuaciones de cada par es mayor y que podamos ordenar
las diferencias sin tener en cuenta su signo (valor absoluto).

d)

Prueba para varias muestras con datos independientes (H de

Kruskal-Wallis). Trata de contrastar si las diferencias entre las


muestras indican idnticas variaciones respecto de las poblaciones
de las que fueron extradas. La condicin necesaria para que pueda
ser aplicada es que la variable est medida, al menos, en una escala
ordinal.

e)

Prueba

para

varias

muestras

con

datos

relacionados

(Friedman). La prueba de Friedman permite contrastar si existen


diferencias entre las poblaciones de las que fueron extradas k
muestras, cuando stas corresponden a datos relacionados. stos
han de estar medidos al menos en una escala ordinal.

4.3.

TCNICAS PARA EL ANLISIS BIVARIABLE

Datos bivariantes provienen de la observacin simultnea de dos variables (x, y) en una


muestra de n individuos. Los datos son parejas de valores, numricos o no numricos, de la
forma:
(x1, y1),(x2, y2), . . . ,(xn, yn)

Se usan para describir las dos variables conjuntamente o una variable en funcin de
la otra

En los estudios de relaciones entre variables, una de las dos variables juega un papel
ms importante que la otra, sta ser la variable dependiente que denotaremos por y,

Pgina 20 de 30

cuyo comportamiento se intentar describir en funcin de otra variable x que


llamaremos variable independiente o explicativa

Las tcnicas estadsticas para el anlisis estadstico de distribuciones bidimensionales son


las correlacionales. Estos permiten conocer el grado de asociacin o relacin entre dos
variables.

La correlacin determina la relacin o dependencia que existe entre las dos variables que
intervienen en una distribucin bidimensional. Es decir, determinar si los cambios en una de
las variables influyen en los cambios de la otra. En caso de que suceda, diremos que las
variables estn correlacionadas o que hay correlacin entre ellas.

La correlacin puede decir algo acerca de la relacin entre las variables. Se utiliza para
entender:

si la relacin es positiva o negativa

la fuerza de la relacin.

Este grado de asociacin se expresa mediante un ndice: Coeficiente de correlacin (r). Su


valor numrico vara de 1,0 a -1,0. Nos indica la fuerza de la relacin de las variables.

Valor de r

Fuerza de relacin

-1,0 A -0,5 o 1,0 a 0,5

Fuerte

-0,5 A -0,3 o 0,3 a 0,5

Moderada

-0,3 A -0,1 o 0,1 a 0,3

Dbil

-0,1 A 0,1

Ninguna o muy dbil

En general, r> 0 indica una relacin positiva y r <0 indica una relacin negativa, mientras que
r = 0 indica que no hay relacin (o que las variables son independientes y no estn
relacionadas). Aqu, r = 1,0 describe una correlacin positiva perfecta y r = -1,0 describe una
correlacin negativa perfecta.

Pgina 21 de 30

Cuanto ms cerca estn los coeficientes de +1,0 y -1,0, mayor ser la fuerza de la relacin
entre las variables.

COEFICIENTE DE CORRELACIN DE PEARSON

Es una medida de la relacin lineal entre dos variables aleatorias cuantitativas, que mide el
grado de relacin de dos variables, cuantifica la fuerza de la relacin.

=1
)
= ( )( )
(

=
[( 2 ) ( )2 ][( 2 ) ( )2 ]

Coeficiente de determinacin, es el cuadrado del coeficiente de correlacin por cien, que se


emplea para indicar el porcentaje de relacin entre las variables.

Ejemplo: Tenemos las siguientes puntuaciones en las variables X (inteligencia) e Y


(rendimiento acadmico) de un grupo de estudiantes. Vamos a determinar el grado de
relacin que existe entre las dos variables.

Estudiantes

X (Inteligencia)

Y (Rendimiento
acadmico)

105

116

103

124

137

126

112

129

10

118

10

105

Pgina 22 de 30

Tabla auxiliar de valores:

Estudiantes

X2

Y2

XY

105

11025

16

420

116

13456

64

928

103

10609

206

124

15376

49

868

137

18769

81

1233

126

15876

81

1134

112

12544

336

129

10

16641

100

1290

118

13924

49

826

10

105
X=
1175

11025

36

Y= 65

X2= 139245

Y2= 489

630
XY=
7871

n=10

Reemplazando los valores en la frmula:

10 (7871) (1175)(65)
[10(139245) (1175)2 ][10(489) (65)2 ]

78710 76375
(1392450 138625)(4890 4225)
=

2335
17863625

2335
2804.2155

= 0.83267

Coeficiente de determinacin
R2 = r2 x 1000
R2 = 69.33%
De los resultados podemos decir que la correlacin es fuerte y positiva, que el 69.33% de la
inteligencia est relacionada con el rendimiento acadmico.

Pgina 23 de 30

COEFICIENTE DE CORRELACIN DE RANGOS

Esta prueba estadstica permite medir la correlacin o asociacin de


dos variables y es aplicable cuando las mediciones se realizan en
una escala ordinal, aprovechando la clasificacin por rangos.

El coeficiente de correlacin de Spearman se rige por las reglas de


la correlacin simple de Pearson.
La ecuacin utilizada en este procedimiento, es la siguiente:
2

= 1 =1
= (21)

Dnde:

= coeficiente de correlacin de Spearman.

2 = sumatoria de las diferencias existentes entre los rangos de las dos variables,
elevadas al cuadrado.
= tamao de la muestra expresada en parejas de rangos de las variables.

Ejemplo: La siguiente tabla muestra el rango u orden obtenido en la primera evaluacin (X) y
el rango o puesto obtenido en la segunda evaluacin (Y) de 8 estudiantes universitarios en la
asignatura de Estadstica. Calcular el coeficiente de correlacin por rangos de Spearman.

Estudiante

Dyana

Elizabeth

Mario

Orlando

Mathas

Josu

Anita

Luca

Pgina 24 de 30

Tabla auxiliar para hallar la sumatoria de las diferencias.

Estudiante

d= X-

d2= (X-Y)2

Dyana

-2

Elizabeth

-2

Mario

-2

Orlando

-1

Mathas

-1

Josu

16

Anita

-1

Luca

1
2

=32

Reemplazando los valores en la frmula:

= 1

632
8(82 1)

=1

192
504

= 1 0.381 = 0.619

Del resultado, se observa que existe una correlacin positiva moderada entre la primera y
segunda evaluacin.

Pgina 25 de 30

ANEXOS
ASPECTOS ADMINISTRATIVOS Y BIBLIOGRAFIA DEL PROYECTO
1. RECURSOS
Todo proyecto requiere para su realizacin una serie de recursos. Los recursos necesarios
para el desarrollo del proyecto generalmente se clasifican en:

1.1 Humanos.
Para poner en marcha cualquier tipo de proyecto hay que disponer de personas adecuadas
y capacitadas para realizar las actividades y tareas previstas. En el caso de la investigacin
participan investigadores, co investigadores, auxiliares de investigacin, asesor temtico,
asesor metodolgico, expertos, correctores de estilo. Es necesario identificarlos para calcular
posteriormente el valor de sus honorarios e insertarlos para determinar el costo del proyecto.
Ejemplo:
a) Asesoramiento
- 01 Asesor metodolgico
- 01 Psicologo
b) Apoyo
- 02 encuestadores

1.2 Econmicos
Los recursos econmicos hacen referencia al presupuesto necesario para la operacin del
proyecto. Sabemos que cualquier accin tiene un costo que es asumido por todas las partes
comprometidas en su puesta en marcha. En este aspecto se debe considerar la valorizacin
de los recursos humanos y materiales, adems de los servicios requeridos para el proyecto.
Ejemplo:

ITEM
a) Personal
- Honorarios del asesor
- Pago a encuestadores
b) Equipos
- Computador
- Impresora
c)Materiales
- Material de escritorio
- Material de enseanza

TOTAL
5,000.00
4,000.00
1,000.00
2,190.00
1,990.00
190.00
245.00
25.00
40.00

Pgina 26 de 30

- Material de impresin
d) Alimentos
- Alimentos para personas
e) Viajes
- Pasajes Lima - Huacho
- Viticos
f) Servicios
- Fotocopias
- Empastado
TOTAL

180.00
200.00
200.00
500.00
100.00
400.00
180.00
50.00
130.00
8,315.00

1.3 Fsicos
Los recursos fsicos o denominados materiales, tradicionalmemte comprenden varios tems
como terrenos, edificios, maquinaria, equipos (computadora, impresora), infraestructura,
vehculos, material de escritorio, documentos, bibliografa, entre otros necesarios para el
desarrollo de la investigacin.
Se debe realizar un listado de ellos para poder ser valorizados e insertados en el costo del
proyecto.
Ejemplo:
a). Equipamiento
-

10 computadores personales
01 impresora lasser

b). Material de escritorio


-

01 millar de papel bond A4


01 docena de lpices B2

c) Material de enseanza
-

01 docena de plumones para pizarra acrlica


millar de papelotes

d) Material de impresin
-

1 cartucho de tinta para impresora HP #52

2. CRONOGRAMA
Es una descripcin especfica de las actividades y del tiempo que se va a emplear para la
ejecucin del proyecto. Se debe organizar el trabajo en fechas probables, para saber cunto
tiempo requerir elaborar el trabajo definitivo. Para su presentacin se utilizan generalmente
diagramas, lo que permite visualizar mejor el tiempo de cada actividad, y sobre todo en
aquellos casos en que hay varias actividades en un mismo tiempo
Para realizar el cronograma de las actividades se utilizan diversas tcnicas grficas, la ms
simple y utilizada es el Diagrama de Gantt.

Pgina 27 de 30

El diagrama de Gantt consiste en una tabla de doble entrada, en las filas se anota el listado
de las actividades descritas en el apartado correspondiente del proyecto y en las columnas,
el tiempo que durar cada una de ellas, marcando con una X a lo largo de qu periodo de
tiempo (semanas, meses, trimestres, etc) est previsto realizar dicha actividad. Una barra
horizontal frente a cada actividad va a representar su duracin.
Ejemplo:

Actividades
Revisin bibliogrfica
Formulacin del proyecto de
investigacin

E
x

Meses
M J J A

Aprobacin del proyecto


Recoleccin de informacin

x
x

Organizacin de la
informacin
Anlisis de la informacin
Interpretacin y discusin

x
x
x

x
x

Redaccin de la tesis

Presentacin de la tesis

3. FUENTES DE INFORMACIN
La lista de referencias cita las fuentes de informacin que sustentan nuestra investigacin y
que se utilizaron para la preparacin del trabajo, comprende un inventario de los materiales
consultados citados, ordenados alfabticamente a partir del apellido del autor. En cuanto a
las normas para su presentacin stas sern desarrolladas aplicando las Normas APA 6ta
edicin.

3.1 Referencias bibliogrficas


Las referencias para libros completos pueden tener las siguientes formas bsicas:
-

Libro con autor:


Apellidos, A. A. (Ao). Ttulo. Ciudad: Editorial.

Libro con editor


Apellidos, A. A. (Ed.). (Ao). Ttulo. Ciudad: Editorial.

Tesis tiene la forma bsica:


Apellidos, A. A. (Ao). Ttulo. (Tesis indita de maestra o doctorado). Nombre de la
institucin, Localizacin.

Pgina 28 de 30

3.2 Referencias hemerogricas


-

Artculo de una revista


Apellidos, A. A., Apellidos, B. B. & Apellidos, C. C. (Fecha). Ttulo del artculo. Ttulo
de la publicacin, volumen nmero), pp. xx-xx.

3.3 Referencias electrnicas


-

Libro en versin electrnica:


Apellidos, A. A. (Ao). Ttulo. Recuperado de http://www.xxxxxx.xxx

Tesis en la Web:
Apellidos, A. A. (Ao). Ttulo. (Tesis indita de maestra o doctorado, Nombre de la
institucin). Recuperado de http://www.xxxxxx.xxx

Artculo de una revista web


Apellidos, A. A., Apellidos, B. B. & Apellidos, C. C. (Fecha). Ttulo del artculo. Ttulo
de la publicacin, volumen (nmero), pp. xx-xx. Recuperado de http://www.xxxxxx.xxx

Pgina 29 de 30

Pgina 30 de 30

S-ar putea să vă placă și