Sunteți pe pagina 1din 22

1

REPBLICA BOLIVARIANA DE VENEZUELA


UNIVERSIDAD PEDAGGICA EXPERIMENTAL LIBERTADOR
INSTITUTO DE MEJORAMIENTO PROFESIONAL DEL MAGISTERIO
SAN FERNANDO, ESTADO APURE.








Tutor: Emilio Bolvar.


Autores:
Alvarado Zhair.
Hidalgo Jannette.
Rodrguez Jos
Ramos Vivir.



San Fernando, Abril 2014.

2


ndice.
Pg.
Introduccin. 3
Propsitos y objetivos de la teora de la correlacin.. 4
Clasificacin de la correlacin. 4
Coeficientes de correlacin... 6
Coeficiente de correlacin de Karl Pearson 8
Tipos de correlacin. 10
Coeficientes de regresin y el clculo de la correlacin a travs de los mismos. 13
Correlacin para datos agrupados en clases.. 17
Construccin y uso de la tabla de correlacin de doble entrada 21
Conclusiones.. 24
Bibliografa.. 25
















3

Introduccin.

Entre las nociones estadsticas fundamentales, cuya enseanza debe
optimizarse, se encuentran las de correlacin y regresin. Desde la prehistoria
hasta nuestros das, el discernimiento sobre la posible relacin que puede existir
entre dos sucesos ha sido un aspecto importante del conocimiento humano.
Conocer si los sucesos se relacionan y, con qu intensidad lo hacen, facilita a las
personas explicar el pasado, controlar el presente y predecir el futuro (Crocker,
1981, p.272). De estas palabras se desprende el valor que tiene por parte de los
ciudadanos el dominio de las nociones de correlacin y regresin. En esta
direccin podemos destacar los importantes avances que desde diversas
disciplinas y ocupaciones del mundo actual, como por ejemplo la Economa,
Direccin de Empresas, Estadstica Sociologa, se han llevado a cabo en cuanto
al estudio de la toma de decisiones. Dentro de este mbito, una destreza
importante es la realizacin de juicios sobre la existencia o inexistencia de
asociacin entre variables (Alloy y Tabachnik, 1984), lo que nos lleva al ncleo del
estudio de la correlacin y regresin. Una comprensin correcta de la misma es
un prerrequisito bsico para garantizar la comprensin de muchos otros
conceptos y procedimientos estadsticos. Podemos aadir que la mayora de los
trabajos didcticos sobre correlacin y regresin (por ejemplo: Estepa y Batanero,
1996; Castro et al., 2009) sealan la dificultad que tienen los estudiantes en el
estudio de estos temas, en consecuencia, debemos realizar esfuerzos con el fin
de ayudar a disminuir dichas dificultades.
En este trabajo se hace una breve resea de varios aspectos relacionados
con la Teora de la correlacin, su clasificacin y tipos, adems se toca lo
relacionado con los Coeficientes de regresin, el clculo de la correlacin a travs
de los mismos, Correlacin para datos agrupados en clases, Construccin y uso
de la tabla de correlacin de doble entrada.


4

Propsitos y objetivos de la teora de la correlacin.
En probabilidad y estadstica, la correlacin indica la fuerza y la direccin
de una relacin lineal entre dos variables aleatorias. Se considera que dos variables
cuantitativas estn correlacionadas cuando los valores de una de ellas varan
sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos
variables (A y B) existe correlacin si al aumentar los valores de A lo hacen tambin
los de B y viceversa. La correlacin entre dos variables no implica, por s misma,
ninguna relacin de causalidad; En cambio la regresin estadstica o regresin a la
media es la tendencia de una medicin extrema a presentarse ms cercana a la
media en una segunda medicin. La regresin se utiliza para predecir una medida
basndonos en el conocimiento de otra. La correlacin trata de establecer la
relacin o dependencia que existe entre las dos variables que intervienen en una
distribucin bidimensional. Es decir, determinar si los cambios en una de las
variables influyen en los cambios de la otra. En caso de que suceda, diremos que
las variables estn correlacionadas o que hay correlacin entre ellas.
Clasificacin de la correlacin.
Segn la relacin entre variables
- Correlacin lineal: Se representa mediante una lnea recta.
- Correlacin no lineal: Se representa con una lnea curva.
Segn el nmero de variables
- Correlacin simple: La variable dependiente acta sobre la variable
independiente.
- Correlacin mltiple: Cuando la variable dependiente acta sobre varias
variables independientes.
- Correlacin parcial: Cuando la relacin que existe entre una variable
dependiente y una independiente es de tal forma que los dems factores
permanezcan constantes.
Segn el valor cuantitativo
- Correlacin perfecta: El valor del coeficiente de correlacin es 1
5

- Correlacin imperfecta: El coeficiente de correlacin es menor a 1 sea en
sentido positivo o negativo.
- Correlacin nula: El coeficiente de correlacin es 0. No existe correlacin
entre las variables. Ejemplo: Nmero de calzado de una persona y su
cociente intelectual.
Segn el signo
- Correlacin positiva.- Dos variables tiene correlacin positiva cuando al
aumentar o disminuir el valor de una de ellas entonces el valor
correspondiente a la otra aumentar o disminuir respectivamente, es decir,
cuando las dos variables aumentan en el mismo sentido. Ejemplo: Peso de
una persona y su talla.
- Correlacin negativa.- Dos variables tiene correlacin negativa cuando al
aumentar o disminuir el valor de una de ellas entonces el valor de la otra
disminuir o aumentar respectivamente, es decir, una variable aumenta y
otra disminuye o viceversa. Ejemplo: Nmero de partidos ganados por un
equipo en una temporada y su posicin final en la tabla.
Coeficientes de correlacin
Los coeficientes de correlacin son medidas que indican la situacin relativa
de los mismos sucesos respecto a las dos variables, es decir, son la
expresin numrica que nos indica el grado de relacin existente entre las 2
variables y en qu medida se relacionan. Son nmeros que varan entre los
lmites +1 y -1. Su magnitud indica el grado de asociacin entre las variables;
el valor r = 0 indica que no existe relacin entre las variables; los valores 1
son indicadores de una correlacin perfecta positiva (al crecer o decrecer X,
crece o decrece Y) o negativa (Al crecer o decrecer X, decrece o crece Y).
6


No hay correlacin


Correlacin Positiva

7


Correlacin Negativa
Para interpretar el coeficiente de correlacin utilizamos la siguiente escala:
Valor Significado
-1 Correlacin negativa grande y perfecta
-0,9 a -0,99 Correlacin negativa muy alta
-0,7 a -0,89 Correlacin negativa alta
-0,4 a -0,69 Correlacin negativa moderada
-0,2 a -0,39 Correlacin negativa baja
-0,01 a -0,19 Correlacin negativa muy baja
0 Correlacin nula
0,01 a 0,19 Correlacin positiva muy baja
0,2 a 0,39 Correlacin positiva baja
0,4 a 0,69 Correlacin positiva moderada
0,7 a 0,89 Correlacin positiva alta
0,9 a 0,99 Correlacin positiva muy alta
1 Correlacin positiva grande y perfecta
Coeficiente de correlacin de Karl Pearson.
Llamando tambin coeficiente de correlacin producto-momento.
a) Para datos no agrupados se calcula aplicando la siguiente ecuacin:
8


r = Coeficiente producto-momento de correlacin lineal

Ejemplo ilustrativo: Con los datos sobre las temperaturas en dos das
diferentes en una ciudad, determinar el tipo de correlacin que existe entre
ellas mediante el coeficiente de PEARSON.
X 18 17 15 16 14 12 9 15 16 14 16 18
SX
=180
Y 13 15 14 13 9 10 8 13 12 13 10 8
SY=
138
Solucin:
Se calcula la media aritmtica

Se llena la siguiente tabla:
9

Se aplica la frmula:

Existe una correlacin moderada.
Tipos de correlacin.
1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables
la otra aumenta. La recta correspondiente a la nube de puntos de la
distribucin es una recta creciente.

2 Correlacin inversa
10

La correlacin inversa se da cuando al aumentar una de las variables
la otra disminuye. La recta correspondiente a la nube de puntos de la
distribucin es una recta decreciente.

3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo
entre las variables. En este caso se dice que las variables son incorreladas y
la nube de puntos tiene una forma redondeada.

Grado de correlacin
El grado de correlacin indica la proximidad que hay entre los puntos
de la nube de puntos. Se pueden dar tres tipos:
1. Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca estn los puntos de la
recta.
11


2. Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la
recta.

3. Correlacin nula
Coeficientes de regresin y el clculo de la correlacin a travs de los
mismos.
Se llama coeficiente de regresin a la pendiente de la recta de
regresin:
En la regresin Y/X : b = S
xy
/ S
x
2

En la regresin X/Y b' = S
xy
/ S
y
2

El signo de ambos coincidir con el de la covarianza, indicndonos la
tendencia (directa o inversa a la covariacin).Es interesante hacer notar que
b.b'= r
2

12

El coeficiente de correlacin lineal es el cociente entre la covarianza y el
producto de las desviaciones tpicas de ambas variables. El coeficiente de
correlacin lineal se expresa mediante la letra r.
Coeficiente de correlacin lineal
Propiedades
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin.
Es decir, si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
Si la covarianza es positiva, la correlacin es directa.
Si la covarianza es negativa, la correlacin es inversa.
Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre 1 y
1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la correlacin
es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la correlacin
es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o
decreciente. Entre ambas variables hay dependencia funcional.
Las notas de 12 alumnos de una clase en Matemticas y Fsica son las
siguientes:
Matemticas 2 3 4 4 5 6 6 7 7 8 10 10
Fsica 1 3 2 4 4 4 6 4 6 7 9 10
Hallar el coeficiente de correlacin de la distribucin e interpretarlo.

13

x
i
y
i
x
i
y
i
x
i
2
y
i
2


2 1 2 4 1
3 3 9 9 9
4 2 8 16 4
4 4 16 16 16
5 4 20 25 16
6 4 24 36 16
6 6 36 36 36
7 4 28 49 16
7 6 42 49 36
8 7 56 64 49
10 9 90 100 81
10 10 100 100 100

72
60 431 504 380

1 Hallamos las medias aritmticas.

2 Calculamos la covarianza.

3 Calculamos las desviaciones tpicas.

4 Aplicamos la frmula del coeficiente de correlacin lineal.
14


Al ser el coeficiente de correlacin positivo, la correlacin es directa.
Como coeficiente de correlacin est muy prximo a 1 la correlacin es muy
Fuerte. Los val ores de dos vari abl es X e Y se di st ri buyen segn l a
t abl a si gui ent e:
Y/ X 0 2 4
1 2 1 3
2 1 4 2
3 2 5 0
Det ermi nar el coefi ci ente de correl aci n. Convert i mos
l a t abl a de dobl e ent rada en t abl a si mpl e.
x
i
y
i
f
i
x
i
f
i
x
i
2
f
i
y
i
f
i
y
i
2

f
i
x
i
y
i
f
i

0 1 2 0 0 2 2 0
0 2 1 0 0 2 4 0
0 3 2 0 0 6 18 0
2 1 1 2 4 1 1 2
2 2 4 8 16 8 16 16
2 3 5 10 20 15 45 30
4 1 3 12 48 3 3 12
4 2 2 8 32 4 8 16
20 40 120 41 97 76


15





Al ser el coeficiente de correlacin negativo, la correlacin es inversa.
Como coeficiente de correlacin est muy prximo a 0 la correlacin es muy dbil.

Correlacin para datos agrupados en clases.
La correlacin es la forma numrica en la que la estadstica ha podido
evaluar la relacin de dos o ms variables, es decir, mide la dependencia de
una variable con respecto de otra variable independiente.
Para poder entender esta relacin tendremos que analizarlo en forma
grfica:
Si tenemos los datos que se presentan en la
tabla y consideramos que la edad determina el
peso de las personas entonces podremos
observar la siguiente grfica:
Donde los puntos representan cada uno de los
pares ordenados y la lnea podra ser una recta
que represente la tendencia de los datos, que
en otras palabras podra decirse que se observa que a mayor edad mayor
peso. La correlacin se puede explicar con la pendiente de esa recta
estimada y de esta forma nos podemos dar cuenta que tambin existe el
caso en el que al crecer la variable independiente decrezca la variable
dependiente. En aquellas rectas estimadas cuya pendiente sea cero
entonces podremos decir que no existe correlacin.
edad peso
15 60
30 75
18 67
42 80
28 60
19 65
31 92

16

1698 47
2045 15
1348 100
1268 120
demanda
0
50
100
150
1000 1500 2000

(
(

|
.
|

\
|

(
(

|
.
|

\
|

=


= = = =
= = =
2
1 1
2
2
1 1
2
1 1 1
*
n
i
i
n
i
i
n
i
i
n
i
i
n
i
n
i
i
n
i
i i i
y y n x x n
y x y x n
r
Edad (x) Peso (y) X
2
Y
2
X* Y
15 60 225 3600 900
30 75 900 5625 2250
18 67 324 4489 1206
42 80 1764 6400 3360
28 60 784 3600 1680
19 65 361 4225 1235
31 92 961 8464 2852
183 499 5319 36403 13483

| || |
65638606 . 0
2
) 499 ( 36403 * 7
2
) 183 ( 5319 * 7
) 499 * 183 ( 13483 * 7
2
1 1
2
2
1 1
2
1 1
*
1
=


=
(
(

|
|
.
|

\
|

=

=
(
(

|
|
.
|

\
|

=

=

=

=

=
n
i
i
y
n
i
i
y n
n
i
i
x
n
i
i
x n
n
i
n
i
i
y
n
i
i
x
i
y
i
x n
r


As en estadstica podremos calcular la
correlacin para datos no agrupados con la
siguiente formula.
En donde:
R = coeficiente de
correlacin
N = nmero de pares
ordenados
X = variable independiente
Y = variable independiente
Ejemplo:
Supngase que deseamos obtener la correlacin de los datos de la
tabla anterior: Ahora podemos observar que:
Se debe aclarar que el coeficiente de correlacin slo puede variar de
la siguiente manera:
s s 1 1 r
y que para entenderlo mejor se debe obtener
el coeficiente de determinacin que se obtiene con r cuadrada, ya que
este representa el porcentaje que se explica y mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya
que, esta muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)
2
= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
17

(

|
.
|

\
|

(

|
.
|

\
|


=
= = = =
= = = =
2
1 1
2
2
1 1
2
1 1 1 1
*
k
i
i y
k
i
i y
l
i
i x
l
i
i x
l
i
k
i
i y
l
i
i x i i
k
j
y f y f n x f x f n
y f x f y x f n
r

Primero tendremos que pensar que se genera una matriz, ya que,
ahora estamos juntando dos tablas de distribucin de frecuencias y por ello
nuestros clculos sern ms laboriosos, por lo que les recomiendo el uso de
una hoja de clculo o al menos una calculadora con regresin para datos
agrupados. De cualquier forma aqu tambien estamos evaluando
numricamente si existe relacin entre dos variables y lo haremos con la
siguiente ecuacin.

En donde podemos
encontrar k como el
nmero de clases
para la variable "y" y
l para el nmero de clases de "x".
Tambin podemos observar que hay varios tipos de "f" es decir, la que
se encuentra sola (sin subndice) que nos habla de las frecuencias celdares
(cada una de las frecuencias que se encuentran en la interseccin entre una
columna y un rengln) y las "f" con subndices que representan las
frecuencias de cada una de las variables.
Para entender el uso de esta formula usaremos un ejemplo:
Los resultados que se presentan en la siguiente tabla representan los pesos
y las estaturas de 48 alumnos entrevistados.

Marcas de clase de "x"
1.44
5
1.54
5
1.64
5
1.745 1.845 1.94
5
y x
y
x
y
^2
44.5 3 1 4 178 7921
marcas 54.5 5 9 5 19 1035.5 56434.7
5
de clase 64.5 1 2 4 1 1 9 580.5 37442.2
18

5
de "Y" 74.5 5 1 1 7 521.5 38851.7
5
84.5 2 2 1 5 422.5 35701.2
5
94.5 1 3 4 378 35721

x
0 9 12 17 7 3 48 3116 212072

x
x
0 13.9
05
19.7
4
29.66
5
12.915 5.83
5
82.06

x
x
^2
0 21.4
832
25
32.4
723
51.76
5425
23.828
175
11.3
490
75
140.898
2

5380.77
Correlacin= 0.695
La sustitucin de la frmula es la siguiente:
Al interpretar nuestro resultado podemos concluir que si existe relacin
entre el peso y la estatura, es decir, que a mayor estatura mayor peso. En
muchas ocasiones el resultado de la correlacin es negativo y lo que
debemos pensar es que la relacin de las variables involucradas en el
calculo es inverso es decir que en la medida que crece la variable
independiente la variable dependiente decrece:





695 . 0
) 3116 - 212072) * 48 (( * ) 82.06 - 140.8982) * ((48
3116) * (82.06 - 5380.77 * 48
*
2 2 2
1 1
2
2
1 1
2
1 1 1 1
= =
(

|
.
|

\
|

(

|
.
|

\
|


=
= = = =
= = = =
k
i
i y
k
i
i y
l
i
i x
l
i
i x
l
i
k
i
i y
l
i
i x i i
k
j
y f y f n x f x f n
y f x f y x f n
r




1698 47
2045 15
1348 100
1268 120
demanda
0
50
100
150
1000 1500 2000

19

Construccin y uso de la tabla de correlacin de doble entrada.
Las punt uaci ones obt eni das por un grupo de al umnos en una
bat er a de t est que mi de l a habi l i dad verbal (X) y el
razonami ent o abst ract o (Y) son l as si gui ent es:
Y/ X 20 30 40 50
(25-35) 6 4 0 0
(35-45) 3 6 1 0
(45-55) 0 2 5 3
(55-65) 0 1 2 7

Se pide:
1 Existe correlacin entre ambas variables?
2 Segn los datos de la tabla, si uno de estos alumnos obtiene una
puntuacin de 70 puntos en razonamiento abstracto, en cunto se estimar
su habilidad verbal?
Convertimos la tabla de doble entrada en tabla simple.
x
i
y
i
f
i
x
i
f
i
x
i
2
f
i
y
i
f
i
y
i
2

f
i

x
i
y
i

f
i

20 30 6 120 2 400 180 5 400 3 600
20 40 3 60 1 200 120 4 800 2 400
30 30 4 120 3 600 120 3 600 3 600
30 40 6 180 5 400 240 9 600 7 200
30 50 2 60 1 800 100 5 000 3 000
30 60 1 30 900 60 3 600 1 800
40 40 1 40 1 600 40 1 600 1 600
20

40 50 5 200 8 000 250
12
500
10
000
40 60 2 80 3 200 120 7 200 4 800
50 50 3 150 7 500 150 7 500 7 500
50 60 7 350 17 500 420
25
200
21
000
40 1 390 53 100 1 080
86
000
66
500
















21

Conclusiones.
- La estadstica es una ciencia formal y una herramienta que estudia el
uso y los anlisis provenientes de una muestra representativa de
datos, busca explicar las correlaciones y dependencias de un
fenmeno fsico o natural, de ocurrencia en forma aleatoria o
condicional.
- El coeficiente de correlacin de Spearman es exactamente el mismo
que el coeficiente de correlacin de Pearson, calculado sobre el rango
de observaciones. La correlacin estimada entre X e Y se halla
calculando el coeficiente de correlacin de Pearson para el conjunto
de rangos apareados. La correlacin de Spearman puede ser
calculada con la frmula de Pearson, si antes hemos transformado las
puntuaciones en rangos.
- El grfico por excelencia es el diagrama de dispersin, debido a que la
posicin de puntos materializa si la relacin es lineal a travs
precisamente de una lnea de fcil observacin por el investigador. En
el mismo, la variable independiente se coloca en el eje de las abscisas
y la dependiente en el eje de las ordenadas. El valor de r se debe
mostrar con dos decimales junto con el valor de la p, si el test de
hiptesis se realiz para demostrar que r es estadsticamente diferente
de cero. El nmero de observaciones debe a su vez estar indicado.









22

Bibliografa.

Universidad Pedaggica Experimental Libertador, Vicerrectorado de
Investigacin y Postgrado. (2011). Manual de Trabajos de Grado de
Especializacin y Maestra y Tesis Doctorales. Caracas.
Estadstica (2009). Documento en lnea. Disponible:
es.wikipedia.org/wiki/Estadstica (Consultado el 16 de Junio 2014).
Teora de la Correlacin. (2010) Documento en lnea. Disponible en
www.buenastareas.com Pgina principal Ciencia. (Consultado el 16
de Junio de 2014).
Coeficiente de Regresin. (2010) Documento en lines . Disponible en
http://www.monografias.com/trabajos93/analisis-correlacion
empleando-excel-y-graph/analisis-correlacion-empleando-excel-y-
graph.shtml#ixzz34mrPF9HU. (Consultado el 16 de Junio de 2014).

S-ar putea să vă placă și