Documente Academic
Documente Profesional
Documente Cultură
|
.
|
\
|
(
(
|
.
|
\
|
=
= = = =
= = =
2
1 1
2
2
1 1
2
1 1 1
*
n
i
i
n
i
i
n
i
i
n
i
i
n
i
n
i
i
n
i
i i i
y y n x x n
y x y x n
r
Edad (x) Peso (y) X
2
Y
2
X* Y
15 60 225 3600 900
30 75 900 5625 2250
18 67 324 4489 1206
42 80 1764 6400 3360
28 60 784 3600 1680
19 65 361 4225 1235
31 92 961 8464 2852
183 499 5319 36403 13483
| || |
65638606 . 0
2
) 499 ( 36403 * 7
2
) 183 ( 5319 * 7
) 499 * 183 ( 13483 * 7
2
1 1
2
2
1 1
2
1 1
*
1
=
=
(
(
|
|
.
|
\
|
=
=
(
(
|
|
.
|
\
|
=
=
=
=
=
n
i
i
y
n
i
i
y n
n
i
i
x
n
i
i
x n
n
i
n
i
i
y
n
i
i
x
i
y
i
x n
r
As en estadstica podremos calcular la
correlacin para datos no agrupados con la
siguiente formula.
En donde:
R = coeficiente de
correlacin
N = nmero de pares
ordenados
X = variable independiente
Y = variable independiente
Ejemplo:
Supngase que deseamos obtener la correlacin de los datos de la
tabla anterior: Ahora podemos observar que:
Se debe aclarar que el coeficiente de correlacin slo puede variar de
la siguiente manera:
s s 1 1 r
y que para entenderlo mejor se debe obtener
el coeficiente de determinacin que se obtiene con r cuadrada, ya que
este representa el porcentaje que se explica y mediante los datos de x .
En nuestro ejemplo decimos que la correlacin es casi perfecta, ya
que, esta muy cerca de 1 y que el porcentaje de datos que explican a y es
(0.65638606)
2
= 0.430842 o sea el 43.08 %
En el caso de que fueran datos agrupados tendremos lo siguiente:
17
(
|
.
|
\
|
(
|
.
|
\
|
=
= = = =
= = = =
2
1 1
2
2
1 1
2
1 1 1 1
*
k
i
i y
k
i
i y
l
i
i x
l
i
i x
l
i
k
i
i y
l
i
i x i i
k
j
y f y f n x f x f n
y f x f y x f n
r
Primero tendremos que pensar que se genera una matriz, ya que,
ahora estamos juntando dos tablas de distribucin de frecuencias y por ello
nuestros clculos sern ms laboriosos, por lo que les recomiendo el uso de
una hoja de clculo o al menos una calculadora con regresin para datos
agrupados. De cualquier forma aqu tambien estamos evaluando
numricamente si existe relacin entre dos variables y lo haremos con la
siguiente ecuacin.
En donde podemos
encontrar k como el
nmero de clases
para la variable "y" y
l para el nmero de clases de "x".
Tambin podemos observar que hay varios tipos de "f" es decir, la que
se encuentra sola (sin subndice) que nos habla de las frecuencias celdares
(cada una de las frecuencias que se encuentran en la interseccin entre una
columna y un rengln) y las "f" con subndices que representan las
frecuencias de cada una de las variables.
Para entender el uso de esta formula usaremos un ejemplo:
Los resultados que se presentan en la siguiente tabla representan los pesos
y las estaturas de 48 alumnos entrevistados.
Marcas de clase de "x"
1.44
5
1.54
5
1.64
5
1.745 1.845 1.94
5
y x
y
x
y
^2
44.5 3 1 4 178 7921
marcas 54.5 5 9 5 19 1035.5 56434.7
5
de clase 64.5 1 2 4 1 1 9 580.5 37442.2
18
5
de "Y" 74.5 5 1 1 7 521.5 38851.7
5
84.5 2 2 1 5 422.5 35701.2
5
94.5 1 3 4 378 35721
x
0 9 12 17 7 3 48 3116 212072
x
x
0 13.9
05
19.7
4
29.66
5
12.915 5.83
5
82.06
x
x
^2
0 21.4
832
25
32.4
723
51.76
5425
23.828
175
11.3
490
75
140.898
2
5380.77
Correlacin= 0.695
La sustitucin de la frmula es la siguiente:
Al interpretar nuestro resultado podemos concluir que si existe relacin
entre el peso y la estatura, es decir, que a mayor estatura mayor peso. En
muchas ocasiones el resultado de la correlacin es negativo y lo que
debemos pensar es que la relacin de las variables involucradas en el
calculo es inverso es decir que en la medida que crece la variable
independiente la variable dependiente decrece:
695 . 0
) 3116 - 212072) * 48 (( * ) 82.06 - 140.8982) * ((48
3116) * (82.06 - 5380.77 * 48
*
2 2 2
1 1
2
2
1 1
2
1 1 1 1
= =
(
|
.
|
\
|
(
|
.
|
\
|
=
= = = =
= = = =
k
i
i y
k
i
i y
l
i
i x
l
i
i x
l
i
k
i
i y
l
i
i x i i
k
j
y f y f n x f x f n
y f x f y x f n
r
1698 47
2045 15
1348 100
1268 120
demanda
0
50
100
150
1000 1500 2000
19
Construccin y uso de la tabla de correlacin de doble entrada.
Las punt uaci ones obt eni das por un grupo de al umnos en una
bat er a de t est que mi de l a habi l i dad verbal (X) y el
razonami ent o abst ract o (Y) son l as si gui ent es:
Y/ X 20 30 40 50
(25-35) 6 4 0 0
(35-45) 3 6 1 0
(45-55) 0 2 5 3
(55-65) 0 1 2 7
Se pide:
1 Existe correlacin entre ambas variables?
2 Segn los datos de la tabla, si uno de estos alumnos obtiene una
puntuacin de 70 puntos en razonamiento abstracto, en cunto se estimar
su habilidad verbal?
Convertimos la tabla de doble entrada en tabla simple.
x
i
y
i
f
i
x
i
f
i
x
i
2
f
i
y
i
f
i
y
i
2
f
i
x
i
y
i
f
i
20 30 6 120 2 400 180 5 400 3 600
20 40 3 60 1 200 120 4 800 2 400
30 30 4 120 3 600 120 3 600 3 600
30 40 6 180 5 400 240 9 600 7 200
30 50 2 60 1 800 100 5 000 3 000
30 60 1 30 900 60 3 600 1 800
40 40 1 40 1 600 40 1 600 1 600
20
40 50 5 200 8 000 250
12
500
10
000
40 60 2 80 3 200 120 7 200 4 800
50 50 3 150 7 500 150 7 500 7 500
50 60 7 350 17 500 420
25
200
21
000
40 1 390 53 100 1 080
86
000
66
500
21
Conclusiones.
- La estadstica es una ciencia formal y una herramienta que estudia el
uso y los anlisis provenientes de una muestra representativa de
datos, busca explicar las correlaciones y dependencias de un
fenmeno fsico o natural, de ocurrencia en forma aleatoria o
condicional.
- El coeficiente de correlacin de Spearman es exactamente el mismo
que el coeficiente de correlacin de Pearson, calculado sobre el rango
de observaciones. La correlacin estimada entre X e Y se halla
calculando el coeficiente de correlacin de Pearson para el conjunto
de rangos apareados. La correlacin de Spearman puede ser
calculada con la frmula de Pearson, si antes hemos transformado las
puntuaciones en rangos.
- El grfico por excelencia es el diagrama de dispersin, debido a que la
posicin de puntos materializa si la relacin es lineal a travs
precisamente de una lnea de fcil observacin por el investigador. En
el mismo, la variable independiente se coloca en el eje de las abscisas
y la dependiente en el eje de las ordenadas. El valor de r se debe
mostrar con dos decimales junto con el valor de la p, si el test de
hiptesis se realiz para demostrar que r es estadsticamente diferente
de cero. El nmero de observaciones debe a su vez estar indicado.
22
Bibliografa.
Universidad Pedaggica Experimental Libertador, Vicerrectorado de
Investigacin y Postgrado. (2011). Manual de Trabajos de Grado de
Especializacin y Maestra y Tesis Doctorales. Caracas.
Estadstica (2009). Documento en lnea. Disponible:
es.wikipedia.org/wiki/Estadstica (Consultado el 16 de Junio 2014).
Teora de la Correlacin. (2010) Documento en lnea. Disponible en
www.buenastareas.com Pgina principal Ciencia. (Consultado el 16
de Junio de 2014).
Coeficiente de Regresin. (2010) Documento en lines . Disponible en
http://www.monografias.com/trabajos93/analisis-correlacion
empleando-excel-y-graph/analisis-correlacion-empleando-excel-y-
graph.shtml#ixzz34mrPF9HU. (Consultado el 16 de Junio de 2014).