Documente Academic
Documente Profesional
Documente Cultură
Tipuri de relaii
dou
Variabile cantitative
Varsta X: X1, X2,..., Xn
TAS Y: Y1, Y2,..., Yn.
*
*
*
*
*
*
*
*
*
*
*
*
*
*
* *
*
X
5
II
I
*
*
*
*
*
*
*
*
*
*
*
*
*
*
* *
III
IV
X
6
II
*
*
*
*
*
*
*
*
* *
*
*
*
III
* *
IV
X
7
II
*
*
*
*
*
*
*
*
* *
*
*
III
*
*
IV
X
8
Indici de corelaie.
Suma produselor ecart
SPE ( X i X )(Yi Y )
i 1
Indici de corelaie.
Covariana
1 n
COV ( X , Y ) ( X i X )(Yi Y )
n i 1
Avantaje: mrime independent fa de volumul seriei
statistice.
10
Indici de corelaie.
Coeficientul de corelaie
Pentru a obine un indicator independent i de unitile de msur
ale celor dou variabile se utilizeaz coeficientul de corelaie sau
coeficientul Bravais-Pearson:
COV ( X , Y )
r
Sx Sy
SX i SY reprezint abaterile standard pentru seriile X i respectiv Y:
n
s2
2
(
X
X
)
i
i 1
n
11
r [-1, 1]
msoar intensitatea relaiei dintre variabilele X i Y
Dac r=1 punctele sunt situate pe o dreapt de
pant pozitiv (cresctoare).
Dac 0 < r < 1, norul de puncte poate fi nlocuit
(ajustat) printr-o dreapt de pant pozitiv .
Dispersia punctelor n jurul dreptei de regresie va fi
cu att mai mare cu ct r se apropie de 0 i cu
att mai mic cu ct r se apropie de 1.
Dac -1 < r < 0 atunci norul de puncte poate fi
aproximat cu o dreapt de pant negativ.
Dispersia punctelor fa de dreapt va fi cu att
mai mic cu ct r este mai apropiat de -1.
Dac r=-1 atunci toate punctele sunt situate pe o
dreapt de pant negativ.
12
35
60
60
30
50
50
40
40
30
30
20
20
25
20
15
10
r=0
r=1
10
10
0
0
0
60
60
50
50
40
40
30
30
20
20
r>0
10
r=-1
r<0
10
0
0
0
6
13
14
Valoarea r
p > 0,05
p < 0,05
in (-0.25 ; 0,25)
Nu are semnificatie
statistica
Grad de asociere
acceptabil
Nu are semnificatie
statistica
O corelaie moderat
spre bun
Nu are semnificatie
statistica
Eroare
Eroare
15
Atentie:
Variabilele corelate trebuie sa fie cantitative
Intre variabilele pentru care se calculeaza
corelatia trebuie sa existe o relatie de
cauzalitate
16
Coeficientul de corelaie-interpretare
Alura norului de puncte
r >0
O cretere a lui X determin o cretere a lui Y
(direct proporionale).
r<0
O cretere a lui X determin o diminuare a
17
Indici de corelaie.
Coeficientul de determinare
d = r2
Cazuri particulare:
18
19
rs 1
6 d i
i 1
n(n 1)
, d i Rxi Ryi
20
21
T
N ( p 1)(q 1)
2
p
q
(oij tij )
2
tij
i 1 j 1
2
, unde
22
23
min
a, bR
2
(
a
bX
Y
)
i
i
i 1
COV( X, Y)
.
SX
a Y b X
24
Drepte de regresie
min (c d Yi X i ) 2
c , d R
i 1
COV( X, Y)
SY
c Y d X
25
Drepte de regresie
Dreapta celor mai mici dreptunghiuri
y=e+fx.
Notnd cu
Yi e
Yi e f X i , X i
f , i=1,2,,n,
^
i 1
( Xi Xi )( Yi Yi )
SY
f sign (SPE )
SX
, e Yf X
.
26
27
Funcia de regresie.
Schimbri de variabile
28
**
* *
* *
*
* *
*
*
*
**
*
* *
*
*
*
29
Liniarizarea datelor
Din forma diagramei de dispersie s-ar putea deduce c o lege exponenial
ar fi mai potrivit pentru descrierea dependenei funcionale, adic o
relaie de forma:
Y = a ebX.
Aceasta, dup o logaritmare a ambilor membri, devine:
ln Y = ln a + b X
care justific schimbarea de variabil Y' = ln Y pentru liniarizarea
relaiei dintre cele dou variabile:
Y'=a'+ b'X
unde a'=ln a i b'=b.
30
Regresii multidimensionale
Fiind date variabilele:
Xi: Xi1,...,Xin , i=1,2,...,m
Y: Y1,..., Yn
se caut o relaie de forma:
Y = a + b1X1+...+bmXm,
unde coeficienii a si bi (i=1,...,m) se determin astfel
nct s minimizeze expresia:
n
(Y (a b X
i 1
1i
... b m X mi ))
2
.
31
Comparaia a
2 grupuri
distribuie
normal
teste
parametrice
Variabil
cantitativ
distribuie
non-normal
Variabil
ordinal
Variabil
dihotomial
Interval de
timp
teste
nonparametrice
Student (t)
Comparaia a
3 grupuri
Test F (ANOVA)
Corelaia a 2
variabile n
acelai grup
Corelaie
(coeficient Pearson)/
regresie
Corelaia a 2
variabile n
acelai grup
Corelaie
(coef. Spearman)
Comparaia a
2 grupuri
Mann-Whitney U,
Wilcoxon
Comparaia a
3 grupuri
Kruskall-Wallis
Hi ptrat
Fisher exact
Log rank
Regresie
linear
multipl
Regresie
logistic
Modelul
lui Cox