Sunteți pe pagina 1din 17

Biostatistică și metodologia cercetării

Tema
ANALIZA DE CORELAŢIE. APLICAŢII ÎN CERCETAREA ŞTIINŢIFICĂ. REGRESIA:
NOŢIUNI GENERALE.\

Pentru rezolarea problemelor practice si a testelor a rog a consultati PRELEGERILE,


MATERIALUL TEORETIC LA TEMA PE CARE IL AVETI MAI JOS SI
SUPORTURILR DE CURS PE CARE LE AVETI IN FORMAT ELECTRONIC (AU FOST
EXPEDIATE PE POSTA LA INCEPUT DE SEMESTRU) Larisa Spinei, Oleg Lozan, Vladislav
Badan; Biostatistica, Univ. de Stat de Medicină şi Farmacie „Nicolae Testemiţanu”; SI
D.Tintiuc, Elena Raevschi, Iu. Grossu, T.Grejdeanu, Corina Vicol, L.Margine, V.Badan, Biostatistica.
Metodologia cercetării ştiinţifice (suport de curs), Univ. de Stat de Medicină şi Farmacie „Nicolae
Testemiţanu. PP 141-153 LA ACESTE PAGINI GASITI INFO LA TEMA
Testul de semnificaţie pentru coeficientul de corelaţie PAG 148
Subiecte pentru pregătirea individuală
1. Noțiuni generale privind corelaţia: definiție, utilitate.
2. Clasificarea tipurilor legăturii de corelație.
3. Calcularea și interpretarea coeficientul de corelație Pearson-Bavarias.
4. Reprezentarea grafică a legăturilor de corelaţie Graficul Scatter (Graficul punctual, Graficul de
corelaţie)
5. Testarea semnificaţiei coeficientului de corelaţie.
6. Coeficientul de determinare: mod de calcul, semnificaţie;
7. Interpretarea semnificaţiei coeficientului de corelaţie în funcţie de valoarea testului „t”.
8. Regresia. Noţiuni generale. Clasificare. Calcularea și interpretarea coeficientul de regresie.
9. Coeficientul de corelaţie Spearman: definiţie, mod de calcul, interpretare.

Probleme practice
În baza datelor prezentate mai jos: 1. Să se calculeze coeficientul de corelaţie şi să se aprecieze
sensul şi intensitatea legăturii. 2. Să se aprecieze semnificaţia coeficientului de corelaţie. Se va utiliza testul
„t”. Dacă pragul de semnificaţie este mai mic decât 0,05 atunci coeficientul de corelaţie este semnificativ. 3.
Să se determine şi să fie interpretată valoarea coeficientului de determinare.
Problema 1.
 Timpul trecut din momentul accesului de pancreatită acută (x) : . 3, 5, 7, 10
 Numărul complicaţiilor postoperatorii (y): 6, 8, 12, 19

Problema 2.
 Nivelul de asigurare cu medici stomatologi (x): 2,3 ; 3,2; 3,4; 3,6
 Ponderea copiilor sanaţi în cadrul a 5 raioane (y): 65,7; 77,7; 88,0; 91,4
Problema 3.
 Greutatea (kg) (x) : 58, 76, 100, 70, 88, 67, 55, 74, 75, 60, 115, 58, 65, 79, 85
 Indicele Masei Corporale (IMC) (unităţi) (y) la un lot de 15 de persoane: 22 ,31 ,34 ,29 ,26 ,25, 22,
24 , 25, 21,33, 25, 20, 23, 27
Problema 4.
 Ggreutatea (kg) (x): 72 ,75, 92, 100, 85, 70,105, 80, 110, 120, 90, 85, 75, 87
 Nivel glicemiei în sînge (mg/dl) (y) la un lot de 14 de persoane: 60, 63, 80, 85,79, 58,90, 80,89, 82,
92, 54, 84
Problema 5.
Analizând incidența în anumite zone, un comitet special al administrației regionale a sănătății a declarat că
planul de măsuri preventive în rândul lucrătorilor agricoli (în 10 regiuni) a fost îndeplinit de: 52%, 57%,

1
Biostatistică și metodologia cercetării
64%, 68%, 72%, 75%, 79% %, 86%, 88%. Frecvența bolilor la nivelul pielii și țesutului subcutanat cu
handicap temporar în aceleași zone este (la 100 de angajați): 3,2, 3,5, 2,9, 2,7, 2,4, 78 2,8, 2,9, 2,2, 1,7, 1,5.
În ce măsură este asociată frecvența acestor cazuri de dizabilitate cu implementarea măsurilor preventive în
rândul lucrătorilor agricoli?
Problema 6.
Identificați tipul de corelație dintre creșterea și masa corporală la 6 bărbați 50 ani: înălțimea corpului (în cm)
164 170 185 180 182 195 Greutatea corporală (în kg) 80, 75, 92, 80, 90, 102.
În tabelul de mai jos este indicat nivelul de asigurare cu medici stomatologi (x) şi ponderea
copiilor sanaţi în cadrul a 5 raioane (y)

Nr. Asigurarea Număr


cu medici copii
x sanaţi
Y
1 2,3 65,7
2 3,2 77,7
3 3,4 88,0
4 3,6 91,4
Total
Media 3.1 80.7
Completaţi tabelul.
Calculaţi şi interpretaţi coeficientul de corelaţie. Calculati si interpretati coeficientul de determinare.
Calculati si interpretati coeficientul de regresie.

Problema 7.

Se analizează existența corelației dintre înălțime și masa corporală la 6 bărbați 50 ani. Au fost
înregistrate 6 perechi asociate a celor doi parapetri: înălțimea corpului (în cm) 164, 170, 185, 180,
182, 195, Greutatea corporală (în kg) 80, 75, 92, 80, 90, 102.

Calculați și interpretați indicatorul de corelație Pearson, coeficientul de determinare și cel al regresiei


statistice.
Problema 8.

Repartizarea a 22 de copii conform înălţimii (x) şi greutăţii (y) a oferit următoarele date:
înălţimea medie – 134 cm, greutatea medie – 31,8 kg, abaterea standard pentru înălţime (x) –
2,37; abaterea standard pentru greutate (y) – 1,97; coeficientul de corelaţie ±0,82.
a. Interpretați valoarea coeficientului de corelație dintre înălțime și greutate calculat pe
lotul de 22 de copii.
b. Cu cât se va modifica greutatea corpului la copii, dacă înălţimea acestora va creşte cu
un centimetru?

Teste pentru autocontrol


1. Coeficientul de corelaţie măsoară:
a. intensitatea împrăştierii datelor unei serii statistice
b. intensitatea corelaţiei între medie şi mediană

2
Biostatistică și metodologia cercetării
c. intensitatea corelaţiei între doi parametri exprimaţi numeric
d. tendinţa de creştere sau descreştere simultană sau inversă a doi parametri.
e. intensitatea oscilaţiilor posibile ale caracterului studiat
2. Coeficientul de corelaţie calculat între vârsta și tensiunea arterială sistolică la 425 de pacienți este de
+0,93. Aceasta înseamnă că:
a. cei doi parametri nu sunt corelaţi
b. cei doi parametri sunt slab corelaţi
c. X cei doi parametri sunt puternic și direct corelaţi
d. sunt prea puţine cazuri şi nu avem încredere în valoarea coeficientului
e. cei doi parametri sunt puternic și invers corelaţi
3. Coeficientul de corelaţie calculat pentru doi parametri măsuraţi la 429 de pacienţi este -0,92. Aceasta
înseamnă că între cei doi parametri avem:
a. corelație indirectă slabă
b. corelație indirectă puternică
c. corelație directă slabă
d. corelație directă, puternică
e. corelație directă perfectă
4.Graficul Scatter ne dă informaţii despre:
a. X corelaţia celor doi parametri de pe orizontală şi verticală
b. omogenitatea eşantionului
c. simetria distribuţiilor fiecăruia din cei doi parametri
d. corelaţia fiecărui parametru cu vârsta pacienţilor
e. intensitatea legăturii de corelație dintre cei doi parametri
5.Coeficientul de corelaţie calculat pentru doi parametri măsuraţi la 150 de pacienţi este 0,89. Aceasta
înseamnă că:
a. cei doi parametri nu sunt corelaţi
b. cei doi parametri sunt slab corelaţi
c. cei doi parametri sunt puternic corelaţi
d. cei doi parametri sunt mediu corelaţi
e. cei doi parametri sunt perfect corelaţi
6.Valoarea coeficientului de corelație Pearson calculat pentru doi parametri este -1. Aceasta semnifică faptul
că:
a. cei doi parametri sunt perfect direct corelați
b. X cei doi parametri sunt perfect indirect corelați
c. cei doi parametri nu sunt corelați
d. cei doi parametri sunt puternic direct corelați
e. cei doi parametri sunt slab indirect corelați
7. Dacă valoarea coeficientului de corelație Pearson este de +1, atunci avem:
a. X corelație perfectă pozitivă
b. corelație perfectă negativă
c. corelație putenică pozitivă
d. corelație puternică negativă
e. corelație slabă pozitivă

8. Relația dintre cei doi parametri, reprezentată prin graficul de mai jos, este următoarea:
a. corelație directă
b. corelație inversă
c. nu sunt corelați
d. corelație funcțională
e. sunt perfect corelați

3
Biostatistică și metodologia cercetării

9.Conform graficului de ma i jos între valorile sodiului seric şi potasiului seric ale pacienţilor cu afecţiuni
hepato-renale:
a. există o corelație perfectă
b. există o corelație directă puternică
c. există o corelație inversă slabă
d. există o corelație inversă puternică
e. nu există nici o corelaţie
Corelatia intre sodiul si potasiul seric la pacientii cu
afectiuni hepato-renale

5.0

4.5
K seric

4.0

3.5

3.0
120 125 130 135 140 145 150
Na seric

10.Coeficientul de corelaţie calculat pentru doi parametri măsuraţi la 12 de pacienţi este -0,98. Aceasta
înseamnă că:
a. cei doi parametri nu sunt corelaţi
b. cei doi parametri sunt indirect puternic corelați
c. cei doi parametri sunt direct și puternic corelați
d. cei doi parametri sunt perfect corelaţi
e. cei doi parametri sunt perfect învers corelați

11. Valoarea coeficientului de corelaţie cuprinsă între ±0,30 şi ±0,69 denotă o:


a. corelaţie slabă între fenomene
b. corelaţie puternică între fenomene
c. corelaţie medie între fenomene
d. corelaţie perfectă între fenomene
e. lipsă de corelaţie

12. Valoarea coeficientului de corelaţie cuprinsă între ±0,15 şi ±0,30 exprimă existența unei:
a. corelaţii puternice între fenomene
b. corelații medii între fenomene
c. corelații perfecte între fenomene
d. corelaţii slabe între fenomene
e. corelații inexistente între fenomene

13. Valoarea coeficientului de corelaţie cuprinsă între ±0,70 şi ±0,99 denotă între fenomene o:
a. corelaţie slabă
b. corelație perfectă
c. corelație medie

4
Biostatistică și metodologia cercetării
d. corelație puternică
e. lipsă de corelație

14. Valori ale coeficientului de corelație sub 0,15 ne arată:


a. corelație puternică între parametri analizați
b. corelație slabă între parametri analizați
c. corelație perfectă între parametri analizați
d. corelație medie între parametri analizați
e. lipsă de corelație între parametrui analizați

15. Relația dintre cei doi parametri, reprezentată prin graficul de mai jos, este următoarea:
a. corelație directă
b. corelație inversă
c. nu sunt corelați
d. corelație funcțională

16.Coeficientul de corelaţie calculat pentru doi parametri măsuraţi la 219 de pacienţi este 0,025. Aceasta
înseamnă că:
a. cei doi parametri nu sunt corelaţi
b. cei doi parametri sunt invers corelaţi
c. cei doi parametri sunt direct corelaţi
d. sunt prea puţine cazuri şi nu avem încredere în valoarea coeficientului
e. cei doi parametri sunt perfect corelaţi

17.Graficul Scatter este un grafic care:


a. reprezintă valorile a doi parametri măsuraţi la mai mulţi pacienţi
b. X reprezintă fiecare pacient printr-un punct
c. X pe abscisă (orizontală) este reprezentat unul din parametrii, iar pe ordonată (verticală) este
reprezentat celălalt parametru, la acelaşi pacient
d. are pierderi din informaţie, ca histograma
e. reprezintă mai mulți pacienți printr-un punct

18. Graficul XY Scatter este un grafic care:


a. X reprezintă fiecare pacient printr-un punct, ale carui coordonate sunt valorile pentru 2 parametri
măsuraţi la acel pacient
b. reprezintă doua sau mai multe subloturi sub forma unor sectoare de cerc
c. se foloseste pentru a compara valorile medii pentru 2 serii de date
d. nu are pierderi din informaţie, ca histograma
e. reprezintă fiecare pacient prin două puncte ale carui coordonate sunt valorile pentru 2 parametri

19.Coeficientul de corelaţie Pearson - r - măsoară:


a. intensitaatea dispersiei datelor unei serii statistice
b. intensitatea corelaţiei între medie şi mediană
c. intensitatea corelaţiei între doi parametri exprimaţi nenumeric (calitativ)
d. probabilitatea ca diferenta dintre doua medii sa fie semnificativă statistic
e. puterea şi direcţia de influenţă a unor factori asupra altor factori

5
Biostatistică și metodologia cercetării
20. O dreaptă de regresie este o dreaptă care:
a. este situată cât mai aproape de punctele unui grafic Scatter
b. trece prin toate punctele unui grafic Scatter
c. aproximează un poligon al frecvenţelor
d. este paralela cu ordonata
e. este paralelă cu abscisa
21. O dreaptă de regresie ne oferă:
a. O relaţie aproximativă între valorile a doi parametri
b. O relaţie exactă între valorile a doi parametri
c. Traseul liniei frânte a poligonului frecvenţelor
d. Posibilitatea aproximării valorilor unui parametru dacă ştim valorile celuilalt
e. O relaţie exactă între valorile a trei parametri
22. Legătura dintre între incidenţa dinţilor cariaţi (fenomen x), dinţilor cu parodontopatii marginale
(fenomen y) şi dinţilor absenţi (fenomen z) se stabilește cu ajutorul:
a. Coeficientului de corelație a rangurilor
b. Coeficientului de corelație liniară simplă
c. Coeficientului de corelație liniară multiplă
d. Coeficientului de variație
e. Coeficientului Spearman
23. Coeficientul de corelație a rangurilor:
a. Nu poate fi mai mare ca 1
b. Nu poate fi mai mic ca -1
c. Nu poate fi egal cu 1
d. Nu poate fi egal cu 2
e. Nu poate fi egal cu 0
24. Selectați afirmațiile cu referire la Coeficientul de corelație a rangurilor:
a. Este mai mare ca 1
b. Este mai mic ca -1
c. Poate fi egal cu 1
d. Poate fi egal cu 0.5
e. Nu poate fi egal cu 0
25. Legătura dintre înălţimea (fenomen x), greutatea (fenomen y) şi vârsta (fenomen z) copiilor se stabilește
cu ajutorul:
a. Coeficientului de corelație a rangurilor
b. Coeficientului de corelație liniară simplă
c. Coeficientului de corelație liniară multiplă
d. Coeficientului de variație
e. Coeficientului Spearman
26. Regresia, similar corelației poate fi:
a. Directă
b. Multiplă
c. Liniară
d. Doar pozitivă
e. Neliniară
27. Pentru a calcula Coeficientul de regresie avem nevoie de următorii indicatori:
a. Coeficientul de variație
b. Coeficientul de corelație liniară
c. Coeficientul de corelație a rangurilor
d. Deviația standard a fenomenului independent
e. Deviația standard a fenomenului dependent

28. Legătură de corelaţie după formă poate fi:


a) pozitivă
b) liniară
6
Biostatistică și metodologia cercetării
c) negativă
d) alternativă
e) matematică
29. Legătură de corelaţie după sens poate fi:
a) negativă
b) curbilinie
c) rectilinie
d) alternativă
e) pozitivă
30. După formă legătura de corelaţie poate fi:
a) lineară
b) negativă
c) pozitivă
d) neliniară
e) multimodală
31. Pentru a verifica existenţa unei corelaţii între datele din două coloane numerice,în programul excel din
Data analysis se foloseşte funcţia:
a. Correlation
b. Average
c. Mode
d. Histogram
e. Median
32. Pentru realizarea unui grafic punctual SCATTER, în excel din meniul chart type selectăm funcția:
a. Histogram
b. XY (Scatter)
c. Pie
d. Bar
e. Stock
33. O dreaptă de regresie se calculează:
a. Folosind mediile de eşantionare
b. Folosind mediile şi deviaţiile standard
c. Folosind metoda celor mai mari pătrate
d. Folosind metoda celor mai mici pătrate
e. Folosind deviațiile standar
34. În ecuaţia unei drepte de regresie, valorile care o determină sunt:
a. Panta (slope) şi ordonata la origine (intercept)
b. Media şi deviaţia standard
c. Mediile de eşantionare
d. Panta (slope)
e. Deviația standard
35. Legătură de corelaţie se numeşte legătura:
a) [ ] care reprezintă o caracteristică complectă a totalităţii după omogenitatea ei, particularităţile de
distribuţie a două caractere comparate ;
b) [ ] unei valori numerice a variabilei independente îi corespund mai multe valori a variabilei dependente;
c) [ ] unei valori numerice a variabilei independente îi corespunde strict o valoare a variabilei dependente ;
d) [ ] mai multor valori numerice a variabilei independente îi corespunde strict o valoare a variabilei
dependente
e) [ ] care este perfectă și rigidă

36. Legătură funcţională este atunci cînd:


a) [ ] unei valori numerice a variabilei independente îi corespund mai multe valori a variabilei dependente
b) [ ] mai multor valori numerice a variabilei independente îi corespunde strict o valoare a variabilei
dependente

7
Biostatistică și metodologia cercetării
c) [ ] unei valori numerice a variabilei independente îi corespunde o valoare strictă a variabilei dependente
d) [ ] mai multor valori numerice ale variabilei independente le corespund mai multe valori a variabilei
dependente
e) [ ] este o legătură vremelnică și într-un singur sens

37. Analiza corelaţiei se utilizează pentru:


a) [ ] calcularea indicilor generali, care caracterizează din diferite aspecte fiecare caracter studiat
b) [ ] compararea gradului de omogenitate a totalităţilor studiate
c) [ ] determinarea limitelor oscilaţiilor posibile ale caracterului studiat
d) [] determinarea interacţiunii factorilor, precum şi a puterii şi direcţiei de influenţă a unor factori asupra
altor factori
e) [ ] analiza variabilității

38. Corelaţia se aplică în practică pentru:


a) [ ] determinarea veridicităţii diferenţei dintre două totalităţi comparate
b) [ ] determinarea mărimii schimbării valorii unui caracter la schimbarea valorii altui caracter cu o unitate
c) [x] determinarea interacţiunii factorilor, precum şi a puterii şi direcţiei de influenţă a unor factori asupra
altor factori
d) [ ] determinarea variabilității fenomenului
e) [ ] determinarea omogenității fenomenului

39. Analiza de corelaţie se utilizează când trebuie de determinat:


a) [ ] mărimea schimbării valorii unui caracter la schimbarea valorii altui caracter cu o unitate
b) [ ] veridicitatea diferenţei dintre două totalităţi comparate
c) [ ] limitele oscilaţiilor posibile ale caracterului studiat
d) [x] puterea şi direcţia de influenţă a unor factori asupra altor factori
e) [ ] variabilitatea fenomenului

40. Selectaţi afirmaţia incorectă referitor la graficul de corelaţie:


a) [ ] este numit corelogramă
b) [ ] are aspectul unui nor de puncte
c) [ ] indică existenţa sau lipsa legăturii
d) [ ] indică forma şi intensitatea exactă a legăturii
e) [ ] arată sensul aproximativ al legăturii

41. După sens legătură de corelaţie poate fi:


a) [ ] rectilinie
b) [ ] curbilinie
c) [x] pozitivă
d) [ ] continuă
e) [ ] ] multimodală

42. Legătură de corelaţie directă slabă este la valoarea r xy :


a) [ ] 0,0 - +0,29
b) [ ] 0,0 - + 0,18
c) [ ] 0,0 - +0,12
d) [ ] 0,5 - +0,29
e) [ ] 0,29 - +0,75

43. Pentru care din valorile enumerate ale lui rxy legătură de corelaţie este directă medie:
a) [ ] +0,3 - +0,65
b) [ ] +0,3 - +0,69
c) [ ] +0,3 - +0,47
d) [ ] +0,3 - +0,74
e) [ ] 0,69 - +0.99

8
Biostatistică și metodologia cercetării
44. Legătură de corelaţie directă puternică este la valoarea r xy :
a) [ ] +0,7 - +0,99
b) [ ] +0,7 - +0,95
c) [ ] +0,7 - +0,98
d) [ ] +0,7 - +0,90
e) [ ] +0,3 - +0,69

45. Pentru rxy = +0,25 legătură de corelaţie va fi:


a) [ ] directă medie
b) [ ] inversă medie
c) [ ] directă puternică
d) [ ] directă slabă
e) [ ] directă medie

46. La valoarea lui rxy = -0,85 legătură de corelaţie este:


a) [ ] inversă medie
b) [ ] inversă slabă
c) [ ] inversă puternică
d) [ ] directă puternică
e) [ ] directă medie

47. Dacă rxy = +0,58 legătură de corelaţie este :


a) [ ] directă slabă
b) [ ] directă medie
c) [ ] directă puternică
d) [ ] directă deplină
e) [ ] indirectă medie

48. Valoarea rxy = -0,36 indică o legătură de corelaţie:


a) [ ] inversă slabă
b) [ ] inversă puternică
c) [ ] directă medie
d) [ ] inversă medie
e) [ ] directă slabă

49. Valoarea rxy= +0,94 indică o legătură de corelaţie:


a) [ ] directă puternică
b) [ ] directă medie
c) [ ] directă slabă
d) [ ] indirectă puternică
e) [ ] indirectă medie

50. Pentru rxy = -0,22 legătură de corelaţie va fi :


a) [ ] inversă medie
b) [ ] directă slabă
c) [ ] inversă slabă
d) [ ] inversă puternică
e) [ ] directă medie

51. Regresie se numeşte:


a) [ ] schimbarea argumentului în dependenţă de schimbarea a unei sau mai multe funcţii
b) [ ] schimbarea funcţiei în dependenţă de schimbarea a unui sau mai multor argumente
c) [ ] în dependenţă de schimbarea unei sau mai multe funcţii argumentul nu se schimbă
d) [ ] gradul de modificare a funcţiei la schimbarea argumentului cu o anumită cantitate
e) [ ] schimbrea argumentului și funcției cu aceias unitate

9
Biostatistică și metodologia cercetării
52. Dacă la sporirea oricăror valori ale argumentului sporirile funcţiei nu sunt echivalente, regresia se
numeşte:
a) [ ] pozitivă
b) [ ] negativă
c) [ ] curbilinie
d) [ ] rectilinie
e) [ ] inversă

53. Dacă la sporirea oricăror valori ale argumentului sporirile funcţiei sunt echivalente, regresia se numeşte:
a) [ ] lineară
b) [ ] rectilinie
c) [ ] inversă
d) [ ] curbilinie
e) [ ] directă
54. În dependenţă de formă, legătura de corelaţie poate fi:
a) [ ] curbilinie
b) [ ] simplă
c) [ ] compusă
d) [ ] alternativă
e) [ ] directă

55. Coeficientul de regresie se utilizează pentru:


a) [ ] calcularea datelor orientative despre nivelul puterii de legătură
b) [ ] calcularea legăturii de dependenţă sub aspect cantitativ
c) [ ] calcularea nivelului puterii de legătură dintre caractere cantitative
d) [ ] calcularea mărimii schimbării valorii unui caracter la schimbarea valorii altui caracter cu o unitate
e) [ ] calcularea direcţiei de influenţă a unor factori asupra altor factori

56. Mărimea schimbării valorii unui caracter la schimbarea valorii altui caracter cu o unitate este determinată
prin calcularea:
a) [ ] coeficientului de corelaţie
b) [ ] coeficientului de regresie
c) [ ] coeficientului de variaţie
d) [ ] deviației standard
e) [ ] erorii standard
57. Apreciaţi care din următoarele afirmaţii sunt adevărate
[ ] Un coeficient de corelaţie de -0,96 arată o dependenţă invers proporţională între şirurile de valori luate în
calcul
b) [ ] Un coeficient de corelaţie de 0,26 arată o dependenţă direct proporţională între şirurile de valori luate
în calcul
c) [ ] Un coeficient de corelaţie de -12 arată o dependenţă invers proporţională între şirurile de valori luate în
calcul
d) [ ] Valorile coeficientului de corelaţie variază între -1 şi 1
e) [ ] Un coeficient de corelaţie de 1 arată o dependenţă direct proporţională între şirurile de valori luate în
calcul
58. Într-un studiu s-au calculat valorile coeficientului de corelaţie între greutate şi inaltimea pacienţilor
rezultând o valoare r= 0,87. Cum interpretaţi rezultatul obţinut?
a) [ ] există o bună corelaţie între cele două variable statistice deoarece r se apropie de 1
b) [ ] nu există o bună corelaţie între cele două variable statistice deoarece r este mai mic decât 1
c) [ ] între cele două variabile există o relatie de proporţionalitate directă
d) [ ] între cele două variabile există o relatie de proporţionalitate inversă
e) [ ] este o eroare de studiu
59. Într-un studiu s-au calculat valorile coeficientului de corelaţie între greutate şi sexul pacienţilor rezultând
o valoare r= 0,87. Cum interpretaţi rezultatul obţinut?
a) [ ] există o bună corelaţie între cele două variable statistice deoarece r se apropie de 1
b) [ ] nu există o bună corelaţie între cele două variable statistice deoarece r este mai mic decât 1

10
Biostatistică și metodologia cercetării
c) [ ] între cele două variabile există o relatie de proporţionalitate directă
d) [ ] între cele două variabile există o relatie de proporţionalitate inversă
e) [ ] este o eroare de studiu
S-a realizat un studiu pe 1500 de subiecți cu vârstă de 16 ani pentru a identifica relația dintre perimetrul
cranian și indicele de inteligență. Valorile perimetrului cranian au fost obținute din fișele medicale, iar
indicele de inteligență a fost determinat prin aplicarea unui test de inteligență. S-a obținut un coeficient de
corelație de -0,35. Care din următoarele afirmații sunt corecte:
a. Corelația este negativă; perimetrul cranian tinde să fie mai mic pentru subiecții cu indice de
inteligență mai mare dar corelația este slabă
b. Există o relație negativă între perimetrul cranian și indecele de inteligență
c. Nu există corelație între perimetrul cranian și indecele de inteligență
d. Corelația este negativă; indicele de inteligență tinde să fie mai mic pentru subiecții cu perimetrul
cranian mai mic, dar corelația este slabă
e. Corelația este pozitivă; indicele de inteligență tinde să fie mai mic pentru subiecții cu perimetrul
cranian la naștere mai mare, dar corelația este slabă.
Bibliografie obligatorie
1. Larisa Spinei, Oleg Lozan, Vladislav Badan; Biostatistica, Univ. de Stat de Medicină şi Farmacie
„Nicolae Testemiţanu”; Şcoala de Management în Sănătate Publică. – Ch. : Şcoala de Management în
Sănătate Publică, 2009 (Î.S. F.E.-P. „Tipografi a Centrală”). - 186 p. 250 ex. ISBN 978-9975-78-743-7,
CZU: 311.2 S 73.
2. Spinei L., Ştefăneţ S. şi alţii. Epidemiologie şi metode de cercetare, Chişinău, 2006, 224 p.
3. D.Tintiuc, Elena Raevschi, Iu. Grossu, T.Grejdeanu, Corina Vicol, L.Margine, V.Badan, Biostatistica.
Metodologia cercetării ştiinţifice (suport de curs), Univ. de Stat de Medicină şi Farmacie „Nicolae
Testemiţanu”; Catedra Sănătate Publică şi Management „Nicolae Testemiţanu”, Chişinău 2011, (Î.S.
F.E.-P. „Tipografi a Centrală”). - 355 p.
4. Tintiuc D., Grosu Iu., Grejdianu T. Sănătate publică şi management, Chişinău, 2007, p. 896.
5. Tintiuc D., Raevschi M., Spinei L. şi alţii, Medicină socială şi management, compendiu pentru studenţi,
Chişinău 2005.
6. Bolboacă Sorana, Biostatistică și informatică medicală, Cluj Napoca, 2016T, Editura medicală
universitară „Iuliu Hațieganu”, ISBN 978-973-693-682-1.
7. Tudor Drugan, Daniel Leucuța Tudor Călinici, Horațiu Colosi, Dan Istrati, Soroana Dăbolboacă,
Cosmina Bondor Mădălina Văleanu, Mihaela Iancu, Curs de biostatistică medicală, ediția a Ii-a revizuită
și adăugită, Ed. Medicală universitară, „Iuliu Hațieganu”, Cluj Napoca 2018. ISBN 978-973-693-861-0.
8. Badea P, Georgescu D. Introducere in biostatistica. Editura Medicală Universitară, Craiova, 2003
9. Balint Ş, Tănasie L. Statistica- notiţe de curs. Universitatea de Vest, Timişoara, 2008
10. Johnson RA, Bhattacharyya GK. Statistics: Principles and Methods, 7th Edition. John Wiley & Sons,
New York, 2014.
11. Moore DS. The Basic Practice of Statistics, 3rd Edition. W.H.Freeman, New York, 2003
12. Alexandru Dragoş Ovidiu. Biostatistică şi statistică medicală, editura SITECH, Craiova, 2018, ISBN
978-606-11-6363-2, pp 127.
13. Curs de biostatistică medicală – editura medical universitară “Iuliu Hațieganu” Cluj-Napoca, 2016
Bibliografie suplimentară:
1. Dolea G. Statistică. Petroşani, 2006 Goschin Z., Vatui M.
2. Isaic-Maniu A., Mitruţ C., Voineagu V. Statistica generală. http://www.biblioteca-
digitala.ase.ro/biblioteca /model/index2.asp (citat martie 2011)

11
Biostatistică și metodologia cercetării
3. Lilea E., Vatui M., Boldeanu D., Goschin Z. Statistica. http://www.bibliotecadigitala.ase.ro/biblioteca
/model/index2.asp (citat martie 2011)
4. Măruşteri M. Noţiuni fundamentale de biostatistică: note de curs. Târgu Mureş, 2006
5. Popuşoi E., Antonişin I. Analiza corelaţiei şi regresiei. Chişinău, 1994 7. Spinei L.,
6. Lozan O., Badan V. Biostatistica. Chişinău, 2009
7. Spinei L. Metode de cercetare şi de analiză a stării de sănătate. Chişinău, 2012, 511p.
8. Банержи А. Медицинская статистика понятным языком: вводный курс/пер. с англ. под ред. В. П.
Леонова. – М.: Практическая медицина, 2007. – 287 с.:ил.
9. Гланц С. Медико-биологическая статистика. Пер. с англ. — М.: Практика, 1998. — 459 с.

Material teoretic / Repere teoretice

1. Noţiunea de corelaţie

În medicină şi biologie, ca de altfel în toate domeniile de activitate, există o interdependenţă între


fenomene. Apariţia şi evoluţia unui fenomen este în strânsă legătură cu o serie de alte fenomene sau factori
care intervin în determinarea sau favorizarea acestuia. Corelaţia este o metodă care ne permite să cunoaştem
fenomenele din natură şi societate sub raportul interferenţei lor, a conexiunilor în care se găsesc.

Definiţie:
1. Relaţie, legătură reciprocă între două sau mai multe lucruri sau fenomene; relaţie în care unul dintre
termeni nu poate exista fără celălalt.
2. Dependenţă reciprocă, relaţie a două fenomene sau procese între variaţiile cărora există o anumită
legătură. – Din fr. corrélation. Sursa: DEX '98
Pentru a explica noţiunea de corelaţie, vom exemplifica câteva legături între parametri de macrosistem,
adică parametri ce caracterizează organismul în totalitatea lui sau sistemele mai importante din organism.
Astfel, ştim cu toţii că există o corelaţie între tensiunea arterială sistolică şi cea diastolică. Ce înseamnă acest
fapt? Înseamnă că tendinţa de creştere a tensiunii sistolice, este însoţită de o tendinţă de creştere şi a tensiunii
diastolice, iar tendinţa de scădere a primeia este însoţită de o tendinţă de scădere a celei de-a doua.
Tot astfel, alte perechi de parametri manifestă o comportare asemănătoare: greutatea şi înălţimea,
numărul de eritrocite şi hemoglobina, vitezele de sedimentare a hematiilor la o oră şi la două ore,
colesterolemia şi lipemia, etc.
În general, deosebim două tipuri de corelaţii: corelaţii funcţionale sau matematice şi corelaţii statistice
sau stohastice (întâmplătoare). Corelaţiile funcţionale sunt perfecte, rigide, exprimând legătura de la cauză la
efect între fenomene. În cazul corelaţiei funcţionale unei valori determinate a unei variabile independente X
(argument) îi corespunde strict o valoare a variabilei dependente Y (funcţie).
După formă legătura de corelaţie poate fi lineară (rectilinie) sau nelineară (curbilinie).
În cazul corelaţiei lineare schimbărilor uniforme a valorilor medii a unei variabile, au loc schimbări
egale a altei variabile (de exemplu, schimbările tensiunii arteriale sistolice şi celei diastolice). Pentru
corelaţia nelineară schimbărilor uniforme a unei valori îi corespund valori medii a altei variabile, care poartă
caracter de creştere ori de micşorare.
După direcţie – directă (pozitivă) şi inversă (negativă).
În cazul corelației directe vom spune că doi parametri au tendinţa de a creşte sau descreşte
simultan
Există cazuri în care doi parametri se corelează prin creşterea unuia însoţită de o tendinţă de descreştere
a celuilalt. Astfel, creşterea concentraţiei hormonului tiroidian T 4, este însoţită de o scădere a frecvenţei
cardiace. Aceşti doi parametri sunt un exemplu de corelaţie inversă.
Vom spune că doi parametri sunt corelaţi invers dacă au tendinţa ca, odată cu creşterea sau
descreşterea unuia, celălalt să descrească sau să crească. (au tendinţă inversă de variaţie).

12
Biostatistică și metodologia cercetării
Corelaţiile statistice presupun evoluţia în acelaşi sens sau sens invers a fenomenelor ce se
corelează, dar nu cu aceeaşi unitate de măsură.
Spre exemplu, creşte nivelul de trai al populaţiei unei colectivităţi de două ori, creşte şi
rezistenţa organismului la îmbolnăviri dar nu în aceeaşi măsură, pentru că în afară de nivelul de trai,
receptivitatea organismului la îmbolnăviri este determinată şi de alţi factori (biologici, climatici,
geografici etc.).
Spre exemplu, dacă într-o colectivitate am efectuat un număr dublu de vaccinări anti-gripă,
numărul persoanelor ce vor contracta boala, în anul următor, va fi cu siguranţă mai scăzut, dar nu va
fi de două ori mai mic decât în anul precedent.

Corelația multiplă. Se stabileşte între mai mult de două fenomene, care au legătură de dependenţă între
ele. În asemenea situaţii, existenţa legăturii de dependenţă între fenomene, sensul şi intensitatea acestei
legături, se stabilesc cu ajutorul coeficientului de corelaţie lineară multiplă. Spre exemplu, dacă dorim să
evidenţiem legătura de dependenţă între înălţimea (fenomen x), greutatea (fenomen y) şi vârsta (fenomen z)
copiilor sau legătura de dependenţă între incidenţa dinţilor cariaţi (fenomen x), dinţilor cu parodontopatii
marginale (fenomen y) şi dinţilor absenţi (fenomen z) ne folosim de următoarea formulă: în care: r xyz =
coefi cientul de corelaţie lineară multiplă între cele trei fenomene; r xy = coefi cientul de corelaţie lineară
simplă între fenomenele x şi y; ryz = coefi cientul de corelaţie lineară simplă între fenomenele y şi z; r xz =
coefi cientul de corelaţie lineară simplă între fenomenele x şi z; Coeficientul de corelaţie lineară multiplă are
valori mai mari decât valorile coefi cienţilor de corelaţie lineară simplă luaţi în parte şi totdeauna semn
pozitiv. Interpretarea intensităţii corelaţiei multiple ţine seama de aceleaşi criterii enunţate la interpretarea
coeficientului de corelaţie lineară simplă.

2. Graficul Scatter (Graficul punctual, Graficul de corelaţie)


Este un grafic care:
 Reprezintă valorile a doi parametri măsuraţi la mai mulţi pacienţi
 Reprezintă fiecare pacient printr-un punct
 Pe abscisă (orizontală) este reprezentat unul din parametri
 Pe ordonată (verticală) este reprezentat celălalt parametru, la acelaşi pacient
Se realizează astfel „norul de puncte”. Dacă norul de puncte se va dispune fuziform, oblic de jos în
sus şi de la stânga la dreapta, între cele două fenomene există o corelaţie directă. Creşte un fenomen, creşte şi
cel de al doilea, cu care se corelează, sau ambele fenomene scad, evoluând în aceeaşi direcţie. Intensitatea
legăturii corelative dintre cele două fenomene se apreciază, aproximativ, după unghiul pe care dreapta ce
trece prinmijlocul norului de puncte îl realizează cu abscisa. Cu cât acest unghi ascuţit este mai mare, având
tendinţa să se apropie de 450, cu atât corelaţia dintre fenomene este mai puternică și invers. Dacă norul de
puncte se dispune fuziform, oblic de sus în jos şi de la stânga la dreapta, între cele două fenomene există o
corelaţie inversă. Intensitatea acestei corelaţii inverse se apreciază după mărimea unghiului ascuţit pe care
dreapta ce trece prin mijlocul norului de puncte îl formează cu abscisa, în partea opusă ordonatei.
Dacă punctele se dispun pe toată reţeaua grafică, neavând nici o tendinţă de a se grupa, înseamnă că
între fenomene nu există nici o legătură de dependenţă, fenomenele evoluând independent unul faţă de
celălalt. În cazul acesta, dreapta care trece prin mijlocul punctelor este paralelă fie cu ordonata, fie cu
abscisa. Acest grafic este extrem de util în statistică, furnizând o informaţie bogată, deoarece nu pierde din
informaţie ca histograma.

3. Coeficientul de corelaţie PEARSON


Legătura de dependenţă dintre două sau mai multe fenomene, sensul şi intensitatea acesteia, se stabilesc
cu ajutorul coeficientului de corelaţie lineară (simplă sau multiplă) al lui Bravais-Pearson. Coeficientul de
corelaţie PEARSON este de departe cel mai utilizat în exprimarea tăriei corelaţiei între doi parametri
numerici.

13
Biostatistică și metodologia cercetării
Anume, fie X  x1 , x 2 ,.......xn şi Y  y1 , y 2 ,....... y n , valorile măsurate pentru cei doi parametri
şi fie X , Y , mediile de eşantionare respective. Atunci coeficientul de corelaţiile al parametrilor exprimaţi
de seriile statistice X şi Y va fi:

x
n
 X    yi  Y 
r  i 1
i

 dxdy
x
n

i  X 
2
 y
n

i Y 
2  dx  dy2 2

i 1 i 1

d x d y – suma produselor dintre abaterile de la media aritmetică a valorilor frecvenţelor celor două
fenomene (x şi y) ce se corelează;

d 2
x - suma pătratelor abaterilor de la media aritmetică a valorilor frecvenţelor d 2
fenomenului x;

d 2
y - suma pătratelor abaterilor de la media aritmetică a valorilor frecvenţelor d 2
fenomenului y.
Pentru a înţelege cum funcţionează formula de mai sus să luăm un exemplu:vârsta și tensiunile arteriale
sistolică (TAMAX) la 14 pacienţi, redate în tabelul 1.
Se observă că pentru calculul lui r avem nevoie de mediile celor două serii statistice, X şi Y , şi pentru
fiecare pacient în parte de diferenţele xi  X şi y i  Y , care pentru numărător trebuie înmulţite între ele,
iar pentru numitor trebuie ridicate la pătrat şi apoi sumate pentru toţi pacienţii. Mediile pentru TAMAX şi
TAMIN sunt X =26 şi Y =157. Este bine ca toate calculele necesare pentru găsirea lui r să fie organizate
într-un tabel aşa cum se vede în tabelul 1:
Tabelul. Calculul coeficientului de corelaţie Pearson
Nr. Valorile
pentru
Valorile
pentru
Diferenţele
pentru
Diferenţele
pentru TAMIN x X
2
y Y 
2

x  X   y Y 
i i
perechi VÎRSTA TAMAX VÎRSTA
i i
corelate xi yi yi  Y ( Y =1
xi  X ( X =2 57)
6)

1. 16 110 -10 -47 470 100 2209

2. 18 120 -8 - 37 297 64 1369

3. 19 130 -7 -27 189 49 729


4. 21 130 -5 -27 135 25 729

5. 22 140 -4 -17 68 16 289

6. 24 160 -2 3 -6 4 9

7. 25 140 -1 -17 17 1 289

8. 27 170 1 13 13 1 169

9. 28 130 2 -27 -54 4 729

10. 29 140 3 -17 -51 9 289

11. 30 160 4 3 12 16 9

12. 32 200 6 43 258 36 1849

13. 37 220 11 63 593 121 3969

14. 47 260 21 103 2163 441 10609

X =26 Y =157
d d
10

 x  X   y  Y  =410
2 2
x
=887 y
=23226
i i
i 1
4

Calculul lui r este:

14
Biostatistică și metodologia cercetării

x
n
 X    yi  Y 
r  i 1
i

 dxdy 
4104

4104 4104
  0.93  93%
x
n

i  X 
2
 y
n

i Y 
2  dx  dy
2 2
23226 887 152  29 4408
i 1 i 1

Interpretarea coeficientului de corelaţie


Coeficientul de corelaţie poate varia între minus unu şi plus unu. Când valoarea coeficientului de
corelaţie se apropie de +1, înseamnă că între cele două fenomene există o legătură de corelaţie perfectă.
Semnul „+” al coeficientului de corelaţie denotă că legătura de dependenţă dintre fenomene este directă.
Ambele fenomene evoluează în acelaşi sens, în aceeaşi direcţie. Când valoarea coeficientului de corelaţie se
apropie de –1, înseamnă că între cele două fenomene există o legătură perfectă, dar inversă, în sens opus:
creşte un fenomen, scade cel cu care se corelează. În medicină, întâlnim de obicei valori ale coeficientului de
corelaţie între 0 şi +1 sau între 0 şi -1, valoarea coeficientului de corelaţie oferindu-ne informaţie despre
intensitatea legăturii dintre fenomenele analizate (figura 1).
Valoarea coeficientului de corelaţie şi semnificaţia lui.
Pentru interpretarea intensităţii legăturii de dependenţă dintre fenomene pot fi următoarele criterii:
 valoarea coeficientului de corelaţie ±1 denotă o corelaţie perfectă între fenomene;
 valoarea coeficientului de corelaţie cuprinsă între ±0,70 şi ±0,99 denotă o corelaţie puternică;
 valoarea coeficientului de corelaţie cuprinsă între ±0,30 şi ±0,69 denotă o corelaţie medie între
fenomene;
 valoarea coeficientului de corelaţie cuprinsă între ±0,15 şi ±0,30 exprimă existenţa unei corelaţii
slabe între fenomene;
 valori sub 0,15 arată lipsă de corelaţie
 valoarea coeficientului de corelaţie 0 denotă că legătura lineară dintre fenomene în mod practic o
considerăm inexistentă.

Astfel, pentru exemplul de mai sus conform coeficientului de corelație și valorii acestuia
rxy  0,93 între vârstă și tensiunea arterială sistolică există o legătură de corelație directă, cu intensitate
puternică.
Interpretarea semnificaţiei corelaţiei
Cel mai utilizat criteriu pentru interpretarea semnificaţiei coeficientului de corelaţie este coeficientul
de determinare (r² – r pătrat).
Prin intermediul coeficientului de determinare se determină partea de asociere comună a factorilor
care influenţează cele două variabile. Cu alte cuvinte, coeficientul de determinare indică partea din dispersia
totală a unei variabile care poate fi explicată sau justificată de dispersia valorilor din cealaltă variabilă.
Pentru exemplul anterior, pentru “r”=0,93, „r²” este de 0,93. Uzual coeficientul de determinare se
înmulţeşte cu 100 şi exprimarea se transformă în procente din dispersie (86%). Prin urmare, 86% din cazuri
variaţia tensiunii arterială sistolice este determinată de variaţia vârstei.
Utilizarea coeficientului de determinare pentru a interpreta coeficienţii de corelaţie necesită prezenţa
unei relaţii puternice pentru a explica o parte mare din dispersia comuna. Astfel, un „r” de 0,71 este necesar
pentru a explica jumătate din dispersia celuilalt test. O corelaţie de 0,90 nu este pur şi simplu de trei ori mai
mare decât una de 0,30; ea este de nouă ori mai mare: (0,30) la pătrat = 0,09 sau 90% si (0,90) la pătrat =
0,81 sau 81%.

Testarea semnificaţiei statistice a lui r


Ca orice variabilă aleatoare, r este supus variaţiilor datorate întâmplării şi valorile calculate folosind
datele pe care le avem la îndemână sunt aproximative, în sensul că sunt supuse acestor erori aleatoare. De
aceea este foarte util să se cunoască distribuţia unei variabile aleatoare strâns legată de r, pentru construirea
intervalelor de încredere

15
Biostatistică și metodologia cercetării
În cazul eşantioanelor mari, se pot folosi nivelurile prag date de z n  1,96 / n  1 , pentru nivelul de
semnificaţie de 95%, dacă n≥50 şi respectiv , pentru nivelul de semnificaţie de 99%, dacă n≥100. Cu ajutorul
lor se construiesc intervale de încredere, care sunt o estimare a valorii adevărate a coeficientului de corelaţie
al populaţiei din care a fost extras lotul pe care s-au făcut măsurătorile.
Un test pentru ipoteza r=0 este statistica tr  r n  2 / 1  r 2 , care are o distribuţie Student cu n-2
grade de libertate şi poate fi comparată cu valorile prag dorite, luate din tabelele pentru această distribuţie.
Semnificaţia coeficientului de corelaţie poate fi calculată şi în modul următor:
rxy
t * n2
1  rxy2

Valoarea calculată se compară cu cea tabelară, stabilită probabilistic pentru un nivel de semnificaţie.
Dacă t calculat > t tabelar coeficientul de corelaţie este semnificativ şi dacă t calculat <t tabelar legătura de
corelație este nesemnificativă şi trebuie căutat un alt factor esenţial cu care să se studieze corelaţia.
Trebuie ţinut cont de faptul, că aceste criterii sunt oarecum arbitrare, astfel orice valoare obţinută a
coeficientului de corelaţie trebuie testată pentru determinarea semnificaţiei
Coeficientul de corelaţie Spearman
În cazul în care dorim să stabilim legătura de dependenţă între fenomene cercetate pe eşantioane mici
(n < 30), deci pe un număr redus de frecvenţe, utilizăm coeficientul de corelaţie al rangurilor, propus de
Spearman (1904). Acest coeficient se notează cu litera greacă  (ro) şi se determină după formula
propusă de Spearman:
6 d 2
  1 
n(n 2  1)
În care:
1 = valoarea absolută a coeficientului de corelaţie;
 = coeficientul de corelaţie Spearman;
6 = valoare constantă;
d 2
= suma pătratelor diferenţelor dintre rangurile primului şir de variante şi rangurile celui de al
doilea şir de variante, cu care se corelează;
n = numărul variantelor perechi care se corelează.
Coeficientul de corelaţie al rangurilor poate avea valori cuprinse între –1 şi +1. El exprimă o legătură
perfectă când are valoarea +1. În această situaţie, rangurile au valori egale, iar diferenţa între ranguri este
egală cu 0.
Exempl:Aprecierea cunoştinţelor (aptitudinilor) prin note reprezintă variabile ordinale. Analizăm
eficienţa unui curs după punctajul obţinut la un test de cunoştinţe aplicat atât înainte cât şi după un curs
auxiliar pe acelaşi grup de studenţi. Rezultatul la un astfel de chestionar se exprimă printr-un punctaj cu
valori între 0 şi 40.
 În tabelul;sunt prezentate rezultatele obţinute pe un lot de 10 studenţi.
Tabelul Rezultatele la testul de biostatistică obținut pe un lot de 10 studenți, înainte şi după ce au
urmatun curs auxiliar de teoria probabilităților
Nr. Înainte de curs După curs y Rang, Rang Diferenţa Diferenţa
student X calificativ X calificativ Y dintre dintre ranguri
ranguri la pătrat
1. 35 38 8 9.5 -1.5 2.25
2. 26 30 6 7 -1 1

16
Biostatistică și metodologia cercetării

3. 36 36 8.5 8.5 0 0
4. 30 35 6.5 8 -1.5 2.25
5. 38 40 9.5 10 -0.5 0.25
6. 29 28 6.5 6.5 0 0
7. 21 25 5 5.5 -0.5 0.25
8. 27 24 6 5.5 +0.5 0.25
9. 31 30 7 6.5 +0.5 0.25
10. 18 19 4 4.5 -0.5 0.25
6 d 2 6  6.75 40.5
Coeficientul de corelaţie Spearman:   1   1   1   0.60
n( n  1)
2
10(10  1)
2
990

t
Testul de semnificaţie pentru coeficientul de corelaţie Spearman: 1  2
n2
Prin urmare între calificativul studentului înainte de curs şi cel de după urmarea acestuia există o legătură de
corelaţie medie.
Regresia. Noţiuni generale
Coeficientul de corelaţie ne dă indicaţii asupra sensului şi intensităţii legăturii de dependenţă dintre
fenomene, fără a putea preciza, sub aspect cantitativ, cu cât creşte sau scade un fenomen când cel cu care se
corelează creşte sau scade cu o anumită cantitate.
Regresia, noţiune strâns legată de noţiunea de corelaţie, completează corelaţia şi prin intermediul
coeficientului de regresie, stabileşte cu cât creşte sau descreşte sub aspect cantitativ, un fenomen, când cel cu
care se corelează creşte sau descreşte cu o unitate de măsură.
Regresia poate fi simplă şi multiplă; liniară şi neliniară. Ca şi corelaţia, regresiapoate fi directă, când
fenomenele evoluează în acelaşi sens (creşte x, creşte y sau scade x scade şi y), sau indirectă, când
fenomenul evoluează în sens opus (creşte x scade y sau scade x creşte y).
Formula coeficientului de regresie este:

y x
b y x  rxy sau b x y  rxy în care:
x y

b y x = coeficientul de regresie a lui y în funcţie de x. El exprimă, cantitativ, cu cât creşte sau scade
fenomenul y când x creşte sau scade cu o unitate de măsură;

b x y = coeficientul de regresie a lui x în funcţie de y. El exprimă, cantitativ, cu cât creşte sau scade
fenomenul x când y creşte sau scade cu o unitate de măsură;

rxy = coeficientul de corelaţie liniară Bravais-Pearson;

 x = deviaţia standard a fenomenului x;

 y = deviaţia standard a fenomenului y

subcapitolul următor.

17