Sunteți pe pagina 1din 1

Material recapitulare și exemple de cerințe CORELAȚIE

O firmă de asigurări doreşte să cunoască măsura în care mărimea unei familii influenţează cheltuielile lunare
pentru servicii medicale ale acesteia. Pentru un eşantion format din 5 dintre clienţii firmei au fost înregistrate
date referitoare la mărimea familiei (număr de membri) şi cheltuielile lunare (Eur) în scop medical ale unei
familii. Datele înregistrate sunt:

Mărimea familiei clientului (nr. membri) 5 1 4 5 2


Cheltuieli medii lunare in scop medical (eur) 51 22 29 49 25

I. Reprezentaţi grafic datele şi analizaţi existenţa, sensul şi forma legăturii dintre cele două variabile;
II. Calculaţi şi interpretaţi coeficientul de corelaţie Pearson
III. Ce tip de date avem în problemă?

I) Reprezentaţi grafic datele şi analizaţi existenţa, sensul şi forma legăturii dintre cele două variabile.
Vom nota cu X variabila care reprezintă numărul de membri din familia clientului. Vom reprezenta această
variabilă pe axa absciselor (Ox).
Vom nota cu Y variabila care reprezintă Cheltuieli medii lunare în scop medical. Vom reprezenta această
variabilă pe axa ordonatelor (Oy)

Graficul ne arată o legătură liniară directă puternică între


cele 2 variabile.

Punctele nu se unesc. Se recomandă trasarea unei linii


imaginare care sa vă permită identificarea tipului de
legătură.

II) Calculaţi şi interpretaţi coeficientul de corelaţie Pearson

Cea mai simplă formulă pentru coeficientul de corelaţie liniară al lui Pearson este
𝑛 ∑𝑛𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ⋅ ∑𝑛𝑖=1 𝑦𝑖
𝑟𝑥𝑦 = ∈ [−1,1]
2 2
√[𝑛 ⋅ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 ) ] ⋅ [𝑛 ⋅ ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 ) ]

Vom face calculele în tabelul de mai jos:

i 𝑥𝑖 𝑦𝑖 𝑥𝑖 ⋅ 𝑦𝑖 𝑥𝑖2 𝑦𝑖2
1 5 51 255 25 2601
2 1 22 22 1 484
3 4 29 116 16 841
4 5 49 245 25 2401
5 2 25 50 4 625
Totaluri 17 176 688 71 6952

5∙688−17∙176 448
𝑟𝑥𝑦 = = = 0,8965
√(5∙71−172 )(5∙6952−1762 ) 499,7439
Rezultă că între cele 2 variabile există o legătură liniară directă (deoarece coeficientul are semnul +) şi
foarte puternică (deoarece valoarea coeficientului este apropiată de 1).

III) date bivariate (2 serii simple)

S-ar putea să vă placă și