Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar IX
C. Variabile cantitative
-se folosesc funcțiile de regresie (dreapta de regresie, hiperbola, parabola, etc.)
Ex.1. Fie repartiția unui grup de firme în raport cu variabilele X-nr de angajați respectiv Y-
costurile medii de producție.
Rezolvare:
a.)
𝑀(𝑋) ∙ 𝑀(𝑌) = 𝑀(𝑋 ∙ 𝑌)
𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
12548.84 ≠ 13435.39 => 𝑋, 𝑌 𝑠𝑢𝑛𝑡 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒
1
b.) Obs: Pentru a studia formele posibile ale funcției de regresie, se reprezintă norul de
puncte.
𝑌̅/𝑋=20 = 218.1
𝑌̅/𝑋=45 = 243.1
𝑌̅/𝑋=80 = 303.2
Norul de puncte
320
300
280
260
240
220
200
0 10 20 30 40 50 60 70 80 90
Dreapta de regresie: 𝑌 = 𝑎 + 𝑏𝑋 + 𝜀
unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= = = 1.44
𝜎𝑥2 𝑀(𝑋 2 )−𝑀(𝑋)2
𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
𝑀(𝑋 2 ) = 3019.38
𝑌 = 185.27 + 1.44𝑋
2
c.) Calculăm coeficientul de corelație
𝑀(𝑌 2 ) = 78363.76
Interpretări:
3
Ex.3. Se consideră distribuția unor apartamente în funcție de variabilele X-suprafața (m2)
respectiv Y-preț (mii euro).
Y/X 10-20 (15) 20-50 (35) 50-100 (75) 100-160 (130) Total
20-40 (30) 2 3 2 - 7
40-80 (60) 3 4 5 1 13
80-150 (115) 1 2 3 2 8
150-200 (175) - 1 2 3 6
Total 6 10 12 6 34
Rezolvare:
a.) Pentru a stabili dacă există legătură între două variabile cantitative putem apela la două
metode învățate:
(2) varianța explicită, și anume arătăm că aceasta este mai mare decât zero:
Obs: Trebuie determinat în baza raționamentului economic (sau în baza unui subpunct al
problemei – dacă este cazul, care este variabila dependentă și cea independentă). În contextul
acestui exercițiu, adițional raționamentului economic, ne putem da seama în baza
subpunctului c.) că prețul apartamentelor este influențat de suprafața acestora => prețul este
variabila dependentă (endogenă) iar suprafața cea independentă (exogenă/factorul).
4
𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
𝑅𝑌𝑋 = √ =√ = 0.49 ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
𝑉𝑡𝑜𝑡𝑎𝑙ă 2498.70
𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
c.) 𝑅𝑌𝑋
2
= = 2498.70 = 0.24 = 24% =>
𝑉𝑡𝑜𝑡𝑎𝑙ă
𝑝𝑟𝑒ț𝑢𝑙 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑒𝑙𝑜𝑟 𝑑𝑒𝑝𝑖𝑛𝑑𝑒 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 24% 𝑑𝑒 𝑠𝑢𝑝𝑟𝑎𝑓𝑎ț𝑎 𝑎𝑐𝑒𝑠𝑡𝑜𝑟𝑎, 𝑖𝑎𝑟 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 76% 𝑑
d.)
̅̅̅̅𝑋=15 = 59.17
𝑌/
̅̅
𝑌/̅̅𝑋=35 = 73.5
̅𝑌/
̅̅̅𝑋=75 = 87.92
̅̅̅̅𝑋=130 = 135.83
𝑌/
Norul de puncte
150
140
130
120
110
100
90
80
70
60
50
0 20 40 60 80 100 120 140
unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= 2 = = 0.63
𝜎𝑋 𝑀(𝑋 2 )−𝑀(𝑋)2
𝑀(𝑋) = 62.35
𝑀(𝑌) = 87.06
𝑀(𝑋) ∙ 𝑀(𝑌) = 5428,19
𝑀(𝑋 ∙ 𝑌) = 6356.62
𝑀(𝑋 2 ) = 5367.65
5
𝑎 = 𝑀(𝑌) − 𝑏 ∙ 𝑀(𝑋) = 47.78
𝑌 = 47.78 + 0.63𝑋
𝑀(𝑌 2 ) = 10077.94
Interpretări:
h.) Pentru X=200 => 𝑌 = 47.78 + 0.63 ∙ 200 = 173.78 𝑚𝑖𝑖 𝐸𝑈𝑅