Documente Academic
Documente Profesional
Documente Cultură
Regresia linear
Cu ct e corelaia mai mic, cu att e mai mare spaiul de greeal. (posibilitatea de a avea
erori n aceast relaie de regresie)
Formul prin care s reduci din erorile de predicie:
Influena dintre cele dou variabile, n aciunea de prezicere, scade cnd corelaia dintre cele
dou scade.
Regresia fa de medie nu e dect o consecin a legilor probabilitiilor cnd corelaia nu e
perfect.
Unghiul liniei de regresie se numete panta (slope) liniei de regresie. (se calculeaz ca
schimbarea/diferena/spaiul dintre y si origine, mprit la spaiul dintre x i origine. Ca la
matematic, b/a n y=ax+b)
Panta reprezint nclinaia liniei de regresie.
Panta liniei de regresie (cnd scorurile sunt transformate n scoruri z), ntotdeauna e egal cu
coeficientul de corelaie.
Cnd corelaia e perfect, toate punctele cad pe o linie, formeaz o linie.
Ce formul folosim pentru predicie atunci cnd nu avem scoruri z, ci scoruri brute?
Folosim formula pentru z, numai c nlocuim pe z cu formula sa:
O alt modalitate de a scrie aceast formul sub o form prescurtat (precum e ecuaia de
gradul I)
Aceast formul reprezint variana estimrii, numit i variana rezidual, adic variana
punctelor din jurul liniei de regresie.
Cu ct erorile sunt mai mari, cu att aceast varian rezidual va avea valori mai ridicate. Cu
ct erorile sunt mai mici, cu att variana rezidual va avea valori mai mici. Cu ct corelaia e
mai mare, cu att erorile sunt mai mici. (deoarece punctele vor fi mai apropriate de linia de
regresie)
Cnd corelaia e 0, linia de regresie devine orizontal. Deci panta va fi i ea 0.
Atunci cnd corelaia este zero, r=0, Y poate fi nlocuit cu media. Aici linia de regresie nu
ne mai ajut cu nimic, deoarece e doar variana valorilor lui Y.
Uneori eroarea de predicie (Y-Y), nu reprezint altceva dect partea neexplicat din acea
predicie. Iar Y-Y (barat, adic media), reprezint partea explicat din predicie.
Dac cineva e foarte nalt i cntrete mult n acelai timp, acest lucru e partea explicat, dar
dac acesta cntrete mult prea mult (peste greutatea indicat de regul), atunci aceasta este
partea neexplicat.
Dac ridicm la ptrat i adunm toate aceste diferene, att pentru partea neexplicat, ct i
pentru partea explicat (separat), i le mprim pe fiecare la N, atunci vom obine variana
neexplicat, respectiv variana explicat. Adunate cele dou variane, vor forma variana
total.
Un lucru important de tiut e acela c atunci cnd corelaia nu e 0, variana neexplicat e mai
mic dect variana total. (Dac exist vreo legtur, nseamn c nu pot fi doar pri
neexplicate, doar erori, pentru c avem acea legtur, acea form de explicaie).
Dac vrei s tii ct de bine poi face predicii bazndu-te pe linia de regresie pe care o ai, te
poi folosi de coeficientul de determinare, care nu e altceva dect raportul dintre variana
explicat supra variana total. Acest coeficient de determinare se poate obine foarte uor
deoarece ntotdeauna este egal cu r2.
Dac vrei s afli proporia din varian care nu se ia n considerare, te foloseti de coeficientul
de nedeterminare, care e raportul dintre variana neexplicat i variana total. i acesta se
poate determina foarte uor deoarece este egal cu 1-r2. De multe ori acesta se simbolizeaz cu
k2.
n cele mai multe cazuri vrem ca r2 s fie ct mai mare posibil i k2 ct mai mic posibil, pentru
a gsi o legtur care s ne ajute s aflm ceva.
Din aceast formul k2=1-r2 => faptul c aceste coeficiente, cel de determinare i cel de
nedeterminare, adunate, dau ntotdeauna 1. (k2+r2=1)
O alt modalitate de a calcula variana estimat e dat de urmtoare formul, care pentru a
putea fi aplicat necesit calcularea varianei pentru Y n prealabil:
Cnd notm cu a i b, interceptul respectiv panta, e bine s avem notaia YX pentru a tii c Y
este prezis cu ajutorul lui X. Pe cnd la indicele de corelaie r, nu e nevoie, deoarece ori X e
corelat cu Y ori invers, nu conteaz. (formula 10.5)
(? N-2, 2 grade de libertate, probabil din cauz c sunt 2 variabile care formeaz relaia de
regresie)
Eroarea standard a estimrii e rdcina ptratic a varianei estimate. (se obine extrgnd
radical din formula pentru variana standard a estimrii).