Sunteți pe pagina 1din 21

Draganel Andrei gr.

1305

Definitia

Regresia este functia, care ne permite dupa marimea unei corelatii legate de o variabila sa identificam marimea medie a altei variabile.

Regresia - scurt istoric al termenului

Sir Francis Galton(1822-1911) spirit enciclopedic al perioadei victoriene, fiind cel care a introdus termenii de regresie i corelaie statistic Originea regresiei ca metod statistic se afl n studiile sale de genetic aplicat n studiul plantelor- 1877 Plantnd boabe dintr-un anumit soi de mazre dulce a observat c exist o legtur liniar ntre diametrele acestor boabe i diametrele boabelor recoltate de la noile plante. El a numit iniial panta acestei drepte coefficient of reversion, schimbndu-i apoi numele n coefficient of regression. Termenul de regresie provine de la descoperirile sale n domeniul ereditii: n general, nalimea copiilor provenii din tai foarte nali se apropie mai mult de nlimea medie dect nlimea tailor.

Scopul regresiei
Scopul este prognoza, n condiia c este posibil, cele dou variabile fiind ntr-adevr corelate. Metoda prin care analizm posibilele asociaii ntre valorile a dou variabile statistice, prelevate de la acelai grup de obiecte, este cunoscut ca metoda corelaiei i are ca indice coeficientul de corelaie (Pearsons r).

Prin intermediul regresiei se pot face prognoze ale unei variabile, n functie de valoarea alteia. Prognoza este procesul de estimare a valorii unei variabile cunoscnd valoarea unei alte variabile.

Regresia se leaga foarte mult de conceptul de corelatie. O asociere puternica ntre doua elemente conduce la cresterea preciziei predictiei unei variabile pe seama alteia. Daca am avea o corelatie perfecta (+1 sau 1) estimarea ar fi extrem de precisa.

Exemplu:

Sa presupunem ca ntre deficitul de atentie si tulburarile emotionale s-a obtinut un coeficient de corelatie r = 0,80 pe un lot de 50 de subiecti. Regresia ne da posibilitatea sa estimam ce tulburari emotionale are un subiect daca cunoastem n prealabil nivelul deficitului de atentie si tipul de relatie dintre cele doua variabile.

Procesul de regresie presupune doi pasi. Primul se refera la determinarea ecuatiei de regresie, iar cel de-al doilea consta n utilizarea acestei ecuatii n predictie (prognoza). Forma generala prin care se exprima o ecuatie de regresie este:

Cu alte cuvinte, variabila estimata (Y) este egala cu suma interceptului (a) cu produsul pantei de regresie (b) si variabilei cunoscute (X).

Unde: Y este rezultatul estimat; a este interceptul (locul pe ordonata unde dreapta de regresie se intersecteaza cu OY, valoarea lui Y pentru X=0); b este panta de regresie (ne arata cu ct se modifica Y atunci cnd X creste (scade) cu o unitate; X este variabila criteriu (cunoscuta).

Calcularea coeficientilor de regresie a, respectiv b conduce la realizarea primului pas din procesul regresiei. Daca se cunoaste valoarea coeficientului de corelatie dintre cele doua variabile X si Y, media si abaterea standard a celor doua variabile putem aplica urmatoarele formule:

Unde: r este valoarea coeficientului de corelatie dintre X si Y; Sy este abaterea standard a variabilei Y; Sx este abaterea standard a variabilei X.

Unde: My este media variabilei Y; Mx este media variabilei X. n exemplul, sa presupunem ca media variabilei X (deficitul de atentie) a fost 20, iar abaterea standard 5. n acelasi timp, media variabilei Y (tulburari emotionale) a fost 16, iar abatarea standard 4. Vom calcula n continuare coeficientii ecuatiei de regresie liniara a si b.

Ecuatia de regresie pentru aceasta problema este:

Interpretarea acestor valori reprezinta al doilea pas din procesul de regresie, cu ajutorul caruia putem estima valoarea lui Y pornind de la orice valoare a lui X.

Coeficientul a ne arata care este valoarea lui Y cnd X este zero. n schimb, coeficientul b (panta de regresie) ne arata cu ct este influentat Y atunci cnd X creste cu o unitate. n problema de fata vom calcula n continuare valorile estimate ale lui Y pentru X =0, 1 si 2. Pentru X(0)=3.2; X(1)=3.84; X(2)=4.48 Ce nseamna acest lucru? Daca un subiect obtine scorul 0 la deficit de atentie, estimam sa obtina rezultatul 3,2 la scala de tulburari emotionale. Daca un alt subiect obtine nota 1 la deficitul de atentie, predictia noastra este ca va obtine rezultatul de 3,84 la testul de tulburari emotionale

Exemplu

S considerm datele culese de la un lot de 24 de pacieni avnd diabet de tip I, privind urmtoarele dou variabile: glucoza (G) n snge pe stomacul gol (mmol/l); viteza medie de contracie Vcf (%/sec) a ventriculului stng, obinut prin ecocardiografie.

Exemplu

Tabelul de mai jos prezint principalele caracteristici numerice ale regresiei liniare aplicate n acest caz.

Exemplu

Aa dup cum se observ, n ciuda faptului c valoarea coeficientului de corelaie r nu pare prea important, totui nivelul de semnificaie p = 0,041 atest o corelaie semnificativ. Ecuaia de regresie liniar este dat de: Vcf = 1,10 + 0.02G , de unde deducem c valoarea estimat (prognozat pe baza regresiei liniare) a variabilei Vcf pentru pacientul No. X este de 1,27%.

Totusi pentru ce ar servi toate aceste calcule, formule, grafice? Prognoza. Pentru a face predictii in diferite situatii pe care noi le cercetam. Avem nevoi doar de o variabila cunoscuta X, si o variabila Y pe care noi pronosticam.

Conform schemei putem intelege care este scopul regresiei, si il vom putea aplica in practica cercetarilor stiintifice

S-ar putea să vă placă și