Sunteți pe pagina 1din 12

Regresia

Liniară
Multiplă
Cuprins

1. Definiție

2. Ecuația regresiei liniare multiple

3. Etape de rezolvare

4. Domenii de utilizare

5. Exemplu

6. Rezolvare in R

7. Concluzii
Definiție
Regresia liniară multiplă este o metodă statistică
utilizată pentru a analiza relația dintre două sau mai
multe variabile independente (numite și predictori sau
variabile explicative) și o variabilă dependentă
(variabila de răspuns). În esență, aceasta extinde
conceptul de regresie liniară simplă la mai mult de o
variabilă independentă.
Ecuația regresiei liniare multiple
În regresia liniară multiplă, modelul este exprimat matematic sub forma unei ecuații liniare, dar cu mai
multe variabile independente :

În care :

- Y este variabila independentă

- este interceptul (valoarea lui Y când toate variabilele independente sunt zero)

- , , . . . , sunt coeficienții asociați cu fieacare variabilă independentă X

- este eroarea sau reziduul, care reprezintă diferența dintre valoarea reală observată și valoarea prevăzută
Etape de rezolvare
Colectarea datelor: Colectarea unui ansamblu de date care cuprinde observații pentru variabila dependentă și toate variabilele
independente relevante.

Analiza corelațiilor: Investigarea corelațiilor dintre variabilele independente și variabila dependentă pentru a determina existența unei
legături.

Construirea modelului: Ajustarea unui model de regresie liniară multiplă utilizând setul de date disponibil. Aceasta implică
identificarea coeficienților β care minimizează suma pătratelor reziduurilor.

Evaluarea modelului: Analiza performanței modelului prin intermediul diferitelor măsuri, precum coeficientul de determinare (R-
squared) sau erorile de prognoză.

Interpretarea rezultatelor: Se interpretează coeficienții modelului pentru a înțelege impactul relativ al fiecărei variabile independente
asupra variabilei dependente.

Validarea și ajustarea modelului: Confirmarea validității modelului prin testarea acestuia pe seturi de date separate. În funcție de
rezultate, se pot face ajustări pentru a îmbunătăți performanța sau pentru a se asigura că modelul generalizează bine.
Domenii de utilizare
Economie și Inginerie și Științe
Finanțe Tehnice
În analiza piețelor financiare pentru a evalua Pentru analiza și proiectarea în diverse
influența mai multor factori asupra prețurilor domenii tehnice, cum ar fi ingineria
acțiunilor, dobânzilor sau altor indicatori electrică, chimică sau mecanică.
financiari.

Agricultură Științe Sociale


În cercetările agricole pentru a evalua cum diferiți Pentru a înțelege comportamentul social, cum
factori, cum ar fi tipul de sol, cantitatea de apă ar fi influența mai multor variabile asupra
sau nivelul de îngrășăminte, influențează veniturilor familiale, nivelul de educație sau
randamentul culturilor. comportamentul de vot.
Exemplu

Presupunem că dețineți o cafenea și dorți să analizați cum influențează atât numărul de afișări
ale reclamelor cafenelei (X1), cât și temperatura medie în fiecare zi (X2) vânzările zilnice (Y).
Scopul este să construim un model de regresie liniară multiplă pentru a prognoza vânzările în
funcție de aceste variabile.

Setul de date

X1 (Număr de afișări ale reclamelor): [100, 120, 150, 80, 200]


X2 (Temperatura medie în grade Celsius): [25, 28, 22, 30, 20]
Y (Vânzări zilnice): [200, 240, 180, 260, 160]
Calculăm valorile medii ale
variabilelor

Calculăm coeficineții
𝛽 0 =𝑌 − 𝛽1 ∙ 𝑋 1 − 𝛽 2 ∙ 𝑋 2

𝛽 1=
∑ ( 𝑋 𝑖 − 𝑋 1) ∙(𝑌 − 𝑌 )
∑ ( 𝑋 𝑖 − 𝑋 1 )2
𝛽 2=
∑ ( 𝑋 2 − 𝑋 2) ∙(𝑌 − 𝑌 )
∑ ( 𝑋 2 − 𝑋 2 )2
( 100 −130 )( 200 − 208 ) + ( 120 −130 )( 240 − 208 ) + ( 150 − 130 ) (180 − 208 ) + ( 80 −130 ) ( 260 −208 ) +(200 −130)(160 −208)
𝛽 1= 2 2 2 2 2
=0.663
(30 +1 0 +20 +50 +70 )

( 25 −25 ) ( 200 −208 ) + ( 28 −25 ) ( 240 − 208 ) + ( 22 −25 )( 180 − 208 ) + ( 30 − 25 ) ( 260 −208 )+(20 − 25)(160 −208)
𝛽 1= =2.350
(0 2+ 32 +3 2 +52 +5 2)

𝛽 0 =208+0.663∙ 130 − 2.350∙ 25=−77.927

𝑌 =− 77.927+0.663 ∙ 𝑋 1 +2.350 ∙ 𝑋 2
Rezultat
În urma rezolvării acestei probleme de regresie liniară multiplă,
am obținut un model matematic care estimează vânzările zilnice
în funcție de numărul de afișări ale reclamelor și temperatura
medie zilnică.Creșterea cu o unitate a numărului de afișări ale
reclamelor este asociată cu o creștere medie de 0.663 unități în
vânzări, menținând constantă temperatura. Creșterea cu o unitate
a temperaturii medii zilnice este asociată cu o creștere medie de
2.350 unități în vânzări, menținând constant numărul de afișări
ale reclamelor. Interceptul este -77.927, reprezentând estimarea
vânzărilor zilnice când ambele variabile independente sunt zero
(situație ipotetică în care nu există afișări ale reclamelor și
temperatura este zero grade Celsius).
Rezolvarea în
R
Concluzi
i
Regresia liniară multiplă oferă o modalitate utilă de a
analiza și cuantifica relațiile dintre o variabilă
dependentă și mai multe variabile independente
simultan. În cadrul acestei analize, coeficienții regresiei
oferă informații despre impactul relativ al fiecărei
variabile asupra variabilei dependente, controlând
celelalte variabile. Un rezultat pozitiv al coeficienților
poate sugera o asociere pozitivă între variabile, în timp
ce un rezultat negativ indică o asociere negativă.

S-ar putea să vă placă și