Documente Academic
Documente Profesional
Documente Cultură
Liniară
Multiplă
Cuprins
1. Definiție
3. Etape de rezolvare
4. Domenii de utilizare
5. Exemplu
6. Rezolvare in R
7. Concluzii
Definiție
Regresia liniară multiplă este o metodă statistică
utilizată pentru a analiza relația dintre două sau mai
multe variabile independente (numite și predictori sau
variabile explicative) și o variabilă dependentă
(variabila de răspuns). În esență, aceasta extinde
conceptul de regresie liniară simplă la mai mult de o
variabilă independentă.
Ecuația regresiei liniare multiple
În regresia liniară multiplă, modelul este exprimat matematic sub forma unei ecuații liniare, dar cu mai
multe variabile independente :
În care :
- este interceptul (valoarea lui Y când toate variabilele independente sunt zero)
- este eroarea sau reziduul, care reprezintă diferența dintre valoarea reală observată și valoarea prevăzută
Etape de rezolvare
Colectarea datelor: Colectarea unui ansamblu de date care cuprinde observații pentru variabila dependentă și toate variabilele
independente relevante.
Analiza corelațiilor: Investigarea corelațiilor dintre variabilele independente și variabila dependentă pentru a determina existența unei
legături.
Construirea modelului: Ajustarea unui model de regresie liniară multiplă utilizând setul de date disponibil. Aceasta implică
identificarea coeficienților β care minimizează suma pătratelor reziduurilor.
Evaluarea modelului: Analiza performanței modelului prin intermediul diferitelor măsuri, precum coeficientul de determinare (R-
squared) sau erorile de prognoză.
Interpretarea rezultatelor: Se interpretează coeficienții modelului pentru a înțelege impactul relativ al fiecărei variabile independente
asupra variabilei dependente.
Validarea și ajustarea modelului: Confirmarea validității modelului prin testarea acestuia pe seturi de date separate. În funcție de
rezultate, se pot face ajustări pentru a îmbunătăți performanța sau pentru a se asigura că modelul generalizează bine.
Domenii de utilizare
Economie și Inginerie și Științe
Finanțe Tehnice
În analiza piețelor financiare pentru a evalua Pentru analiza și proiectarea în diverse
influența mai multor factori asupra prețurilor domenii tehnice, cum ar fi ingineria
acțiunilor, dobânzilor sau altor indicatori electrică, chimică sau mecanică.
financiari.
Presupunem că dețineți o cafenea și dorți să analizați cum influențează atât numărul de afișări
ale reclamelor cafenelei (X1), cât și temperatura medie în fiecare zi (X2) vânzările zilnice (Y).
Scopul este să construim un model de regresie liniară multiplă pentru a prognoza vânzările în
funcție de aceste variabile.
Setul de date
Calculăm coeficineții
𝛽 0 =𝑌 − 𝛽1 ∙ 𝑋 1 − 𝛽 2 ∙ 𝑋 2
𝛽 1=
∑ ( 𝑋 𝑖 − 𝑋 1) ∙(𝑌 − 𝑌 )
∑ ( 𝑋 𝑖 − 𝑋 1 )2
𝛽 2=
∑ ( 𝑋 2 − 𝑋 2) ∙(𝑌 − 𝑌 )
∑ ( 𝑋 2 − 𝑋 2 )2
( 100 −130 )( 200 − 208 ) + ( 120 −130 )( 240 − 208 ) + ( 150 − 130 ) (180 − 208 ) + ( 80 −130 ) ( 260 −208 ) +(200 −130)(160 −208)
𝛽 1= 2 2 2 2 2
=0.663
(30 +1 0 +20 +50 +70 )
( 25 −25 ) ( 200 −208 ) + ( 28 −25 ) ( 240 − 208 ) + ( 22 −25 )( 180 − 208 ) + ( 30 − 25 ) ( 260 −208 )+(20 − 25)(160 −208)
𝛽 1= =2.350
(0 2+ 32 +3 2 +52 +5 2)
𝑌 =− 77.927+0.663 ∙ 𝑋 1 +2.350 ∙ 𝑋 2
Rezultat
În urma rezolvării acestei probleme de regresie liniară multiplă,
am obținut un model matematic care estimează vânzările zilnice
în funcție de numărul de afișări ale reclamelor și temperatura
medie zilnică.Creșterea cu o unitate a numărului de afișări ale
reclamelor este asociată cu o creștere medie de 0.663 unități în
vânzări, menținând constantă temperatura. Creșterea cu o unitate
a temperaturii medii zilnice este asociată cu o creștere medie de
2.350 unități în vânzări, menținând constant numărul de afișări
ale reclamelor. Interceptul este -77.927, reprezentând estimarea
vânzărilor zilnice când ambele variabile independente sunt zero
(situație ipotetică în care nu există afișări ale reclamelor și
temperatura este zero grade Celsius).
Rezolvarea în
R
Concluzi
i
Regresia liniară multiplă oferă o modalitate utilă de a
analiza și cuantifica relațiile dintre o variabilă
dependentă și mai multe variabile independente
simultan. În cadrul acestei analize, coeficienții regresiei
oferă informații despre impactul relativ al fiecărei
variabile asupra variabilei dependente, controlând
celelalte variabile. Un rezultat pozitiv al coeficienților
poate sugera o asociere pozitivă între variabile, în timp
ce un rezultat negativ indică o asociere negativă.