Sunteți pe pagina 1din 6

ATELIER SĂPTĂMÂNA 11

Având în vedere baza de date atașată atelierului, trebuie să parcurgeți următorii pași, nu uitați să răspundeți adăugând un cod și/sau casetă text
dacă este necesar

1. Notați bibliotecile necesare pentru a rula codul(urile).


2. Importați și curățați (dacă este necesar) baza de date în mod corespunzător.
3. Dezvoltați un model de regresie liniară multiplă în care variabila explicată este produsul intern brut (PIB) al țării.
4. Care este efectul cauzal pe care doriți să îl estimați? Pentru ca este interesant?
5. Concluzii la nivel global despre rezultatele modelului.
^. Încheiați într-un mod special rezultatele modelului.
7. Ce variabile neconsiderate ar putea afecta variabila explicată? Justi^que.

din google.colab import fișiere încărcate = files.upload()

Alegeți fișierele nations_gdp_s…life_co2.csv


• nations_gdp_school_life_co2.csv (application/vnd.ms-excel) - 11654 de octeți, ultima modificare: 26.12.2021 - 100% gata
Salvarea nationsgdpschoollifeco2.csv în nationsgdpschoollifeco2 (1).csv

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente

import statsmodels.api ca sm
import statsmodels.formula.api ca smf
import matplotlib.pyplot ca plt
din statsmodels.graphics.regressionplots import abline_plot
import numpy ca np
import seaborn ca sns

import statsmodels.formula.api ca smf

# Observați datele

import io

df = pd.read_csv(io.BytesIO(uploaded['nations_gdp_school_life_co2.csv']), sep=';', decimal=",",encoding='ISO-8859-1')


print(df)

regiune de țară pib scoli viaţ co2


ă
0 algerian Africa 7300.399902 6.716667 72.316666 15.00
1 Benin Africa 1338.800049 3.100000 54.733334 1.20
2 botswana Africa 12307.400390 8.600000 52.250000 9.20
3 Burkina Faso Africa 1063.400024 1.300000 53.783333 0.20
4 Burundi Africa 349.200012 2.483333 48.866665 0.10
.. ... ... ... ... ... ...
189 samoa Oceania 4012.600098 10.300000 71.533333 3.10
190 Insulele Solomon Oceania 2249.199951 4.500000 66.500000 1.40
191 Tonga Oceania 4072.199951 10.133333 71.833336 4.85
192 Tuvalu Oceania NaN NaN 66.033333 NaN
193 Vanuatu Oceania 3809.800049 6.700000 69.966667 1.50
[194 de rânduri x 6 coloane]

df.head()


țară regiune pib scoli viaţă co2

0 algerian Africa 7300.399902 6.716667 72.316666 15.0

1 Benin Africa 1338.800049 3.100000 54.733334 1.2

2 botswana Africa 12307.400390 8.600000 52.250000 9.2

3 Burkina Faso Africa 1063.400024 1.300000 53.783333 0.2

4 Burundi Africa 349.200012 2.483333 48.866665 0.1

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente

<clasa „pandas.core.frame.DataFrame”>
RangeIndex: 194 intrări, de la 0 la 193
Date coloane (total 6 coloane):
# Număr Null dtype

0 țară 194 nenulă obiect


1 regiune 194 nenulă obiect
2 pib 179 nenulă float64
3 scoli 188 nenulă float64
4 viaţă 194 nenulă float64
5 co2 185 nenulă float64
dtypes: float64(4), object(2) utilizare memorie: 9,2+ KB

df.corr()

pib scoli viaţă co2

pib 1.000000 0.573280 0.611219 0.826819

scoli 0.573280 1.000000 0.725207 0.416818

viaţă 0.611219 0.725207 1.000000 0.445990


#Eliminați rândurile care conțin NaN df.dropna(inplace=True) df.info()

<clasa „pandas.core.frame.DataFrame”>
Int64Index: 175 intrări, de la 0 la 193
Coloane de date (în total 6 coloane):
# Coloană Număr nul Dtype
0 țară 175 nenulă obiect
1 regiune 175 nenulă obiect
2 pib 175 nenulă float64
3 scoli 175 nenulă float64
4 viaţă 175 nenulă float64
5 co2 175 nenulă float64
dtypes: float64(4), object(2) utilizare memorie: 9,6+ KB

df.corr()

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente

gap scnooi lire coz M

pib 1.000000 0.580460 0.614272 0.826819

scoli 0.580460 1.000000 0.735768 0.422787

viaţă 0.614272 0.735768 1.000000 0.443450

co2 0.826819 0.422787 0.443450 1.000000

sns.heatmap(df.corr(), cmap="RdBu", annot=True);


AC
EA
1 0.58

0.9

042

# Rezumatul modelului

mod = smf.ols('gdp ~school+life+co2 ', df).fit() mod.params

Intercept -19827.455018 scoala 651.858271


viaţă 301.887907
co2 362.431085
dtype: float64 mod = smf.ols('gdp ~school+life+co2 mod.params print(mod.summary())

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente
df).fit()

Departamentul variabil: pib R pătrat: 0.769
Model: OLS adj. R pătrat: 0.764
metodă: Cele mai mici F-statistică: 189.2
Data: pătrate
Lun , 27 decembrie Prob (F-statistic): 4.26e-54
Timp: 2021 02:43:37 Probabilitatea de -1791.2
Nu. Observatii: 175 înregistrare:
AIC: 3590.
Df Reziduuri: 171 BIC: 3603.
dfModel: 3 non-robuste
Tip de covarianță:

======================= ==========
std err tu P>|t| [0.025
coeff 0.975]
Interceptare -1.983e+04 4250.157 -4.665 0.000 -2,82e+04 -1.14e+04
scoli 651.8583 259.089 2.516 0.013 140.434 1163.283
viaţă 301.8879 78.581 3.842 0.000 146.775 457.001
co2 362.4311 22.374 16.198 0.000 318.266 406.597

======================== ==========
36.887 Durbin-Watson:
Autobuz: 1.850
Problemă (autobuz): 0.000 Jarque-Bera (JB): 67.548
Oblic: 1.020 Prob (JB): 2.15e-15
Kurtoza: 5.258 Condiții Nu. 600.

Avertizări:
[1] Erorile standard presupun că matricea de covarianță a erorilor este corect specificată.

mod.summary()

Rezultatele regresiei MOL


Variabilă dep.: pib R pătrat: 0.769
Model: OLS adj. R pătrat: 0,764
metodă: Cele mai mici F-statistică: 189.2
pătrate Prob (F-statistic): 4,26e-54
Probabilitatea jurnalului: -
Data: Luni, 27 decembrie 1791.2
2021
AIC: 3590.
Timp: 02:08:23
BIC: 3603.
Nu. Observații: 175
Df Reziduuri: 171
dfModel: 3
tP>|t|
Tip de covarianță: nonrobust coef std [0.025 0.975]
Interceptare -1.983e+04
err 4250.157 - 0.000 -2.82e+04 -1.14e+04
4.665
scoala 651.8583 259.089 2.516 0.013 140.434 1163.283
viata 301.8879 78.581 3.842 0.000 146.775 457.001
co2 362,4311 22.374 16.198 0.000 318.266 406.597
Autobuz: 36.887 Durbin-Watson: 1.850
Prob(Omnibus): 0.000 Jarque-Bera (JB): 67.548

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente

Avertizări:
[1] Erorile standard presupun că matricea de covarianță a erorilor este corect specificată.

4. Care este efectul cauzal pe care doriți să îl estimați? Pentru ca este interesant?

Efectul cauzal de estimat cu variabila Produsul Intern Brut (PIB) este subvariabilitatea în raport cu alte variabile (școlarizare, viață și emisii de CO2)
și modul în care acestea influențează celelalte. Efectuând un model de regresie liniară simplă sau multiplă, înveți cum să ignori informațiile existente
și să o găsești pe cea care este cu adevărat relevantă și care ne oferă informații reale și consistente Produsul Intern Brut este valoarea totală a
bunurilor și serviciilor produse în teritoriul unei țări într-o anumită perioadă, fără dubluri. Se poate obține prin diferența dintre valoarea brută a
producției și bunurile și serviciile consumate în timpul procesului de producție propriu-zis, la prețuri de cumpărător (consum intermediar). Această
variabilă poate fi obținută și în termeni neți prin scăderea din PIB a valorii adăugate și a consumului de capital fix al bunurilor de capital utilizate în
producție.

5. Concluzii la nivel global despre rezultatele modelului.


La concluzia globală, se poate afirma că variabila PIB în raport cu celelalte variabile studiate se obține un R pătrat (R2) 76,9%, această valoare ne
spune că variabilele sunt semnificative.
^. Încheiați într-un mod special rezultatele modelului.

Dintr-o scurtă analiză a regresiei multiple efectuate, se pot observa variabile care nu ne oferă prea multe informații și devin variabile care colorează
modelul.

7. Ce variabile neconsiderate ar putea afecta variabila explicată? Justi^que.

Pe lângă variabilele deja analizate, trebuie luată în considerare și cantitatea de populație pe care o au țările și astfel ar putea fi evaluat PIB-ul pe
cap de locuitor și astfel să se poată compara veniturile pe individ. O altă variabilă care poate fi adăugată este inflația experimentată de țări și
efectuați exercițiul de găsire a PIB-ului Real pe care îl obține fiecare țară într-un an.

Salvarea automată a eșuat. Acest fișier a fost actualizat de la distanță sau într-o altă filă. arata diferente

• 0 s a alergat 23:43

S-ar putea să vă placă și