Sunteți pe pagina 1din 77

Ministerul Educației al României

Universitatea de Stat ”Alexandru Ioan Cuza”, Iași


Facultatea de Economie și Administrarea Afacerilor
Specializarea Management în Turism

Proiect Statistica pentru afaceri


Analiza statistică a nivelului de trai a
populației în Republica Moldova

Coordonator: prof.univ.dr. Christiana Sandu

Studenți: Nebojenco Tatiana


Cernova Iana
Introducere..................................................................................................................................................3

Capitolul I. Prezentarea fenomenului studiat...............................................................................................5

1.1 Elemente conceptuale privind fenomenul studiat.............................................................5

1.2 Metodologia de culegere a datelor....................................................................................5

1.3 Populaţia ţintă şi eşantionul observat................................................................................6

Capitolul II. Crearea bazei de date..............................................................................................................7

2.1. Definirea variabilelor și introducerea datelor în SPSS......................................................................7

2.2.Verificarea bazei de date prin depistarea outlierilor..........................................................................9

2.3.Verificarea normalității distribuțiilor...............................................................................................13

Capitolul III. Descrierea statististică a distribuțiilor univariate..................................................................17

3.1. Analiza statistică univariată a variabilelor categoriale....................................................................17

3.2. Analiza statistică univariată a variabilelor numerice.......................................................................23

Capitolul IV. Estimarea și testarea mediei


4.1. Estimarea mediei prin interval de încredere....................................................................................30

4.2. Testarea egalității unei medii cu o valoare specificată....................................................................34

4.3. Testarea egalității mediilor a două populaţii...................................................................................37

4.4 Testarea egalităţii mediilor a trei și mai multe populaţii (ANOVA)................................................40

Capitolul V. Analiza de regresie și corelație..............................................................................................44

5.1 Analiza statistică a gradului de asociere dintre două variabile.........................................................44

5.2. Analiza de corelație........................................................................................................................47

5.3. Analiza de regresie.........................................................................................................................49

Capitolul VI. Prognoza nivelului unui fenomen........................................................................................55

6.1 Definirea variabilelor și introducerea datelor în SPSS.....................................................................55

6.2 Reprezentarea grafică a seriei de timp.............................................................................................57

6.3 Desezonalizarea seriei.....................................................................................................................67

6.4 Estimarea trendului..........................................................................................................................69

6.5 Prognoza fenomenului pe bază de trend..........................................................................................72

Concluzii...................................................................................................................................................75

2
Introducere
Începând cu 1 ianuarie 2019 conform estimărilor BNS,  populația Republicii Moldova  a
constituit  2.681.735 persoane. După proclamarea independenței în anul 1991 situația
demografică din Republica Moldova a devenit una foarte grea. Cauza acestui fapt este situația
social-economică dificilă din țară.
În ultimii ani a scăzut creșterea naturală a populației (cu toate că se atestă o revigorare), s-a
majorat emigrarea peste hotare oamenilor profesional-educați în vârsta lucrătoare. S-a majorat
nivelul de mortalitate naturală a populației.
În ultima perioadă este foarte importantă analiza mediului populației unei țări precum și a
condițiilor de trai a acestora . Problemele cu care se confruntă cel mai des populația Republicii
Moldova sunt: starea sănatății la fel și salarii mici , neajunsuri sunt printer cele mai principalele.
Motivul
Motivul alegerii temei a fost interesul fața de cum a evoluat demografia populației , să analizez
un sector anumit de persoane (tineri-vîrsnici ) cum se descurcă vis-a-vis de situația actuală din
țară.
Scopul Cercetării
Cercetarea are ca scop analiza profilului de persoane cu virsta cuprinsă între 20-80 ani a
nivelul de șomaj ,venitul lunar și cât și nivelul de educație.
Obectivul General
Obiectivul general reprezintă cercetarea nivelului de trai a Republicii Moldova și problemele
generale ale cetățenilor.
Obiectivele specifice
1. Identificarea principalelor probleme ale cetățenilor noștri;
2. Determinarea variației salariului în dependență de stdiile pe care le dețin;
3. Identificarea nivelului de șomaj pe sexe;
4. Investigarea mediului de trai(urban sau rural) cum acționaeză asupra venitului și
asupare cheltuelilor lunare;
5. Analiza diferențelor de salarii în dependență de nivelul educațional acumulat
(deținut) de cetățeni.
Ipotezele cercetării
 H1. Majoritatea cetățenilor care au un job stabil au salarii cuprinse între 4500-7000 lei.
 H2. Printre probelemele principale cu care se confruntă populația sunt nivelul slab de
școlarizare și lipsa locurilor de muncă.
 H3.Majoritatea persoanelor care au aceptat să răspundă la întrebări au fost de gen
femenin care au un loc de muncă stabil și au virsta cuprinsă între 20-45 de ani.

4
Capitolul I. Prezentarea fenomenului studiat
1.1 Elemente conceptuale privind fenomenul studiat

Încă din trecut Republica Moldova s-a caracterizat printr-o intensitate mare a procesului de
urbanizare. În anii 1950-1990 numărul populației urbane s-a mărit de 5,4 ori datorită migrației de la
sate, repartizarea în orașe a specialiștilor alolingvi din republicile unionale, natalității înalte etc. În
ultimii 20 ani, populația urbană s-a micșorat de la 47,4% în 1990 până la 40,9% în 2002, de aici
crescând până la 42,5%  Astăzi Republica Moldova are unul dintre cele mai scăzute nivele de
urbanizare din Europa.

Orasele mici și mijlocii au pierdut din importanța lor din cauza unui șir de factori:

 crizei economice, dezindustrializării;

 creșterea șomajului și reducerea venitului populației;

 degradarea infrastructurii de utilități publice (drumuri, sisteme de apă și canalizare) din


cauza lipsei resurselor financiare pentru reabilitare;

 stoparea bruscă a prestării unor servicii publice (asigurarea cu energie termică sau
prestarea serviciilor de transport public).

Aceasta a favorizat reducerea populației urbane și “ruralizarea“ modului de viață orășenesc.


Actualitatea acestei teme se explică prin importanța cunoașterii nivelului de trai a populației și ce
factori au determinat o astfel de repartizare neuniformă a populației.

1.2 Metodologia de culegere a datelor

Chestionarul a fost instrumentul pe care l-am ales să-l utilizăm în cercetarea noastră pentru
relizarea obiectivelor cercetării și ipotezelor pe care ni le-am propus . Instrumentul dat constă
dintr-o serie de întrebări, precum şi a altor solicitări în vederea colectării de informaţii necesare
de la direrite persoane .

Fiind o modalitate modernă de măsurare a datelor, oferă posibilitatea analizei ușoare a


informației în timp rapid și cu utilizarea unor costuri foarte mici. Un alt avantaj al
chestionarului este posibilitatea de a depistării părerii unui număr mare de persoane în raport cu
problemele sociale.. Chestionarul realizat pentru cercetarea dată cuprinde 7 întrebări, printre care
identificăm întrebări de tip închis, adică cu răspunsuri stabilite prealabil, și de tip deschis.

5
1.3. Populaţia ţintă şi eşantionul observat

Definirea populației

Populația țintă o reprezintă locuitorii din mediul rural și urban al Republicii Moldova.
Eșantionul supus cercetării este alcătui din 30 persoane . Acest eşantion a fost stabilit în urma
unor analize şi decizii.

Derularea propriu - zisă a cercetării

Colectarea datelor a durat două săptămâni în intervalul calendaristic, începînd cu data de 03


noiembrie pînă în data de 16 noiembrie. Persoanele care au colectat datele sunt cele care au
realizat proiectul propriu-zis..

Datele obținute sunt date primare, fiind culese nemijlocit de la persoane din cadrul
eșantionului selectat pentru efectuarea studiului curent. În funcție de originea datelor utilizate,
informația este obținută din surse externe. Acest fapt va ajuta și va confirma realitatea și
corectitudinea rezultatelor pe care le vom obține. Unitatea de observare a cercetării este individul
în cauză. Astfel, în decurs de 14 zile au fost selectațipersoane care au ales să ne răspundă la
întrebările din chestionar , dar am avut și refuzuri pe care nu le-ai inclus în proiect.

Fixarea gradului de precizie

 Eroarea de estimare sub forma relativă – 5%;


 Gradul de încredere a rezultatelor (0,95).

Metoda de eșantionare
Metoda de eșantionare pe care am ales-o a fost puțin complicată deoarece pentru a obține
rezultate favorabile și înteresante cît și diferite am interogat atât persoane din mediu rural cît și
urban.

6
Capitolul II. Crearea bazei de date

2.1. Definirea variabilelor și introducerea datelor în SPSS


Pentru a realiza analiza statistică a datelor colectate prin intermediul chestionarului, am folosit
programul SPSS. Datele colectate au fost introduse în programă, iar pentru fiecare variabilă a
fost specificat : numele acesteia,tipul, numărul de caractere, tipul de scală , iar variabilele
categoriale le-am codificate.
Definirea variabilelor
Gen persoanei – este o variabilă nominală, categorială, calitativă, nealternativă, primară și
discretă. Variabila divide cetățenii în funcție de gen. Codurile folosite pentru această variabilă
au fost : 1= ”Feminin” , 2 = ” Masculin”.
Vârsta – este o variabilă ordinală, cantitativă, numerică, primară și continuă. Variabila descrie
profilul demografic al consumatorului și reflectă vîrsta respondentului.
Venitul – este o variabilă ordinală, cantitativă, numerică, primară și continuă. Variabila descrie
venitul mediu pe care îl au persoanele interogate lunar.
Reședința – este o variabilă calitativă, categorială, nealternativă, primară, nominală și discretă.
Variabila face distincție între respondenții din mediul urban de cei din mediul rural.
Ocupație-este o variabilă nenumerică, categorială , caliatativă și direct. Variabila face diferența
dintre nivelul de șomaj al eșantionului analizat.
Educație-este o variabilă nenumerică, nominal ,categorială.Variabila descrie nivelul de educație
a eșantionului de persoane analizate.

Pentru crearea bazei de date în SPSS au fost realizați următorii pași:

7
Figura.2.1 Definirea valorilor in meniul Variable view

8
Figura 2.2. Introducerea datelor în fereastra Data view

2.2.Verificarea bazei de date prin depistarea outlierilor


În statistică, outlierii reprezintă un punct de date care diferă foarte mult de alte valori într-un
set de date, acestea pot afecta uneori modul în care datele sunt percepute în ansamblu.
Pentru această analiză vom utilize următoarele variabile numerice: virsta persoanei și venitul
lunar . Astfel se va urma următoarea cale: Analyze- Descriptive Statistics – Explore – Plots.

9
Figura 2.3. Selectarea opțiunii Analyze- Descriptive Statistics- Explore.

10
Figura 2.4. Selectarea variabilei

11
Astfel se obține următoarea diagramă Box-Plot:

Figu
ra 2.5. Diagrama Box-plot pentru variabila Vârsta persoanei

12
Figura 2.6 Selectarea variabilei
Astfel se obține următoarea diagram Box-Plot:

13
Fig
ura 2.7.Diagrama Box-plot pentru variabila Venitul lunar de la locul de muncă

2.3.Verificarea normalității distribuțiilor


Pentru a verifica normalitatea distribuțiilor variabilelor ” Vârsta personei’’și “ Venitul lunar de
la locul de muncă” se utlizează următoarele procedee : Box-Plot, Q-Q Plot, P-P Plot, histograma,
testul Kolmogorov Smirnov.Pentru a putea depista atât outilierii cât și normalitatea distribuției se
va folosi procedeul Q-QPlot.
Am observant că distribuția variabilei testate este normală și atunci punctele Q-Q formează o
linie care se suprapune cu dreapta și reprezintă distriuția teoretică, ceea ce semnifică că trece
prin origine și are panta egală cu 1.Pentru a determinarea normalității distribuției vom efectua
următorii pași : Analyze- Descriptive Statistics – Explore – Plots.

14
Figura 2.8. Selectarea opțiunii Analyze- Descriptive Statistics- Explore.

Se aleg variabilele care urmează să fie analizate, iar apăsând pe Plots se bifează Normality plots
with tests.

15
Figura 2.9. Selectarea variabilelor
După selectarea variabilelor vom obține câte un grafic pentru fiecare variabilă, care arătă
în felul următor.

Figura 2.10.Graficul Q-Q Plot pentru variabila Vârsta persoanei

16
Figura 2.11.Graficul Q-Q Plot pentru variabila Venitul lunar de la locul de muncă

Conform gaficelor observăm ca nu există o mare abatere de la abcisă ceia ce semnifică că


este o distribuție normală.

17
Capitolul III. Descrierea statististică a distribuțiilor univariate

3.1. Analiza statistică univariată a variabilelor categoriale


Cercetarea noastră avem următoarele variabile categoriale: genul persoanei, nivelul de
ocupație, mediul de trai și nivelul de educație . Reprezentarea variabilelor se va face cu ajutorul
diagramelor pie chart, cât și prin intermediul diagramelor în bare.
Pașii care urmați în programul SPSS pentru reprezentarea grafică a datelor sunt: Meniul
Analyze – Descriptive Statistics – Frequencies.

18
Figura 3.1. Selectarea opțiunii Analyze- Descriptive Statistics – Frequencies

Figura 3.2. Selectarea variabilei și tipul graficului


Tabelulul și graficul de frecvență a Nivelului de Educație
19
Figura 3.3 Tabelul de frecvență a nivelului de educație

Figura 3.4. Graficul de frecvență a nivelului de educație


Argumentarea: După graficul și figura 3.3 și 3.4 putem să observăm că : 6 persoane din cei
interogați au studii doar gimnaziale (20%) , 3 persoane au doar studii de liceu (10%),

20
11 persoane au numai studii de colegiu (36,6%) și doar 10 persoane au studii superioare de
licență (33,3%). Analizând nivelul de educațiea a persoanelor obeservăm că este o diferență
mică(3%) între persoanele cu studii de colegiu și cele cu studii de licență.

Nivelul de ocupație a eșantionului interogat

Figura 3.5 Tabelul nivelul de ocupație a persoanelor

Figura 3.6 Graficul Nivelul de ocupație a persoanelor

21
Argumentarea: Din graficul și tabelul de mai sus obeservăm că din eșantionul interogat
majoritatea persoanelor sunt ocupate în câmpul muncii circa (66,7%) pe când numărul
persoanelor șomeri și pensionari este la fel circa (16,7%) pentru fiicare.

Mediul de trai a persoanelor respondente.

Figura 3.7 Tabelul frecvenței Mediului de trai a persoanelor

Figura 3.8 Reprezentarea grafică a mediului de trai

22
Argumentarea: Rezultatele obținute în figura 3.8 denotă faptul că (63.3% ) dintre
respondenți vin din mediul urban , iar (36,7) % din mediul rural.
Genul persoanelor respondente

Tabelul 3.9. Genul persoanei respondente

Figura 3.10. Reprezentarea procentuală a genului persoanelor respondente


Argumentare: După datele obținute în figura 3.10. putem observa că majoritatea
persoanelorrespondente sunt de genul feminine, și anume (66,7 %), iar (33,3 %) sunt de genul
masculine. Aceste date denotă faptul că femeile sunt mai receptive în societate.

23
3.2. Analiza statistică univariată a variabilelor numerice
Variabilele numerice care urmează a fi analizate în cadrul proiectului sunt
următoarele:”Vârsta persoanei ”,și ”Venitul lunar de la locul de muncă”.
Pentru a face această analiză se va urma calea ca în cazul variabilelor categoriale Meniul
Analyze – Descriptive Statistics – Frequencie, doar că în cazul dat se vor bifa toți indicatorii din
Statistics iar la Chart se va alege Histograms.

Figura 3.11. Selectarea variabilei și bifarea indicatorilor Statistics

24
Figura 3.12. Selectarea opțiunii Histogram
Vârsta persoanei

25
26
Figura 3.13. Reprezentarea grafică a Vârstei persoanelor
Argumentare:
𝒙 (mediu)- Conform datelor obținute în figura 3.13.putem menționa că vârsta medie a
respondenților este aproximativ 39 de ani.
Me- 50% dintre persoanele respondente au cel mult 35 de ani ,iar 50% dintre respondenți cel
puțin vârstade 35 ani.
Mo- Valoarea cea mai des întâlnită în cazul variabilei noastre este 22 ani , 30 ani și 41 de ani.
s- În medie vârsta respondenților se abate de la medie cu ±3 ani .
Din rezultatele obținute putem menționa că distribuția este simetrică , deoarece Me = x(mediu).
Coeficientul de boltire Kurtosis demonstrează că variabila are o distribuție normală leptocurtică.
Q1- 25% dintre consumatori au cel puțin 27 de ani, iar 75 % dintre respondenți au cel mult 27
ani.
Q2=Me- 50% dintre persoanele respondente au cel mult 35 de ani ,iar 50% dintre respondenți
cel puțin vârsta de 35 de ani.
Q3 - 75% dintre consumatori au cel puțin 46 ani , iar 25 % din consumatori cel mult 46 de ani,

27
Venitul lunar de la locul de muncă

Figura 3.14. Selectarea variabilei și bifarea indicatorilor Statistics

Figura.3.15. Venitul de la locul de muncă

28
Figura 3.16 Venitul lunar de la locul de muncă

29
Figura 3.17. Reprezentarea grafică a venitului respondenților.
Interpretare:
𝒙 (mediu)- Conform datelor obținute în figura 3.15. se poate de menționat că venitul mediu al
respondenților este de 3586,67 lei.
Me- 50% dintre persoanele respondente au cel mult 4250,00 lei ,iar 50% dintre respondenți cel
puțin unvenit de 4250,00 lei.
Mo- Valoarea cea mai des întâlnită în cazul variabilei date este 0 lei.
s- În medie venitul respondenților se abate de la medie cu ±425,55 lei .
Din rezultatele obținute putem menționa că distribuția este asimetrică , deoarece Me< x(mediu).
Coeficientul de boltire Kurtosis demonstrează că variabila are o distribuție normală leptocurtică.
Q1- 25% dintre consumatori au cel puțin 1175,00 lei venit, iar 75 % dintre respondenți au cel
mult 1175,00 lei venit lunar.
Q2=Me- 50% dintre persoanele respondente au cel mult 4250,00 lei ,iar 50% dintre respondenți
cel puțin4250,00 lei lunar.
Q3 - 75% dintre consumatori au cel puțin 5500,00 lei, iar 25 % din consumatori cel mult
5500,00 lei.
30
Capitolul IV. Estimarea și testarea mediei

4.1. Estimarea mediei prin interval de încredere


În cadrul programei SPSS stabilirea intervalului de încredere se realizează conform demersului:
Meniul Analyze – Descriptives Statistics – Explore.

Figura 4.1. Meniul Analyze – Descriptives Statistics – Explore

31
Figura 4.2. Definirea variabilei dependente – alegerea nivelului de încredere.

Venitul lunar de la locul de muncă

Figura 4.3. Tabelul Descriptives Venitul lunar de la locul de muncă (95% încredere).
Argumentarea: Cu un risc de 5% putem afirma că venitul lunar de la locul de muncă se află în
intervalul de la 2716,31 lei- 4457,02 lei.

Figura 4.4. Definirea variabilei dependente – alegerea nivelului de încredere


32
Figura 4.5. Tabelul Descriptives Venitul lunar de la locul de muncă (99% încredere).
Argumentarea:Conform tabelului de mai sus putem spune cu o probabilitate de 99% că salariu
mediu de la locul de muncă este cuprins între 2413,67 lei-4759,66 lei.
Vârsta personei

Figura 4.6. Definirea variabilei dependente – alegerea nivelului de încredere

33
Figura 4.7. Tabelul Descriptives Vârsta persoanei (95% încredere)
Argumentare:Cu riscul de 5% putem menționa ca vârsta persoanelor este cuprinsă între 33 ani-
45 ani.

Figura 4.8 Tabelul Descriptives Vîrsta Persoanei (99% încredere)


Argumentare: Cu o probabilitate de 99 % putem afirma că vârsta medie a respondenților este
cuprinsă în limitele intervalului 31ani -47 ani .

34
4.2. Testarea egalității unei medii cu o valoare specificată

Testarea mediei cu o valoare fixă în programul SPSS se face cu ajutorul următorului traseu:
Analyze – Compare Means – One –Sample T test. Instrumentul One Simple T Test este pentru a
realiza a testărea respectivă.

Figura 4.9. Selectarea opțiunii Analyze- Compare Means – One –Sample T test.

35
Figura 4.10. Selectarea variabilei și valorii test.
Conform unor statistici realizate în Republica Moldova salariu mediu a persoanelor este
estimat la 2000 de lei. Efectuând această testare ,vom observa dacă sunt abateri de la datele
înregistrate pentru eșantionul ales de noi.

Formularea ipotezelor:

Ho: 𝜇 = 𝜇 0(Valoarea teoretică este egală cu valoarea practică)


H1: 𝜇 ≠ 𝜇 0 (Valoarea teoretică diferă de valoarea practică)

Regula de decizie:

Dacă sig.>α se acceptă ipoteza Ho;


Dacă sig<α se acceptă ipoteza H1.

Figura 4.11 Tabelul One sample Statistics pentru venitul lunar de la locul de muncă

36
Figura 4.12.Tabelul One sample Test pentru venitul lunar de la locul de muncă
Argumentarea: Analizând datele din tabelul One Sample Test se poate de menționat că valoarea
sig( 0.001) <0.05( riscul asumat) , atunci statistica Test este semnificativă pentru 95% . Deci
observăm că ipoteza nulă se respinge.

Vârsta medie a populației din enșantionul observat


Conform observației noastre putem spune că vârsta medie a persoanelor este de 23 de ani.
Formularea ipotezelor:
Ho: 𝜇 = 𝜇 0(Valoarea teoretică este egală cu valoarea practică)
H1: 𝜇 ≠ 𝜇 0 (Valoarea teoretică diferă de valoarea practică)
Regula de decizie:
Dacă sig.>α se acceptă ipoteza Ho;
Dacă sig<α se acceptă ipoteza H1.

Figura 4.13.Tabelul One sample Statistics pentru vârsta medie a populației

37
Figura 4.14.Tabelul One sample Test pentru vârsta persoanei
Argumentarea: Analizând datele din tabelul One Sample Test pentru valoarea vârsta persoanei
se poate de menționat că valoarea sig( 0.000) <0.05( riscul asumat) , atunci statistica Test este
semnificativă pentru 95% . Deci observăm că ipoteza nulă respectiv se respinge.

4.3. Testarea egalității mediilor a două populaţii

Pentru a face o testare a diferenței dintre două medii se va utilize instrumentul Independent –
Samples T test care se regăsește în meniul Analyze - Compare Means.

Figura 4.15. Selectarea opțiunii Analyze-Compare Means- Independent-Samples-T Test

38
Figura 4.16.Selectarea variabilei definirea variabilei ”criteriu”
Venitul lunar a persoanei- Genul persoanei
Ho: Cele două populații au varințe egale
H1: Cele două populații nu au varianțe egale

Figura 4.17. Tabelul Group Statistics pentru venitul de la locul de muncă -Genul

39
Figura 4.18.Tabelul Independent Sample Test pentru venitul de la locul de muncă –Genul

Argumentare: Din tabelul Group statistics 4.3.1 se poate observa că respondenții de gen
masculin au în medie salariu lunar de 3340 lei iar persoanele de gen femenin în medie 3710 lei.
De aici deduce că nu există o mare diferență între salariile femeilor și cel al bărbaților.
Conform tabelului sig=0,818 este mai mare decât α= (0,05) se utilizează varianțe reunite. În
acest caz nivelul de semnificație (0,690) al testului t >0,05, ceea ce semnifică faptul că salariu nu
diferă semnificativ în funcție de genul individului.

Figura 4.19.Tabelul Group Statistics Vârsta persoanei- Mediu de trai

Figura 4.20. Tabelul Independent Samples Test Vârst persoanei - Mediul de reședință
Argumentare: Nivelul de semnificație observat în tabelul Independent Samples Test (0,432 )
este mai mare decât pragul α=0,05, se utilizează varianțe reunite. Testul t =0,67 4cu o
probabilitate Sig. 0,528 >0.05 semnifică faptul că majoritatea persoanelor din eșantionul dat sunt
din mediul urban sunt 19 persoane și 11 sunt din mediul rural.

40
4.4 Testarea egalităţii mediilor a trei și mai multe populaţii (ANOVA)

ANOVA este un procedeu de analiză a variației în funcție de sursa acesteia ce permite


compararea a trei sau mai multe grupe sau populații cu scopul de a verifica dacă există diferențe
semnificative între acestea.
Condițiile de aplicare a procedeului sunt:
 Condiția de independență;
 Condiția de normalitate;
 Condiția de homoscedasticitate;
Procedeul se bazează pe descompunerea variației totale pe componente:
 Variația explicată sau intergrupe (variația sub influența factorilor esențiali);
 Variația reziduală sau intragrupe (variația sub influența factorilor întâmplători);
Pentru aplicarea testului ANOVA în programul SPSS se folosește: meniul Analyze –
Compare Means – One –Way ANOVA.

Figura 4... Meniul Analyze – Compare Means – One –Way ANOVA

41
Figura 4.21. Selectarea variabilei dependente și a factorului de influență

42
Tabelul 4.22 Venitul lunar de la locul de muncă

Tabelul 4.23.Test of Homogeneity of Variances Venitullunar de la locul de muncă

Argumentarea: Valoarea Sig (Testul Levene) egala cu 0,000 este mai mica decât 0,05. În aceste
condiții nu se poate aplica testul Anova pentru condiția de homoscedasticitate.

43
Tabelul 4.24.ANOVA Venitul lunar de la locul de muncă

Argumentare: Valoarea Sig. (0,656) din cadrul tabelului ANOVA este mai mare ca valoarea α
(0,05). Conform acestui fapt ipoteza de egalitate a mediilor pe grupe nu se respinge, deci grupele
de venit nu diferă semnificativ . Cu un risc de 5% se afirmă faptul că populațiile nu diferă
statistic.

44
Capitolul V. Analiza de regresie și corelație

5.1 Analiza statistică a gradului de asociere dintre două variabile

Analiza de asociere se realizează între două variabile categoriale care măsoară legătura dintre
variabilele studiate.Pentru această analiză se va efectua următorul demers: Analyze –
Descriptives Statistics –Crosstabs. La opțiunea Statistics se bifează Chi – Square.

Figura 5.1. Meniul Analyze – Descriptives Statistics – Crosstabs

45
Figura 5.2. Selectarea variabilelor

Figura 5.3.Tabelul Case Processing Summary Sortimentul preferat de ciocolată * Genul


persoanei respondente

46
Figura Tabelul 5.4.*Nivelul de ocupație * Genul persoanei Crosstabulation

Figura 5.5. Tabelul Chi-Square Tests *Nivelul de ocupație * Genul persoanei

Ipotezele:

H0 – Nu există legătură semnificativă între nivelul de ocupație și genul persoanelor


H1 – Există legătură semnificativă nivelul de ocupație și genul persoanelor
Argumentarea: În cazul resectiv Sig (0,861) și este mai mare ca riscul α (0,05) ceia ce nu
confirmă că există o legătură între variabilele studiate.Nu există legătură semnificativă între
Nivelul de ocupație și vârsta persoanei.

47
5.2. Analiza de corelație

Analiza de corelație este utilizată pentru a studia intensitatea legă5turii între variabile. În
cadrul programului SPSS poate fi realizată analiza de corelație bivariată (studierea legăturii între
două variabile, dintre care una reprezintă efectul, iar cealaltă reprezintă cauza) și parțială
(stabilirea legături47 între variabile dintre care una este efectul controlat al influenței uneia sau a
mai multor ariabile factoriale). Pentru această analiză se fac următorii pași: Analyze – Correlate
– Bivariate

Figura 5.5 Meniul Analyze – Correlate – Bivariate

48
Figura 5.6. Selectarea variabilelor

Tabelul 5.7. Correlations Vârsta persoanei*-Venitul de la locul de muncă


Argumentare: Coeficientul Pearson reprezintă -0,769 ce atestă o legătură directă și foarte bună
între variabilele studiate, deci există o legătură strânsă între vârsta persoanei și venitul lunar de la
locul de muncă.

49
5.3. Analiza de regresie

Analiza de regresie este un instrument de modelare statistică, folosit pentru a determina un


model al legăturilor care se stabilesc între perechi de date numerice. Între aceste 2 variabile
numerice se poate stabili o legătură liniară caracterizată prin ecuația de regresie simplă :
Yi= α+Bxi+εi
Unde: Y – Variabila dependentă
X – Variabila independentă
ε - Valoarea reziduală
Bo, Bi – parametrii modelului
Pentru a efectua o analiză de regresie se vor face următorii pași: Analyze – Regression – Linear

Figura 5.8 Selectarea meniului Analyze – Regression – Linear

50
Figura 5.8. Selectarea variabilelor pentru Regression Linear

A. Analiza de regresie liniară simplă

Figura 5.9.Tabelul Coefficients Liniar Regression


Estimarea punctuală
Ecuția de regresie conform tabelului Coefficients este următoarea:
Y= 8196,883 +( -88,690)X
b0= 8196,883
Valoarea dată reprezintă estimația punctuală a parametrului b0. Deci, ea prezintă
constanta sau termenul liber al modelului. Putem spune că valoarea medie a variabilei
dependente”Cantitatea de ciocolată consumată săptămânal” este egală cu 8196,883 , atunci când
valoarea variabilei independente ” venitul lunar dela locul de muncă’’ .

51
b1= -88.690
Argumentare: Valoarea dată reprezintă estimația punctuală a parametrului b1 . Creșterea cu o
unitate a variabilei independente ” venitul persoanei de la locul de muncă” vârsta persoanei ”
egală cu-88,690 unități.
Testarea
H0: β0 = 0
H1: β1 ≠0
Argumentarea: Pentru parametrul β0 se poate menționa că statistica t este egală cu 10,150 iar
Sig.=0,000. Valoarea lui Sig. este mai mică ca riscul α =0,05 ceea ce confirmă faptul că nu se
respinge ipoteza de nul. Iar cu probabilitatea de 95 % se poate garanta faptul că parametrul β0
nu este semnificativ statistic.Se poate observa că pentru parametrul β1 statistica t este egală cu
-5,11 iar valoarea Sig. este egală cu 0,000. În consecință ,valoarea Sig. este mai mare ca riscul
α=0,05, ceea ce confirmă faptul că nu se acceptă ipoteza alternativă . Cu o probabilitate de 95 %
se poate afirma faptul căparametrul β1 nu este semnificativ statistic.
Testarea modelului se face cu ajutorul tabelului ANOVA. Ipotezele modelului sunt:
H0 = nu există legătură între Venitul de la locul de muncă și Vârsta persoanei
H1 = există legătură între Venitul de la locul de muncă și vârsta persoanei.

Figura 5.10. Tabelul Anova pentru venitul lunar și vârsta persoanei


Argumentare: Statistica F conform tabelului ANOVA este egală cu 26,126 iar valoarea Sig.
este echivalentă cu 0,000 ce este mai mică decât riscul α =0,05. Potrivit acestui fapt se acceptă
ipoteza alternativă și se respinge ipoteza nulă. Cu o încredere de 95% putem afirma că există
legătură între variabilele venitul lunar de la locul de muncă și vârsta persoanei.

52
Figura 5.11. Tabelul Model Summary pentru Vârsta persoanei- venitul lunr de la locul de muncă.
Coeficientul de corelație este egal cu 0,769 . Acest fapt confirmă o legătură pozitivă și directă,
semnificativă puternică între variabile. Valoarea raportului de determinație este egală cu 0,592.

B.Analiza de regresie liniară multiplă


Ecuația de regresie:4 Yi = Bo+Bx1+Bx2+ei
Unde: Y – variabila dependentă
X – variabila independentă
X – variabila independentă
e-variabila aleatoare

Figura 5.12. Tabelul Coeficients Venitul lunar de la locul de muncă

Estimarea punctuală
b0 = 8196,883 Această valoare reprezintă estimația punctuală a parametrului b0 . Ea reprezintă
constanta sau termenul liber al modelului. Valoarea medie a variabilei dependente ”Venitul lunar
de la locul de muncă ” atunci când valorile simultane ale variabilelor sunt independente .
b1 = -88,690 Această valoare reprezintă estimația punctuală a parametrului b1.
b2 = 10,150 Această valoare reprezintă estimația punctuală a parametrului b2 . Atunci când
vârsta respondentului crește cu o unitate, cantitatea de ciocolată crește cu 17,351 menținând
constantă influența celeilalte variabile independente.

53
Testarea
Parametrul Bo are valoarea sig.= 0,00 ce este mai mic ca riscul asumat 0,05. Din acest motiv
putem afirma cu o încredere de 95% că acest parametru este diferit nu semnificativ egal cu zero.
Parametrul B1 are valoarea sig.=0,000 este mai mică ca riscul 0,05 ceea semnifică că se poate de
afirmat cu o încredere de 95 % că parametrul este semnificativ diferit de zero.
Parametrul B2 are valoarea sig.=0,511 este mai mare ca riscul 0,05 ceea ce ne permite să
afirmăm cu o încredere de 95 % că parametrul nu este semnificativ diferit de zero.

Figura 5.13 Tabelul ANOVA Venitul lunar de la locul de muncă


Ho: modelul nu explică semnificativ legătura între variabile
H1: modelul explică semnificativ legătura între variabile
Potrivit tabelului Anova statistica F este egală cu 26,126 iar valoarea sig asociată este 0,000 .
Această valoare este mai mică ca 0,05 ceea ce ne determină să afirmăm cu o încredere de 95% că
modelul explică semnificativ legătura între variabile.

Figura 5.14. Tabelul Model Summary pentru Vârsta persoanei*Venitul lunar de la locul de
muncă.

54
Estimarea
Coeficientul de corelație este egal cu 0,769. Această valoarea ne indică prezența unei legături
pozitive, directe și puternice între cele variabilele studiate.Raportul de determinație este egal cu a
0,592. Această valoare ne arată că 59,0 % din variața variabilei dependente este explicată de
variația variabilei independente.

55
Capitolul VI. Prognoza nivelului unui fenomen

6.1 Definirea variabilelor și introducerea datelor în SPSS

La realizarea acestui capitol am avut nevoie de o altă serie de date pe care am colectat-o de
pe situ-l official de statistic din Republica Moldova :
https://statbank.statistica.md/pxweb/pxweb/ro/30%20Statistica%20sociala/30%20Statistica
%20sociala__04%20NIV__04%20NIV__NIV020/NIV020100.px/table/tableViewLayout1/?rxid=b2ff27d7-
0b96-43c9-934b-42e1a2a9a774.

Vom analiza Cheltuieli de consum medii lunare pe o persoana pe Ani, Destinatia cheltuielilor,

Medii, Trimestre si Unitatea de masura între anii 2010-2018. Variabilele identificate pentru

analiza dată au fost luate de tip numeric.

Figura 6.1.Definirea valorilor in Variable view

56
Figura 6.1. Introducerea datelor în fereastra Data View

Cheltuelile medii de consum lunare pentru anii 2010-2018 pentru patru trimestre.

57
6.2 Reprezentarea grafică a seriei de timp

Pentru a reprezenta evoluția fenomenului analizat în formă grafică se va parcurge următorul


demers: Analyze – Forecasting – Sequence Charts

Figura 6.2.Meniul Analyze – Forecasting – Sequence Charts

58
Figura 6.3. Selectarea Variabilelor

59
60
Figura 6.4 Tabelul Descriptive pentru Anul analizat- Cheltueli în ani

61
Figura 6.5 Diagrama Box plot pentru Cheltueli pentru intretinerea locuinței -Anul Analizat
Argumentare: Diagrama Box plot reprezinta cheltuielile pentru intetinerea locuintei pentru anii
2010-2018. Boxploturile anuale prezintă forme asemănătoare ale distribuției imprimate de
acțiunea facturilor sezoniere.Nivelul anual repezentat prin mediana box plot marchează linia de
tendință a cheluelilor trimestriale pentru anii 2010-2018.

62
Figura 6.6 Dinamica semestrială a Cheltuelilor pentru îmbrăcăminte /încălțăminte pentru
perioada de ani 2010-2018.
Graficul seriei de timp este prezentată în figura 6. definită ca Cheluelile pentru încălțăminte/
îmbrăcăminte în Republica Moldova în perioada 2010 – 2018 arată că:
 O creștere a cheltuelilor pentru încălțaminte/îmbrăcăminte și o variație nu prea mare;
 Seria pezintă valori aberente pentru anii 2015-2018.
Argumentarea: În urma analiei cronogramei liniare putem obesrva că variabila este în
continuă creștere. Cea mai mică valoarea înregistându-se în anul 2010- 150,00 lei iar cea mai
mare se observă în a fi în anul 2018-300,00 lei.

63
64
Figura 6.7. Tabelul Descriptives pentru Trimestrul analizat și Venitul disponibil.

65
Figura 6.8. Diagrama Box plot pentru Cheltuieli pentru întreținerea locuințe

66
Figura 6.8. Dinamica semestrială a venitului disponibil în Republica Moldova în perioada 2010
-2018.
Argumentare: Boxploturile trimestriale din figura 6.8. au distribuții aproape identice, ușor
asimetrice în sens pozitiv. Asimetria pozitivă este explicată de tendința ascedentă de evoluție a
fenomenului.

67
6.3 Desezonalizarea seriei

Pentru a realize în programul SPSS desezonalizarea seriei se urmează calea: Analyze –


Forecasting – Seasonal Decomposition

Figura 6.9. Meniul Analyze – Forecasting – Seasonal Decomposition.

68
Figura 6.10. Tabelul Seasonal factors pentru Cheltuieli
Variațiile sezoniere înregistrează un minim în trimestrul 1 al fiecărui an (S1 = 40,0) și un maxim
în trimestrul 3 (S3 = 160,0).

69
Figura 6.11. Tabelul Seasonal Decomposition pentru Valoarea venitului

6.4 Estimarea trendului

Am estimat trendul venitului urmând următorii pași: Analyze – Regression – Curve Estimation

Figura 6.12. Meniul Analyze – Regression – Curve Estimation.

70
Am estimat modelul de trend liniar și am realizat prognoza venitului disponibil pe baza acestui
model.Deci în consecință s-a obținut următorul table:

Figura 6.13. Tabelul Coefficients pentru estimarea trendului liniar


Ecuația de trend este:
Yt = 2002,924+ 0,050t
Estimarea punctuală
b0 = 2002,924
Această valoare reprezintă estimația punctuală a parametrului b0 . Ea reprezintă constanta sau
termenul liber al modelului. Valoarea medie a variabilei dependente ”Chelueli pentru
îmbrăcăminte/încălțăminte” atunci când valoarea variabilei independente ”Cheltuieli” este egală
cu zero.
b1 = 0,050
Această valoare reprezintă estimația punctuală a parametrului b1 . Creșterea cu o unitate a
variabile independente .
Valoarea pozitivă a coeficientului b1 arată că trendul este crescător.

71
Figura 6.14. Estimarea trendului pe Cheltuieli pentru îmbrăcăminte/încălțăminte

72
6.5 Prognoza fenomenului pe bază de trend

Pentru a realize prognoza fenomenului pe bază de brand, se urmează următorii pași:


AnalyzeForecasting-Create Models

Figura 6.15. Meniul Analyze-Forecasting-Create Models

73
Figura 6.16. Selectarea opțiunii Predicted Values

74
În final se obține un astfel de tabel cu valorile venitului disponibil pentru trimestrele anilor
2018-2020:

Tabelul 6.17. Forecast previziunea trendului

Din datele tabelului 6.18. se poate observa că trendul urmează o direcție pozitivă și
crescătoare. De exemplu în trimestrul Q4 al anului 2019 , cheltuielele pentru îmbrăcăminte
încălțăminte este 305,84 făcând comparație cu anul 2020 este mai mare.

Figura 6.18.Graficul Prognoza fenomenului pe bază de trend 2019-2020.

75
Concluzii:

Potrivit datelor obținute în proiectul dat putem observa că în prima jumatate a anului 2019,
minimul de existentă în Republica Moldova a constituit în medie pe lună 2 028 de lei. Acestă
sumă ar urma să asigure pentru o persoana volumul minim de consum al bunurilor materiale și a
serviciilor pentru satisfacerea necesităților principale, menținerea sanătatii și pentru susținerea
viabilității omului. Valoarea maximă a minimului de existentă revine populației în vârsta aptă de
muncă – 2 181 lei. Respectiv, pentru barbății minimul de existenta ar fi de 2 355 lei, pe cand
pentru femei – 1 985 de lei. Deasemenea putem afirma că se cheltuie foarte mult pe servicii
comunale care sunt mai mari ca veniturile uneori chiar. Populația Republicii Moldova a scăzut
foarte tare în ultima perioadă deasemena și acest factor a pus influența asupra niveluli de trai.
Totuși am mai observat că majoritatea persoanelor interogate sunt ocupate în câmpul muncii , iar
persoanele fară loc de muncă sunt pensionarii în marea majoritate, cât și femei care fie că sunt în
concediu de maternitate fie nu au loc stabil de muncă.

În cea doua partea și anume , după analiza datelor din BSN am estimat mai multe categorii de
trend dar s-a atras mai mult atenția la Cheltuelile pentru încălțămint/îmbrăcăminte care vor
crește tot mai mult și mai mult pentru următorii ani cît și cheltuelile pentru întreținerea locuinței.

76
Bibliografie
1. Elisabeta Jaba, Ana Grama, Analiza Statistică cu SPSS sub Windows, Polirom,
2004
2. Elisabeta Jaba Carmen Pintilescu, Editura Libris, Iași, 2007
3. https://statbank.statistica.md/pxweb/pxweb/ro/30%20Statistica
%20sociala/30%20Statistica
%20sociala__04%20NIV__04%20NIV__NIV020/NIV020100.px/table/tableVie
wLayout1/?rxid=b2ff27d7-0b96-43c9-934b-42e1a2a9a774.
4. https://statistica.gov.md/

77

S-ar putea să vă placă și