Sunteți pe pagina 1din 53

Capitolul II.

Crearea bazei de date

Pentru analiza statistică a fenomenului demografic, am prelevat date oferite de site-urile:


https://countrymeters.info/, https://knoema.ru, https://ro.wikipedia.org.

Figura. Date statistice preluate de pe site-ul https://countrymeters.info/

Analiza se realizează pe un eșantion de 33 țări. Datele ce au fost prelevate se referă la: denumirea țării,
suprafața, populația la 31 decembrie 2017, repartiția după vîrste la 31 decembrie 2017, total bărbați,
total femei, nașteri 2017, decese 2017, creșterea natural a populației, densitatea populației, nivel de
alfabetizare, PIB 2016, regiunea, grad de dezvoltare, indice de dezvoltare umană, grad de dezvoltare
după venit.

Variabilele ce vor constitui baza de date din SPSS vor fi următoarele: Nume.tara, Suprafata,
Populatie.totala, Barb.mmic15, Fem.mmic15, Barb.15...65, Fem.15...65, Barb.mmari65, Fem.mmari65,
Total.barb, Total.fem, Nasteri, Decese, Crest.natur.popul, Migratie.popul, Densit.popul, Nivel.alfabet,
PIB.2016, Regiune, Grad.dezv, Indice.dezv.um, Grad.dezv.venit.

2.1. Definirea variabilelor și introducerea datelor în SPSS

Variabile care au fost alese pentru examinare au fost introduse în Fereastra DataEditor, Foaia
VariableView. Am definit atributele pentru fiecare variabilă. Am obținut 2 valori Nominale, 2 valori
Ordinale și restul valorilor – Numerice.
Figura . Fereastra DataEditor, Foaia VariableView, pentru baza de date Statistica_demografica.sab

După definirea variabilelor în Fereastra DataEditor, Foaia VariableView, am completat datele pentru
fiecare dintre cele 33 țări, în Fereastra DataEditor, Foaia DataView.

Astfel, baza de date privind statistica demografică, va fi următoarea:


Figura . Fereastra DataEditor, Foaia DataView, pentru baza de date Statistica_demografica.sab

2.2.Verificarea bazei de date prin depistarea outlierilor

Outlierile sînt valorile care diferă foarte mult de majoritatea datelor. Înainte ca să observăm valorile
anormale, într-o probă aleatorie, trebuie să observăm valorile normale. De aceea outlierile înregistrate
la nivelul unui eșantion se depistează pe baza normalității distribuțiilor variabilelor.

Pentru depistarea outlierilor, vom analiza toate variabilele numerice. Valorile outlierilor le vom
determina astfel: Analyze-DescriptiveStatistics-Explore.
Figura. Selectarea opțiunii Analyse-Descriptive-Satistics-Explore

După care, în Dependent List: alegem toate variabilele numerice, și în Label Cases by: alegem Denumirea
țării. În opțiunea Statistics bifăm Outliers.
Figura. Selectarea în Dependent List a variabilelor numerice, în Label Cases by –Denumirea țării.

Vom obține și vom analiza diagramele Boxplot pentru toate variabilele numerice. Diagramele Boxplot
sînt folosite pentru a prezenta ditribuția după o variabilă numerică chiar atunci cînd numărul datelor de
care dispunem este mic (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba, Ana Grama).
Figura. Output SPSS: diagramele Boxplot pentru toate variabilele numerice.

Interpretare: Analizînd diagramele Boxplot putem face următoarele concluzii:

1. nu au fost depistate outlieri în cazul variabilelor: Bărbați mai mari de 65 ani, Femei mai mari de
65 ani;
2. au fost depistate outlieri în număr de 1 țară în cazul următoarelor variabile: Suprafață totală
(țara sub numărul de ordine 33); Populație totală (32), Bărbați mai mici de 15 ani (32), Femei
mai mici de 15 ani (32), Bărbați la 15-65 ani (32), Femei la 15-65 ani (32), Total bărbați (32), Total
femei (32), Decese (32), Indice de dezvoltare umană (32);
3. au fost identificate 2 sau mai multe outlieri la următoarele variabile: Nașteri (la tările sub
numărul de ordine: 32, 31, 25), Creșterea naturală a populției (32, 31, 25, 33, 6, 29, 27), Migrația
populației (3, 12, 10, 21, 32), Densitatea populației (3, 13, 6, 10), Nivel de alfabetizare (32, 3, 26,
17), PIB-ul (13, 12, 10).

A ieșit mult în evidență țara sub numărul de ordine 32 Nepal, care se caracterizează printr-un număr
mare al populației, densitate mare, creștere naturală a populației, migrație a populației, de asemenea se
caracterizează printr-un nivel mic de dezvoltare, de alfabetizare.

2.3.Verificarea normalității distribuțiilor.

Normalitatea distribuțiilor ne arată dacă datele sînt distribuite normal. Pentru a verifica normalitatea
distribuțiilor a variabilelor numerice vom proceda astfel: Analyze-DescriptiveStaistics-Explore. În
fereastra Statictisc nu facem nici o modificare, în fereastra Plots selectăm None în secțiunea Boxplots, și
deselectăm toate opțiunile din secțiunea Descriptive. Selectăm caseta Normality plots with tests,
apăsăm Continue apoi Ok, și fereastra Output se va deschide cu rezultatele.
Figura. Demersul pentru verificarea normalității distribuțiilor.
Astfel vom obține Testul de normalitate după Kolmogorov-Smirnov și Shapiro-Wilk.
Tabelul. Output SPSS: testul de normalitate după Kolmogorov-Smirnov și Shapiro-Wilk.

Interpretare: ca datele să aibă o distribuire normală, valoarea Sig. din testul Kolmogorov-Smirnov sau
testul Shapiro-Wilk trebuie să fie mai mare decît 0,05.

Respectiv, vor avea o distribuție normală următoarele valori: Suprafața totală, Populație totală, Bărbați
15-65 ani, Femei 15-65 ani, Femei mai mari de 65 ani, Total bărbați, Total femei și Indice de dezvoltare
umană. Distribuirea normală o putem observa și după graficele Q-Q Plot, pentru fiecare variabilă. După
grafic se va observa că o distribuție normală este atunci cînd graficul arată o tendință liniară.
Fig. Output SPSS: Graficile Q-Q Plots și Detrended Q-Q Plot pentru toate variabilele numerice

Interpretare: cu cît punctele de pe graficele Q-Q Plot sînt mai aproape de dreaptă, cu atît și distribuția
este mai normală, și cu cît punctele se îndepărtează de dreaptă cu atît deviația de la normalitate este
mai mare. Datele de pe grafice confirmă rezultatele Testelor de normalitate Kolmogorov-Smirnov și
Shapiro-Wilk.

Capitolul III. Descrierea statististică a distribuțiilor univariate

3.1. Analiza statistică univariată a variabilelor categoriale

Vom analiza 4 variabile categoriale (inclusiv nominale), care vor fi: Denumirea țării și Regiune geografică,
nivel de dezvoltare după IDU și Grad de dezvoltare după venit.

Pentru analiza statistică a acestor variabile trebuie să urmăm următorii pași: în fereastra Data Editor,
meniul Analyse-Descriptive Statistics-Frequencies. În opțiunea Statistics, la Central Tendency bifăm
Mode. În opțiunea Charts – la Charts Type – bifăm Pie sau Bar, la Chart Value – Frequencies sau
Percentages. Obținem următoarele rezultate:
Figura. Demersul – selectarea variabilelor și a indicatorilor.

Pentru variabila Denumirea tării obținem rezultatele:

Tabelul. Output SPSS: Denumirea țării


Figura. Output SPSS: diagrama Pie pentru Denumirea țării

Interpretare: observăm că frecvența fiecărei țări este egală cu 1, deci repartiția în diagramă este
uniformă.

Pentru variabila Regiune geografică obținem următoarele rezultate:


Tabelul. Output SPSS: Regiunea geografică

Figura. Output SPSS: diagrama Pie pentru Regiunea geografică

Interpretare: dacă e să analizăm repartiția tărilor după regiunea geografică, fiecare dintre regiuni are un
procent asemănător în baza de date.

Pentru variabila Nivel de dezvoltare, după IDU obținem următoarele rezultate:

Tabelul. Output SPSS: Nivel de dezvoltare, după IDU, 2016


Figura. Output SPSS: diagrama Pie pentru Nivel de dezvoltare, după IDU, 2016

Interpretare: dacp e să analizăm nivelul de dezvoltare a țărilor vizate în baza de date, observăm că
ponderea cea mai mare revine țărilor cu dezvoltare umană foarte ridicată 60,6%, iar ponderea cea mai
mică revine țărilor cu un grad de dezvoltare umană medie.

Pentru variabila Grad de dezvoltare, după venit - obținem următoarele rezultate:


Tabelul. Output SPSS: Grad de dezvoltare, după venit

Figura. Output SPSS: diagrama Pie pentru Grad de dezvoltare, după venit

Interpretare: dacă e să analizăm gradul de dezvoltare a țărilor vizate în baza de date, după venit, atunci
putem concluziona că ponderea cea mai mare o au țările cu venit mare 57,6%, iar ponderea cea mai
mică - țările cu venit mic 6,1%.

3.2. Analiza statistică univariată a variabilelor numerice

Pentru variabilele numerice se urmează aceeași cale ca în cazul variabilelor categoriale, însă în opțiunea
Statictics se bifează toți îndictorii, iar în opțiunea Charts se bifează Histograms. Deci, vom obține
următoarele rezultate:
Figura. Demersul – selectarea variabilelor și a indicatorilor.

Tabelul. Output SPSS: Statistics – analiza statitică univariată


Figura. Output SPSS: histogramele pentru toate variabilele numerice.
Interpretare: tabelul obținut este semnificativ deoarece curpinde principalii indicatori ca: medie,
mediană, modul, varianță, valorile maxime și valorile minime.

Nu toate histogramele obținute sînt relevante pentru analiză statistică. Relevante ar fi histogramele
variabilelor Indice de dezvoltare umană (eșantionul are o distribuție asimetrică pe stînga astfel
frecvențele cele mai mari sînt situate între 0,750-0,920).

Nivelul de alfabetizare la fel este relevant, însă din cauza outlierilor, putem spune că de asemenea are o
distribuție asimetrică pe stînga puternic pronunțată.

Pentru variabila PIB – histograma are o distribuție asimetrică pe dreapta.

Capitolul IV. Estimarea și testarea mediei

4.1. Estimarea mediei prin interval de încredere

Calculul intervalului de încredere pentru o medie sau pentru o proporție presupune efectuarea
următoarelor operații:

- calculul valorii tipice de sondaj (media sau proporția);


- determinarea variabilității estimatorului considerat (varianța mediei de selecție, spre exemplu);
- alegerea nivelului de încredere (90, 95, 99%);
- calculul limitelor intervalului de încredere.

În SPSS se calculează valoarea tipică de sondaj, scorul Z corespunzător și eroarea standard a mediei,
precum și limita inferioară și limita superioară ale intervalului de încredere (sursa: Analiza statistică cu
SPSS sub Windows, Elisabeta Jaba, Ana Grama).

Vom parcurge următoarea cale în SPSS: Analyse-Descriptive Statistics-Explore. În secțiunea Explore


alegem variabila pe care o dorim să o analizăm și o mutăm în Dependent List. În opțiunea Statistics –
bifăm Descriptives și în Confidence Interval for Mean alegem nivelul de încredere dorit.
Figura. Demersul pentru estimarea mediei prin interval de încredere

Vom obține următoarele în Output:


Tabelul. SPPS Output – estimarea mediei prin interval de încredere 95%

Interpretare: pentru majoritatea valorilor nu putem afirma care este intervalul de încredere deoarece
eroarea standart este foarte mare. Putem afirma doar pentru 2 valori: putem spune cu o încredere de
95% că nivelul de alfabetizare mediu este cuprins între indicii 94,528 și 99,872% (eroarea standard –
1,31); de asemenea putem spune cu o încredere de 95% că IDU mediu este cuprins între indicii 0,784 și
0,850 (eroarea standard – 0.016).

Odată cu alegerea unui alt nivel de încredere (99%), obținem rezultate diferite.

Tabelul. SPPS Output – estimarea mediei prin interval de încredere 99%

Interpretare: putem spune cu o încredere de 99% că nivelul de alfabetizare mediu este cuprins între
indicii 93,607 și 100,792% (eroarea standard – 1,31); de asemenea putem spune cu o încredere de 99%
că IDU mediu este cuprins între indicii 0,773 și 0,861 (eroarea standard – 0.016).

4.2. Testarea egalității unei medii cu o valoare specificată

Testarea egalității unei medii cu o valoare specificată sau One-Sample T-Testeste un procedeu prin care
se testează dacă media unei variabile este egală cu o constantă specificată. În SPSS, testarea egalității
unei medii cu o valoare specificată (sau valoarea ipotetică) se poate realiza printr-un procedeu grafic:
Error Bar (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba, Ana Grama).

Pentru a realiza aceasta, trebuie sa parcurgem următoarea cale în SPSS: Analyze-Compare Means-One-
Sample T Test.
Vom analiza așa un caz: luînd în considerație variabila Densitatea populației, vrem să verificăm, dacă
densitatea populației din eșantionul observat diferă de valoarea de 100 pers/km pătrat.

Pentru aceasta: în fereastra One-Sample T Test, selectăm variabila Densitatea populației și o mutăm în
zona Test Variable(s), apoi specificăm valoarea dorită = 100 în zona Test Value, după care apăsînd
butonul Options se deschide fereastra One-Sample T Test Options în care alegem intervalul de încredre
95% în zona Confidence Interval, apoi Continue, apoi Ok.

Figura. Demersul pentru testarea unei medii cu o valoare specificată

Obținem următoarele rezultate în Output:


Tabelul. Output SPSS: One-Sample Test și One-Sample Statistics pentru variabila Densitatea populației

Interpretare: valoarea specificată a fost 100 pers/km pătrat, iaar valoarea medie obținută este de
138,71, diferența dintre valoarea medie și valoarea ipotetică este 38,71. Respectiv se respinge ipoteza
nulă că valoarea medie a densității populației la nivelul unui eșantion aleator este de 100 pers/km
pătrat, deoarece între valoarea medie ipotetică și cea obținută există diferență semnificativă.

Putem construi de asemenea și diagrama Error Bar, care descrie intervalul de încredre de 95% a mediei
unei variabile. Pentru construirea diagramei Error Bar în SPSS vom proceda astfel: meniul Graphs-Legacy
Dialogs-Error Bar, în fereastra Error Bar alegem tipul Simple și Summaries of separate variables, apăsăm
butonul Define se deschide fereastra Define Simple Error Bar, mutăm în zona Error Bars variabila ce ne
interesează. În zona Level alegem intervalul de încredere – 95%, apăsăm Ok.
Figura. Demersul pentru diagrama Error Bar
Figura. Diagrama Error Bar – intervalul de încredere 95%, pentru variabila Densitatea populației

Interpretare: și prin procedeul Error Bar observăm că valoarea specificată de 100 pers/km pătrat este
cuprinsă în intervalul de încredere 120-140. Ca urmare, putem spune cu o încredere de 95% că se
respinge ipoteza de nul, adică de egalitate a densității medii a populației din eșantion cu valoarea
specificată (100).

4.3. Testarea egalității mediilor a două populaţii

În SPSS, testarea a 2 medii poate viza fie cazul a 2 populații (grupe) independente, fie cazul a 2 populații
(grupe) dependente.

În cazul eșantioanelor independente se aplică procedeul Independent-Samples T Test. Acest procedeu


ne arată dacă mediile a 2 grupe sînt egale (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba,
Ana Grama).

În SPSS vom parcurge următoarea cale: Analyze - Compare Means - Independent-Samples T Test.

Spre exemplu dorim să testăm dacă, la nivelul eșantionului observat dacă nivelul de alfabetizare a
populației este diferit, în cazul unui nivel de dezvoltare diferit al țării după IDU (vom testa pentru IDU : 1-
nivel de dezvoltare foarte ridicată; 2- nivel de dezvoltare ridicată).
Vom analiza încă un exemplu: dorim să testăm dacă la nivelul eșantionului observat, PIB-ul diferă la
nivele diferite de dezvoltare după IDU (vom testa pentru IDU: 1-nivel de dezvoltare foarte ridicată; 2-
nivel de dezvoltare ridicată).

Pentru aceasta în fereastra Independent-Samples T Test, selectăm variabilele de testat: pentru primul
caz- Nivelul de alfabetizare, pentru al 2-lea caz- PIB-ul, și le mutăm în zona Test Variables, iar în Grouping
Variable – Nivel de dezvoltare după IDU. În Define Groups – definim grupele variabilei: 1-nivel de
dezvoltare foarte ridicată; 2- nivel de dezvoltare ridicată.

Calculul statisticii Test pentru compararea mediilor a 2 populații cere să se verifice dacă deviațiile
standard la nivelul celor 2 grupe sînt semnificativ diferite, deoarece prin ipoteza de nul se presupune că
cele 2 populații au varianțe egale. Se folosește testul Levene de egalitate a varianțelor.
Figura. Demersul pentru testarea egalității mediilor a 2 populații.

Tabelul. Output SPSS: testarea egalității mediilor Nivelul de alfabetizare și Nivel de dezvoltare umană
după IDU
Tabelul. Output SPSS: testarea egalității mediilor PIB și Nivel de dezvoltare umană după IDU

Interpretare: valoarea Sig. în ambele cazuri este mai mică decît pragul 0,05, astfel se folosesc varianțe
distincte pentru testarea mediilor.

După tabel se observă că în primul caz diferența dintre valorile medii ale celor 2 grupe nu este
semnificativă. În al doilea caz putem spune că diferența dintre valorile medii ale celor 2 grupe este
semnificativă

4.4 Testarea egalităţii mediilor a trei și mai multe populaţii (ANOVA)

Capitolul V. Analiza de regresie și corelație

5.1 Analiza statistică a gradului de asociere dintre două variabile

Gradul de asociere îl vom studia între 2 variabile nominale. Astfel, vom analiza gardul de asociere dintre
variabilele Regiune geografică și Nivel de dezvoltare după IDU, 2016. Deci vom parcurge următoarea
cale: Analyze-Descriptive Statistics-Crosstabs. După care, pentru Row(s) – alegem Regiune geografică, iar
pentru Column(s) - în opțiunea Statistics – Nivel de dezvoltare, după IDU. În opțiunea Statistics bifăm
Chi-square.
Gigura. Prezentarea demersului
Tabelul. Output SPSS: analiza gradului de asociere dintre variabilele Regiune geografică și Nivel de
dezvoltare, după IDU.

Tabelul: Output SPSS: Testele Chi-Square

Interpretare: Analizînd tabelele, putem vorbi despre frecvența nivelului gradului de dezvoltare, pe
diferite regiuni geografice. Astfel, țările cu un IDU mare sesituează în regiunile geografice: Europa
Centrală, Europa de Vest, Europa de Nord. Cele mai mici IDU se obsevă la țările din Asia.

Pentru o reprezentare mai clară, vom bifa Display clustered bar charts, în fereastra Crosstabs.
Figura. Demersul pentru obținerea diagramei Bar Chart

Figura. Output SPSS: Diagrama Bar Chart, pentru gradul de asociere dintre 2 variabile
5.2 Analiza de corelație

Analiza de corelație presupune identificarea unei legături logice între variabilele analizate, precum și
determinarea gradului de intensitate a corelației.

Legăturile statistice, în funcție de tipul variabilelor considerate, pot exprima fie asocieri (în cazul
variabilelor nominale), fie corelații (în cazul variabilelor numerice). Ne vom opri asupra măsurării
corelației (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba, Ana Grama).

Vom studia observa dacă există legături între 2 variabile numerice. Acest lucru în vom realiza prin
următoarea cale: Analyse-Correlate-Bivariate.
Figura. Demersul pentru analiza de corelație

În Output vom obține statisticile pentru fiecare variabilă, și valoarea coeficientului Pearson.

Tabelul. Output SPSS pentru procedeul Corelație

Interpretare: am obținut un coeficient de corelație Pearson egal cu 0,926, ceea ce indică că între
variabilele supuse analizei există o corelație directă puternică, deoarece valoarea coeficientului este
foarte aproape de unu.

Testarea semnificației coeficientului de corelație se se realizează cu ajutorul testului t. Valoarea Sig.


corespunzătoare egală cu 0 evidențiază că s-a obținut un coeficient de corelație semnificativ la un prag
de 0%, adică sînt șanse mai mici de 1% de a greși dacă afirmăm că între cele 2 vriabile există o corelație
semnificativă (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba, Ana Grama).
Pentru interes am mai realizat 2 exemple de corelații.

Tabelul. Output SPSS pentru procedeul Corelație între variabilele Populație totală și decese.

Interpretare: ca și în exemplul anterior am obținut un coeficient de corelație Pearson mare, egal cu


0,900, ceea ce indică că între variabilele supuse analizei există o corelație directă puternică, deoarece
valoarea coeficientului este foarte aproape de unu.

Valoarea Sig. corespunzătoare egală cu 0 evidențiază că s-a obținut un coeficient de corelație


semnificativ la un prag de 0%, adică sînt șanse mai mici de 1% de a greși dacă afirmăm că între cele 2
vriabile există o corelație semnificativă (sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba,
Ana Grama).
Tabelul. Output SPSS pentru procedeul Corelație între variabilele Suprafața totală și Nivel de
alfabetizare.

Interpretare: analizînd acest exemplu, observăm că am obținut un coeficient de corelație Pearson egal
cu -0,272, ceea ce indică că între variabilele supuse analizei nu există vreo corelație. Coeficientul este
departe de 1.

Valoarea Sig. corespunzătoare este egală cu 126%, adică există șanse mai mari de 126% de a nu greși în
afirmația că între aceste 2 variabile nu este vre-o legătură semnificativă.

5.3 Analiza de regresie

Conceptul de regresie exprimă o legătură de tip statistic, și anume regresia în medie cu privire la
comportamentul unor variabile.

Analiza de regresie este folosită pentru:

- estimarea valorilor unei variabile considerînd valorile altei/altor variabile;


- evaluarea măsurii în care variabila dependentă poate fi explicată prin variabila independentă
sau printr-un set de variabile independente;
- identificarea unui subset din mai multe variabile independente care trebuie luate în calcul
pentru estimarea variabilei dependente.

(sursa: Analiza statistică cu SPSS sub Windows, Elisabeta Jaba, Ana Grama)

Pentru a efectua analiza de regresie în SPSS, trebuie să contruim diagrama Scatterplot. Pentru a construi
diagrama Scatterplot, vom parcurge următoarea cale: din meniul Graphs, selectăm comanda Legacy
Dialogs, alegem ScatterDot, alegem Simple, acționăm butonul Define prin care se deschide fereastra
Simple Scatterplot.

Aici definim elementele de bază prin care SPSS va realiza diagrama. În fereastra Simple Scatterplot, vom
selecta variabilele dorite, și le vom poziționa astfel: variabila independentă în zona X Axis, iar variabila
dependentă în zona Y Axis.
Cu ajutorul butoanelor de comandă Titles și Options se stabilesc liniile pentru titlu și subtitlu și respectiv,
se definesc anumite opțiuni. Activînd butonul OK se comandă obținerea output-ului.
Figura. Demersul pentru analiza de regresie.

Vom analiza cîteva exemple.

Pentru X Axis – Populație totală la 31 decembrie 2017, Y Axis – Bărbați mai mici de 15 ani, obținem în
Output:
Figura. Output SPSS, diagrama Scatterplot

Pentru X Axis – Populație totală la 31 decembrie 2017, Y Axis – Bărbați 15-65 ani, obținem în Output:

Figura. Output SPSS, diagrama Scatterplot

Pentru X Axis – Populație totală la 31 decembrie 2017, Y Axis – Bărbați mai mari 65 ani, obținem în
Output:
Figura. Output SPSS, diagrama Scatterplot

Pentru X Axis – Femei mai mici de 15 ani, Y Axis – Bărbați mai mici de 15 ani, obținem în Output:
Figura. Output SPSS, diagrama Scatterplot

Pentru X Axis – Populație totală la 31 decembrie, Y Axis – Migrația populație obținem în Output:

Figura. Output SPSS, diagrama Scatterplot

Interpretare: după graficile obținute, putem concluziona că există o dependență vizibilă între variabilele
Bărbați 15-65 ani și Populație totală; și variabilele Bărbați mai mici de 15 ani și Femei mai mici de 15 ani.

Între variabilele Bărbați mai mici de 15 ani și Populație totală, și variabilele Bărbați mai mari de 65 ani și
Populație totală există o dependență dar nu atît de pronunțată ca în cazut primelor 2 variante.

Între variabilele Migrația populației și Populația totală nu există vreo dependență vizibilă.

Pentru a ne încredința de dependența unei anumite categorii de vîrstă de numărul de populație totală la
nivelul unui eșantion aleatoriu, am mai realizat încă graficul pentru variabilele Femei 15-65 ani și
Populație totală. Am obținut un grafic asemănător ca în cazul examinării variabilei Bărbați 15-65 ani față
de Populație totală.

Posibil anume în aceste grafice dependența unei variabile față de alta este atît de vizibilă deoarece vîrsta
15-65 ani cuprinde un număr mai mare de oameni, decît celelalte vîrste, de asemenea oamenii cu vîrste
mai mici de 15 ani și mai mari de 65 ani sînt mai imprevizibili în cee ce ține de starea sănătății,
mortalitate.
Figura. Output SPSS, diagrama Scatterplot

Vom face și aproximarea modelului de regresie pentru ultimul exemplu studiat mai sus. Pentru arealiza
această parcurgem următoarea cale: Analyse-Regression-Curve Estimation.

Figura. Demersul pentru aproximarea modelului de regresie.


Graficul va arăta astfel:

Interpretare: graficul reprezintă o linie dreaptă care parcurge majoritatea valorilor din variabilele
examinate, există o dependență strînsă între aceste 2 variabile.

Capitolul VI. Prognoza nivelului unui fenomen

6.1 Definirea variabilelor și introducerea datelor în SPSS

6.2 Reprezentarea grafică a seriei de timp

6.3 Desezonalizarea seriei

6.4 Estimarea trendului

6.5 Prognoza fenomenului pe bază de trend

S-ar putea să vă placă și