Sunteți pe pagina 1din 21

ACADEMIA DE STUDII ECONOMICE DIN BUCUREȘTI

Facultatea de Cibernetică , Statistică și Informatică Economică


Specializarea: Informatică Economică

Analiza Comparativa a Trei


Pachete Software din Aceasi
Categorie
[Type the document subtitle]

Grupa 1040

2014
Cuprins

Introducere..................................................................................................................................................2
Prezentarea celor trei pachete software statistice.........................................................................................3
IBM SPSS Statistics................................................................................................................................3
EViews....................................................................................................................................................4
SYSTAT..................................................................................................................................................5
Aplicație......................................................................................................................................................7
Concluzii...................................................................................................................................................17
Bibliografie................................................................................................................................................18
Anexe........................................................................................................................................................19

1
Introducere

În activitatea industrială, rezultatele muncii se caracterizează prin produse palpabile și


concrete. În domeniul tehnologiei informației, în ramura de realizare a produselor software,
rezultatul muncii nu este unul palpabil, însă se măsoară prin performanțe și prin modul în care
reușește să ușureze efortul intelectual.
Domeniul statistic implică lucrul cu volume mari de date și necesită o precizie foarte
exactă în prelucrarea acestora. Pentru o persoană, prelucrarea acestor date reprezintă un efort
mare și o muncă riguroasă, iar de precizia și corectitudinea rezultatelor nu putem fi niciodată
siguri.Această muncă, dacă ar fi realizată de un om ar fi redundantă, pentru că aspectul cel mai
important este reprezentat de interpretarea datelor. De aceea existența unor produse software de o
calitate superioară care să prelucreze datele și să le aducă sub forma dorită în acest domeniu este
mandatorie.
Din acest motiv, am ales trei produse software din domeniul statistic pentru a le analiza și
a le compara, pentru a stabili care sunt avantajele și dezavantajele fiecăruia și a concluziona care
dintre cele trei produse este mai ușor de folosit. Propunem spre analiză următoarele pachete
software: IBM SPSS Statistics, EViews și Systat.
Referatul este organizat în trei părți astfel: prima parte cuprinde o descriere generală
referitoare la fiecare produs în parte. În cea de-a doua parte vom rezolva o aplicație în toate cele
trei produse software pentru a vedea care dintre ele ne aduce rezultatele dorite și sub ce formă,
iar în ultima parte vom trage concluziile referitoare la performanțele fiecăruia dintre cele trei
pachete.

2
Prezentarea celor trei pachete software statistice

IBM SPSS Statistics

SPSS Statistics este un pachet software folosit pentru analize statistice. Multă vreme a
fost produs de SPSS Inc., însă a fost cumpărat de IBM în 2009. Versiunile actuale, cea mai
recentă fiind cea din 2014, poartă numele oficial de IBM SPSS Statistics. Produsele din aceeasi
familie sunt folosite pentru cercetare și implementare, precum IBM SPSS Data Collection, data
mining (IBM SPSS Modeler), sau analiză de text.
Acronimul SPSS înseamna Statistical Package for the Social Sciences (Pachet Statistic
pentru Stiintele Sociale), scoțând în evidență piața originală, deși produsul este acum popular și
în alte domenii precum științe medicale sau marketing.
SPSS este un produs des folosit pentru analize statistice în domeniul științelor sociale.
Este de asemenea folosit de către cercetătorii de piață, cercetătorii în educație, organizații de
marketing, data miners și alții. Manualul SPSS original (Nie, Bent&Hull, 1970) a fost descris ca
fiind una dintre cele mai influente cărți de sociologie, pentru că permitea cercetătorilor obișnuiți
să realizeze propriile lor analize statistice. Analizele statistice, gestiunea datelor și documentația
lor, reprezintă caracteristici ale produsului software de bază.

Funcționalități statistice incluse în produsul de bază:


 Statistici descriptive: tabele încrucişate, frecvențe, descrieri, explorări;
 Statistici bivariate: medii, teste T, ANOVA, corelații(bivariate, parțiale, distanțe), teste
nonparametrice;
 Predicții pentru rezultate numerice: regresie liniară;
 Predicții pentru identificarea grupurilor: analiză de factori, discriminanți, analiză de grup.
Majoritatea funcționalităților SPSS Statistics sunt accesibile prin intermediul meniurilor
extensibile sau pot fi programate cu ajutorul sintaxei limbajului de comandă 4GL. Programarea
prin comandă prezintă avantajul codului sursă, care poate fi reprodus, simplificând sarcinile
repetitive și ajută la o mai ușoară manipulare a analizelor pe date complexe. În plus, anumite

3
aplicații complexe, pot fi programate doar cu ajutorul sintaxei și nu pot fi accesibile prin
intermediul meniului. Lucrul cu ajutorul interfeței generează însă și cod sursă, care poate fi afișat
în output, acest lucru rămânand la alegerea utilizatorului dacă dorește sau nu să modifice setările
implicite.
SPSS Statistics impune niște constrângeri pe structura internă de fișiere, pe anumite tipuri
de date, pe procesarea datelor și fișiere pereche care împreună simplifică considerabil modul de
programare. Seturile de date din SPSS au o structură tabelară bidimensională, unde rândurile
reprezintă cazurile (cases) și coloanele reprezintă măsurători (measurements). Sunt definite doar
două tipuri de date: numeric și text (sau string). Prelucrarea datelor are loc secvențial prin
intermediul fisierului. Fișierele pot fi de tip unu la unu (1:1) și unu la mai mulți (1:n), dar nu și
de tip mai mulți la mai mulți (n:n).
Interfața grafică cu utilizatorul are două ferestre care pot fi inversate prin click pe una
dintre cele două file din partea stângă jos a ferestrei SPSS Statistics. Vizualizarea de date,
prezintă o foaie de calcul formată din rânduri și coloane. Spre deosebire de alte foi de calcul,
celulele de date pot conține numai numere sau text și nu pot stoca și formule. Vizualizarea
variabilelor afișează un dicționar de metadate, în care fiecare rând reprezintă o variabilă și arată
numele acesteia, eticheta, eticheta de valoare, lățimea precum și o varietate de alte caracteristici.
Celulele din ambele fereștre permit introducerea de dată manuală, fără a utiliza sintaxa de
comandă. Acest lucru poate fi suficient pentru lucru cu seturi mici de date. Seturile mari de date,
precum anchetele statistic sunt introduse in timpul intervievării prin scanarea și captarea directă
de chestionare online. Aceste seturi de date sunt apoi citite în SPSS.
SPSS Statistics poate citi și scrie date din fișiere text ASCII, alte pachete statistice, foi de
calcul și baze de date. SPSS Statistics poate citi și scrie în tabele externe prin intermediul ODBC
și SQL.

EViews
EViews (Econometric Views) este un software pentru statistică pentru sistemul de
operare Microsoft Windows, folosit în special pentru analiză econometrică. Software-ul este
dezvoltat de firma Quantitative Micro Software (QMS). Versiunea 1.0 a fost lansată în martie
1994, și mai târziu a fost înlocuită cu software-ul MicroTSP. Versiunea curentă a EViews este
8.0, din 2014.

4
EViews combină software-ul de tip tabel (spreadsheet) și bazele de date relaționale cu
funcții tradiționale din software statistic. Programul are și un limbaj de programare integrat.
EViews suportă fișiere din Excel, SPSS, SAS, Stata, RATS, TSP și poate accesa baze de
date compatibile ODBC.
EViews oferă instrumente sofisticate de analiză de date, de regresie și prognoză.
Domeniile unde produsul software poate fi folosit sunt: analiza și evaluarea științifică a datelor,
analiză financiară, previziune macroeconomică, simulare, prognoză de vânzări și de analiză a
costurilor.
Deși EViews a fost dezvoltat de economiști și cele mai multe dintre funcționalitățile sale
aparțin acestui domeniu, nu este nimic în design-ul acestuia care să limiteze utilitatea sa la serii
de timp economice. EViews oferă modalități vizuale de a accesa datele, de a crea noi serii de
date din cele existente, de a vizualiza și printa serii si de a realiza o analiză statistică a relațiilor
dintre seriile de date.
EViews profită de caracteristicile vizuale ale software-ului modern a sistemului de
operare Windows. Se poate utiliza mouse-ul pentru a face o legătură ușoară între meniuri și
ferestre.
Alternativ poate fi folosit și limbajul de comandă EViews. Se pot insera și edita comenzi
în fereastra specială de comandă. Acestea pot fi create și stocate și pot fi păstrate și pentru
execuții ulterioare.

SYSTAT
SYSTAT este un pachet de programe utilizat pentru rezolvarea problemelor din domeniul
statistic.
Facilităţile principale oferite de SYSTAT pot fi grupate în trei categorii:
 introducerea şi gestionarea datelor (observaţiilor) statistice

 calcule şi prelucrări statistice

 reprezentări grafice ale datelor


SYSTAT oferă în privinţa execuţiei comenzilor, două moduri de lucru care pot fi folosite
separat sau împreună:

5
 introducerea comenzilor cu ajutorul meniurilor, modalitate mai abordabilă pentru
utilizatorii începători
 introducerea comenzilor în linia de comandă (în fereastra principală), modalitate
recomandată pentru utilizatorii avansaţi.
Acest mod permite o mai mare flexibilitate a comenzilor, precum şi agregarea mai multor
comenzi în fişiere de tip script, pentru automatizarea prelucrărilor cu caracter repetitiv.
SYSTAT pune la dispoziţia utilizatorului mai multe ferestre de lucru, cu funcţionalităţi specifice.
Principalele sunt:
a. Fereastra principală (Main), care permite introducerea comenzilor şi afişarea
rezultatelor prelucrărilor şi a diverselor mesaje. Este afişată la pornirea programului, şi conţine
iniţial data şi ora rulării, informaţii despre versiunea programului şi un mesaj de bun-venit.
Meniurile afişate sunt: File (gestiunea fişierelor), Edit (comenzi de editare), Data (comenzi de
manipulare a datelor), Window (gestiunea ferestrelor), Help (documentaţie de utilizare).
b. Foaia de lucru (fereastra "Worksheet"), care are rol de stabilire a structurii datelor din
setul de lucru, introducerea, modificarea şi ştergerea acestora. Afişarea ferestrei Worksheet se
face prin comanda Window->Worksheet (meniul Window, opţiunea Worksheet) din orice altă
fereastră SYSTAT. Foaia de lucru are o structură tabelară şi conţine variabilele observate pe
coloane şi cazurile pe linii, care sunt numerotate. Foaia de lucru are un meniu propriu, cu
comenzile File (gestiunea fişierelor), Edit (comenzi de editare), Editor (comenzi de manipulare a
datelor), Window (gestiunea ferestrelor) şi Help (ajutor).
c. Fereastra de grafice (Graph), în care sunt afişate şi editate graficele obţinute pe baza
datelor. Este accesibilă din orice fereastră prin comanda Window->Graph şi are de asemenea
meniu propriu, cu comenzile File, Edit, Window şi Help
Datele statistice care vor fi supuse prelucrării sunt introduse cu ajutorul ferestrei
Worksheet şi sunt salvate în fişiere cu extensia .SYS.
Prelucrările statistice aplicabile în SYSTAT se împart în zece grupe, care se regăsesc în
meniul Stats al ferestrei principale:

 ƒ Analiză Cluster (Cluster)

 ƒ Corelaţii (Corr)

6
 ƒ Analiză factorială (Factor)

 ƒ Scalare multidimensională (MDS)

 ƒ Regresii liniare şi analiza varianţei (MGLH - Multivariate General Linear


Model)

 ƒ Regresii neliniare (Nonlin)

 ƒ Statistici neparametrice (Npar)

 ƒ Serii de timp (Series)

 ƒ Statistici descriptive (Stats)


 ƒ Tabele de frecvenţe (Tables)

Aplicație
Aplicația își propune spre analiză legătura dintre cheltuielile pentru educație ca procent
din PIB și numărul tinerilor care au abandonat orice formă de educație înainte de terminarea
cursurilor ca procent din populația totală. Seriile de date ce urmează a fi analizate sunt din
perioada 1998-2012 la nivelul României.
Cheltuielile publice pentru educație – “reprezintă ponderea cheltuilelilor pentru educație
din Produsul Intern Brut dintr-un anumit an financiar”. (INSSE)
Tinerii care au abandonat orice formă de educație sau training înainte determinarea
cursurilor – “reprezintă ponderea tinerilor din populația totală care au abandonat școala în cursul
unui an.” (EUROSTAT)
Datele nu au necesitat transformări ulterioare, deoarce au fost exprimate în procenteceea
ce le conferă proprietatea de comparabilitate.
Seriile de date: datele au o frecvență anuală și sunt exprimate în procente, atâtcheltuielile
pentru educație, cât și ponderea tinerilor care au abandonat școala în cursul unui an.

7
Datele au fost obținute prin interogarea bazelor de date disponibile pe site-ul
BănciiMondiale pentru variabila cheltuieli cu educația (% PIB) și respectiv de pe site-ul Eurostat
pentru obținerea ponderii tinerilor ce au abandonat orice formăde educație (% din populația
totală).
Vom analiza această situație folosind toate cele trei pachete software pentru a stabili care
ne oferă cea mai bună perspectivă.

Evoluția economică a variabilelor analizate

Grafice SPSS

Figura 1 Figura 2

Grafice EViews

8
Figura 3 Figura 4
Grafice Systat

3.5 24

Tinerii care au abandonat scoala


Cheltuieli cu educatia % din PIB

23
3.4
22
3.3
21

3.2 20

19
3.1
18
3.0
17

2.9 16

15
2.8 1,995 2,000 2,005 2,010 2,015
1,995 2,000 2,005 2,010 2,015
AN
AN
Figura 5 Figura 6

Analiză:
Evoluția cheltuielilor cu educația nu urmează o traiectorie clar definită, având o perioadă
de declin între 1998-2000 ce se datorează politicilor guvernamentale implementate de România
în perioada respectivă. După 2000 se observă un interes crescut asupra importanței educației,
cheltuielile guvernamentale crescând în cea mai mare parte.
În ceea ce privește evoluția procentului tinerilor din populația totală ce au abandonat
orice formă de învățământ, aceasta prezintă următoarele caracteristici. Creștere accentuată în
perioada 1998- 2000, următoarea variație semnificativă înregistrânduse după anul 2004, după o
scădere bruscă de la aproximativ 22.5 la 16 procente.Se observă că punctele de extrem sunt
înregistrate în aceleași perioade ale celor două evoluții ale variabilelor.

Statistici descriptive asupra datelor

Statistici descriptive SPSS

Tabel 1

9
Statistici descriptive SYSTAT și EViews

Figura 7

Tabel 2 Analiză:

Putem observa cu ușurință din toate cele trei tabele că media cheltuielilor cu educația ca
și procent din PIB este 3.21%. Intervalul căruia îi corespund aceste 15 valori este [2.81,3.50].
Coeficientul de variație este foarte apropiat de valoarea 0, ceea ce înseamnă că seria este
omogenă și media anterior precizată este foarte reprezentativă. Coeficientul Skewness este< 0,
ceea ce înseamnă că datele sunt concentrate în partea dreaptă a mediei, cu valori extreme în
stânga. Kurtosis are valoarea < 3, ceea ce înseamnă că datele prezintă o distribuție platicurtică,
mai aplatizate decât o distribuție normală. Probabilitatea pentru valoari extreme este mai mică
decât în cazul distribuției normale și valorile sunt răspândite în jurul mediei.

Intensitatea legăturilor între variabile

Corelație SPSS

Correlations

CHELTUIELI_E RATA_ABAND
D ON

Pearson Correlation 1 -.733**

CHELTUIELI_ED Sig. (2-tailed) .002

N 15 15

10
Pearson Correlation -.733** 1

RATA_ABANDON Sig. (2-tailed) .002

N 15 15

**. Correlation is significant at the 0.01 level (2-tailed).


Tabel 3

Corelatie EViews

Tabel 4

Corelație SYSTAT

Tabel 5

Analiză:

Pentru a măsura intensitatea legăturii dintre variabile, utilizăm coeficientul de corelație


liniară Pearson. Observăm că avem o legătură inversă puternică între cele două variabile, ceea
cesusține analiza de față. Aceeași relație se poate remarca și din graficul de tip scatter plot dintre
cheltuielile cu educația și ponderea tinerilor ce au abandonat orice formă de educație.
Grafic de tip Scatter Plot realizat în cele trei pachete software statistice
24
Tinerii care au abandonat scoala

23

22

21

20

19

18

17

16

15
8

5
2.

2.

3.

3.

3.

3.

3.

3.

Figura 9 Cheltuieli cu educatia % din PIB


Figura 8 Figura 10

11
Regresie SPSS
Model Summaryb

Model R R Square Adjusted R Std. Error of the Durbin-Watson


Square Estimate
a
1 .733 .538 .502 1.77373 .832

a. Predictors: (Constant), CHELTUIELI_ED


b. Dependent Variable: RATA_ABANDON
Tabel 6

ANOVAa

Model Sum of Squares df Mean Square F Sig.

Regression 47.625 1 47.625 15.138 .002b

1 Residual 40.899 13 3.146

Total 88.524 14

a. Dependent Variable: RATA_ABANDON


b. Predictors: (Constant), CHELTUIELI_ED
Tabel 7

Coefficientsa

Model Unstandardized Coefficients Standardized t Sig.


Coefficients

B Std. Error Beta

(Constant) 55.129 9.148 6.026 .000


1
CHELTUIELI_ED -11.072 2.846 -.733 -3.891 .002

a. Dependent Variable: RATA_ABANDON


Tabel 8

Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N

Predicted Value 16.3775 23.9007 19.5800 1.84439 15


Residual -3.13354 3.31712 .00000 1.70921 15
Std. Predicted Value -1.736 2.343 .000 1.000 15
Std. Residual -1.767 1.870 .000 .964 15

a. Dependent Variable: RATA_ABANDON


Tabel 9

12
Regresie EViews

Figura 11

Regresie SYSTAT

Tabel 10

Tabel 11

Tabel 12

13
Tabel 13

Analiză

Estimarea parametrilor modelului de regresie


Modelul de regresie: y i=β 0 + β 1 ∙ x 1i + ε i, unde x = cheltuielile cu educația (%PIB),

y = ponderea tinerilor ce au abandonat școala(%populația totală)

y i=b 0 +b1 ∙ x 1 i
^

y i=55.12899−11.07186 ∙ x 1 i
^

În urma aplicării metodei celor mai mici pătrate asupra variabilelor în cauza am obținut
următoarele rezultate:

Valoarea lui b1=-11.07186 indică faptul că dacă cheltuielile cu educația cresc cu un


procent, atunci numărul tinerilor care au abandonat orice formă de educație va scădea în medie
cu aproximativ 11.07 procente.

Valoarea interceptului de 55.12899 indică faptul că în ipoteza în care cheltuielile


guvernamentale cu educația ar fi nule, rata de abandon școlar ar fi de 55.12 procente. Din punct
de vedere economic, acest lucru nu este posibil într-o economie reală.

Testarea seminificației parametrilor modelului de regresie

H0: β0=0, β1=0 (parametrii sunt nesemnificativi din punct de vedere statistic)

H1: β0≠0, β1≠0 (parametrii sunt semnificativi din punct de vedere statistic)

Din output-ul preluăm valorile calculate ale lui t.

14
Statistica testului Student este ttab=tα/2;n-k-1=2.1603

Comparând rezultatele cu această statistică se obțin următoarele:

│t1calc│>ttab

│t2calc│>ttab

Din toate rezultă că respingem ipoteza nulă și acceptăm ipoteza alternativă ceea ce
înseamnă că toți parametrii sunt seminificativi din punct de vedere statistic. Această concluzie
este susținută și de probabilitățile corespunzătoare din output-ul de regresie ce au valori
inferioare pragului de 5%.

Testarea validității modelului

H0: modelul nu este valid statistic

H1: modelul este valid statistic

Deoarece Prob(F-statistic) = 0.001859 < 5% rezultă respingerea ipotezei nule și


acceptarea alternativei, prin care se validează modelul din punct de vedere statistic.

R2 = 0.53 de unde rezultă o bonitate ridicată a modelului. Coeficientul de determinație reflectă


faptul ca aprox. 53% din variația variabilei independente este influențată de variația variabilelor
independente. Restul de 47% se pune pe seama altor factori, care nu au fost incluși în model .

Testare semnificație R2

1. H0: R2 = 0 (modelul nu este corect specificat) -> variabilele independente nu influenteaza


variabila dependentă
H1: R2 > 0 (modelul este corect specificat) -> variabilele independente influenţează
variabila dependentă.

2. F calculat = 15.13
3. F critic = 4.66 -» F calculat > F critic => se respinge H 0 si se accepta H1 => modelul este
corect specificat.

15
Ceilalați indicatori de bonitate și anume Multiple R = 0.72 și Adjusted R-Squared = 0.50
ce tind spre valoarea 1, confirmă bonitatea ridicată a modelului.

Ipoteze de non autocorelare a rezidurilor

Pentru un nivel de semnificație α=0.05 si n=15 avem următoarele ipoteze:

H0: ρ = 0 (nu există autocorelare)

H1: ρ ≠ 0 (există autocorelare de ordin I)

Durbin Watson = 0.832277

DW
DW =2 ( 1−ρ ) → ρ=1− → ρ=1−0.4161385→ ρ=0.5838615
2

Din valoarea lui ρ care tinde spre 1, rezultă că avem autocorelare pozitivă perfectă.

De asemenea observăm că valoarea lui DW aparține intervalului (0;1,077), ceea ce reconfirmă


ipoteza conform căreia avem autocorelare pozitivă de ordin I.

16
Concluzii

În concluzie putem spune că toate aceste trei pachete software sunt performante și
profesionale și sunt dedicate lucrului cu volume mari de date și realizării unor analize statistice
de calitate. Toate prezintă funcțiile de bază necesare unei analize primare și sunt fiecare
specializate către o ramură anume a domeniului economic.
Cele trei pachete software analizate prezintă interfeţe grafice intuitive, fapt ce facilitează
folosirea acestora atât de persoane familiarizate cu codul sursă, cât şi de cei ce preferă lucrul
vizual. Gruparea funcţionalităţilor se realizează în toate cazurile după o logică anume în vederea
regăsirii cu uşurinţă și optimizării lucrului.
Pachetele SPSS și SYSTAT sunt destul de asemănătoare, prezintă aceleași funcții
statistice în mare parte și ambele realizează grafice complexe și de precizie mare, cu posibilitate
de particularizare a acestora. Se axează pe domeniul statistic și majoritatea funcțiilor
implementate aparțin acestui domeniu.
Pachetul software EViews este dedicat analizelor macroeconomice și econometrice, cu
mai multe funcționalități din această catergorie implementate. Însă acest fapt nu înseamnă că
restul funcționalităților sunt limitate pentru că nu există restricții de folosire a produsul și pentru
alt tip de analize. De asemenea și acest produs prezintă posibilitatea de realizare a graficelor de
înaltă precizie.
Așadar, nu putem spune cu exactitate că un produs este mai bun decât celălalt pentru că
toate sunt produse profesionale ce au același nucleu, însă sunt folosite în general pentru arii
diferite ale domeniului statistic care este extrem de vast.

17
Bibliografie
[1] Pachet Software IBM SPSS Statistics

[2] Pachet Software EViews

[3] Pachet Software Systat

[4] Wikipedia – http://en.wikipedia.org

[5] Manual Utilizare Systat – T. Krishnan și R.L. Karandikar

18
Anexe
Anexa 1 – Captură ecran SPSS

Anexa 2 – Captură ecran EViews

19
Anexa 3 – Captură ecran MYSTAT

20

S-ar putea să vă placă și