Documente Academic
Documente Profesional
Documente Cultură
Grupa 1040
2014
Cuprins
Introducere..................................................................................................................................................2
Prezentarea celor trei pachete software statistice.........................................................................................3
IBM SPSS Statistics................................................................................................................................3
EViews....................................................................................................................................................4
SYSTAT..................................................................................................................................................5
Aplicație......................................................................................................................................................7
Concluzii...................................................................................................................................................17
Bibliografie................................................................................................................................................18
Anexe........................................................................................................................................................19
1
Introducere
2
Prezentarea celor trei pachete software statistice
SPSS Statistics este un pachet software folosit pentru analize statistice. Multă vreme a
fost produs de SPSS Inc., însă a fost cumpărat de IBM în 2009. Versiunile actuale, cea mai
recentă fiind cea din 2014, poartă numele oficial de IBM SPSS Statistics. Produsele din aceeasi
familie sunt folosite pentru cercetare și implementare, precum IBM SPSS Data Collection, data
mining (IBM SPSS Modeler), sau analiză de text.
Acronimul SPSS înseamna Statistical Package for the Social Sciences (Pachet Statistic
pentru Stiintele Sociale), scoțând în evidență piața originală, deși produsul este acum popular și
în alte domenii precum științe medicale sau marketing.
SPSS este un produs des folosit pentru analize statistice în domeniul științelor sociale.
Este de asemenea folosit de către cercetătorii de piață, cercetătorii în educație, organizații de
marketing, data miners și alții. Manualul SPSS original (Nie, Bent&Hull, 1970) a fost descris ca
fiind una dintre cele mai influente cărți de sociologie, pentru că permitea cercetătorilor obișnuiți
să realizeze propriile lor analize statistice. Analizele statistice, gestiunea datelor și documentația
lor, reprezintă caracteristici ale produsului software de bază.
3
aplicații complexe, pot fi programate doar cu ajutorul sintaxei și nu pot fi accesibile prin
intermediul meniului. Lucrul cu ajutorul interfeței generează însă și cod sursă, care poate fi afișat
în output, acest lucru rămânand la alegerea utilizatorului dacă dorește sau nu să modifice setările
implicite.
SPSS Statistics impune niște constrângeri pe structura internă de fișiere, pe anumite tipuri
de date, pe procesarea datelor și fișiere pereche care împreună simplifică considerabil modul de
programare. Seturile de date din SPSS au o structură tabelară bidimensională, unde rândurile
reprezintă cazurile (cases) și coloanele reprezintă măsurători (measurements). Sunt definite doar
două tipuri de date: numeric și text (sau string). Prelucrarea datelor are loc secvențial prin
intermediul fisierului. Fișierele pot fi de tip unu la unu (1:1) și unu la mai mulți (1:n), dar nu și
de tip mai mulți la mai mulți (n:n).
Interfața grafică cu utilizatorul are două ferestre care pot fi inversate prin click pe una
dintre cele două file din partea stângă jos a ferestrei SPSS Statistics. Vizualizarea de date,
prezintă o foaie de calcul formată din rânduri și coloane. Spre deosebire de alte foi de calcul,
celulele de date pot conține numai numere sau text și nu pot stoca și formule. Vizualizarea
variabilelor afișează un dicționar de metadate, în care fiecare rând reprezintă o variabilă și arată
numele acesteia, eticheta, eticheta de valoare, lățimea precum și o varietate de alte caracteristici.
Celulele din ambele fereștre permit introducerea de dată manuală, fără a utiliza sintaxa de
comandă. Acest lucru poate fi suficient pentru lucru cu seturi mici de date. Seturile mari de date,
precum anchetele statistic sunt introduse in timpul intervievării prin scanarea și captarea directă
de chestionare online. Aceste seturi de date sunt apoi citite în SPSS.
SPSS Statistics poate citi și scrie date din fișiere text ASCII, alte pachete statistice, foi de
calcul și baze de date. SPSS Statistics poate citi și scrie în tabele externe prin intermediul ODBC
și SQL.
EViews
EViews (Econometric Views) este un software pentru statistică pentru sistemul de
operare Microsoft Windows, folosit în special pentru analiză econometrică. Software-ul este
dezvoltat de firma Quantitative Micro Software (QMS). Versiunea 1.0 a fost lansată în martie
1994, și mai târziu a fost înlocuită cu software-ul MicroTSP. Versiunea curentă a EViews este
8.0, din 2014.
4
EViews combină software-ul de tip tabel (spreadsheet) și bazele de date relaționale cu
funcții tradiționale din software statistic. Programul are și un limbaj de programare integrat.
EViews suportă fișiere din Excel, SPSS, SAS, Stata, RATS, TSP și poate accesa baze de
date compatibile ODBC.
EViews oferă instrumente sofisticate de analiză de date, de regresie și prognoză.
Domeniile unde produsul software poate fi folosit sunt: analiza și evaluarea științifică a datelor,
analiză financiară, previziune macroeconomică, simulare, prognoză de vânzări și de analiză a
costurilor.
Deși EViews a fost dezvoltat de economiști și cele mai multe dintre funcționalitățile sale
aparțin acestui domeniu, nu este nimic în design-ul acestuia care să limiteze utilitatea sa la serii
de timp economice. EViews oferă modalități vizuale de a accesa datele, de a crea noi serii de
date din cele existente, de a vizualiza și printa serii si de a realiza o analiză statistică a relațiilor
dintre seriile de date.
EViews profită de caracteristicile vizuale ale software-ului modern a sistemului de
operare Windows. Se poate utiliza mouse-ul pentru a face o legătură ușoară între meniuri și
ferestre.
Alternativ poate fi folosit și limbajul de comandă EViews. Se pot insera și edita comenzi
în fereastra specială de comandă. Acestea pot fi create și stocate și pot fi păstrate și pentru
execuții ulterioare.
SYSTAT
SYSTAT este un pachet de programe utilizat pentru rezolvarea problemelor din domeniul
statistic.
Facilităţile principale oferite de SYSTAT pot fi grupate în trei categorii:
introducerea şi gestionarea datelor (observaţiilor) statistice
5
introducerea comenzilor cu ajutorul meniurilor, modalitate mai abordabilă pentru
utilizatorii începători
introducerea comenzilor în linia de comandă (în fereastra principală), modalitate
recomandată pentru utilizatorii avansaţi.
Acest mod permite o mai mare flexibilitate a comenzilor, precum şi agregarea mai multor
comenzi în fişiere de tip script, pentru automatizarea prelucrărilor cu caracter repetitiv.
SYSTAT pune la dispoziţia utilizatorului mai multe ferestre de lucru, cu funcţionalităţi specifice.
Principalele sunt:
a. Fereastra principală (Main), care permite introducerea comenzilor şi afişarea
rezultatelor prelucrărilor şi a diverselor mesaje. Este afişată la pornirea programului, şi conţine
iniţial data şi ora rulării, informaţii despre versiunea programului şi un mesaj de bun-venit.
Meniurile afişate sunt: File (gestiunea fişierelor), Edit (comenzi de editare), Data (comenzi de
manipulare a datelor), Window (gestiunea ferestrelor), Help (documentaţie de utilizare).
b. Foaia de lucru (fereastra "Worksheet"), care are rol de stabilire a structurii datelor din
setul de lucru, introducerea, modificarea şi ştergerea acestora. Afişarea ferestrei Worksheet se
face prin comanda Window->Worksheet (meniul Window, opţiunea Worksheet) din orice altă
fereastră SYSTAT. Foaia de lucru are o structură tabelară şi conţine variabilele observate pe
coloane şi cazurile pe linii, care sunt numerotate. Foaia de lucru are un meniu propriu, cu
comenzile File (gestiunea fişierelor), Edit (comenzi de editare), Editor (comenzi de manipulare a
datelor), Window (gestiunea ferestrelor) şi Help (ajutor).
c. Fereastra de grafice (Graph), în care sunt afişate şi editate graficele obţinute pe baza
datelor. Este accesibilă din orice fereastră prin comanda Window->Graph şi are de asemenea
meniu propriu, cu comenzile File, Edit, Window şi Help
Datele statistice care vor fi supuse prelucrării sunt introduse cu ajutorul ferestrei
Worksheet şi sunt salvate în fişiere cu extensia .SYS.
Prelucrările statistice aplicabile în SYSTAT se împart în zece grupe, care se regăsesc în
meniul Stats al ferestrei principale:
Corelaţii (Corr)
6
Analiză factorială (Factor)
Aplicație
Aplicația își propune spre analiză legătura dintre cheltuielile pentru educație ca procent
din PIB și numărul tinerilor care au abandonat orice formă de educație înainte de terminarea
cursurilor ca procent din populația totală. Seriile de date ce urmează a fi analizate sunt din
perioada 1998-2012 la nivelul României.
Cheltuielile publice pentru educație – “reprezintă ponderea cheltuilelilor pentru educație
din Produsul Intern Brut dintr-un anumit an financiar”. (INSSE)
Tinerii care au abandonat orice formă de educație sau training înainte determinarea
cursurilor – “reprezintă ponderea tinerilor din populația totală care au abandonat școala în cursul
unui an.” (EUROSTAT)
Datele nu au necesitat transformări ulterioare, deoarce au fost exprimate în procenteceea
ce le conferă proprietatea de comparabilitate.
Seriile de date: datele au o frecvență anuală și sunt exprimate în procente, atâtcheltuielile
pentru educație, cât și ponderea tinerilor care au abandonat școala în cursul unui an.
7
Datele au fost obținute prin interogarea bazelor de date disponibile pe site-ul
BănciiMondiale pentru variabila cheltuieli cu educația (% PIB) și respectiv de pe site-ul Eurostat
pentru obținerea ponderii tinerilor ce au abandonat orice formăde educație (% din populația
totală).
Vom analiza această situație folosind toate cele trei pachete software pentru a stabili care
ne oferă cea mai bună perspectivă.
Grafice SPSS
Figura 1 Figura 2
Grafice EViews
8
Figura 3 Figura 4
Grafice Systat
3.5 24
23
3.4
22
3.3
21
3.2 20
19
3.1
18
3.0
17
2.9 16
15
2.8 1,995 2,000 2,005 2,010 2,015
1,995 2,000 2,005 2,010 2,015
AN
AN
Figura 5 Figura 6
Analiză:
Evoluția cheltuielilor cu educația nu urmează o traiectorie clar definită, având o perioadă
de declin între 1998-2000 ce se datorează politicilor guvernamentale implementate de România
în perioada respectivă. După 2000 se observă un interes crescut asupra importanței educației,
cheltuielile guvernamentale crescând în cea mai mare parte.
În ceea ce privește evoluția procentului tinerilor din populația totală ce au abandonat
orice formă de învățământ, aceasta prezintă următoarele caracteristici. Creștere accentuată în
perioada 1998- 2000, următoarea variație semnificativă înregistrânduse după anul 2004, după o
scădere bruscă de la aproximativ 22.5 la 16 procente.Se observă că punctele de extrem sunt
înregistrate în aceleași perioade ale celor două evoluții ale variabilelor.
Tabel 1
9
Statistici descriptive SYSTAT și EViews
Figura 7
Tabel 2 Analiză:
Putem observa cu ușurință din toate cele trei tabele că media cheltuielilor cu educația ca
și procent din PIB este 3.21%. Intervalul căruia îi corespund aceste 15 valori este [2.81,3.50].
Coeficientul de variație este foarte apropiat de valoarea 0, ceea ce înseamnă că seria este
omogenă și media anterior precizată este foarte reprezentativă. Coeficientul Skewness este< 0,
ceea ce înseamnă că datele sunt concentrate în partea dreaptă a mediei, cu valori extreme în
stânga. Kurtosis are valoarea < 3, ceea ce înseamnă că datele prezintă o distribuție platicurtică,
mai aplatizate decât o distribuție normală. Probabilitatea pentru valoari extreme este mai mică
decât în cazul distribuției normale și valorile sunt răspândite în jurul mediei.
Corelație SPSS
Correlations
CHELTUIELI_E RATA_ABAND
D ON
N 15 15
10
Pearson Correlation -.733** 1
N 15 15
Corelatie EViews
Tabel 4
Corelație SYSTAT
Tabel 5
Analiză:
23
22
21
20
19
18
17
16
15
8
5
2.
2.
3.
3.
3.
3.
3.
3.
11
Regresie SPSS
Model Summaryb
ANOVAa
Total 88.524 14
Coefficientsa
Residuals Statisticsa
12
Regresie EViews
Figura 11
Regresie SYSTAT
Tabel 10
Tabel 11
Tabel 12
13
Tabel 13
Analiză
y i=b 0 +b1 ∙ x 1 i
^
y i=55.12899−11.07186 ∙ x 1 i
^
În urma aplicării metodei celor mai mici pătrate asupra variabilelor în cauza am obținut
următoarele rezultate:
H0: β0=0, β1=0 (parametrii sunt nesemnificativi din punct de vedere statistic)
H1: β0≠0, β1≠0 (parametrii sunt semnificativi din punct de vedere statistic)
14
Statistica testului Student este ttab=tα/2;n-k-1=2.1603
│t1calc│>ttab
│t2calc│>ttab
Din toate rezultă că respingem ipoteza nulă și acceptăm ipoteza alternativă ceea ce
înseamnă că toți parametrii sunt seminificativi din punct de vedere statistic. Această concluzie
este susținută și de probabilitățile corespunzătoare din output-ul de regresie ce au valori
inferioare pragului de 5%.
Testare semnificație R2
2. F calculat = 15.13
3. F critic = 4.66 -» F calculat > F critic => se respinge H 0 si se accepta H1 => modelul este
corect specificat.
15
Ceilalați indicatori de bonitate și anume Multiple R = 0.72 și Adjusted R-Squared = 0.50
ce tind spre valoarea 1, confirmă bonitatea ridicată a modelului.
DW
DW =2 ( 1−ρ ) → ρ=1− → ρ=1−0.4161385→ ρ=0.5838615
2
Din valoarea lui ρ care tinde spre 1, rezultă că avem autocorelare pozitivă perfectă.
16
Concluzii
În concluzie putem spune că toate aceste trei pachete software sunt performante și
profesionale și sunt dedicate lucrului cu volume mari de date și realizării unor analize statistice
de calitate. Toate prezintă funcțiile de bază necesare unei analize primare și sunt fiecare
specializate către o ramură anume a domeniului economic.
Cele trei pachete software analizate prezintă interfeţe grafice intuitive, fapt ce facilitează
folosirea acestora atât de persoane familiarizate cu codul sursă, cât şi de cei ce preferă lucrul
vizual. Gruparea funcţionalităţilor se realizează în toate cazurile după o logică anume în vederea
regăsirii cu uşurinţă și optimizării lucrului.
Pachetele SPSS și SYSTAT sunt destul de asemănătoare, prezintă aceleași funcții
statistice în mare parte și ambele realizează grafice complexe și de precizie mare, cu posibilitate
de particularizare a acestora. Se axează pe domeniul statistic și majoritatea funcțiilor
implementate aparțin acestui domeniu.
Pachetul software EViews este dedicat analizelor macroeconomice și econometrice, cu
mai multe funcționalități din această catergorie implementate. Însă acest fapt nu înseamnă că
restul funcționalităților sunt limitate pentru că nu există restricții de folosire a produsul și pentru
alt tip de analize. De asemenea și acest produs prezintă posibilitatea de realizare a graficelor de
înaltă precizie.
Așadar, nu putem spune cu exactitate că un produs este mai bun decât celălalt pentru că
toate sunt produse profesionale ce au același nucleu, însă sunt folosite în general pentru arii
diferite ale domeniului statistic care este extrem de vast.
17
Bibliografie
[1] Pachet Software IBM SPSS Statistics
18
Anexe
Anexa 1 – Captură ecran SPSS
19
Anexa 3 – Captură ecran MYSTAT
20