Sunteți pe pagina 1din 13

ACADEMIA DE STUDII ECONOMICE

FACULTATEA CIBERNETICĂ, STATISTICĂ ȘI


INFORMATICĂ ECONOMICĂ

ANALIZA STATISTICĂ MULTIDIMENSIONALĂ

Nicolescu Iuliana Elena Beatrice

Furdui Andreea Evelina

Grupa 1063

Seria Statistică
Cuprins:

Introducere ( Datele, Ce anume se urmareste in lucrare, Scurta analiza a datelor)


……………………………………………………………………………..3

Analiza de clasificare ierarhică…………………………………………………….6

Analiza in componente principale……………………………………..….………..9

Concluzii……………………………………………………………....…………..12

Bibliografie………………………………………………………………………..13
Introducere

Analiza statistică are ca și scop obținerea informațiilor relevante și


semnificative din datele primare. Cu ajutorul acestor informații, putem interpreta,
testa, estima și predicționa fenomene economico-sociale și financiare ale țărilor
din Europa(continent).

Datele

Baza de date pe care am lucrat am creat-o folosind date preluate de pe www.worldbank.org


și furnizează informații despre 44 de țări cu privire la următoarele variabile:
 PIB/locuitor (dolari)
 Rata șomajului
 Rata urbanizare
 Speranța de viață la naștere (ani)
 Cheltuieli cu sănătatea (dolari)
 Pământ arabil (hectare/personă)
 Nivel de educație superior ( % din populatia totală)
 Utilizatori de Internet ( la 100 de persoane)

Aceste date sunt utile pentru modelarea unor fenomene economico-sociale, asupra cărora vom
aplica diverse tehnici de analiză multidimensioanală în scopul reducerii numărului de variabile,
pentru determinarea unor cauze, a unor factori latenți care influențează aceste date, a stabilirii
cauzalității și legăturilor între ele. De asemenea, le vom grupa, în funcție de anumite variabile
care au o putere de discriminare mai mare, să determinăm anumite clase de apartenență pentru
fiecare dintre variabile prin intemediul tehnicii de recunoaștere a formelor nesupervizată, de
determinarea unor funcții de clasificare și în cele din urmă de testarea calității acestor indicatori.

Setul de 44 de țări va fi împărțit după variabila „rang”, cu valorile UE/nonUE, UE indicând


faptul că țara respectivă aparține Uniunii Europene, iar nonUE, nu aparține. După cum se observă
în tabelul de mai jos, am selectat ca variabile independente: PIB/cap de locuitor, rata șomajului,
rata de urbanizare, speranta de viață la naștere, cheltuielile cu sănătatea, pământul arabil, nivelul
de educație superior și numărul de utilizatori de Internet la 100 de persoane.

Conform analizei, putem deduce că există diferențe semnificative între mediile variabilelor celor
două categorii de țări.
 PIB-ul pe cap de locuitor este semnficativ mai mare în țările care fac parte din UE,
decât cele care nu sunt incluse.
 Rata șomajului este mai mare în țările neicluse în UE.
 Rata de urbanizare este mai mare în țările care fac parte din UE, decât cele
care nu sunt incluse.
 Speranța de viață la naștere este mai mare în țările care fac parte din UE,
decât cele care nu sunt incluse.
 În țările din UE, cheltuielile cu sănătatea sunt mai mari decât cele neincluse
în UE.
 Suprafața de pământ arabil este mai mare în țările neincluse în UE.
 Nivelul de educație superior și al utilizatorilor de Internet sunt mai mari în
țările care fac parte din UE, decât cele care nu sunt incluse.

Speranța de viață la naștere, rata de urbanizare, nivelul de educație superior


și utilizatorii de Internet au mediile asemănătoare.
Analiza de clasificare ierarhică
Prin această metodă vom realiza, o clasificare a țărilor după variabilele alese.

În urma testării datelor în analiză, putem observa că procentul variabilelor valide


este de 100%.

În acest tabel putem observa distanțele dintre fiecare 2 țări.

Cea mai mica valoare coeficienților este 107 488 780,79 , corespunzând perechii
de țări 21-39(Islanda și Slovenia), indicând faptul că sunt cele mai asemănătoare
țări, conform caracteristicilor studiate.

La polul opus, putem observa cea mai mare valoare a coeficientilor, 88 291 489
276, ce corespunde perechii 41-16(Suedia și Franța), indicând faptul că sunt cele
mai diferite țări, conform caracteristicilor studiate.
Conform tabelului “Cluster membership” putem observa apartenența
fiecărei țări la un anumit cluster. Cele 44 țări incluse în analiză sunt grupate
astfel:

 Clusterul 1 : Albania, Belarus, Bulgaria, Cehia,Lituania, Muntenegru,


Polonia, Romania, Rusia, Croatia, Estonia, Letonia, Slovacia, Turcia,
Ucraina, Ungaria, Ucraina.
 Clusterul 2 : Armenia, Azerbaidjan, Bosnia Hertegovina, Macedonia,
Moldova, Georgia, Serbia.
 Clusterul 3 : Austria, Belgia, Luxemburg, Norvegia, Olanda, Danemarca,
Elvetia, Finlanda, Islanda, Suedia.
 Clusterul 4: Cipru, Malta, Marea Britanie,Portugalia, Franta, Germania,
Grecia, Irlanda, Italia, Slovenia, Spania.
Analiza în componente principale

Conform tabelului Total Variance Explained, putem sa observăm calitatea


reprezentării pe mai multe planuri. Cum doar primele două componente au
coeficientul mai mare decât 1, vom putea avea cel mult două componente. Prima
componentă explică în proporție de 43,47%, în timp ce a doua componentă explică
62,24%.

Acest lucru se obervă și din graficul de mai jos (Scree Plot), unde punctul de
inflexiune este cel mai mare în punctul 2.
Din tabelul Component matrix, putem observa următoarele:
Componenta 1 este determinată pozitiv de: PIB/locuitor, de rata de
urbanizare, speranța de viață la naștere, cheltuielile cu sănătatea, investițiile
straine, nivelul de educație superior și utilizatorii de Internet; Influențată negativ de
:rata șomajului și pământul arabil.

Componenta 2 este determinată pozitiv de rata de urbanizare, pământul


arabil, investițiile straine, nivelul de educație superior, utilizatorii de Internet;
Influențată negativ de: PIB/locuitor, rata șomajului, speranța de viață la naștere si
cheltuielile cu sănătatea.

Din tabelul Component Plot putem observa că prima grupă reprezintă tările cu PIB
pe locuitor mare, utilizatori de internet multi, investitii straine mari, speranta de
viată mare si rata somajului mică.
Concluzii:

Cu ajutorul Analizei in compnente principale a datelor am identificat noi


variabile care sa exprime sintetic vechile variabile astfel incat cantitatea totala de
informatie sa nu se piarda decat in mod controlat. In concluzie, analiza
componentelor principale ne-a permis să realizăm o sintetizare informaţională şi să
caracterizăm un şir de observaţii.

Metodele de analiza statistică multidimensională a datelor, utilizând SPSS,


ne oferă tehnici valoroase de prelucrare a datelor.

În cadrul analizei efectuate pe aceste 44 de tari s-a putut observa că unele


variabile erau corelate între ele.

Am mai putut observa că folosind anumite variabile, tarile puteau fi


împărţite în 4 clustere.
Bibliografie:

1. www.worldbank.org

2. http://spssx-discussion.1045642.n5.nabble.com/Comparing-Output-from-
Hierarchial-Clustering-Vs-K-Means-td3288054.html

3. http://pic.dhe.ibm.com/infocenter/spssstat/v20r0m0/index.jsp?topic=
%2Fcom.ibm.spss.statistics.help%2Fidh_clus.htm

S-ar putea să vă placă și