Sunteți pe pagina 1din 14

ACADEMIA DE STUDII ECONOMICE

FACULTATEA CIBERNETICĂ, STATISTICĂ ȘI


INFORMATICĂ ECONOMICĂ

ANALIZA STATISTICĂ MULTIDIMENSIONALĂ

Fustanela Diana-Elena

Maxim Emilia-Silvia

Paicu Elisabeta

Grupa 1047

Seria Statistică

Profesor coordonator: Conf. univ. dr. Cristina BOBOC


Sumar

Introducere
Analiza discriminantă……………………………………………………………..4

Analiza de clsificare ierarhică………………………………………………….….8

Analiza in component principale………………………………………….………11

Bibliografie………………………………………………………………………..14
Introducere

Analiza statistică are ca și scop obținerea informațiilor relevante și semnificative


din datele primare. Cu ajutorul acestor informații, putem interpreta, testa, estima și
predicționa fenomene economico-sociale și financiare ale țărilor din
Europa(continent).

Datele

Baza de date pe care am lucrat am creat-o folosind date preluate de pe www.worldbank.org


și furnizează informații despre 44 de țări cu privire la următoarele variabile:
 PIB/locuitor(dolari)
 Rata șomajului
 Rata urbanizare
 Speranța de viață la naștere(ani)
 Cheltuieli cu sănătatea(dolari)
 Pământ arabil(hectare/personă)
 Nivel de educație superior(%din popultia totală)
 Utilizatori de Internet (la 100 de persoane)

Aceste date sunt utile pentru modelarea unor fenomene economico-sociale, asupra cărora vom
aplica diverse tehnici de analiză multidimensioanală în scopul reducerii numărului de variabile,
pentru determinarea unor cauze, a unor factori latenți care influențează aceste date, a stabilirii
cauzalității și legăturilor între ele. De asemenea, le vom grupa, în funcție de anumite variabile
care o au putere de discriminare mai mare, să determinăm anumite clase de apartenență pentru
fiecare dintre variabile prin intemediul tehnicii de recunoaștere a formelor nesupervizată, de
determinarea unor funcții de clasificare și în cele din urmă de testarea calității acestor indicatori.
Analiza discriminantă
Setul de 44 de țări va fi împărțit după variabila „rang”, cu valorile UE/nonUE, UE indicând
faptul că țara respectivă aparține Uniunii Europene, iar nonUE, nu aparține. După cum se observă
în tabelul de mai jos, am selectat ca variabile independente: PIB/cap de locuitor, rata șomajului,
rata de urbanizare, speranta de viață la naștere, cheltuielile cu sănătatea, pământul arabil, nivelul
de educație superior și numărul de utilizatori de Internet la 100 de persoane.

Conform analizei, putem deduce că există diferențe semnificative între mediile variabilelor celor
două categorii de țări.
 PIB-ul pe cap de locuitor este semnficativ mai mare în țările care fac parte din UE,
decât cele care nu sunt incluse.
 Rata șomajului este mai mare în țările neicluse în UE.
 Rata de urbanizare este mai mare în țările care fac parte din UE, decât cele
care nu sunt incluse.
 Spranța de viață la naștere este mai mare în țările care fac parte din UE,
decât cele care nu sunt incluse.
 În țările din UE, cheltuielile cu sănătatea sunt mai mari decât cele din țările
neincluse în UE.
 Suprafața de pământ arabil este mai mare în țările neincluse în UE.
 Nivelul de educație superior și al utilizatorilor de Internet sunt mai mari în
țările care fac parte din UE, decât cele care nu sunt incluse.

Speranța de viață la naștere, rata de urbanizare, nivelul de educație superior și


utilizatorii de Internet au mediile asemănătoare.

Conform Canonical Corelation cu valoarea .639, putem afirma că există o


discriminare bună a celor două clase.
Conform valorii Wilkis`Lambda, putem afirma ca 59,2% din varianță nu poate fi
explicată de diferențele dintre grupe.

Variabilele care stau la baza funcției discriminante sunt PIB-ul pe cap de locuitor și
speranța de viață la naștere, ceea ce rezultă din valorile absolute extreme.

Dacă o țară va avea o valoare a funcției discriminante ce tinde spre .613, atunci
ea se va înscrie în grupul țărilor din UE. Dacă valoarea acestei funcții tinde spre
-1.073, atunci țara face parte din grupul țărilor care nu fac parte din UE.
81,8% din cazuri au fost clsificate corect

Speranța de viață la naștere și investițiile în sănătate sunt variabilele cu cea mai


mare putere de discriminare, acestea fiind mai ridicate în țările care fac parte din
Uniunea Europeană.

Analiza de clasificare ierarhică


Prin această metodă vom realiza, în continuare, o clasificare a țărilor după
variabilele alese.

În urma testării datelor în analiză, putem observa că procentul variabilelor valide


este de 100%.

În acest table putem observa distanțele dintre fiecare 2 țări.

Cea mai mica valoare coeficienților este 107 488 780,79, coresponzând perechii
de țări 21-39(Islanda și Slovenia), indicând faptul că sunt cele mai asemănătoare
țări, conform caracteristicilor studiate.

La polul opus, putem observa cea mai mare valoare a coeficientilor, 88 291 489
276, ce corespunde perechii 41-16(Franța și Suedia), indicând faptul că sunt cele
mai diferite țări, conform caracteristicilor studiate.
 Conform tabelul “Cluster membership” putem observa apartenența fiecărei
țări la un anumit cluster. Cele 44 țări incluse în analiză sunt grupate astfel:
 Clusterul 1 : Albania, Belarus, Bulgaria, Cehia,Lituania, Muntenegru,
Polonia, Romania, Rusia,Letonia, Slovacia, Turcia, Ucraina, Ungaria,
Ucraina.
 Clusterul 2 : Armenia, Azerbaidjan, Bosnia Hertegovina, Macedonia,
Moldova, Georgia.
 Clusterul 3 : Austria, Belgia, Luxemburg, Norvegia, Olanda, Danemarca,
Elvetia, Finlanda, Islanda, Suedia.
 Clusterul 4: Cipru, Malta, Marea Britanie,Portugalia, Germania, Grecia,
Italia, Slovenia, Spania.
Analiza în componente principale

Conform tabelului Total Variance Explained, putem observăm calitatea


reprezentării pe mai multe planuri. Cum doar primele două componente au
coeficientul mai mare decât 1, vom putea avea cel mult două componente. Prima
componentă explică în proporție de 43,47%, în timp ce a doua componentă explică
62,24%.

Acest lucru se obervă și din graficul de mai jos (Scree Plot), unde punctul de
inflexiune este cel mai mare în punctul 2.
Din tabelul Component matrix, putem observa următoarele:
Componenta 1 este determinată pozitiv de: PIB/locuitor, de rata de
urbanizare, speranța de viață la naștere, cheltuielile cu sănătatea, investițiile
straine, nivelul de educație superior și utilizatorii de Internet; influențată negativ de
rata șomajului și pământul arabil.

Componenta 2 este determinată pozitiv de rata de urbanizare, pământul


arabil, investițiile straine, nivelul de educație superior, utilizatorii de Internet;
influențată negativ de: PIB/locuitor, rata șomajului, speranța de viață la naștere,
cheltuielile cu sănătatea.

Din tabelul Component plot putem observa că:

Prima grupă reprezintă tările cu PIB pe locuitor mare, utilizatori de internet multi, investitii straine mari,
speranta de viată mare, rata somajului mică,
Bibliografie: www.worldbank.org

S-ar putea să vă placă și