Documente Academic
Documente Profesional
Documente Cultură
Gălii Mihaela
Mihai Ana Maria
Numărul de cititori active de la bibliotecile din România care au împrumutat cel puțin
o carte în decursul anului în care au fost numărați
Numărul de instituții de spectacol (filarmonici, orchestre, teatre, opere, etc.),
considerând faptul că numrăul lor influențează în mod direct participarea oamenilor la
astfel de evenimente
Salariul mediu (deflaționat după IPC-urile aferente fiecărui an)
Nr. Mediu de ore lucrate calculate ca medie ponderată între numărul de salariați și nr
de ore lucrate
Gradul de cuprindere al tinerilor 19-25 ani în învățământ, calculate ca pondere a
tinerilor incluși în forme de învățământ raportat la numărul total de tineri din România
cu vârstele cuprinse între 19-25 ani.
Aplicația 1 – Analiza componentelor principale
Scopul acestei analize fiind ca pentru matricea noastră de date să identifice noi
variabile ce să exprime sintetic vechile variabile astfel încât cantitatea totală de informaţie să
nu se piardă decât în mod contralat.
Astfel, după încărcarea matricei de date în SPSS, vom începe analiza prin a remarca
faptul că toate caracteristicile urmărite, anume indicatorii numarului de cititori din Romania
sunt variabile continue, scara lor de măsură fiind uşor de identificat. Prin urmare pentru
fiecare variabilă în parte, pentru început, vom calcula indicatorii de centrare şi de împrăştiere
cum ar fi media, valoarea minimă, valoarea maximă, precum şi abaterea standard.
Descriptive Statistics
Valid N (listwise) 17
1) Factor Analysis: Descriptives: În această căsuţa de dialog vom alege să ne prezinte informaţii
legate de o variabilă (medie, dispersie etc) precum și afișarea coeficienților matricei de
corelaţie, după care dăm Continue.
2) Factor Analysis: Extraction: Aici vom alege metoda componentelor principale, care va fi
aplicată pe matricea corelaţiilor, dar la fel de bine puteam să folosim şi matricea de covariaţă
întrucât datele sunt standardizate, după câţi factori dorim să facem analiza (2) şi să ne afişeze
graficul ataşat valorilor proprii (Sree plot), după care Continue.
3) Factor Analysis – Rotation: Aici alegem tehnica de rotire Varimax, apoi Continue.
4) Factor Analysis: Factor Scores: Aici alegem ca scorurile firmelor pe fiecare dintre cele două
axe analizate să fie salvate ca variabile în tabelul SPSS imediat după variabilele standardizate,
şi totodată selectând şi a doua opţiune vom obţine versorii axelor „u”, apoi Continue.
După parcurgerea paşilor de mai sus, vom trece la interpretarea rezultatelor obţinute.
Astfel primul tabel din Anexa Nr.1, ne oferă informaţii cu privire la media şi abatarea
standard a fiecărui indicator şi având în vedere faptul că media este 0, iar dispersia este 1,
confirmă faptul că datele sunt standardizate, după cum puteţi observa în următorul tabel:
Apoi pentru a vedea dacă indicatorii calculaţi sunt independenţi sau nu, vom analiza
matricea coeficienţilor de corelaţie din tabelul următor:
La o primă vedere, putem afirma faptul că în matricea coeficienţilor de corelaţie,
există atât corelaţii în sens pozitiv, cât și în sens negativ, acestea găsindu-se în număr aproape
egal. Astfel identificăm în matricea de mai sus, cel mai mare coeficient de corelaţie cu
valoarea 0,540, şi anume între indicatorul Nr ore de lucru şi indicatorul Salariu net, existând
posibilitatea de a se renunţa la unul dintre indicatori, având în vederea că numărul de ore de
lucru intră în alcătuirea salariului. Totodată se mai identifică coeficienţi de corelaţie destul de
mari între indicatorul Numar ore de lucru şi indicatorul Grad de cuprindere în învățământ,
indicatorul Grad de cuprindere în învățământ şi indicatorul Instituții de spectacol, precum şi
între indicatorul Procent de cititori din populație şi indicatorul Salariu net. Ca urmare a
acestor constatării am putea totuși să eliminăm unii indicatori, dar problema este pe care să-i
eliminăm; pentru a elimina subiectivismul decizie, vom folosi tehnicile de analiză a
componentelor principale implementate în SPSS, şi ne propunem să identificăm doi indicatori
sintetici cu care ne-am mulţumi în atingerea scopului propus.
Mai departe vom trece la analiza calităţii norului de puncte, urmărind informaţiile din
tabelul următor:
Acest tabel ne prezintă în coloana „Eigenvalue” , toate valorile proprii asociate
Apoi vom avea în vedere informaţiile despre proiecţiile acestor indicatori (considerate
ca puncte în spaţiul indivizilor) pe cele două axe principale, ele fiind salvate în matricea de
date iniţială, imediat după valorile indicatorilor standardizaţi, fiind prezentate în următorul
tabel:
Astfel cel două coloane (Fact_1 şi Fact_2) conţin componentele principale sau noii
indicatori sintetici calculaţi pentru cei 17 ani. Aşadar apelăm Graphs → Scatter/Dot →
Alegem „Simple Scatter”.
După care alegem cordonatele axelor X – factorul 1 şi Y – factorul 2, iar la Label Case
by – alegem Anul, şi pentru a ne afişa anii pe grafic, din Options bifăm căsuţa
corespunzătoare „Display chart with case labels” , apoi Continue şi în final OK şi vom
obţine următorul grafic:
(FIGURA 2)
Aşadar, componenta principală 1 este cel mai puternic corelată (pozitiv) cu indicatorul
Grad de cuprindere în învățământ și mai slab corelată cu cealaltă componentă principală, fapt
pentru care putem afirma că indicatorul Grad de cuprindere în învățământ poate fi considerat
un indicator sinteză pentru aplicaţia noastră. A doua componentă principală are un coeficient
de corelaţie relativ mare (pozitiv) cu indicatorul Nr ore de lucru, și un coeficient de corelaţie
mai mic cu cealaltă componentă principală.
Fapt pentru care apelăm la folosirea unei opţiuni de „rotire a axelor”, cu scopul de a
obţine coeficienţi de corelaţie cât mai mici pe cealaltă componentă principală şi pentru o
analiză mai relevantă şi o interpretare mai apropriată de realitate. Astfel apelăm la una dintre
cele mai utilizate tehnici de rotire a axelor, şi anume, tehnica Varimax – în acest fel
interpretarea componentelor principale devine mai semnificativă.
Iar pentru aplicaţia noastră, apleând la opţiunea de rotire a axelor (Varimax), obţinem
informaţiile din tabelul următor:
Şi odată cu întocmirea de către SPSS a tabelului de mai sus, SPSS mai asociază şi o
reprezentare grafică a celor şase indicatori financiari-contabili în spaţiul rezultat ca urmare a
rotirii axelor, astfel:
Astfel acum componenta principală 1 poate fi interpretată în termenii indicatorul
Instituții de spectacol sau eventual Gradul de cuprindere în învățământ (corelaţie pozitivă),
dar cum matricea corelaţiilor ne arată că aceştia sunt puternic corelaţi între ei, coeficientul de
corelaţie alor având valoarea de 0,344.
Componenta principală 2 este cum a fost interpretată şi mai devreme, tot în termenii
indicatorului Nr ore de lucru (corelaţie pozitivă), adică este un indicator sintetic şi este unul
dintre cei mai reprezentativi indicatori.
Așadar, primul pas în analiza canonică a fost de a standardiza datele (Z-uri) pentru a
putea compara între ele aceste variabile.
Nr. de
cititori în
Salariul
Salariul biblioteci
mediu
mediu
Variabile
Variabile dependente
independente (Y)
(X)
Nr.
Nr. mediu
mediu Grad de
Grad de
de
de ore de
ore de acoperire
acoperire
lucru
lucru în
în educație
educație Instituții
Instituții
de
de
spectacol
spectacol
Așadar, îmi doresc întâi să descopăr legăturile dintre variabile independente, apoi dintre
cele dependente și apoi dintre ambele.
Ceea ce descoperim aici este faptul că există o legătură notabilă între cele două variabile
dependente, la un nivel de semnificație de 99%.
Așadar, există o legătură notabilă și semnificativă între numărul de ore de lucru ale
populației și salariul net (odată cu numărul de ore, crește și salariul), dar și între numărul de
ore de lucru al populației și gradul de cuprindere în învățământ (s-ar putea explica prin faptul
că, odată cu accesul mai multor tineri la învățământ este nevoie de mai multă muncă din
partea cadrelor didactice, care au o influență suficient de mare asupra modificării primei
variabile).
Observăm că există o corelație puternică și semnificativă între procentul de cititori și
gradul de cuprindere în învățământ. (analizând doar de la variabile independente către
variabile dependente).
Toate corelațiile anterioare se pot sintetiza odată cu rularea scriptului aferent acestei
metode. Așadar, acesta arată astfel:
Prin urmare, corelațiile canonice între primul set de date (independent) și cel de-al
doilea arată în felul următor:
Observăm că prima legătură este foarte puternică.
Următorul pas este testarea corelațiilor rămase, dacă acestea sunt 0. În cazul primei
corelații ipoteza aceasta se respinge.
0.908
Variabile Variabile
independente dependente
(X)
Nr. mediu
Nr. mediu Grad
Grad de
de
de
de ore
ore de
de acoperire
acoperire
lucru
lucru în
în educație
educație
Instituții
Instituții
0.236 0.883 de
de
spectacol
spectacol
0.378
Concluzie
Cu ajutorul Analizei in compnente principale a datelor am identificat noi variabile care
sa exprime sintetic vechile variabile astfel incat cantitatea totala de informatie sa nu se piarda
decat in mod controlat. In concluzie, analiza componentelor principale ne-a permis să
realizăm o sintetizare informaţională şi să caracterizăm un şir de observaţii prin 2
caracteristici în loc de 5. Astfel, am putut realiza comparaţii între observaţii.
Figura 1
Figura 2