Sunteți pe pagina 1din 64

CAPITOLUL 1

PACHETE DE PROGRAME PENTRU STATISTICA

Odata cu raspandirea calculatoarelor (PC-urilor) i a


programelor informatice comerciale specifice (software) s-a
dezvoltat analiza statistica complexa, in special analiza
multivariata, care este strans legata de volumele mari de date ce
intra in prelucrare.
Criterii de clasificare a programelor informatice cu care se pot
realiza analize statistice complexe:
1. Dup gradul de cuprindere a tehnicilor de analiz
statistic pot fi:
pachetele de analiz statistic complete (cuprind
majoritatea tehnicilor de analiz statistica complexa -
analiza regresiei, analiza discriminantului, analiza
varia iei, analiza factorial , analiza grupurilor,
scalarea multidimensional ),
pachete de analiz statistic minimale sau par iale
(cuprind doar o parte din tehnicile de analiza
statistica complexa)
2. Dup destina ia principal , programele informatice
pentru analiza statistica complexa pot fi:
programe (software) comerciale
programe (software) academice i pentru cercetare.

1.1 Pachete de programe statistic complete

Cele mai utilizate pe plan mondial sunt: SPSS i SAS.


In SUA acestea sunt cele mai utilizate din punct de vedere al
num rului de utilizatori. In România se folose te mai mult
SPSS, SAS mult mai pu in.

1
Pachetele cele mai importante de analiz statistic complex
sunt:
SPSS www.spss.com
Pachetul de programe statistice a fost destinat la inceput
calculatoarelor mainframe, apoi a fost adaptat pentru
platforma PC. SPSS con ine un set complet de tehnici de
prelucrare i analiz a datelor. Pachetul eeste folosit in
diferite domenii: studii de piata, anchete, marketing
direct, domeniul academic, cercetarea administrativa,
resurse umane, planificarea resurselor, planificare si
predictie, optimizarea calitatii, raportare si luarea
deciziilor, etc.
SPSS poate fi folosit sub forma produsului SPSS Base
sau ca o combinatie a acestuia cu module si produse de
sine-statatoare.
In functie de varianta de SPSS utilizata, vor putea fi
accesate diferite module care compun SPSS cum ar fi:
o SPSS Base, contine tehnici statistice uzuale,
grafice, etc. Dintre statisticile importante ale SPSS
Base pe site-ul http://www.spss.ro/detail.php?id=18
sunt enumerate urmatoarele:
Linear Regression - exploreaza relatiile
dintre predictori si ceea ce se doreste prezis
(ex. vanzarile in functie de pret si tipul de
client)
Factor Analysis - identifica variabilele sau
factorii care explica corelatiile intre un set de
variabile observate. Cu ajutorul analizei
factoriale se obtine un numar mai mic de
factori care explica cea mai buna varianta
observata intr-un numar foarte mare de
variabile manifeste.
TwoStep Cluster analysis - algoritm folosit
in cazul seturilor mari de date la manipularea
variabilelor sau atributelor continue si

2
categoriale, presupune doar un singur pas in
procedura si descopera numarul potrivit de
clusteri. De exemplu, poate fi aplicata datelor
care descriu comportamentul de cumparare,
sexul, varsta, venitul, dupa care vor fi croite
strategiile de marketing pentru fiecare grup de
clienti, pentru a spori vanzarile si a construi
loialitatea.
K-means Cluster Analysis - grupeaza datele
din seturi mari de date. Presupune un numar
cunoscut de clusteri. Un analist de marketing
poate dori sa grupeze orasele in grupuri
omogene pentru a descoperi orase
comparabile, carora sa se adreseze diferit.
Hierarchical cluster analysis: SPSS ia
clusterii dintr-o singura inregistrare si
formeaza grupuri pana cand toti sunt uniti.
Dispune de mai mult de 40 masuri ale
similaritatii si disimilaritatii, de standardizare
a datelor dupa diferite metode, grupuri de
cazuri sau grupuri de variabile. Genereaza
masuri ale distantei si similaritatii. Afiseaza
statistici la fiecare stadiu pentru a ajuta in
selectarea solutiei optime ca numar de
clusteri. Procedura e recomandata pentru
seturi de date mai mici, ca focus-grupurile.
Un analist de marketing poate folosi
Hierarchical cluster analysis pentru a
identifica emisiunile TV care atrag audiente
similare pentru fiecare tip de emisiune sau le
poate grupa in clusteri omogeni in baza
caracteristicilor telespectatorului, pentru a
identifica segmentele carora sa li se adreseze.
Ordinal regression (PLUM): Realizeaza
predictii cu raspunsuri ordinale. De exemplu,
identifica nivelul de satisfactie (foarte
nesatisfacator, nesatisfacator, satisfacator,
3
foarte satisfacator) pentru a intelege
loialitatea clientilor. Alegand diferite functii,
sunt disponibile modele ca ordinal logistic
regression, ordinal probit si ordinal Cauchit.
Pot fi modelate atat locatia cat si scala
distributiei. PLUM ofera optiunea de a a salva
in fisierul de date probabilitatile predictate
pentru toate categoriile de variabile
dependente.
SPSS Base include si:
Statistici descriptive
Crosstabulations
Frequencies
Descriptives
Explore
Descriptive Ratio Statistics
Statistici bivariate
Means
t-tests
ANOVA
Correlation (Bivariate, Partial,
Distances)
Non-parametric tests
Predictie pentru variabile numerice
Linear Regression
Predictie pentru identificarea grupurilor
Factor Analysis
TwoStep Cluster Analysis
K-means Cluster Analysis
Hierarchical Cluster Analysis
Discriminant
o SPSS Tables modul utilizat la afisarea
rezulatelor in format tabelar. SPSS Tables ofera
cele mai solicitate facilitati, ca interactive table
preview builder, managementul categoriilor,
4
statistici inferentiale si desfasurarea cu usurinta in
Microsoft® Word sau Excel. Pentru oricine isi
actualizeaza rapoartele pe o baza normala, SPSS
Tables este cel mai potrivit instrument de
recalculare si re-formare de noi tabele cu date
revizuite.
o SPSS Trends - este cea mai performanta
procedura de analiza a datelor istorice,
construieste modele si prognozeaza evenimentele
viitoare. Este des folosita in: managementul
productiei - monitorizarea standardelor de
calitate, procesarea datelor - conducerea
performantei sistemelor de predictie,
managementul bugetului - ruleaza predictii
privind vanzarile, cercetari asupra politicilor
publice - studiul opiniei publice si multe altele
o SPSS Categories ajuta la analiza si
interpretarea datelor multivariate si a relatiilor
dintre ele folosind procedura analizei de
corespondenta cea mai performanta. Cu ajutorul
procedurii Optimal scaling variabilele calitative
sunt transformate in variabilele calitative,
procedura atribuind unitati de masura si puncte
zero datelor categoriale. Aceasta deschide un nou
set de functii statistice care permit analize pe
variabile cu nivele mixte de masuratoare
(nominale, ordinale si numerice). Pot fi mai bine
intelese datele categoriale cu proceduri similare
cu regresia obisnuita, analiza componentelor
principale (PCA) etc.
o Professional Statistics,
o SPSS Advanced Statistics,
o SPSS CHAID, etc.

5
SAS
http://www.sas.com/technologies/analytics/statistics/stat/
Pachet de programe statistice dezvoltat pentru cercetarea
academic i comercial , fiind utilizat atât pe
calculatoarele mainframe cat i pe calculatoarele
personale (PC-uri). Pachetul are denumirea comercial
SAS/STAT i face parte din sistemul SAS
(www.sas.com), un sistem complex de gestiune a
resurselor informa ionale destinat în special companiilor.
Datele pot fi introduse sau extrase din SAS folosind
produsul SAS/ACCESS. Sistemului SAS cuprinde
module pentru:
o managementul bazelor mari de date; analiza
statistica a seriilor cronologice; analiza statistica
clasica; vizualizarea si reprezentarea grafica a
rezultatelor.
o sistemul informational geografic SAS/GIS care
permite stocarea, analiza si afisarea datelor
spatiale.
o Modulul SAS/INSIGHT cu care se fac analize
exploratorii ale datelor folosind reprezentarea
grafica a rezultatelor.
STATISTICA www.statsoftinc.com
Pachet de programe statistice complet dezvoltat pentru
PC-uri, care cuprinde proceduri pentru toate tehnicile de
baz necesare unei analize statistice complete. Pe site se
g sesc resurse utile pentru analiza i interpretarea
datelor, inclusiv un manual gratuit de metode statistice
(The Electronic Statistics Textbook).
Stata http://www.stata.com
Stata este un pachet complet pentru statistica, un sistem
complet dedicat managementului datelor, continand solutii
integrale pentru statistica si grafica aferenta.
Stata este un produs "programabil" astfel, utilizatorii

6
obisnuiti cu Stata isi pot programa si adauga propriile functii
care sa le usureze munca de cercetare. Cu Stata se pot face
diferite analize de regresie si analize factoriale, etc
(http://www.token.com.ro/stata.htm).
BMDP http://www.statsol.ie/bmdp/bmdp.htm.
Pachet de programe statistice destinat calculatoarelor
mainframe (bazate pe limbaje de programare), orientat în
special pentru aplica ii specifice tiin elor care studiaz
via a i aspectele ei. Pachetul a fost achizi ionat de SPSS,
care a creat o versiune sub Windows a acestuia
Minitab http://www.minitab.com
Pachet software în domeniul educa ional foarte
prietenos, care con ine toate tehnicile de baza ale analizei
statistice. Datele pot fi introduse direct în fereastra de
date MINITAB sau pot fi importate Excel, Acces, etc.
S-Plus
http://www.insightful.com/products/splus/default.asp.
Pachet comercial de analize statistice, este folosit i în
mediile educa ionale i academice. Permite realizarea
regresiei liniare si a celei neliniare, are o serie de
facilitati pentru realizarea analizei multivariate, respectiv
pentru tratarea seriilor cronologice.
STATGRAPHICS http://www.statgraphics.com
Pachet de programe statistice dezvoltate pentru
calculatoarele personale. Programul este util în analiza
grafic i afi area rezultatelor.
WinSTAT
http://www.winstat.com/english/function/function.htm.
Modul de completare pentru Microsoft Excel destinat
analizei datelor. Cu el se pot realiza tabele, indicatori,
grafice. Indicatii despre modul se g sesc pe site.

7
1.2 Pachetele de programe pentru statistic par ial

Con in in general o parte din tehnicile de baz cum ar fi:


regresia, analiza varia iei ANOVA/MANOVA, analiza
factorialdar
Analiza discriminantului, analiza grupurilor etc.).
DataDesk1 http://www.datadesk.com
Pachet de programe statistice destinat analizei
exploratorii a datelor, creat de Paul Velleman, Este foarte
bun pentru reprezentarea grafic a rela iilor dintre
variabile.
JMP2 http://www.jmp.com
Analog cu DataDesk1, este un pachet de programe
statistice realizat pentru vizualizarea i explorarea
rezultatelor începând de la cele simple pân la cele
complicate, cum ar fi regresiea neliniar , analiza cluster,
etc. Este recunoscut calitatea sa de a reprezenta
rezultatele sub form grafic . JMP este un produs al SAS
ce poate fi utilizat atât de încep tori cât i de avansa i.
NCSS3 http://ncss.com
Pachet de programe statistice realizat pentru mediile
educa ionale.
NetMul1 http://pbil.univ-lyon1.fr/ADE-4/NetMul.html
Pachet de software statistic mai nou, adaptat la analiza
datelor prin Internet. Analizele statistice (factoriale), se
fac direct pe server-ul unde se afl programul si
rezultatele se ob in cu ajutorul programului de navigare
pe net
StatMost
http://www.dataxiom.com/products/statmost/index.html
Pachet de programe statistice destinat analizei si
reprezentarii grafice a rela iilor dintre variabile. Pachetul

8
cuprinde si doua module statistice complementare unul
de analiza numeric si unul de calcul tabelar.
ViSta http://forrest.psych.unc.edu/research/index.html
Pachet de programe statistice gratuit, cu care se pot
realiza: analiza regresiei, analiza componentelor
principale, scalarea multidimensional , analiza
coresponden elor.

1.3 Pachetele de programe pentru strict specializate


Cuprind in multe cazuri tehnici noi de analiza, care urmeaza a fi
apoi preluate de pachetele complete.
Acestea sunt dezvoltate de diverse institute de cercetare i
universit i, sunt în marea majoritate a lor gratuite, nu pot fi
utilizate de începatori, pot con ine erori, deoarece se afl inca in
faza de testare, au interfa greoaie si sunt adaptate doar pentru
cateva tehmici de analiza. Exemple:
ALSCAL2
http://forrest.psych.unc.edu/research/alscal.html -
integrat în prezent în SAS i SPSS, este util pentru
scalarea multidimensional .
AMOS1 - integrat în prezent în SPSS, specializat pe
modelarea ecua iilor structurale.
EViews2, RATS5, SORITEC6 si LIMDEP4 pachete
de programe statistice specializate pe estim ri
econometrice. Cu EViews2 se pot rezolva sisteme de
ecua ii simple/ multiple, se pot face previziuni/simulari,
RATS5 este util in previziuni, I lucrul cu serii
cronologice, etc.

1.4 Pachete matematice care contin tehnici statistice


MATLAB http://www.mathworks.com - sistem
computerizat interactiv folosit în cadrul universitar,
contine functii pentru analiza primara a datelor si de

9
realizare a graficelor. Statistics Toolbox din MATLAB
permite testarea ipotezelor, contine functii de regresie si
permite vizualizarea informatiilor statistice.
Mathematica http://www.wolfram.com
Maple http://www.maplesoft.com,
Mathcad
http://www.mathsoft.com/solutions/calculation_manage
ment_suite/mathcad.asp,

1.5 Programe informatice pentru analiza statistica


academica si de cercetare
Sunt concentrate pe concepte, multe din programele comerciale
au pornit de la software-ul academic si de cercetare.
Exemple
XGobi http://www.research.att.com/areas/stat/xgobi -
sistem bazat pe X-Window, realizat la MIT, poarte lucra
cu maxim 20 variabile.
Xlisp-Stat4 ftp://ftp.stat.umn.edu/pub/xlispstat/- realizat
la Universitatea Minnesota, contine un set de instrumente
performante pentru dezvoltarea tehnicilor grafice
dinamice.
ExplorN1
www.science.gmu.edu/~rmoustaf/explorn.html - pachet
statistic de vizualizare si constructie grafica, lucreaza cu
seturi masive de date (pâna la 30 de dimensiuni, 250.000
de observatii).
MANET2 http://stats.math.uni-augsburg.de/Manet -
software realizat pentru derularea graficelor statistice
interactive, pentru sistemul de operare Macintosh.
MANET, realizat laUniversitatea Augsburg, contine
metode inovative de tratare grafica a valorilor lipsa.

10
CAPITOLUL 2
SPSS TUTORIAL

Toate versiunile pachetului de programe statistice SPSS contin


acelea i func ii statistice de baza. Cursul acesta fiind un curs
introductiv, tot ce se va studia va fi valabil pentru aproape toate
versiunile.
Cu ajutorul SPSS se pot: edita si prelucra date, se fac rapoarte si
grafice, se pot face proceduri proprii de prelucrare sau se pot
modifica procedurile standard SPSS.
Prima versiune a programului SPSS a ap rut în anul 1968,
ajungand in prezent la versiune 16. Programul este utilizat
pentru aproape toate tipurile de analize statistice si in
managementul datelor (selectare, reconfigurare, creare de date
noi, etc.) .

2.1 SPSS -initializare, baza de date,

La pornire, programul deschide fereastra SPSS data editor in


care se afiseaza inregistrarile VARIABLE VIEW sau
metadatele asociate variabilelor DATA VIEW.

1
Meniuri SPSS:
File - contine comenezi de
deschidere i salvare de fi iere
Edit contine operatiile comune
programelor Microsoft, respectiv:
Select, Copy, Cut, Paste, Find i
setarea caracteristicilor de lucru
ale SPSS

View - seteaz modul de afi are:


cu sau f r bara de butoane, cu sau
f r liniile
desp r itoare
ale
celulelor, .
Data
contine func ii
de operare cu
variabilele;
definire,
inserare,
tergere, selectare, sortare, adi ionare de
fi iere, etc.

2
Transform contine func ii de
modificare a datelor prin calculare,
recodificare. Pentru a crea o noua variabila
in SPSS folosind variabile existente in baza
de date se utilizeaza comanda Compute din
meniul TRANSFORM.
Pentru a recodifica o variabila in SPSS se
foloseste comanda Recode din meniul
TRANSFORM.

Analyze - grupeaz procedurile de calcul


statistic, are optiuni pentru reprezentarea
grafica a rezultatelor.
Graph -

contine
procedurile de
reprezentare
grafic
Utilities
contine informa ii despre variabile,

3
structurare pe seturi de variabile.
Window - contine lista ferestrelor deschise si permite
selectarea lor.
Help contine un tutorial de operare cu SPSS si o procedur
pentru alegerea tipului de prelucrare statistic (Statistic Coach)

O analiza statisitca se realizeaza in general in 7 pasi:


1. Se introduc datele direct în DATA EDITOR, sau intr-un fi ier
de date SPSS (extensia .SAV), sau se importa un fi ier de format
diferit (se alege din caseta File open/File of type)
2. Se corecteaza erorile, se fac selec ii, recodific ri, se fac
calcule asupra variabilelor etc.
3. Se aleg procedurile statistice pe baza carora se face
prelucrarea.
4. Se selecteaza variabilele ce intra in prelucrare
5. Se da RUN si apoi butonul OK
6. Se afiseaza si se analizeaza rezultatele.
Observatie: cu dublu click pe un element din Viewer face ca
elementul respectiv sa intre în regim de editare)
7. Se face un raport.

Cele mai simple prelucrari ce se realizeaza cu un program statistic


sunt tabelele de frecventa. Acestea se obtin astfel:
Meniul ANALYZE,
Comanda DESCRIPIVE STATISTICS,
Optiunea FREQUENCIES
Se selecteaza variabilele ce vor intra in prelucrare, apoi OK.

Un caz special de analiza este cazul analizei bivariate. Acest tip de


analiza foloseste in multe cazuri tabele cu doua intrari, numite si
tabele de contingenta sau CROSSTABS. Acestea se obtin astfel:
Meniul ANALYZE,
Comanda DESCRIPTIVE STATISTICS
Optiunea CROSSTABS

4
Se selecteaza variabilele ce vor intra in prelucrare, apoi OK.

Pentru afisarea si prelucrarea ulterioara a formei rezultatelor se


foloseste fereastra SPSS Viewer, in care vor aparea: statistici,
tabele, grafice etc.
Graficele pot fi obtinute in acelasi timp cu statisticile ca in
exemplu anterior sau utilizand meniul GRAPHS si pot fi
prelucrate ulterior cu CHART EDITOR.

arborele de
navigare

Fereastra SPSS VIEWER are 2 parti. In partea stanga se


vizualizeaza , iar in partea dreapta apar rezultatele prelucrarilor
cerute.
Rezultatele din fereastra Viewer se salveaza intr-un fisier cu
extensia .SPO
5
Fisierul .SPO nu poate fi deschis decât din SPSS
Trecerea de la o fereastr la alta se face:
Selectand fereastra dorita din meniul SPSS;
Cu butoanele din bara de comenzi;
Cu butoanele de pe bara de sarcini a sistemului de operare
(din partea de jos a ecranului).

Modificarea unui tabel in SPSS se face in fereastra OUTPUT-SPSS


VIEWER astfel:
Se selecteaza din fereastra tabelul ce trebuie modificat prin dublu
click pe acesta
Meniul PIVOT
Comanda PIVOTING TRAYS
In fereastra PIVOTING TRAYS deschisa se observa pe lateral trei
flori: LAYERS, ROW, COLUMN. Folosind DRAG AND DROP
acestea por fi trase, rotite intre ele sau pot fi puse pe aceeasi linie
sau coloana.

Rotirea liniilor si a coloanelor unui tabel in SPSS se face in fereastra


OUTPUT-SPSS VIEWER astfel:
Se selecteaza din fereastra tabelul ce trebuie modificat prin dublu
click pe acesta
Meniul PIVOT
Comanda TRANSPOSE
ROWS AND
COLUMNS.

Copierea unor rezultate din


fereastra SPSS VIEWER
pentru a fi implementate in
documente de tip WORD,
EXCEL, POWER POINT,
etc se face dupa metoda
universal valabila Edit

6
Copy Paste/Paste Special sau cu optiunea EXPORT din
meniul FILE. In acest caz se deschide fereastra EXPORT
OUTPUT .

Datele sunt
organizate ca la
orice baza de date
in tabele cu linii
si coloane, liniile
fiind observatiile,
coloanele fiind
campurile
(variabilele)
bazei.

Pentru a putea
face o analiza
statistica este
nevoie de o baza
de date. Aceasta
poater fi creata sau importanta.
Cea mai uzuala metoda de scriere intr-o baza de date este
introducerea datelor direct de la tastatura
Inseararea unei
variabile in baza de
date se face astfel:
Se fixeaza cursorul pe
coloana variabilei în
stânga c reia se face
inserarea, meniul
Data-Insert variable.
se definesc apoi
numele, tipul si
eticheta variabilei.
7
tergerea unei variabile: clic pe numele variabilei, apoi click pe
tasta Delete .
Inserarea unei observatii: se fixeaza cursorul intr-una din
celulele liniei deasupra c reia se face inserarea, apoi meniul
Data-Insert case
tergerea unei observatii: se selecteaza observatia si apoi click
pe tasta Delete
Pentru inserari si stergeri se
poate folosi si meniul
contextual (drag and drop).

In cazul prelucrarilor pe
esantioane, se pot selecta
anumite observatii din baza
de date prin comanda
Data Select Cases si se
alege modalitatea de
filtrare.

Cazurile taiate vor fi


eliminate din analiza.
Revenirea la baza initiala se
face cu op iunea All cases care va reactiva toate observatiile din
baza de date.

In SPSS atributele variabilelor se seteaza în fereastra Data


Editor - Variable View.
Variabilele sunt denumite (NAME) cu identificatori care nu sunt
case sensitiv si nu pot contine spa ii i caracterele speciale &, !,
?, ', *. În cazul folosirii unui caracter interzis apare un mesaj de
eroare i se permite corectarea numelui
Numele: trebuie s exprime cat mai sugestiv con inutul
variabilei, sa fie unic in cadrul aceleiasi baze si sa nu contina
8
cuvinte rezervate: ALL, AND, BY, EQ, GE, GT, LE, LT, NE,
NOT, OR,
THRU, TO,
WITH. Pentru
numele formate
din doua sau
mai multe
cuvinte se poate
folosi caracterul
underscore
pentru legatura.
Tipul (TYPE)
unei variabile
poate fi :
numeric (max
40 caractere, 16
dintre acestea
pentru partea
zecimala), comma, dot, scientific notation, date, custom
currency sau string (short string maxim 8 caractere, sau long
string maxim 256 caractere).

Daca o variabila contine celule libere (caz in care spre exemplu


la o intrebare dintr-un chestionar repondentul nu a raspuns) se
definesc valorile lips (MISSING VALUE).
Atributele WIDTH si COLUMNS precizeaz cate caractere pot
lua valorile string si cate caractere vor fi afi ate.
Scala de m sur a unei variabile se specifica cu atributul din
coloana MEASURE din Variable View:
SCALE pentru variabile de interval,
ORDINAL pentru variabile ordinale,
NOMINAL pentru variabile nominale.
Pentru codificarea variabilelor se foloseste coloana VALUES:.

9
Fereastra Data Editor, pagina Variable View,
Se activeaza celula din coloana Values.
Se deschide caseta de dialog Value Labels:
La VALUE se scrie codul, fie acesta 1
La VALUE LABEL se completeaza ce reprezinta codul, fie
acesta FOTBAL, Apoi ADD
Se pot atasa etichete si valorilor variabilelor, daca acestea sunt
de tip categorial: nominale sau ordinale. Exemplu: specializarea
cu valorile: fotbal, volei, etc., putem da eticheta 1 valorii fotbal,

eticheta 2 valorii volei.

La incheierea unei sesiuni de completare a bazei de date trebuie


salvat ceea ce s-a lucrat Salvarea oricaror completari sau
modific ri în Data Editor pe ecran, se face la prima deschidere
cu meniul File-Save as, in caseta de dialog deschisa se da un
nume fi ierului (File name), se alege tipul de fi ier (formatul
implicit are extensia .sav), apoi Save

10
Se observa ca SPSS poate salva în multe formate, utile atunci
cand transferam date pentru prelucr ri ulterioare în alte
programe.
Deschiderea unei baze de date SPSS creat cu SPSS se face cu
meniul File - Open,

11
CAPITOLUL III

3.1 REPREZENTARI GRAFICE

Elementele principale ale unui grafic in SPSS sunt: titlul, axele


de coordonate, legenda si sursa din care provin datele.
Tipul de grafic utilizat depinde de tipul si numarul variabilelor.
In SPSS graficele se obtin cu ajutorul meniului GRAPHS sau
din meniul ANALYZE, folosind butoanele CHARTS, PLOTS
ce se gasesc in diferite ferestre.
Graficele realizate cu SPSS in cercetarea statistica pot fi grupate
in:
Grafice pentru distributii dupa o variabila cantitativa
Grafice pentru distributii dupa o variabila calitativa.
Grafice pentru distributii bivariate. Pot fi reprezentate
o o variabila nominala si o variabila numerica
o doua variabile nominale
o doua variabile numerice

3.1.1 Grafice pentru distributii dupa o variabila cantitativa


Histograma modalitati de obtinere:
Metoda 1.
o meniul Graphs Histogram
o in fereastra deschisa se selecteaza variabila pentru
care se realizeaza histograma
o la Titles se da titlul graficului, apoi OK.
Metoda 2.
o Meniul Graphs Interactive Histogram
o In fereastra deschisa Create Histogram se muta cu
drag and drop variabila de reprezentat pe axa abscisa.
Pe bara de meniuri a ferestrei se selecteaza Options si
in noua fereastra deschisa se seteaza SCALE
RANGE., apoi OK.

12
Metoda 3.
o Meniul Analyze Descriptive Statistics
Frequencies Charts - Histograms
Curba frecventelor utila in determinarea normalitatii unei
distributii
meniul Graphs comanda Histogram
in fereastra deschisa se selecteaza variabila pentru care se
realizeaza histograma
se bifeaza Display normal curve.
la Titles se da titlul graficului, apoi OK.
Q-Q Plot - utila in determinarea normalitatii
meniul Graphs comanda Q-Q
in fereastra deschisa se selecteaza variabila (variabilele)
pentru care se realizeaza graficul
se selecteaza modelul distributiei test (ex: normala), apoi
OK.
Boxplot pentru distributii numerice. Datele sunt intai ordonate
si impartite in grupe (25% din distributie pentru fiecare grupa).
meniul Analyze Descriptive Statistics Explore aici se
selecteaza variabila de reprezentat graphic apoi Plots
Acest tip de grafic se poate obtine si din
meniul Graphs Boxplot , se seteaza Summaries of
separate variables, apoi Define
in caseta deschisa se selecteaza variabila de reprezentat si
OK.

3.1.2 Grafice pentru distributii dupa o variabila calitativa


SPSS pune la dispozitia utilizatorului mai multe variante de
grafice pentru diagramele Bar si Pie in functie de diferite optiuni
ce pot fi setate in casetele de dialog ce se deschid la actionarea
celor doua comenzi PIE si Bar. In continuare se va prezenta cate
o modalitate de reprezentare.
Diagrama Bar

13
meniul Graphs Bar
in caseta deschisa se bifeaza Summaries for groups of
cases apoi se apasa Define,
se deschide caseta Define Simple Bar , in care la Bar
Represent se bifeaza modalitatea de reprezentare (frecvente,
procente, ), se selecteaza apoi variabila ce urmeaza a se
reprezenta grafic, la Titles se da titlul graficului , apoi OK.
Diagrama Pie
meniul Graphs Pie
in caseta deschisa se bifeaza Summaries for groups of
cases apoi se apasa Define,
se deschide caseta Define Simple Pie , in care la Slices
Represent se selecteaza % of cases, la Define Slice by se
seteaza variabila ce va fi reprezentata, iar la Titles se da titlul
graficului , apoi OK.
Diagrama Pie prezinta procentele variabilei analizate.

3.2 INDICATORI STATISTICI DESCRIPTIVI

Indicatorii statistici descriptivi se acceseaza cu ajutorul: unor


proceduri specializate sau din interiorul altor proceduri.
Exista trei proceduri specializate grupate in meniul Analyze-
Descriptive statistics: Frequencies, Descriptives i Explore.

3.2.1 Procedura Frequencies ajuta la calculul frecventelor si se


obtine din:
Meniul Analyze-Descriptive statistics-Frequencies
In caseta Frequencies deschisa se selecteaza din lista
variabilele ce vor intra in prelucrare.
Prin actionarea celor trei butoane din partea de jos a casetei
se pot obtine:

14
o Indicatori statistici descriptivi butonul Statistics cu
optiunile: percentile (Percentile values), tendinta
centrala (Central Tendency), dispersie
(Dispersion), distributie (Distribution).
o Diferite tipuri de grafice butonul CHART cu
optiunile: grafice bar, pie, histograma
o Diferite moduri de prezentare a rezultatelor butonul
FORMAT cu optiuni de ordonare a variabilelor
(Order by) sau de prelucrare a variabilelor multiple
(Multipla variables).
Apoi OK.

3.2.2 Procedura Descriptives ajuta la calculul mai multor


indicatori statistici descriptivi:
Meniul Analyze-Descriptive statistics-Descriptives
In caseta Descriptives deschisa se selecteaza din lista
variabilele care vor intra in prelucrare.
La Options se selecteaza indicatorii statistici descriptivi
doriti:
o Medie (Mean) cu optiunile:
Mean - media
Sum suma observatiilor
o Dispersie (Dispersion) cu optiunile:
Std. deviation abaterea standard sau
abaterea medie patratica
Variance - varianta
Min valoarea minima a variabilei
cercetate
Max - valoarea maxima a variabilei
cercetate
Range amplitudinea variatiei
S.E. mean eroarea medie de selectie
o Distributie (Distribution) cu optinule

15
Kurtosis - boltirea
Skewness - asimetria
o Modul de prezentare a indicatorilor (Display
Order)

3.2.3 Procedura Explore ajuta la analiza exhaustiva a


variabilelor:
Meniul Analyze-Descriptive statistics- Explore
In caseta Explore deschisa:
o La Dependent List se selecteaza variabilele ce
urmeaza a fi analizate
o La Factor List se selecteaza variabilele dupa
care se face analiza
o La Display se seteaza modul de afisare al
rezultatelor:
Statistics (numerice)
Plots (grafice)
Both (ambele)
Caseta Explore mai contine 3 butoane:
Statistics aici se aleg indicatorii statistici ce vor intra in
prelucrare
Plots aici se alege tipul de grafic
Options - aici se alege modalitatea de tratare a valorilor
lipsa.

3.3 TESTAREA IPOTEZELOR STATISTICE

3.3.1 Aplicarea testelor parametrice in SPSS

Testul z - analizeaza diferen a dintre media unui e antion si


media cunoscut a popula iei din care face parte (o constanta
specificata obtinuta pe baza unui esantion extras din aceeasi

16
populatie sau o valoare standard, precizata). Se aplica pentru
esantioane distribuite normal, datele trebuie sa fie numerice.
Obs. Pentru esantioane mai mici de 30 subiecti se foloseste
testul t pentru un singur esantion.
Meniul Analyze -Compare Means-One Sample T Test

Testul t pentru esantioane independente - analizeaza diferen a


dintre mediile unei variabile dependente m surata pe dou
grupuri cu subiec i diferi i. Se testeaza daca mediile celor doua
grupuri sunt egale. Datele trebuie sa fie numerice pentru
variabila dependenta si cu doua variante pentru variabila
independenta (ex: A, B, sau 1, 2, etc.).
Meniul Analyze - Compare means-Indpendent Samples T
Test
La Test Variable(s) se trece variabila (variabilele)
dependenta. Programul poate analiza mai multe variabile
dependente simultan.
La Grouping Variable se trece variabila independenta si in
caseta deschisa se aleg cele doua valori, apoi Continue si
OK.

Testul t pentru e antioane dependente (perechi) analizeaza


(compara) mediile unui grup in doua momente diferite.
Meniul Analyze -Compare Means- Paired Sample T Test
In caseta deschisa se selecteaza cele 2 variabile si apoi se
muta la Paired Variables, apoi OK.

Testul One Way ANOVA - pentru testarea egalitatii a trei si


mai multe medii. Este o extensie a analizei facuta cu testul t
pentru doua grupari (cele notate cu A, B, sau !,2, etc). In cazul
acestui test se lucreaza cu trei sau mai multe grupari). Variabila
de grupare se mai numeste variabila factor sau variabila
independenta.

17
Meniul Analyze - Compare Means One-Way-Anova.
In caseta deschisa se selecteaza variabila (variabilele)
dependenta apoi variabila factor.
La Options se pot seta diferite verificari de restrictii,
exemplu: verificarea restrictiei de normalitate (Descriptive).

3.3.2 Aplicarea testelor neparametrice in SPSS

Testul Chi-Square (HI patrat) al asocierii se aplica


variabilelor nominale (categoriale), pentru a evidentia gradul de
asociere intre doua variabile.
Meniul Analyze Descriptive Statistics Crosstabs
In caseta deschisa se selecteaza perechea (perechile) de
variabile ce va fi analizata
Se bifeaza Display clustered bar charts pentru a vedea si
reprezentarea grafica a corespondentei variabilelor.
La Statistics se selecteaza Chi-Square, apoi Continue
La Cell Display se seteaza ce dorim sa apara in celulele
tabelului de contingenta (Crosstab) respectiv: frecvente
(Counts-Observed), procente pe linie, procente pe coloana,
procente pe total, . , apoi Continue si OK.
Testul se aplica pentru variabile ale caror subiecti nu se
intersecteaza.

Testul semnelor - se aplica pentru


variabile de tip numeric,
care au aceeasi unitate de masura,
pe aceiasi subiecti,
pentru a testa diferen a dintre valori, folosind semnul diferen ei
(nu valoarea acesteia). Dac nu ar exista nici o diferen între
valorile perechi, atunci spre exemplu, num rul diferen elor
pozitive ar trebui s fie egal cu cel al diferen elor negative. Cu
cât num rul diferen elor pozitive este mai mare decat cel al

18
diferen elor negative, cu atât cre te posibilitatea ca diferen a
dintre variabile s fie statistic semnificativ .
Meniul Analyze - Nonparametric Tests - 2 Related
Samples.
Se seleteaza variabilele doua cate doua formand perechi si
fiecare pereche se trece la Test Pair(s) List, apoi OK.

3.4 CORELATII

Coeficientul de corela ie liniar Pearson (r)


M soar gradul de asociere dintre variabile, gradul i sensul
de varia ie concomitent a valorilor unei variabile în raport
cu cealalt , dup un model de tip liniar.
Coeficientul de corela ie Pearson (r) variaza între -1
(corela ie perfect negativ ) i +1 (corela ie perfect
pozitiv ). Pentr r = 0 nu exista legatura (corela ie) intre
variabile.
Variabilele trebuie s fie m surate pe scal de interval/raport
Distribu ia sa nu se abata mult de la curba normal .
Meniul Statistics-Corelate-Bivariate
Testul implicit, la Correlation Coefficients, este Pearson,
dac datele sunt neparametrice se poate alege testul Kendall
sau Spearman.
Flag significant correlations - pune un asterisc coeficien ilor
semnificativi la p=0.05 i dou asteriscuri la cei
semnificativi la p=0.01.
Rezultattul obtinut va fi un tabel in care fiecare celul cuprinde
urm toarele informa ii: valoarea lui r, nivelul p, num rul de
subiec i (N). S eobtine o matrice a coeficientilor de corelatie, in
care coeficientii de sub diagonala principala sunt egali cu
coeficientii de deasupra diagonalei principale, ceea ce inseamna
risipa de spatiu si citire greoaie in cazul unei matrice mari.

19
Caracterul i intensitatea corela iei dintre cele dou variabile se
observa prin reprezentarea grafica scatterplot: meniul Graphs-
Scatter... Se electeaza modelul de graphic, fie acesta Simple i se
apasa Define. Se selecteaza apoi variabilele si OK.

3.5 REGRESIA LINIAR SIMPL


Analiza de regresie este o aplica ie a corela iei, utilizat în
scopuri de predic ie, deci condi iile impuse variabilelor supuse
analizei de regresie sunt acelea i ca în cazul corela iei. Regresia,
în care exist o singur variabil predictor i o variabil criteriu
se nume te regresie liniar simpl .
Analiza de regresie începe cu calculul coeficientului de corela ie
dintre variabile i vizualizarea imaginii scatterplot.
Pe baza existen ei unei leg turi semnificative intre cele doua
variabile se poate trece la analiza de regresie a c rei finalitate
este aceea de ob inere a coeficien ilor a (termenul liber, sau
originea dreptei de regresie) i b (panta dreptei de regresie), cu
ajutorul c rora se poate face estimatia dorita.
Meniul: Statistics-Regression-Linear...
În caseta principal la Linear Regression, se trece variabila
predictor în zona Dependent si variabila criteriu în zona
Independent(s).
În caseta Statistics, se seteaza Estimates pentru a ob ine
coeficien iir de regresie (op iune implicit )
În caseta Regression Save, se seteaza
o Predicted Values-Unstandardized i Residuals-
Unstandardized, pentru a se crea de variabile
distincte în baza de date.
o Prediction interval (individual) pentru a calcula
limitele de încredere pentru valorile prezise

20
BIBLIOGRAFIE

Matlab. High-Performance Numeric Computation and


Visualisation Software. Referance Guide -The Math Works
A First Course in Electrical and Computer Engineering with
Matlab Programs and Experiments -L.Scharf,R.T.Behreus
Matrix Computation -A.Jennings,J.J.McKeown
MATLAB - calcul numeric, grafica, aplicatii - Marin Ghinea,
Virgiliu Fireteanu
Metode numerice - M .Postolache
MATRICES AND MATLAB:A TUTORIAL - M.Marcus
Metode noi de matematica aplicata - Sima V.
http://statisticasociala.tripod.com
NOVAC, ANDREI, Statistic social aplicat , Ed.
Hyperion,XXI, 1995
NOVAC, ANDREI, Metode statistice în pedagogie i
psihologie, Ed. didactic i pedagogic , Bucure ti 1977
SAVA, FLORIN , Analiza datelor în cercetarea psihologic ,
metode statistice complementare, Cluj Napoca: Ed. ASCR, 2004
Rotariu Traian, Badescu Gabriel, Culic Irina, Mezei Elemer,
Muresan Cornelia, Metode statistice aplicate în tiin ele sociale,
Ed. Polirom, 2000
Spircu Liliana, Calciu Mihai, Spircu Tiberiu, Analiza datelor de
marcheting, Ed. ALL, 1994
http://www.mathworks.com/access/helpdesk/help/techdoc/matla
b.html
http://www.math.unvt.ro/zaharia/labnn1.pdf
http://www.geocities.ro
http://www.math.utah.edu/lab/ms/matlab/matlab.html
http://www.math.ufl.edu/help/matlab-tutorial/
http://www.romsym.ro/detalii.php?ctg=175

21
http://www.amath.unc.edu/Faculty/mitran/papers/metodenumeri
ce.pdf
http://www.spss.ro/cauta.php

22
ANEXA

Pentru a putea vedea evolutia pachetului de programe SPSS si


diferentele intre versiuni se poate merge pe site-ul:
http://www.spss.com/software_version/base.cfm. Mai jos sunt
enumerate imbunatatirile aduse modulului SPSS de la o versiune
la alta:
SPSS Version 15.0 Added
SPSS Adapter for SPSS Predictive Enterprise Services
Updated PMML to include transformations
Single administration utility for SPSS Server, Clementine Server, and SPSS
Predictive Enterprise Services platform
Stripe temporary files over multiple disks for increased performance (in SPSS Server)
Export to Database Wizard
Custom Attributes for user-defined meta data in the SPSS Data Editor
Export to Dimensions Data Model
Optimal Binning (in SPSS Data Preparation ; this add-on module was previously
called SPSS Data Validation)
Subset variable views
Python® programming language included on the SPSS CD (in SPSS
Programmability Extension)
Ability to create first-class, user-defined procedures (in SPSS Programmability
Extension)
Syntax control of output files (in SPSS Programmability Extension)
Generalized linear models (in SPSS Advanced Models)
Generalized estimating equations (in SPSS Advanced Models)
Ordinal regression to model ordinal outcomes
Complex samples ordinal regression (in SPSS Complex Samples)
Estimation and imputation of ordered-categorical and censored data (in Amos 7.0
structural equation modeling software)
Dual-Y axis and overlay charts
Enhanced process control charts
Export output to PDF (in SPSS Base)
SPSS Version 14.0 Added
Data-free client (in SPSS Server)
SPSS Adapter for Predictive Enterprise Services (available in SPSS 14.0.1)
User interface (UI) for scoring (in SPSS Server)
Predictor selection algorithm (in SPSS Server)
Naïve Bayes algorithm (in SPSS Server)
Clone dataset command
Open multiple datasets within a single SPSS session
Long value labels (up to 120 bytes)

23
Support for Dimensions Data Model and traditional market research software
OLE DB data access
Control the flow of your syntax jobs using an external programming language
(through SPSS Programmability Extensions )
Validate Data procedure (in SPSS Data Validation )
Anomaly detection for multivariate outliers (in SPSS Data Validation)
Enhanced SPSS Trends add-on module with Expert Modeler
Bayesian estimation MCMC algorithm (in Amos 6.0 structural equation
modeling software)
Data imputation, including multiple imputation (in Amos 6.0 structural equation
modeling software)
Run significance tests on multiple response variables (in SPSS Tables )
Exclude categories used in subtotal calculations from significance tests (in SPSS
Tables)
Preference scaling (PREFSCAL) procedure (in SPSS Categories )
Chart Builder user interface for graphics
Support for SPSS Inc.'s Graphics Production Language (GPL)
2-D line charts (both axes can be scale axes) and charts for multiple response sets
Network license reservations and priority settings
Network commuter license
License manager redundancy
SPSS Version 13.0 Added
In-database data preparation (sort and aggregate) to improve performance (SPSS
Server only)
Create and save PMML models for scoring data at a later time (SPSS Server only)
Date and Time Wizard
Very long text strings (up to 32,767 bytes)
Interactive interface for the Output Management System (OMS)
Complex samples general linear model (GLM) (in SPSS Complex Samples add-on
module)
Complex samples logistic regression (in SPSS Complex Samples add-on module)
SPSS Classification Trees add-on module
Multiple correspondence analysis (in SPSS Categories add-on module)
Population pyramids (also called mirror charts or dual charts), 3-D bar charts, and dot
charts (also called dot density charts)
Additional chart display features/options, including paneled charts and error bars on
categorical charts
Export output to Microsoft® PowerPoint®
SPSS Version 12.0 Added
Support for Open SSL
Presentation graphics system
Identify Duplicate Cases tool
Long variable names (up to 64 bytes)
Visual Bander to easily create bands (e.g., break income into income "bands" of
10,000)

24
Output Management System (turn pivot table output, such as SPSS data files, XML,
and HTML into data/input)
SPSS Complex Samples add-on module
Stepwise Multinomial Regression (in SPSS Regression Models add-on module)
SPSS Manuals on CD, featuring manuals in PDF format for SPSS Base and all add-
on modules
64-bit version of SPSS Server (coming soon)
Multithreaded ODBC (in SPSS Server)

25
MATLAB exemple de functii de prelucrare a datelor i calcule
statistice
MATLAB este un pachet de programe de inalt performanta, dedicat calculului numeric
i reprezentarilor grafice in domeniul stiintei si ingineriei. El cuprinde module de analiza
numerica, calcul matriceal, reprezentari grafice, intr-un mediu usor de folosit in care
enunturile problemelor si rezolvarile acestora sunt exprimate in modul cel mai natural
posibil, asa cum sunt scrise matematic, fara a fi necesara programarea traditionala.
Elementul de baza cu care opereaz MATLAB este matricea.
Numele MATLAB vine de la Matrix Laboratory si este un sistem interactiv destinat
prelucrarilor numerice si simbolice asupra structurilor de tip matrice.
Dintre resursele de calcul i reprezentare grafica ale MATLAB-ului se mentioneaz
urmatoarele:
1. Operatii matematice fundamentale,
2. Algebra liniara si functii matriceale
3. Analiza datelor i transformatele Fourier:
corelatia, covarianta, diferente finite
transformata Fourier rapida (FFT)
media statistica, mediana si deviatia standard
interpolarea datelor
4. Analiza numerica neliniara
5. Programarea
6. Reprezentarea graficelor 2D t 3D:
folosirea pixelilor, liniilor, poligoanelor pline, liniilor de contur
utilizarea diagramelor polare, de bare sau a histogramelor
reprezentarea in coordonate liniare, semilogaritmice si logaritmice
reprezentarea suprafetelor
7. Vizualizarea graficelor:
controlul culorilor si a pozitiei sursei de lumina
vizualizari volumetrice
afisarea imaginilor si a animatie
8. Proprietati si resurse grafice:
crearea si manipularea figurilor
desenarea, scalarea, etichetarea i colorarea axelor
desenarea i manipularea liniilor si textului
9. Utilizarea interfetei grafice (Graphical User Interface - GUI)
10. Suportul pentru imprimare
11. Schimbul de documente.

FUNCTII MATLAB GENERALE


Help Furnizeaza informatia on-line What Listeaza fisierele '.M, '.MAT i
despre MATLAB si functiile acestuia; '.MEX din directorul curent;
Type Listeaz fisierul M, mentionat; Lookfor Retuneaza numele fisierelor care
au in prima linie a HELP-ului (linia H1
cuvinte precizate ca argumente
Which Returneaza calea in care este Path Returneaza caile cu care lucreaz
localizat un fisier sau o functie MATLAB; MATLAB-ul (in care sunt cautate fisierele
apelate);
Who Listeaza variabilele curente din Whos Listeaza variabilele curente,
memorie. dimensiunile lor, precum si tipul acestora
(reale sau compltexe)
exist Verifica daca o variabila exista in Cd returneaza sau schimba directorul
mediul MATLAB. current. Se apeleaza folosind sintaxa: cd
cale/nume_director
Dir listeaza continutul directorului Delete permite stergerea unui fisier sau a
curent. Se apeleaza cu sintaxa: dir unui grafic. Sintaxa: delete nume_fisier
Diary creaza pe disc un fisier al sesiunii clc-sterge fereastra de comenzi
de lucru in MATLAB (fara grafice).Practic
inregistreaza toate comenzile si
raspunsurile returnate intr-un fisier ASCII
Sintaxa: diary nume_fisier .Suspendarea
inregistrarii se realizeza cu comanda : diary
off, iar reluarea inregistrarii se face cu
comanda : diary on. Daca nu a fost amintit
nici un nume se da fisierului un nume
implicit
home muta cursorul in pozitia format seteaza formatul de afisare a datelor
initiala(prima linie prima coloana)
echo permite afisarea liniilor de program more functie pentru controlul numarului de
in timpul executarii acestora linii afisate pe ecran
disp afiseaza o matrice sau un text.
Sintaxa: disp(x),unde x este un sir text sau
o matrice.
Exemplu.:

Afiseaza:
Clear sterge variabile si functii. Pack compacteaza datele din memorie
Sintaxa: clear x y z .Optional se pune
variabila , fara x,y,z sterge toate variabilele.
Size returneaza dimensiunea unei matrice. Length returneaza lungimea unui vector.
Sintaxa:[m,n]=size(X) si returneaza un Sintaxa:a=length(X) si returneaza
vector linie cu doua componente [m,n] care dimensiunea maxima a matricei sau a
contin numarul de linii m si numarul de lungimii vectorului.E echivalenta cu
coloane n ale matricii X max(size(X)).

Exemplu:
Fie matricea X=[1 2 4 ;5 7 9]

Intructiunile:

au ca rezultat:
Variabile speciale si constante in MATLAB
Acestea nu pot fi declarate si sunt accesibile global in orice fisier - M.Variabilele si
constantele speciale sunt:
Ans variabila creata automat in care Eps variabila permanenta in care este
este returnat rezultatul unui calcul,atunci memorata eroarea relativa pentru
cand expresia nu a avut asignat un calculele in virgula mobila.
nume.
Pi variabila permanenta care are I variabila folosita pentru introducerea
asignata valoarea 3.14159265358. numerelor complexe ca in exemplul
z=2+3*i.Aceasta poate fi redusa si ca
variabila oarecare .Spre exemplu, daca
se defineste s=sqrt(-1),variabila s poate
fi folosita la introducerea numerelor
complexe.
Inf variabila folosita pentru NaN variabila folosita pentru
reprezentarea lui plus infinit, fiind reprezentarea lui Not-a-Number,
rezultatul impartirii 1.0/0.0. rezultatul impartirii 0.0/0.0.
Nargin variabila permanenta pentru Nargout variabila permanenta pentru
testarea numarului de argumente de testarea numarului de argumente de
intrare ce trebuie introduse pentru iesire ale unei functii.
apelarea unei functii.

Exemple de functii MATLAB pentru prelucrarea datelor si a calculelor


statistice:
cumsum - calculeaza suma cumulata.
Prin suma cumulata a unui vector se intelege vectorul ale carei componente se
calculeaza astfel:
j
sj= xk , j 1,2,...N
k 1
Se foloseste functia:
Y = cumsum(x).
Daca argumentul x este un vector, functia returneaza un vector care contine suma
cumulata a elementelor vectorului, iar daca este o matrice, functia returneaza o matrice
care pe fiecare coloana contine suma cumulata a elementelor din coloana respectiva.

Exemplu:
Se obtine:

cumprod - calculeaza produsul cumulat.


Prin produs cumulat a elemnetelor unui vector se intelege vectorul ale carei
componente se calculeaza astfel:
j
pj= xk , j 1,2,...N
k 1
Se foloseste functia:
Y = cumprod (x).
Daca argumentul x este un vector functia returneaza un vector care contine produsul
cumulat al elementelor vectorului, iar daca este o matrice, functia returneaza o matrice
care pe fiecare coloana contine produsul cumulat al elementelor din coloana respectiva.

Exemplu:
Se obtine:

corrcoef- calculeaza coeficientii de corelatie.


Pentru a stabili daca intre doua seturi de date, inregistrate in vectorii u si v , exista o
dependenta liniara , se calculeaza coeficientul de corelatie cu formula:
N N N
N u i vi ui vi
i 1 i 1 i 1
Ruv
N N 2 N N
2 2
[N u i ( u i ) ][ N v i ( vi ) 2 ]
i 1 i 1 i 1 i 1

Functia MATLAB care calculeaza acest coeficient este corrcoef .


Se apeleaza cu una din sintaxele:
Rx = corrcoef(X)
Rxy= corrcoef(X,Y) .
Daca functia are ca argument de intrare o matrice ,se returneaza o matrice care contine pe
pozitiile Rx(i,j) coeficientii de corelatie dintre coloana i si j.Apelata cu doua argumente
de intrare X si Y,matrice de aceasi dimensiune ,functia returneaza o matrice care contine
pe pozitiile Rxy(i,j) coeficientii de corelatie dintre fiecare coloana X si fiecare coloana Y.

Exemplu: Fie urmatoarele functii :


x = 2+3t,
y = 3t,
z = 2sin(t).
Calculati coeficientii de corelatie Rxy si Rxz,pentru domeniul t [0,10]
Cu secventa MATLAB:

Se obtin rezultatele:

Se observa ca intre x si y exista o dependenta liniara , deoarece Rxy(1,2)=Rxy(2,1) , iar


intre x si z exista o dependenta neliniara pentru ca Rxz(1,2) R(2,1).

cov - calculeaza matricea de covarianta.


Se apeleaza cu una din sintaxele:
C = cov(X)
C = cov(x,y).
Daca X este un vector calculeaza varianta .
Pentru matrici in care fiecare rand este o observatie si fiecare coloana o variabila cov(X)
este matricea de covarianta.
Diag(Cov(X)) este un vector al variantelor coloanelor si Sqrt(Diag(Cov(X))) este un
vector ce reprezinta deviatia standard.
Cov(x,y) unde x si y sunt vectori de lungimi egale este echivalenta cu Cov([x(:),y(:)])

diff - calculeaza diferentele dintre numere succesive.

hist - reprezinta histograma. Histograma este un tip special de grafic,folositor pentru


reprezentarile statistice.
Aceasta functie se apeleaza cu sintaxa:
hist(X) hist(X,N)
[N,Y]=hist(X) [N,Y]=hist(X,N)
unde X este setul de analizat,iar N este numarul de intervale.
Daca este apelata fara argumente de iesire , functia realizeaza reprezentarea histogramei
datelor din X. Apelata cu argumente de iesire , returneaza vectorii N si Y ce pot fi
utilizati ulterior pentru reprezentarea grafica a histogramei cu functia bar. Vectorul N
contine numarul de valori ce se gasesc in fiecare interval corespondent din Y. Functia bar
se apeleaza cu una din instructiunile:
bar(Y) bar(X,Y) [XX,YY]=bar(X,Y)
Apelata fara argumente de iesire , functia bar reprezinta grafic histograma datelor din
vectorul Y.
Reprezentarea histogramei se face cu functia plot:
Plot(XX,YY)

max - determina cea mai mare componenta dintr-un vector sau matrice.
Se apeleaza cu sintaxa:
M=max(x).
Daca x este vector , aceasta functie returneaza un scalar, cel mai mare element, iar daca x
este matrice returneaza un vector linie care contine elementele maxime din fiecare
coloana.
Determinarea elementelor maxime ale vectorului , precum si a indicelui acestora se face
prin functia:
[M,l]=max(x)
Pentru a crea o matrice care contine elementele maxime din doua matrice de aceasi
dimensiune folosim sintaxa:
C=max(A,B)

min - determina cea mai mica componenta dintr-un vector sau matrice.
Se apeleaza cu sintaxa:
m=min(x) ).
Daca x este vector , aceasta functie returneaza un scalar, cel mai mic element, iar daca x
este matrice returneaza un vector linie care contine elementele minime din fiecare
coloana.
Determinarea elementelor minime ale vectorului , precum si a indicelui acestora se face
prin functia:
[M,l]=min(x)
Pentru a crea o matrice care contine elementele minime din doua matrice de aceasi
dimensiune folosim sintaxa:
C=min(A,B)

mean - calculeaza valoarea medie.Media aritmetica a unui set de date se calculeaza


cu relatia:
N
xk
k 1 x1 ... x N
=
N N
Functia mean se apeleaza cu sintaxa:
m=mean(X).
Pentru vectori returneaza un scalar , iar pentru matrice un vector linie.

median - calculeaza valoarea mediana.


Mediana este elementul de la mijlocul unui set de date ordonat crescator.
Daca numarul N de elemente al setului este impar, valoarea mediana este cea de pe
pozitia (N+1)/2, iar daca este par (N/2) si (N/2)+1,

N 1
x( ), dacaN 2M 1
mediana(x)= 2
N N
x( ) x( 1)
2 2 , dacaN 2M
2

Functia median se apeleaza cu sintaxa:


M=median(X)

Exemplu: Calculati mediana matricei A.

Folosim secventa MATLAB:

Obtinem:

prod - calculeaza produsul.


Pentru calculul produsului elementelor unui vector:
N
p= xk
k 1
Se apeleaza cu sintaxa:
Y=prod(x).
Daca x este vector , aceasta functie returneaza un scalar, produsul elementelor, iar daca x
este matrice returneaza un vector linie care contine produsul elementelor din fiecare
coloana.
sort - sorteaza elementele unui vector sau matrice in ordine crescatoare.
Se poate folosi una din formule:
Y=sort(X) [Y,l]=sort(X)
Daca argumentul X este o matrice , functia sorteaza fiecare coloana a acesteia.
A doua forma de apelare returneaza in matricea Y elementele coloanelor sortate in ordine
ascendenta si in matricea l indicii elementelor sortate ale matricei X.
Pentru matrice complexe , elementele sunt sortate dupa valoarea modulului.

Exemplu:Sa se sorteze elementele unui vector , cu precizarea indicelui fiecarui element.

Cu secventa MATLAB:

Va rezulta:

Exemplu. Sa se sorteze elementele unei matrice , cu precizarea indicelui fiecarui


element.
Cu secventa MATLAB:

Va rezulta:

std - calculeaza abaterea standard.


Variatia unui set de date se calculeaza cu relatia:
N
( xk )2
2 k 1
,
N 1
unde termenul (xk- ) reprezinta diferenta sau abaterea lui xk fata de valoarea medie .
Deci , varianta reprezinta patratul abaterii medii patratice a datelor fata de medie.
2
Abaterea medie patratica este definita ca radacina patrata a variatiei, .
Functia MATLAB std calculeaza abaterea medie patratica:
N
( xk )2
k 1
.
N 1
Daca X este un vector , functia std returneaza un scalar care reprezinta abaterea medie
patratica a elementelor vectorului; pentru matrice , functia std returneaza un vector linie
continand abaterea medie patratica a fiecarei coloane.
sum - calculeaza suma elementelor unui vector.Pentru calculul sumei elementelor
unui vector:
N
s= xk
k 1
Se apeleaza cu sintaxa:
Y=sum(x).
Daca x este vector , aceasta functie returneaza un scalar, suma elementelor, iar daca x
este matrice returneaza un vector linie care contine suma elementelor din fiecare
coloana.

Aproximarea datelor prin metoda celor mai mici p trate


Problema consta in aproximarea unui set de date cu o functie care constituie cea mai
buna aproximare . In acest caz nu este neaparat necesar ca functia determinata sa treaca
prin toate punctele date, insa trebuie sa fie cea mai buna aproximare intr-un anumit
sens (dupa un anumit criteriu de eroare impus). Metoda celor mai mici patrate furnizeaza
de exemplu cea mai buna aproximare in sensul minimizarii patratului distantelor dintre
punctele date si functia de aproximare. Cu aceasta conditie este posibil ca nici un punct al
setului de date sa nu se gaseasca pe curba aproximata.
Regresia liniara este aproximarea unui set de date printr-o dependenta liniara care
minimizeaza suma patratelor dintre dreapta de aproximare si punctele date. Masura
calitatii unei aproximari liniare este data de suma patratelor distantelor de la fiecare punct
la estimatia liniara, distante prezentate in figura 2, marime data de expresia:
Sum_p=sum((y-y1).^2)
Determinarea parametrilor m si n ai dreptei de aproximare y=mx+n se face utilizand
functia polyfit care aproximeaza un set de date cu un polinom de grad n.
Exemplu:Sa se aproximeze in sensul celor mai mici patrate cu o regresie liniara setul de
date:
x=[0,1,2,3,4,5]
y=[0,20,60,68,77,110]

Cu urmatoarea secventa MATLAB:


Se obtine :

Regresie polinomiala - este o aproximare a unui set de date printr-un polinom de forma :
N
p(x)= ai x N i

i 0
Daca setul de date are N elemente , toate datele se afla pe curba de aproximare . Pentru
un grad mai mic decat numarul de date , aproximarea este cu atat mai buna cu cat gradul
polinomului este mai apropiat de numarul de date. Utilizarea unui polinom de aproximare
cu grad mai mare decat setul de date poate conduce la erori de aproximare considerabile.
Determinarea celei mai bune aproximari a unui set de date (x,y) cu un polinom de ordin n
foloseste functia polyfit, care se apeleaza cu sintaxa:
p=polyfit(x,y,n),care returneaza coeficientii ai ai polinomului p(x) care in valorile
precizate de vectorul x are ,in sensul celor mai mici patrate ,valorile date de vectorul y.
Exemplu:Fie polinomul p(x)=x3-6x2+11x-6, peste care este suprapus un zgomot cu
distributie normala. Aproximati in sensul celor mai mici patrate datele rezultate cu un
polinom de grad 3. Reprezentati grafic datele cu zgomot si polinomul aproximant.

Cu secventa MATLAB:
Se obtine graficul:

figura 2.Aproximarea datelor cu un polinom de grad 3


Reamintirea catorva
elemente de statistica

Lect. drd. Mariana Popa


1. VARIABILE: tipuri, organizare, reprezentare

Prin individ statistic în elegem o entitate elementar purtatoare de însu iri. Dintre aceste
însu iri una exprim natura îns i a entit ii respective iar restul însu irilor sunt variabile,
adic au forme de manifestare diferite la entit i diferite. Insu irile variabile sau doar
variabilele au fost cuantificate sau m surate.
Clasificarea variabilelor:
- Calitative:
o nominale (categoriale),
o ordinale,
- Cantitative (numerice):
o de tip interval
o de tip raport.
Scalele nominale : sunt calitative, m soar variabilele, prin categorizare f r a indica o
anumit ordine ori cantitate. Ele nu pot fi prelucrate în func ie de cantitate sau ordine.
Scalele ordinale: sunt calitative, se reprezint prin numere care reprezint locul sau
ordinea într-un ir de date.
În cazul datelor ordinale, diferen a numeric în clasament nu este necesar egal cu
diferen a numeric exprimat în unitatea de m sur utilizat în acel caz (cinci sutimi,
respectiv cincizeci de sutimi).
Observa ie. Pentru analiza datelor reprezentate prin scale nominale i ordinale se
folosesc teste statistice neparametrice.
Scalele de tip interval: permit compara ia dintre date, dar valorile respectivelor date nu
pot fi multiplicate sau divizate.
Exemplu : Fie dou rezultate 85IQ i 100IQ ob inute dup efectuarea unui test de
inteligen . Diferen a dintre 85IQ i 100IQ este egal cu diferen a dintre 100IQ i 85IQ .
Observa ie. Cele mai multe instrumente psihometrice sau educa ionale implicate în
m surarea variabilelor cognitive sau comportamentale se g sesc la aceste trei nivele
(nominale, ordinale, de interval). [1]
Scalele de tip raport : sunt reprezentate de scalele de tip interval care indeplinesc în plus
condi iile :
zero absolut indic lipsa total a cantit ii m surate
datele pot fi multiplicate sau divizate (70 cm sunt jum tate din 140 cm i dublul a 35
de cm).
Observa ie. În general, pentru analiza datelor reprezentate prin scale numerice de tip
raport sau interval se folosesc teste statistice parametrice dac variabilele analizate
în cadrul e antionului de lucru :
- au o distribu ie normal ;
- au dispersia asem n toare cu dispersia acelora i variabile la nivelul întregii popula ii
din care a fost extras e antionul de lucru.
În plus, pentru anumite metode parametrice pot exista i alte condi ii suplimentare.
Tehnicile statistice parametrice sunt mai solide i deci ansa de a respinge o fals ipotez
nul este mare.
Datele unei variabile se pot organiza :
- Simplu se face o ierarhie a valorilor dup m rime i se calculeaz frecven a de
apari ie a fiec rei valori (variante);
- Grupat - se împart valorile variabilei în clase de intervale egale inând cont de
distribu ia grupat a datelor. Se pot folosi mai multe metode de grupare:
Algoritm de grupare dup metoda lui Spatz:
2
o Se stabile te num rul intervalelor între 10 i 20
o Se stabile te m rimea i a intervalului (trei sau cinci în general)
o Primul interval începe cu o valoare multiplu de i.
o Se trec în tabel valorile în ordine descresc toare.
Metoda lui Sturges are la baz formula:

unde:
i - lungimea recomandat a intervalului;
Xmax i Xmin - extremele valorilor irului de date ordonate descresc tor.
lg n - logaritm zecimal din num rul de date a irului (volumul e antionului).
Frecven a cumulat a unei clase este egal cu suma frecven elor din clasa respectiv i
frecven ele din toate clasele cu valori inferioare.

In statistic datele se pot defini, edita, prelucra i reprezinta sub form numeric sau
grafic utilizând diferite software-uri. Unul dintre cele mai cunoscute softuri pentru
statistica social este SPSS for Windows .
La reprezentarea grafic a datelor se pot folosi diferite tipuri de grafice:
- poligonul frecven elor i histogramele - pentru variabile cantitative de tip interval
ori de tip raport;
- cercurile de tip "pie" , histogramele - pentru variabile calitative nominale, etc.

2. INDICATORI : ai tendin ei centrale, de împr tiere a datelor, cotele z


iT

Media : indicator de caracterizare a unui e antion (o popula ie) din punct de vedere a
unei caracteristici studiate. Media ine seama de toate cazurile i este influen at de
valorile lor,
Pentru a calcula media trebuie avut în vedere tipul de date cu care lucr m :
- Pentru o distribu ie simpl : se adun toate valorile dintr-un ir de date i se
împarte rezultatul ob inut la num rul de date:
- Pentru date grupate se aplic o alt formul :
n
f i * xi
i 1
M (X ) n
fi
i 1
unde: fi - frecven a grupat ,
xi - centrul intervalului.
Mediana : indicator care se afl pozi ionat în mijlocul seriei de date. Este punctul
central al seriei, la stânga i la dreapta ei aflându-se 50% din totalitatea datelor.
In cazul datelor distribuite normal mediana coincide cu media.
In cazul datelor distribuite asimetric mediana se îndep rteaz mult de medie.
Mediana ine seama de toate cazurile, dar nu este influen at de valorile extreme.

Pentru a calcula mediana trebuie avut în vedere tipul de date cu care lucr m :
- Pentru o distribu ie simpl se utilizeaz dou formule de calcul a medianei:

3
o n este impar - locul medianei = (n+1) / 2, iar valoarea medianei este
valoarea din ir de pe acea pozitie.
o n este par - valoarea medianei se ob ine prin adunarea valorilor din
centrul seriei i împ r irea sumei ob inute la doi.
- Pentru date grupate se utilizeaz formula
N
fc
Med l 2 *j
fi
unde:
l - limita inferioar a intervalului din clasa care con ine mediana;
fc - frecven a cumulat precedând clasa care con ine mediana;
fi - frecven a clasei intervalului care con ine mediana;
N - num rul total al cazurilor;
j - m rimea intervalului i care cuprinde mediana.
Modul : indicator care corespunde celei mai mari frecven e în variabila analizat
(valoarea cu frecuen a cea mai mare).
Pentru a calcula modul trebuie avut in vedere tipul de date cu care lucr m. Pentru date
grupate modul este dat de intervalul care are cea mai mare frecuen iar valoarea modal
este valoarea aflat în centrul respectivului interval Modul corespunde unuia sau mai
multor elemente ale seriei dac se ob in frecven e egale.
Observa ii [1} :
- Media este recomandat în cazul variabilelor numerice care îndeplinesc condi iile
parametrice (distribu ie normal , omogenitate s.a.).
- Mediana se recomand pentru cazurile în care nu sunt îndeplinite condi iile
parametrice (distribu ii asimetrice, eterogenitate crescut etc) i în cazul variabilelor
de tip ordinal.
- Modul este utilizat mai rar pentru date numerice, fiind îns foarte util în cazul
variabilelor de tip categorial (date calitative, nominale), deoarece nu putem calcula
ceilal i parametrii centrali.
Amplitudinea : indicador de determinare a distan ei dintre valoarea minim i valoarea
maxim într.-un ir de date:
A = (Xmax Xmin)

unde: Xmax - valoarea maxim a irului de date


Xmin valoarea minim a irului de date
Abaterea standard : indicatorul cel mai des folosit pentru a m sura variabilitatea
datelor.
Simboluri pentru abaterea standard:
Abaterea standard a popula iei
s Estimator al abaterii standard a popula iei
S Abaterea standard a e antionului
Gre elile ce pot ap rea în calculul abaterii standard pot fi depistate u or deoarece în
general amplitudinea este de dou pân la cinci, ase ori mai mare decât abaterea
standard.
Dispersia - este egal cu abaterea standard la p trat.
Simboluri pentru dispersie :
² pentru dispersia popula iei,
S² pentru dispersia e antionului

4
s² pentru dispersia e antionului utilizat pentru estimarea dispersiei popula iei.
Coeficientul de variabilitate se noteaz cu V i determin gradul de omogenitate a
unui e antion

unde: S - abaterea standard a e antionului studiat;


M - media grupului.
Coeficientul se aplic în cazul variabilelor m surate pe scala de raport, cu origine
natural zero.
Interpretarea coeficientului de variabilitate:
Dac V se afl între 0 - 15%:
a. împr tierea datelor este foarte mic ,
b. media este reprezentativ ,
c. e antionul m surat este omogen;
Dac V se afl între 15 si 30%,
a. împr tierea datelor mijlocie,
b. media suficient de reprezentativ ;
Dac V este mai mare ca 30%,
a. media nu este reprezentativ pentru e antionul în cauz ,
b. se recomand utilizarea medianei ,
c. e antionul m surat neomogen.
In literatura de specialitate se admite c , dac acest coeficient este mai mic decât 35%,
atunci colectivitatea este omogen iar media este reprezentativ pentru colectivitatea
respectiv . (A. Novac)
Indicele de asimetrie arat în ce m sur media se îndep rteaz de median i
implicit, în ce m sur distribu ia normal a datelor se deplaseaz spre stânga sau spre
dreapta.
In cazul în care indicele de asimetrie nu dep e te ±1,96 distribu iile sunt relativ
normale.
Asimetria este pozitiv dac media este mai mare decât mediana. In aceast situa ie
indicele de asimetrie este pozitiv i datele sunt distributie spre stânga.
Exist mai multe formule de calcul a asimetriei. Pearson a propus urm toarea formul
pentru calculul indicelui de oblicitate:

Asimetria = 3(Media Mediana) / Abaterea standard

Asimetria pozitiv se reprezint astfel.

Fig. 1
Asimetría este negativ dac media este mai mic decât mediana.
In aceast situa ie indicele de asimetrie este negativ i datele sunt distributie spre
dreapta.
Asimetria negativ se reprezint astfel

Fig. 2

Indicele de boltire sau de kurtoz (Kurtosis "cocoa ") - arat în l imea curbei,
comparativ cu cea normal .
5
Distribu iile pot fi leptocurtice (cu cocoa înalt ) i platicurtice (cocoa mic ).
In cazul în care indicele de boltire este pozitiv avem o distribu ie leptocurtic .
In cazul în care indicele de boltire este negativ avem o distribu ie platicurtica.
Dac indicele de boltire nu dep e te ±1,96 distribu ia este relativ normal .
Cotele standardizate z
Parametrii tendin ei centrale i ai varian ei descriu caracteristicile unui e antion sau a
popula iei.
X M
z
S
unde M - media e antionului , X - valoarea intrat în studiu, S - abaterea standard a
e antionului
Cotele z descriu un rezultat individual din cadrul e antionului sau al popula iei.
Cu ajutorul lor se pot face compara ii i între probe diferite.
Cotele z arat pozi ia valorii ob inute în distribu ia datelor pentru caracteristica m surat
din cadrul e antionului. In general sunt cuprinse între - 3,5 si +3,5.
Cota z=0 arat c valoarea g sit este egal cu media (într-o distribu ie normal ).
Cotele standardizate T
Rezultatul ob inut în cote z este exprimat în valori zecimale pozitive sau negative. Pentru
a u ura calculul s-au introdus cotele T pentru care : se propune media 50 i abaterea
standard 10. Astfel toate punctajele ob inute vor fi pozitive i distribuite pe o scal de la
20 la 80 în peste 99% din cazuri.
Formula de calcul a cotelor T este:
X M
T 50 10 *
S
unde: X - o anumit valoare, M - este media, S - abaterea standard a e antionului în
cauz .

CORELA II PARAMETRICE

Corela iile pot fi : parametrice i neparametrice.


Coeficientul de corela ie variaz între -1 si +1 i este o valoare cantitativ ce descrie
rela ia dintre dou sau mai multe variabile.
In cazul în care coeficientul de corela ie ia valori extreme se presupune c între variabile
exist o rela ie perfect .
In cazul în care coeficientul de corela ie ia valoarea zero se presupune c între variabile
nu exist o rela ie liniar .
Pentru a face interpretarea rezultatului ob inut în urma calcul rii coeficien ilor de
corela ie se compar rezultatele ob inute cu anumite valori prestabilite în tabele de
corela ii în func ie de num rul de subiec i, tipul de leg tur i pragul de semnifica ie
dorit.
Corela iile parametrice pot fi utilizate dac sunt îndeplinite urm toarele dou condi ii:
variabilele analizate au o distribu ie normal în e antion i dac dispersia e antionului
pentru variabilele intrate în studiu este omogen .
Probele parametrice sunt mai solide, astfel ipoteza nula poate fi respinsa mai usor.
Tipuri de corela ii parametrice:
1. coeficientul de corela ie simpl (Bravais-Pearson);
2. coeficientul de corela ie par ial ;

6
Coeficientul de corela ie simpl - r (Bravais-Pearson)
Pentru calcularea lui r sunt necesare dou variabile numerice care îndeplinesc condi iile
parametrice.
Analiza semnifica iei lui r se face cu ajutorul unor tabele special construite i luând
diferite praguri de semnifica ie. La nivelul comunit ii tiin ifice interna ionale pragul
minim acceptat pentru ca o corela ie simpl s fie semnificativ statistic este 0,05.
Algoritmul de determinare a încrederii coeficientului de corela ie:
1. Se stabile te pragul de semnifica ie
Dac acesta este 0,05. rezult c din 100 de experimente cel mult 5 se vor datora
întâmpl rii restul datorîndu-se asocierii reale dintre variabile.
Dac acesta este 0,01 eroarea are loc numai într-un singur caz din 100.
2. Se stabile te tipul de rela ie între variabile:
bilateral (two-tailed), dac nu se dore te s se stabileasc directia leg turii
unilateral (one-tailed) daca se dore te s se demonstreze c dou variabile
coreleaz fie direct, fie invers
3. Se cite te din tabel valoarea lui r pentru coloana corespunz toare num rului de grade
de libertate (notat cu df), df=N-2 unde N=num rul de subiec i.
Dac valoarea lui r ob inut este mai mare decât cea din tabel, atunci valoarea lui
r este semnificativ la pragul de semnifica ie ales.
Cu cât cre te num rul de subiec i cu atât scade valoarea coeficientului de corela ie
necesar pentru ca r s fie semnificativ Astfel, valori foarte mici ale coeficien ilor
de corela ie pot fi semnificative dac sunt analizate grupe mari de subiec i.
Semnifica ia coeficientului de corela ie :
Interpretarea semnifica iei coeficientului de corela ie se realizeaz cu ajutorul
coeficientului de determinare (r²). Coeficientul de determinare indic partea din dispersia
total a m sur rii unei variabile care poate fi explicat de dispersia valorilor din cealalt
variabil , sau altfel spus, el determin partea de asociere comun a factorilor care
influen eaz cele dou variabile.
Analiza coeficientului de determinare se poate face numai dac r este semnificativ. Acest
criteriu este influen at de m rimea lotului utilizat în determinarea coeficientului de
corela ie. Se recomand utilizarea lui pentru un num r mai mare de 20 de subiec i, sau, în
cazul utiliz rii în aceasta situa ie analiza s se fac cu multa grij .
Coeficientul de corela ie par ial stabile te corela ia între dou m rimi,
men inând o a treia constant i neutr [Novac A] . El se utilizeaz atunci când între dou
variabile exist o a treia, responsabil de dependen a comun a celor dou i deci
corela ia dintre cele dou variabile poate induce în eroare i este dificil de interpretat.

REGRESIA LINIAR

Cu ajutorul regresiei se pot face predic ii ale unei variabile, în func ie de valoarea alteia.
Predic ia este procesul de estimare a valorii unei variabile cunoscând valoarea unei alte
variabile.
Regresia simpl liniara se realizeaz între o variabil dependent i una independent
astfel încât rela ia dintre cele dou variabile poate fi descris printr-o dreapt în cadrul
norului de puncte.
Ecua ia de regresie are forma:
^
Y a bX
unde:
7
^
Y - rezultatul estimat
a - valoarea lui Y când X este zero.
b - arat cu cât este influen at Y atunci când X cre te cu o unitate
X - variabil criteriu (cunoscut ).
Dup determinarea ecua iei de regresie se fac predic iile.

CORELA II NEPARAMETRICE

Dac nu pot fi aplicate testele parametrice (nu sunt îndeplinite cele dou condi ii) se
utilizeaz tehnicile neparametrice pentru a determina gradul de asociere între variabile.
Exemple de probe neparametrice:
coeficientul de corela ie (fi) (variabile dihotomice);
coeficientul de contingen C a lui Pearson (date categoriale nominale);
coeficientul de corela ie V a lui Cramer (date categoriale nominale);
testul Spearman al corela iei diferen ei rangurilor (date ordinale);
coeficientul (tau) b a lui Kendall (date ordinale).

Coeficientul de corelatie
Coeficientul de corelatie (fi) este o prob corela ional neparametric utilizata pentru
variabile dihotomice ob inute nu datorit unei regrup ri ci prin îns i natura variabilei.
Se interpreteaz ca i coeficientului de corela ie r, deoarece coeficientul de corela ie
este în esen o variant a acestui coeficient.
2
Semnul coeficientului de corela ie (fi) calculat dup formula:
N
se fixeaz în func ie de num rul subiectilor afla i pe cele dou diagonale ale tabelului de
dimensiune 2x2:
+ dac diagonala principal num r mai multi subiec i
- dac diagonala secundar num r mai mul i subiec i.
Coeficientul de contingen C a lui Pearson este utilizat pentru a determina
asocierea dintre dou variabile nominale mai mari de 2 x 2.
Coeficientul nu poate lua niciodat valoarea 1, chiar în cazul unei asocieri perfecte.
Pentru un tabel de tip 3 x 3 poate lua valoarea maxim 0,82, pentru un tabel de tip 4 x 4
poate lua valoarea maxim 0,87. Limita coeficientului C se deplaseaz spre 1, pe masur
ce dimensiunea tabelului cre te, astfel se recomand utilizarea coeficientului C în special
în cazul tabelelor de contingen de dimensiuni mari, de la 7-8 linii sau coloane în sus.
Coeficientul de corela ie V a lui Cramer este utilizat pentru a determina
asocierea dintre dou variabile nominale mai mari de 2 x 2. V poate atinge valoarea 1.
Interpretarea coeficien ilor C, respectiv V se face teoretic astfel: un rezultat cât mai
apropiat de 1 indic o corela ie pozitiv , iar un coeficient negativ indic o asociere
invers .
Testul Spearman al corela iei diferen ei rangurilor - se aplica atunci când
condi iile privind parametrii statistici nu pot fi îndeplinite, din cauza neomogenit ii
grupului sau a num rului prea mic de subiec i (sub 20). Testul ajut la determinarea
locului fiec rui individ într-un clasament. Testul un poate fi aplicat dac mai mult de 25
la sut din totalul rangurilor celor dou grupe sunt egale. In cazul rangurilor egale spre
exemplu, dac doi subiec i sunt clasa i pe locul patru, ei vor primi rangul 4,5 iar dac trei

8
subiec i sunt clasa i pe locul 2, ei vor primi rangul 3, aflat la mijlocul dintre locurile 2,3 i
4, iar urm torul rang ce va fi acordat va fi rangul 5.
Ccoeficientul de corela ie a rangurilor se noteaz cu , poate lua valori între -1 i +1, i
valori ale lui aproipiate de 1 ne arat o corela ie invers iar valori apropiate de zero arat
c nu avem asociere semnificativ .
Coeficientul (tau) b a lui Kendall pentru variabile ordinale se utilizeaz
pentru determinarea asocierii dintre variabile în cazul în care mai mult de 25% din date
sunt egale în ranguri. Asocierea este pozitiv dac indivizii plasa i pe locuri frunta e dup
o variabil , se afl mai în fa i dup cealalt variabil . Asocierea este negativ dac
aceia i indivizi plasa i bine dup prima variabil se vor reg si mai curând spre coada
clasamentului dup cea de a doua variabil .
In cazul corela iilor de date nominale:
- dac cele dou variabile sunt dihotomice de tip 2 x 2 se utilizeaz coeficientul de
corela ie .
- daca cele dou variabile sunt categoriale, peste 2 x 2 se utilizeaz coeficientul V a lui
Cramer, respectiv coeficientul de contingen C a lui Pearson (util în special pentru
tabele peste 5 x 5).
In cazul corela iilor de date ordinale (ordonate sub form de ranguri):
- dac cele dou variabile au pu ine ranguri egale se utilizeaz coeficientul de corela ie
a lui Spearman.
- dac cele dou variabile au mai multe ranguri egale se utilizeaz coeficientul a lui
Kendall.

TESTELE PARAMETRICE T I Z PENTRU COMPARA IA ÎNTRE


GRUPURI

S-a analizat pân acum asocierea dintre grupuri. Pentru analiza diferen elor dintre grupuri
se folosesc o serie de tehnici parametrice care permit evaluarea efectelor unei variabile
independente (manipulate de cercetator) sau ale unei variabile categoriale (vârsta, sex,
etc) asupra unei variabile dependente când se lucreaz cu una sau dou grupe de
subiec i [1].
Exemple de tehnici de compara ie între grupuri:
- Tehnicile t i z pentru un e antion
- Testele t i z pentru dou e antioane independente
- Testele t i z pentru e antioane dependente .

Tehnicile t i z pentru un e antion - analizeaz dac un e antion de subiec i difer


de o popula ie mai mare.
Pentru a se utiliza testul z trebuie cunoscut abaterea standard a variabilei dependente la
nivelul popula iei i num rul de subiec i din e antionul comparativ s fie peste 30 de
subiec i. Dac una din condi ii nu este îndeplinit , se utilizeaz testul t.
Testul t - valideaz sau infirm ipoteza nul potrivit c reia, nu exist nici o diferen
între media ob inut pe e antionul de subiec i i media ob inut pe popula ia din care a
fost extras e antionul.
Se aplic în cazul unei e antion ri simple aleatoare, pentru date m surate pe scala de
interval sau raport iar rezultatele variabilei dependente trebuie s fie normal distribuite (în

9
cazul în care n este mai mic de 30, se urm re te forma distribu iei datelor, astfel încât
indicatorii de oblicitate (skewness) i de boltire (kurtosis) s fie cât mai apropia i de zero
(maxim doi)}[1].
Se poate alege varianta de lucru pentru testul t: respectiv testul t unilateral sau testul t
bilateral. Dac exist supozi ia c datorit unor caracteristici speciale media e antionului
comparativ este mai mare sau mai mic decât media popula iei din care face parte
e antionul se utilizeaz valorile testului t unilateral din tabel.
Dac exist supozi ia c media e antionului comparativ i media popula iei din care face
parte e antionul difer semnificativ, f r a putea specifica dinainte care este mai mare sau
mai mic se utilizeaz valorile testului t bilateral din tabelul lui t. Pragul de semnifica ie p
ales va fi maxim 0,05.
Pentru a determina cât de mare este diferen a (semnificativ statistic) ob inut se
calculeaz m rimea efectului propus de Cohen i notat cu d. Aceasta este foarte
important pentru determinarea puterii experimentului i pentru calcularea m rimii
e antionului necesar pentru a da credibilitate cercet rii efectuate.
Interpretarea valorii d (m rimea efectului)
Prin conven ie: d = 0,20 se ob ine un efect mic, d = 0,50 se ob ine un efect mediu, d =
0,80 se ob ine un efect mare .
Testul z utilizat în cazul în care cele dou condi ii de mai sus sunt îndeplinite se
interpreteaz astfel: valorea ob inut cu testul z se raporteaz la valorile standardizate ale
lui z. In cazul testului z bilateral, pentru a putea admite sau respinge ipoteza nul ,
valoarea ob inut se compar cu dou valori standardizate: z = 1,96 pentru un p .05 i
z = 2,58 pentru un p .01 iar în cazul testului z unilateral valoarea ob inut se compar
cu valorile standardizate z = 1,65 pentru un p .05 si z = 2,33 pentru un p .01 .
Interpretarea m rimii efectului d se face la fel ca la testul t..

Tehnicile t i z pentru dou e antioane independente


Alegerea tipului de test (t sau z) în cazul a dou e antioane dependente sau independente,
se face în primul rând în func ie de volumul e antionului :
- Fie n1 i n2 num rul subiec ilor din cele dou e antioane. Dac n1 30 i n2 30 se
aplic testul t.
- Dac n1 30 i n2 30 se aplic testul z.
In cazul a dou e antioane independente criteriul hot râtor în alegerea tipului de test z sau
t sunt: cunoa terea abaterii standard a celor dou e antioane i a volumului acestora.
Testul t. Se aplic în cazul unei e antion ri simple aleatoare, pentru date m surate pe
scala de interval sau raport. Rezultatele variabilei dependente trebuie sp fie normal
distribuite. Grupurile sp fie independente li varianta s fie omogen (grupurile trebuie s
provin din e antioane cu dispersii egale (raportul lor s a fie cât mai apropape de unu))
[1].
Dup calcularea i analizarea lui t, afl m doar dac ipoteza nul este respins i dac
exist sau nu o diferen semnificativ între mediile celor dou grupe de subiec ti. Se
calculeaz apoi m rimea efectului d pentru a vedea care este efectul variabilei
independente în determinarea diferen ei dintre medii.
Testul z. Dac n1 30 i n2 30 i cele dou e antioane sunt independente se aplic
testul z.
Ca i în cazul testului z anterior primul pas este determinarea lui z. In cazul testului z
bilateral, pentru a putea admite sau respinge ipoteza nul , valoarea ob inut se compar
cu dou valori standardizate: z = 1,96 pentru un p .05 si z = 2,58 pentru un p .01

10
iar în cazul testului z unilateral valoarea ob inut se compar cu valorile standardizate z =
1,65 pentru un p .05 si z = 2,33 pentru un p .01 .
Interpretarea m rimii efectului d se face la fel ca la testul t..
Observa ie. In ultimii ani exist tendin a de a înlocui testul z cu testul t. Astfel,
programe de statistica computerizate precum SPSS au renun at la testul z în favoarea
testului t care este folosit i în cazul e antioanelor mai mari de 30 de subiec i fiecare.

Tehnicile t i z pentru doua e antioane dependente


Pentru cazul a dou e antioane dependente exist trei situa ii în care se aplic testele de
compara ie t i z: perechile naturale (exist în mod natural), perechile artificiale (sunt
realizate de c tre experimentator în scopul egaliz rii grupelor de subiec i) i efectuarea de
m sur tori repetate (un grup de subiec i este testat de dou ori: înainte i dup
introducerea variabilei independente).
Testul t (n1 30 i n2 30) Se aplic în cazul unei e antion ri simple aleatoare, pentru
date m surate pe scala de interval sau raport. Rezultatele variabilei dependente trebuie s
fie normal distribuite i diferen ele ob inute între scorurile ob inute la pre test i post test
s fie normale. Aceasta se determin analizând indicatorii de oblicitate i de boltire [1].
Se calculeaz t i se compar valoarea ob inut cu valoarea dat în tabelul lui t. Se
calculeaz i în cazul testului t dependent m rimea efectului. Interpretare lui d se face
analog ca la celelalte teste t. Efectul variabilei independente asupra celei dependente se
calculeaza numai în situatiile în care testul t a fost semnificativ, iar ipoteza nul a fost
respins .
Testul z - poate fi utilizat în cazul e antioanelor mai mari de 30 de subiec i fiecare.
Interpretarea rezultatului se face la fel ca la celelalte teste z.
Observa ia de la testul z pentru e antioane independente r mâne valabil (vezi
SPSS).

TEHNICILE ANOVA

Se utilizeaz în cazul lucrului cu mai mult de dou grupe pentru a determina diferen ele
între grupe. Pentru a cre te siguran a rela iei dintre o variabil independent i una
dependent se recomand cre terea num rului de grupe experimentale.
Tehnicile ANOVA au fost dezvoltate de R. A. Fisher:
ANOVA simpl ;
ANOVA cu m sur tori repetate;
Tipul de eroare de ordinul I este determinat de formula: 1 (1 )c
unde: este nivelul de încredere pentru fiecare test t efectuat iar c este num rul de teste t
ce trebuie efectuate.
Nivelul de încredere maxim pân la care putem respinge o ipotez nula este 0,05.
ANOVA simpl sau analiza dispersiei dependente - lucreaz cu o singur variabil
independenta care are mai mult de dou trepte i o singur variabil dependent .
Pentru a putea lucra cu aceasta tehnic optim trebuie ca: e antionul s se selecteze
randomizat din popula ie sau m car s se randomizeze subiec ii din grupele
experimentale, variabila dependent trebuie s fie distribuit normal (se poate lucra si
f r îndeplinirea acestei condi ii f r a fi foarte tare afectat eroarea de tip), iar dispersia
subiec ilor împ r i i pe grupe de tratament diferite s fie egal ..
Tehnica este echivalentul testului t independent. Cu aceast tehnic se poate evalua
ipoteza nul între mediile a dou sau mai multe serii de date cu restric ia ca acestea s fie
11
trepte ale aceleia i variabile independente i se poate face compara ia simultan a trei sau
mai multe grupe men inând nivelul la valoarea dorit , de maxim 0,05.
Totalul dispersiei în ANOVA simpl provine din dispersia intragrup i intergrup:
Dispersia datorat e antion rii aleatoare se nume te i dispersia erorii
Dispersia datorata variabilei independente se nume te i dispersie adev rat .
Simbolul rezultatului ob inut prin ANOVA este F
Dac F ob inut este mai mare decât F tabelar rezult c raportul F ob inut este
semnificativ statistic, ipoteza nul este respins , deci exist diferen e între mediile celor n
grupe.
Dac ipoteza nul este respins rezult doar c cele n grupe nu sunt egale în ce priveste
media rezultatelor variabilei dependente. Pentru a afla cum difer cele n grupe între ele se
utilizeaz compara ii post hoc (efectuate dup g sirea unui raport F semnificativ).
De asemenea, pot fi utilizate i compara ii planificate pentru a testa diferen ele între
grupele de subiec i, înainte de efectuarea experimentului.
Pentru testul ANOVA simpl nu este obligatoriu ca num rul de subiec ti din grupe s fie
egal dac dispersia în grupe este omogen .
M rimea asocierii între variabila independent i cea dependent în cazul ANOVA se
m soar cu - omogenitatea dispersiei care este o m sura asem n toare lui r2. M sura
arat propor ia din dispersia variabilei dependente care poate fi pus pe seama varia iei
variabilei independente i se aplic numai dac : variabila independent este împ r it în
trepte cât mai egale posibil .
In tehnicile ANOVA m rimea efectului se noteaz cu f i se interpreteaz conform
propunerii lui Cohen astfel:
f =.10 efect slab, f =.25 efect mediu, f =.40 efect mare.
ANOVA cu m suratori repetate - este în coresponden cu testul t dependent.
Prin m suratori repetate se în elege evaluarea unui individ de dou sau mai multe ori în
ce prive te variabila dependent .
Pentru a putea lucra cu aceast tehnic optim trebuie ca: e antionul s se selecteze
randomizat din populatie sau macar s se randomizeaza subiec ii din grupele
experimentale, variabila dependent trebuie s fie distribuit normal (se poate lucra i
f r indeplinirea acestei condi ii f r a fi foarte tare afectat eroarea de tip), iar dispersia
subiec ilor împ r i i pe grupe de tratament diferite s fie egal . La aceste condi ii care
erau impuse i pentru ANOVA simpl se adaug una specific ANOVA cu m suratori
repetate: coeficien ii de corela ie între diferitele evalu ri repetate s fie aproximativ egali.
Totalul dispersiei în ANOVA cu m sur tori repetate provine din dispersia dintre indivizi;
dispersia datorat variabilei independente; i dispersia rezidual .
Se calculeaza F i se compar cu valoarea din tabelul lui F. Dac valoarea ob inut F este
mai mare decât cea din tabelul lui F la un prag de .05, ipoteza nul este respins , i se
trage concluzia c exist diferen e semnificative în ce prive te mediile celor n serii de
evalu ri.
Un alt test ANOVA este ANOVA factorial. Acesta studiaz influen a simultan a dou
sau mai multe variabile independente asupra unei variabile dependente
Raporturile F stabilite în cazurile ANOVA simpl , ANOVA cu m sur tori repetate i
ANOVA factorial se numesc i teste omnibus.

TEHNICI DE COMPARA II MULTIPLE


S-au analizat mai sus diferite tipuri de analiz dispersional (ANOVA) i s-a v zut cum se
respinge ipoteza nul . Dup respingerea acestei ipoteze trebuie v zut care combina ii de
12
medii difer prin aplicarea unor proceduri care men in nivelul la nivelul ini ial sau aproape
de acesta. Aceste proceduri poart numele de tehnici de compara ii multiple i pot fi:
1. compara ii post-hoc (realizate dup calcularea lui F din ANOVA)
testul Tukey (HSD) i testul Newman-Keuls pentru grupe egale i compara ii pereche
(câte dou medii comparate);
testul Tukey-Kramer pentru grupe inegale i compara ii pereche;
testul Scheffé al contrastelor complexe (pot fi comparate combina ii de medii,
dep ind nivelul contrastului dintre dou medii).
2. compara ii a priori (tehnici alternative ANOVA care pornesc de la alte ipoteze nule i
care sunt planificate înainte de desf urarea experimentului pe baze ra ionale)
metoda contrastelor ortogonale
metoda analizei direc iei.
In cazul ANOVA simpl i ANOVA cu m suratori repetate se pot aplica o serie de
proceduri de compara ie multipl post hoc:
Metoda Tukey - simbolizat HSD, cel mai utilizat procedeu de compara ie multipl ,
este denumit i testul diferen ei semnificative oneste. Metoda realizeaz compara ii între
toate perechile de medii în timp ce men ine eroarea experimentului la valorile alfa
stabilite.
Testul Newman-Keuls - are la baz ideile testului Tukey, îns presupune o analiz
mai complex .
Metoda Newman-Keuls are avantajul c este mai puternic , deoarece luceraz cu mai
multe diferen e între medii decât metoda Tukey. Metoda Tukey p streaz îns constant
eroarea experimentului la nivelul ini ial în compara ie cu metoda Newman-Keuls care
m re te riscul de comitere a erorii de tip I, deoarece cre te nivelul lui alfa la nivelul întregului
experiment. Dac se ia în calcul faptul c nivelul de eroare a unui experiment cre te o
dat cu num rul de grupe ale acestuia rezult c situa iile experimentale cu trei grupe sunt
adecvate aplic rii atât a metodei Tukey cât i a metodei Newman-Keuls. În schimb
situa iile cu patru sau mai multe grupe necesit aplicarea metodei Tukey [1].
Metoda Tukey-Kramer se folose te pentru efectuarea de compara ii multiple în
cazul grupelor inegale.
Metoda Scheffé se aplic în cazul experimentelor în care cercet torul este interesat
de testarea unor ipoteze mai complexe decât simpla diferen dintre medii.
Cu ajutorul acestei metode se pot testa o mul ime de ipoteze cu condi a ca suma
coeficien ilor mediilor s fie zero.
Metoda Scheffé este procedeul post-hoc cel mai conservator (sesizeaz cele mai pu ine
diferen e), îns este foarte util în situatiile în care se dore te realizarea de compara ii
complexe ce dep esc nivelul perechilor de medii.

TESTE NEPARAMETRICE DE COMPARA IE ÎNTRE GRUPURI


Tehnicile neparametrice se mai numesc i tehnici statistice independente de distribu ia
datelor.
Testele pot prelucra atât date calitative cât i date cantitative. Dezavantajul lor este
puterea mai mic de a detecta falsitatea unei ipoteze nule.
Exemple de tehnici neparametrice:
2
- tehnica (hi patrat);
- testul U a lui Mann-Whitney (echivalentul testului parametric t independent);

13
- testul Wilcoxon al rangurilor pereche (echivalent ANOVA cu m sur tori repetate ori
t dependent);
- testul ANOVA Kruskal-Wallis al rangurilor (echivalent ANOVA simpl , îns datele
sunt convertite în ranguri);
- testul Friedman ANOVA biunivoc al rangurilor (echivalent ANOVA m sur tori
repetate).

2
Tehnica este un test statistic asupra semnifica iei discrepan ei dintre rezultatele
observate celei a teptate. Se utilizeaz atunci când avem de analizat date nominale
(calitative).
Gradele de libertate se stabilesc în func ie de num rul de alternative existente minus unu.
Frecven a teoretic se stabile te împ r ind num rul total de date la num rul de alternative
(dac exist informa ii prealabile care s ateste o anumit distribu ie a datelor atunci
principiul amintit anterior cade).
2 2
Valoarea lui se compar cu valoarea tabelar a lui .
In cazul tabelelor de contingen frecven a teoretic se calculeaza în alt mod.
2
Daca se aplic unui tabel de contingen atunci num rul gradelor de libertate pentru
tabel este (r-1) (c-1), unde r este num rul de linii iar c num rul de coloane .
2 2
Dac observat este mai mare decât teoretic ipoteza nul poate fi respins a ,
valoarea ob inut fiind semnificativ .
2
Restric ii de utlizare a testului [1]:
Observa iile trebuie s fie independente i categoriile formate trebuie s se exclud
reciproc (eliminarea r spunsurilor multiple i alegerea unui singur r spuns la întrebare).
Frecven a teoretic pentru orice c su nu trebuie s fie mai mic de unu.
Nu mai mult de 20% din c su ele tabelului de contingen trebuie s aib valorile
teoretice ale frecven elor mai mici de cinci. Astfel SPSS anun când aceste valori nu
sunt atinse..
Pentru tabelele de contingen de tip 2 x 2 se aplic corectia Yates pentru continuitate.
In tabelele de contingen de tip 2 x 2 num rul total (N) trebuie s fie cel pu in 20;
2
Testul de omogenitate arat dac exist diferen e semnificative între distribu ia
teoretic (a teptat ) i distribu ia real (observat ) ob inut ..
Testul U al lui Mann-Whitney - este analog testului parametric t independent, fiind
una din cele mai puternice probe neparametrice.
Este utilizat pentru compara ia a dou grupe independente de date ordinale (ordonate pe
ranguri). Poate fi utilizat atât cu e antioane mici de subiec i, cât i cu e antioane mari.
Necesit numai m sur tori de tip rang . Acest test opereaz cu numere ordinale.
Testul Wilcoxon al rangurilor pereche se aplic pentru studii comparative între
dou grupe dependente (corelate) care nu îndeplinesc condi iile parametrice. Are acelea i
principii cu testul t dependent. Testul determin m rimea diferen elor dintre rezultate
(spre exemplu înainte i dup o ac iune), ordonate dupa rang.
Testul ANOVA Kruskal-Wallis al rangurilor se aplic pentru date ordinale, în
cazul când exist mai mult de dou grupe independente. Este comparabil cu ANOVA
simpl . Datele sunt convertite în ranguri.
Cele dou teste ANOVA Kruskal-Wallis i testul U a lui Mann-Whitney sunt tehnici ce
utilizeaz date ordinale, existând posibilitatea unor ranguri egale. Dac num rul
rangurilor egale este peste 30% nu este indicat utilizarea lor.

14
Testul Friedman ANOVA biunivoc al rangurilor - este analog tehnicii ANOVA
cu m sur tori repetate. Se aplic pentru date ordinale, pentru mai mult de dou grupe
dependente. Rezultatele sunt ordonate pe ranguri i se utilizeaz hi p trat ca test de
semnifica ie.

ANALIZA FACTORIAL

Cu ajutorul analizei factoriale se determin variabilele care au cât mai mult varia ie
(informa ie) comun , astfel încât, prin restrangerea acestea s piard cât mai pu in
informa ie util . Ea este utilizat pentru: detectarea structurii rela iilor dintre variabile
(clasificarea variabilelor) i reducerea num rului variabilelor la un num r mic de factori,
care s fac o descriere general a realit ii analizate.
Exemple de metode de analiz factorial :
- Analiza componentelor principale a lui Hotteling care face analiza varian ei totale
dintre variabile. In solu ia generat apar atâ ia factori câte variabile sunt disponibile.
Metoda ofer o solu ie unic , iar datele ini iale pot fi reconstruite din rezultatele
ob inute.
- Analiza factorilor comuni a lui Thurstone estimeaz varian ia comun la nivelul
variabilelor originale. Metoda produce mai pu ini factori decât num rul variabilelor
existente.
Datele ce intr în analiza factoriala trebuie s fie distribuite normal i s aib valorile
m surate pe scal parametric .

BIBLIOGRAFIE
[1] http://statisticasociala.tripod.com
[2] NOVAC, ANDREI, Statistic social aplicat , Ed. Hyperion,XXI, 1995
[3] NOVAC, ANDREI, Metode statistice în pedagogie i psihologie, Ed. didactic i
pedagogic , Bucure ti 1977
[4] SAVA, FLORIN , Analiza datelor în cercetarea psihologic , metode statistice
complementare, Cluj Napoca: Ed. ASCR, 2004
[5] Rotariu Traian, Badescu Gabriel, Culic Irina, Mezei Elemer, Muresan Cornelia,
Metode statistice aplicate în tiin ele sociale, Ed. Polirom, 2000
[6] Spircu Liliana, Calciu Mihai, Spircu Tiberiu, Analiza datelor de marcheting, Ed.
ALL, 1994

15

S-ar putea să vă placă și