Documente Academic
Documente Profesional
Documente Cultură
Ce este statistica?
1
manevrată astfel încât fiecare subiect este testat (evaluat) la fiecare nivel al
variabilei. Mai este denumită variabilă cu măsurători repetate, tocmai din
cauză că acelaşi subiect este supus unor evaluări repetate (la nivele diferite
ale factorului).
• Variabilă nominală
• Variabilă ordinală
Principalele tipuri de variații(oscilație valorică a unei variabile)
• Variații: interindividuale și intra-individuale
• Variații intra-grup și inter-grup
• Variații: previzibile și imprevizibile
Scala nominală
Scala ordinală
Scala de interval
Scala de raport
Scalele sunt enumerate în ordinea complexității și puterii lor de măsurare. Scala
nominală și cea ordinală poartă denumirea de scale slabe, pe când scala de interval și
cea de raport se mai numesc și scale puternice. Există și alte tipuri de scale care sunt
utilizate foarte rr în domeniul nostru de interes: scala de log-interval, scala absolută,
etc..
2
stil, specie biologică şi formă. Dintre indicatorii de nivel sau de
tendinţă centrală are sens valoarea mod, nu acela și lucru putându-se
spune despre medie şi mediana
În disciplina taxonomiei sunt ilustrate cel mai frecvent scalele
nominale prin tot felul de clasificări din varii domenii(clasificarea
bolilor, clasificarea profesiunilor, clasificarea tipurilor psihologice,
etc..) Pentru a fi recunoscută ca făcând parte din clasa nominală, o
variabil trebuie să aibă cel puțin două modalităţi sau două categorii.
Cel mai la îndemână exemplu este variabila gen care are două
modalităţi, masculin şi feminin, notate cu M şi F . Important este ca în
dihotomie să fie absentă o relaţie de ordine. Pentru modalitate se mai
foloseşte denumirea de categorie sau calitate, motiv pentru care scala
nominală mai este denumită scală categorială sau scală calitativă. Se
mai afirmă că o variabilă calitativă are mai multe nivele, însă utilizarea
termenului de nivel este mai puţin recomandată, acesta fiind mai
indicat pentru a indica variantele de variație ale unei scale ordinale.
Locul modalităţilor într-o scală nominală poate fi continuu schimbat
fără să se reproșeze o procedură greşită. Nici o modalitate, indiferent
cum este codată, nu este considerată mai mare sau mai importantă în
comparaţie cu alta, deci nu există o ordine de prezentare a
modalităţilor. Deci, din punct de vedere formal, nu există o ordine și
nici o distanță între masculin şi feminin. Scala nominal înseamnă a
plasa date în categorii fără să ținem cont de nici o structură. Un
exemplu fizical de scală nominală este constituit din termenii prin
care noi desemnăm culorile. Spectrul care stă la baza lor este ordonat,
dar numele atribuite nu. Prezenţa unui mare număr de modalităţi la o
scală nominală determina practica de a condensa modalităţile cu
frecvenţe foarte mici în categoria ş.a.(şi altele). Nu se permite de obicei
ca ş.a. să depăşească ă 5%.
3
mai des întâlnită în rândul celor cu preocupări în această direcţie este
cea a convergenţei ascensionale(Chevalier şi Gheerbrant, 2009,p.732)
Putem să utiliză şi termenii de modalitate sau categorie pentru a
desemna o anumită gradaţie a scalei, însă cel de de nivel este cel mai
adecvat. Pentru caracteristici cu demnitate scalară ordinal[, iau
naştere ordini de rang de felul „mai mare“, „mai mic“, „mai mult“, „mai
puţin“, „mai puternic“, „mai slab“ între fiecare din diversele valori ale
caracteristicii. Exemplu x > y > z). Faptul important este că nu se pot
face afirmaţii despre distanţa care separă două nivele diferite; putem
deci să spunem că un nivcel este mai mare sau mai mic decât altul,
dar nu putem preciza cu cât Notele şcolare constituie un exemplu de
scală ordinală O formă specială a scalei ordinale este scala de rang. În
aceat caz poate să fie acordată o singură valoare. Unui anumit nivel
Exemple adecvate sunt cele din competiţiile sportive(locul 1, locul 2,
locul 3, ş.a.m.d) cele care rezultă compararea diferitelor performanţe
din variii domenii. . Un sistem ordonat în domeniul fizic sau
psihologic poate fi considerat ca sistemul numerelor, ca o realizare
axiomatică definind ordinea. Codificarea nivelelor nu exclude forma
alfabetică sau de altă natură, dar în acest caz trebuie să se precizeze
expres că b>a, c>b, d>c ş.a.m.d.
Recodificările nivelelor sunt permise dacă respectă ordinea ierarhică.
Demn de precizat este şi faptul că în cadrul unei distribuţii de valori
scalate ordinal noţiunea de formă a distribuţiei capătă sens.
Exemplifică prin forma cea mai cunoscută şi mai frecvent întâlnită,
aşa-numita curbă a lui Gauss
Deşi este foarte popular, modelul de repartiţie Gauss-Laplace, la care
vom face mai multe referinţe pe parcursul acestei lucrări, este unul
din modelele existente,cele mai frecvente fiind modelul binomial,
modelul Student şi modelul chi pătrat. Foarte rar datele empirice
rezultate dintr-o cercetare se „mulează” pe forma distribuţiei normale.
De la acest model avem mai multe feluri de deviaţii, dintre care
exemplificăm asimetriile pozitive şi negative. Este foarte important să
nu încercăm doar o singură explicaţie pentru o anumită formă de
asimetrie de la modelul normal de distribuţie. Asimetria pozitivă
presupune „îngrămădirea” valorilor spre zona de din stânga, cea a
performanţelor slabe si modeste, dacă ne-am raporta la rezultatele
unui test de aptitudini. Dacă nu cunoaştem contextul în care s-a făcut
o anumită cercetare, am putea înclina să adoptăm ceam mai la
îndemână explicaţie, anume aceea că subiectii sunt în mare majoritate
slabi. În schimb, forma distribuţiei de acest fel poate fi consecinţa
utilizării unui test psihologic conceput pentru supradotaţi la subiecţi
normali. Asimetria de stânga sau asimetria negativă presupune
„îngrămădirea” subiecţilor în zona valorilor înalte, situaţie care nu
certifică valoarea deosebită a subiecţilor, ci utlizarea unui test
4
psihologic de dificultate scăzută(care se poate afla în perioada de
verificare
Se impune o precizare în legătură cu utilizarea datelor
dihotomice sau dihotomizate în scala ordinală, spre deosebire de scala
nominală. Specifice scale nominale sunt dihotomii precum „bolnav”
contra „sănătos” când măsurăm sănătatea, „vinovat” contra
„nevinovat” când apreciem judecata unei curţi cu juri,
„adevărat”/”fals” când măsurăm valoarea de adevăr şi, pe de altă parte
date nedihotomice consistând într-un spectru de valori, precum
„complet de acord”, „ mai degrabă de acord” ….”dezacord total”, atunci
când întocmim dispozitive de răspuns pentru întrebările chestionarelor
de opinii. În 1946 Stevens observă că măsurarea psihologică, precum
măsurarea opiniilor, este operată prin scala ordinală.; deci media şi
abatareas standard sunt nonvalide, dar ele pot fi folosite pentru a
neface o idee pentru a vedea cum să operaţionalizăm variabilele
folosite în chestionare. Cele mai multe date psihologice colectate prin
instrumente psihometrice şi teste măsoară aptitudini cognitive şi alte
aptitudini., sunt ordinale. Cu toate acestea anumiţi teoreticieni au
argumentat că ele pot fi tratate ca scale de interval sau de raport.
Există o evidenţă prima facie(la o primă apreciere, la o primă privire,
prima abordare) sugerează că astfel de atribute nu sunt nimic mai
mult decât ordinale. IQ+urile reflectă o scală ordinală, în care toate
scorurile au semnificaţie doar pentru comparare. Nu există 0 absolut.
Scala de interval
Specific: în cadrul unor valori care îndeplinesc exigenţele scale de interval,
variantele de variație au caracteristica de a fi ordonate, putându-se preciza în
plus că una din ele este mai mare decât alta, dar şi cu cât este mai mare decât
alta. Dacă avem variantele de variație 10 şi 4, putem spune că 10 este mai mare
decât 4, că 10 este mai mare cu 6 decât 4, dar nu putem spune că 10 este de 2,5
ori mai mare decât 4. Deci, diferența între ele nu este relevantă. Variabilele de
interval sunt calificate drept variabile cantitative sau numerice. Prezența
valorii 0 este arbitrară. Dacă analizați temperaturile în grade Fahrenheit, să
zicem 20-40 grade și 40-60 grade, există o ordine și o diferența semnificativă
dintre variabile, dar prezența zero este arbitrară. Cum este zero arbitrar? Zero
grade pe scara Fahrenheit (și Celsius) nu este o constantă universală, ci, în
schimb, atribuită pentru a reprezenta temperatura la care saramura formată
din părți egale de gheață, apă și sare îngheață. Este ușor de reținut obiectivul
acestei scale, deoarece „interval” se referă la intervalul (sau distanța) dintre
două variabile. O altă modalitate de a ne aminti această scală este că datele
dintre două variabile pot fi adăugate sau scăzute, dar nu multiplicate sau
împărțite. Variantele de variație ale unei scale de interval sunt legate printr-o
relaţie de ordine şi permit toate operaţiile aritmetice, iar distanţele între două
variante de variație ordonate sunt egale
5
◦ Scorurile de memorizare a unei liste de cuvinte sau
cifre;
◦ Cel mai frecvent aceste scoruri sunt constituite după
schema „totul sau nimic”.(reuşită/eşec la itemi,
memorizare/ lipsa memorizare a unui cuvânt. Se
observă că nu se pot obţine rezultate decât sub forma
întreagă(subiectul nu poate să aibă un semi-
comportament sau un sfert de comportament de acel
gen).
◦ Cercetări care fac apel la liste de
itemi(comportamente, trăsături de personalitate)
pentru a produce o evaluare permiţând, dincolo de
analiza item cu item, de a ajunge la scoruri care au
statut de măsură de interval(număr total de trăsături
selecţionate, număr de trăsături pozitive, număr de
trăsături negative)
◦ Parametri de ordin fiziologic, cum sunt bătăile inimii
în studiu asupra emoţiilor;
Exemple de scale de interval continue:
◦ Timpul scurs pentru a realiza o probă (ex. DM-ul lui
Jean MauriceLahy) şi timpul necesar pentru a detecta
un stimul(timpul de reacţie verbală, timpul de
identificare);
◦ Aprecierea vitezei în cursul unui studiu de etologie
referitor la comportamentele de fugă;
◦ Distanţele(studii asupra distanţelor de intimitate, de
comunicare);
◦ Măsurarea anumitor parametri în cazul studiilor
psiho-farmacologice (concentrarea neuro-
mediatorilor) sau psihofiziologice(analiza anumitor
unde cerebrale).
Fiind vorba de o scală cantitativă se face distincţia între variabile discontinue
sau discrete şi variabile continue.
În privinţa indicatorilor sunt premise şi posedă sens indicatorii de nivel
valoare mod, mediana şi media aritmetică, în timp ce indicatorii de împrăşţiere cuprind
pe cei din scalele ierarhic inferioare, plus amplitudinea varianţa şi abatarea standard.
Se pot calcula indicatorii Sqweness şi Kurtosis. Operaţiile aritmetice care pot fi aplicate
asupra valorilor aparţinând acestui tip de scală: adunare, scădere, diviziune şi
multiplicare. Pe date cu valoare scalar de interval se poate constitui un ansamblu de
tehnici de modelare şi tehnici multivariate avansate.
Exemplu: variabila „clase de vârstă” poate fi exprimată prin intervale egale:
◦ 19 - 23 ani;
◦ 24 – 28 ani;
◦ 29 – 33 ani;
◦ 34 – 38 ani
◦ Diferenţa dintre 19 -23 este aceiaşi ca diferenţa dintre 34 – 38
Scala de raport
Scara de raport are o valoare naturală absolută zero. Are ordine și valoare la fel
de distanțată între unități. Caracteristica punctului zero face relevant sau semnificativ
să se spună „un obiect are de două ori lungimea celuilalt” sau „este de două ori mai
lung”.
Scara de raport nu are un număr negativ, spre deosebire de scala de intervale
datorită caracteristicii punctului zero. Pentru a măsura orice obiect pe această scală,
cercetătorii trebuie mai întâi să vadă dacă obiectul îndeplinește toate criteriile pentru
scala de intervale plus o caracteristică de zero absolut.
6
Scara de raport oferă posibilități unice pentru analiza statistică. În această scară,
variabilele pot fi adăugate, scăzute, multiplicate și împărțite în mod sistematic
(raport). Toate analizele statistice, inclusiv media, modul, mediana pot fi calculate
folosind aceasta. De asemenea, chi-pătratul poate fi calculat pe această variabilă de
scară.
Scara de raport are unități care au mai multe proprietăți unice și utile. Unul
dintre ele este că permit conversia unității.
7
A= X -X
max min
A=X -X +1.
max min
A = 81-22+1= 60.
8
1 2 3 4 5 6
1 21-27 24 5 5,43 5
2 28-34 31 13 14,13 18
3 35-41 38 12 13,04 30
4 42-48 45 17 18,48 47
5 49-55 52 10 10,87 57
6 56-62 59 16 17,39 73
7 63-69 66 9 9,78 82
8 70-76 73 5 5,43 87
9 77-83 80 5 5,43 92
Total N=92
9
10
Exemplificare protocoale de înregistrare a datelor
11
enciclopedie de statistică, Editura științifică și
enciclopedică, București, 1985, p. 81.
• În cercetarea psihologică se utilizează un număr restrâns de
procedee de reprezentare grafică comparativ cu ansamblul
investigațiilor statistice.
12
• Indicator: Indicatorul statistic este expresia numerică a unui fenomen,
proces sau a unei categorii economico-sociale, definite în timp, spaţiu şi
structură organizatorică. El este rezultatul procesului investigării
sistematice și are o formulă de calcul şi o formă specifică de exprimare
• Indice: număr caracteristic obţinut ca raport între mărimea unui
indicator statistic la momentul t(mărime curentă sau de comparat) şi
mărimea lui la momentul 0(mărime de bază sau de referinţă). Se exprimă
obişnuit în procente. Se foloseşte şi cu accepţiunea de indicator. (Vladimir
Trebici, Mică Enciclopedie de demografie, Editura ştiinţifică şi
enciclopedică, Bucureşti, 1975, p. 54 -55)
13
• O medie trebuie să poată fi rapid studiată cu ajutorul calculului
algebric
14
Valoarea mod
• Este valoarea sau modalitatea care revine cel mai frecvent într-o distribuție
• Exemplu: 2,4,6,1,6.6,5,6, 6,3,4,8,9,6,6, Valoarea mod este valoarea 6
• Există:
• distribuții unimodale: ex. 5, 5, 7 ,6, 5, 5, 5, 7, 9, 2, 1, 5, 5.
Valoarea 5
• Distribuții bimodale: 5, 9, 7, 5, 4, 3, 2, 6, 6, 9, 9, 10, 5 .
Valorile 5 și 9
• Distribuții multimodale, în cazul în care există mai mult de
două valori mod.
• Valoarea mod nu există în mod obligatoriu. Ex. 3, 4, 5, 6 , 7 ,9, 10, 1, 14.
• Valoarea mod nu este cea mai mare valoare.
• Valoarea mod se referă atât la valori numerice cât și la caracteristici sau
modalități.
Mediana
• Indicator de nivel al unei distribuţii care are particularitatea de a fi
împărţi valorile ordonate în două părţi egale. Mediana are teoretic
50% din valori mai mici decât ea şi 50% din valori mai mari decât
ea.
• Înaintea operaţiei de stabilire a medianei, datele neorganizate ale
unei distribuţii se ordonează crescător sau descrescător
• Exemplu: date neordonate cu volum impar: 5, 12,3, 9,14,17,1, 13,
8,6, 4,
• Ordonare:1, 3, 4,5,6,8,9,12,13,14,17.
• Exemplu de date cu volum par: 2,5,3,7.11,14.16,4, 6,8,13,17, 9
• Ordonare: 2, 3,4,5,6,7,8,9,11,13,16, 17
Volum impar V
Ordonare Rang Mediana Ordonare Ra
1 1 2 1
Me X N 1
3 2 ( ) 3 2
2
4 3 4 3
5 4 5 4
6 5 6 5
8 Rangul 6 7 6
9 7 8 7
15
Me X N N 2
( ; )
2 2
12 8 78 9 8
Me 7,5
2
13 9 11 9
14 10 13 10
17 11 16 11
Indicatori de împrășiere
Abaterea medie. Este un indicator de împrăștiere care reprezintă media abaterilor de
la medie(luate ăn valoare absolută)
16
AM
XX
N Formulă pentru date
neorganizate
AM
f *XX
N Formulă pentru date organizate
pe variante de variație. X reprezintă o valoare brută, X media distribuției de valori și f
frecvența unei variante de variație. Cu AM se notează abaterea medie
X x │x│
4 -6 6
7 -3 3
5 -5 5
4 -6 6
9 -1 1
13 3 3
10 0 0
12 2 2
11 1 1
17 7 7
17
13 3 3
15 5 5
ΣX= Σ│x│=42
120
AM
x
42
3,5
N 12
Exemplu pentru calculul abaterii medii pentru date organizate pe variante de variație
X f fX x │x│ f│x
18
23 4 92 9.37 9.37 37.
Σf =131 ΣfX=1786 Σf│x│=
X
f X
1786
13,63
N 131
X
f X
1786
13,63
N 131
19
Abaterea standard este o mărime ce rezultă din extragerea rădăcinii pătrate
din media abaterilor pătratice de la medie. Formula pentru date neorganizate
este următoarea:
s
x 2
s 2 x 2
N
Tabelul care cuprinde rubricile necesare calculării varianței și abaterii
standard(date negrupate) este următorul
1 12 -5 25
2 22 5 25
3 20 3 9
4 15 -2 4
5 16 -1 1
6 19 2 4
7 18 1 1
8 17 0 0
9 14 -3 9
10 21 4 16
11 13 -4 16
20
s2
x 2
110
10 s
x 2
110
10 3,16
N 11 N 11
Formula de calcul a varianţei şi abaterii standard - date grupate pe
variante de variaţie
s 2
f *x 2
s
f *x 2
N
Tabel cuprinzând rubricile necesare calculării varianței și abaterii
standard pentru date grupate pe variante de variație
Nr,crt. X f f*X x 2
x
1 8 3 24 - 5,85 34,22
2 9 7 63 - 4,85 23.52
8 19 5 95 5,15 26,52
21
9 21 2 42 7,15 51,12
Σf*X=1150
X
f *X
1150
13,85
N 83
s 2
f *x 2
742,06
8,90 s
f *x 2
8,90 2,98
N 83 N
22
318 6
2
23
24