Sunteți pe pagina 1din 24

Note de curs – Statistică 2022

Ce este statistica?

Statistica este ştiinţa care studiază regularităţile care se produc în fenomenele


economice şi sociale, evidenţiază gradul de influenţă a factorilor şi mutaţiile
structurale din interiorul domeniului studiat şi, de asemenea, permite efectuarea de
prognoze asupra fenomenelor studiate. Statistica aplicată în psihologie este o
disciplină care se ocupă cu înregistrarea, ordonarea, sistematizarea, prelucrarea
cantitativă și redarea sintetică a datelor provenite din cercetarea științifică și
aplicarea metodelor de investigație în psihologie(experiment, test, chestionar,
observație, etc..). Este o ramură a statisticii.
O diviziune larg acceptată în domeniul statisticii este cea care împarte cest
domeniu în statistica descriptivă și statistica inferențială. Cele două secțiuni au apărut
istoric în această ordine.
Prin statistică descriptivă se înțelege un ansamblu de metode pentru descrierea
datelor statistice prin intermediul indicatorilor statistici, graficelor, tabelelor sau
diagramelor. Statistica descriptivă se raportează la un eșantion, adică la peroanele
care sunt observate și cercetate faptic. Foarte rar psihologii pot investiga populații de
indivizi în toată amploarea lor. Statistica inferențială are ca domeniu de preocuparea
transferul semnificației rezultatelor investigațiilor cantitative obținute din unul sau
mai multe eșantioane spre nivelul întregii populații(de fiecare dată, cu o anumită
aproximare).
O altă clasificare se referă la numărul de variabile care sunt analizate. Avem astfel
statistică univariată( o singură variabilă aflată în analiză), statistică bivariată(două
variabile), statistică multivariată(mai multe variabile.
O colecție de date din statistică nu se constituie doar pe baza caracteristicilor
persoanelor, ci și spre alte caracteristici, precum locuința, condițiile geo-climatice,
specificul ambiental în general.

Noțiuni fundamentale în statistică

Variabila este o entitate care ia anumite valori. Entitatea este un


concept folosit în filozofie, semantică și informatică. O entitate descrie esența sau
identitatea unui obiect concret sau abstract al ființei. Entitățile sunt identificabile în
mod unic și, prin urmare, unice. Frecvent se folosește în sensul de abstracție
considerată ca o realitate. Sinonimele entității sunt : abstracție, idee, noțiune. Alte
definiții se referă la ceea ce constituie esența unui lucru sau la un obiect, un
eveniment, un loc, o persoană..., un lucru identificabil fără ambiguitate.
Sensul curent al variabilei în disciplina statisticii este acela a unei valori
numerice, a unui atribut care diferă de la un element la altul. Principalele feluri de
variabile sunt următoarele:
• Variabilă aleatoare este acea variabilă care ia valori la întâmplare, la
hazard, fără o anumită regularitate
• Variabilă binară este variabila care ia doar două valori, de exemplu 0 și 1.
• Variabilă cantitativă și variabilă calitativă sau categorială.
• Variabilă continuă și discontinuă(discretă)
• Variabilă independentă și variabilă dependentă
• Variabilă inter-subiect(Este o variabilă independentă (factor) manevrată
astfel încât la fiecare nivel al factorului este evaluat un alt grup de
subiecţi.) și variabilă intra-subiect independentă (factor) care este

1
manevrată astfel încât fiecare subiect este testat (evaluat) la fiecare nivel al
variabilei. Mai este denumită variabilă cu măsurători repetate, tocmai din
cauză că acelaşi subiect este supus unor evaluări repetate (la nivele diferite
ale factorului).
• Variabilă nominală
• Variabilă ordinală
Principalele tipuri de variații(oscilație valorică a unei variabile)
• Variații: interindividuale și intra-individuale
• Variații intra-grup și inter-grup
• Variații: previzibile și imprevizibile

Principalele scale folosite existente în cercetarea psihologică sunt:

 Scala nominală
 Scala ordinală
 Scala de interval
 Scala de raport
Scalele sunt enumerate în ordinea complexității și puterii lor de măsurare. Scala
nominală și cea ordinală poartă denumirea de scale slabe, pe când scala de interval și
cea de raport se mai numesc și scale puternice. Există și alte tipuri de scale care sunt
utilizate foarte rr în domeniul nostru de interes: scala de log-interval, scala absolută,
etc..

Scalele nominale ne spune S.S. Stevens la începutul unui articol


publicat în revista Science, în 1946), oferă cea mai puţin restricţionată
regulă de asigurare a numerelor. Acestea sunt folosite ca etichete sau
simboluri, cuvintele, literele, imaginile putând să îndeplinească aceiaşi
funcţie de distingere a claselor unui fenomen. (Stevens, 1946). În
consecinţă, numerele sunt atribuite bucurându-se de puţine
proprietăţi, poate dintre cele care au o utilitate secundară. Dacă A şi B
sunt numere, ne putem pronunţa doar asupra unei singure din două
eventualităţi ; A = B sau A nu este egal cu B. În cazul în care A nu este
egal cu B nu putem să stabilim care este mai mare şi care este mai
mic. În plan empiric aplicarea unei scale nominale se poate face în
condiţia în care suntem în stare de a discrimina lucrul A de lucrul B,
deci de a dispune de un criteriu empiric care ne permite de a distinge
două lucruri „echivalente” de două lucruri „diferite”(Reuchlin, 1962,
p.54). Acest criteriu este un criteriu de apartenenţă la o clasă de
echivalenţă. „Măsurarea” realizată de către scalele nominale este o
măsurare slabă, nerecunoscută ca atare de reprezentanţii „duri” ai
teoriei măsurării. Aceştia denumesc rezultatul eforturilor lui Stevens
de a detaşa niveluri diferite de măsurare „teoria neştiinţifică de
măsurare Stevens”, consecinţa acestei aprecieri fiind utilizarea
predilectă în psihologie şi ştiinţele sociale, geografie şi cartografie. Mult
timp denumită tipul calitativ de scală, diferenţiază între itemi sau
subiecţi bazându-se doar pe numele lor sau, realizând (meta) categorii
şi alte clasificări calitative: gen, naţionalitate, etnicitate, limbaj, gen,

2
stil, specie biologică şi formă. Dintre indicatorii de nivel sau de
tendinţă centrală are sens valoarea mod, nu acela și lucru putându-se
spune despre medie şi mediana
În disciplina taxonomiei sunt ilustrate cel mai frecvent scalele
nominale prin tot felul de clasificări din varii domenii(clasificarea
bolilor, clasificarea profesiunilor, clasificarea tipurilor psihologice,
etc..) Pentru a fi recunoscută ca făcând parte din clasa nominală, o
variabil trebuie să aibă cel puțin două modalităţi sau două categorii.
Cel mai la îndemână exemplu este variabila gen care are două
modalităţi, masculin şi feminin, notate cu M şi F . Important este ca în
dihotomie să fie absentă o relaţie de ordine. Pentru modalitate se mai
foloseşte denumirea de categorie sau calitate, motiv pentru care scala
nominală mai este denumită scală categorială sau scală calitativă. Se
mai afirmă că o variabilă calitativă are mai multe nivele, însă utilizarea
termenului de nivel este mai puţin recomandată, acesta fiind mai
indicat pentru a indica variantele de variație ale unei scale ordinale.
Locul modalităţilor într-o scală nominală poate fi continuu schimbat
fără să se reproșeze o procedură greşită. Nici o modalitate, indiferent
cum este codată, nu este considerată mai mare sau mai importantă în
comparaţie cu alta, deci nu există o ordine de prezentare a
modalităţilor. Deci, din punct de vedere formal, nu există o ordine și
nici o distanță între masculin şi feminin. Scala nominal înseamnă a
plasa date în categorii fără să ținem cont de nici o structură. Un
exemplu fizical de scală nominală este constituit din termenii prin
care noi desemnăm culorile. Spectrul care stă la baza lor este ordonat,
dar numele atribuite nu. Prezenţa unui mare număr de modalităţi la o
scală nominală determina practica de a condensa modalităţile cu
frecvenţe foarte mici în categoria ş.a.(şi altele). Nu se permite de obicei
ca ş.a. să depăşească ă 5%.

Scala ordinală are proprietăţile scalei nominale plus o serie de


caracteristici suplimengtare derivate din introduce relaţiei de ordine. O
scală ordinală are mai multe nivele; despre două numere utilizate
pentru a desemna un rezultat al unei investigaţii putem şti nu numai
dacă sunt identice sau nu, ci care este mai mare. Acesta sugerează
ierarhia, ordinea de mărime. Una din ilustrările grafice cel mai
frecvent folosite ăn ştiinţă pentru a simboliza ordinea este piramida.
Astfel întâlnim în câmpul preocupărilor ştiin ştiinşifice denumiri
precum : piramida nivelurilor neurologice, piramida alimentaţiei,
piramida cotelor de piaţă, piramida nevoilor emoţionale a lui Anthony
Robbins, piramida succesului antrepenorial, piramida valorilor vorbirii
în public şi, în psihologie, cunoscuta piramidă a nevoilor umane a
binecunoscutului psiholog umanist american Abraham Maslow.
Termenul de piramidă este încărcat simbolic şi constituie o preocupare
a aşa-numitei piramidologii- este adevărat, cam discutabilă-, un fel de
sinteză dintre ştiinţa faraonilor şi a savanţilor moderni. Semnifica cel

3
mai des întâlnită în rândul celor cu preocupări în această direcţie este
cea a convergenţei ascensionale(Chevalier şi Gheerbrant, 2009,p.732)
Putem să utiliză şi termenii de modalitate sau categorie pentru a
desemna o anumită gradaţie a scalei, însă cel de de nivel este cel mai
adecvat. Pentru caracteristici cu demnitate scalară ordinal[, iau
naştere ordini de rang de felul „mai mare“, „mai mic“, „mai mult“, „mai
puţin“, „mai puternic“, „mai slab“ între fiecare din diversele valori ale
caracteristicii. Exemplu x > y > z). Faptul important este că nu se pot
face afirmaţii despre distanţa care separă două nivele diferite; putem
deci să spunem că un nivcel este mai mare sau mai mic decât altul,
dar nu putem preciza cu cât Notele şcolare constituie un exemplu de
scală ordinală O formă specială a scalei ordinale este scala de rang. În
aceat caz poate să fie acordată o singură valoare. Unui anumit nivel
Exemple adecvate sunt cele din competiţiile sportive(locul 1, locul 2,
locul 3, ş.a.m.d) cele care rezultă compararea diferitelor performanţe
din variii domenii. . Un sistem ordonat în domeniul fizic sau
psihologic poate fi considerat ca sistemul numerelor, ca o realizare
axiomatică definind ordinea. Codificarea nivelelor nu exclude forma
alfabetică sau de altă natură, dar în acest caz trebuie să se precizeze
expres că b>a, c>b, d>c ş.a.m.d.
Recodificările nivelelor sunt permise dacă respectă ordinea ierarhică.
Demn de precizat este şi faptul că în cadrul unei distribuţii de valori
scalate ordinal noţiunea de formă a distribuţiei capătă sens.
Exemplifică prin forma cea mai cunoscută şi mai frecvent întâlnită,
aşa-numita curbă a lui Gauss
Deşi este foarte popular, modelul de repartiţie Gauss-Laplace, la care
vom face mai multe referinţe pe parcursul acestei lucrări, este unul
din modelele existente,cele mai frecvente fiind modelul binomial,
modelul Student şi modelul chi pătrat. Foarte rar datele empirice
rezultate dintr-o cercetare se „mulează” pe forma distribuţiei normale.
De la acest model avem mai multe feluri de deviaţii, dintre care
exemplificăm asimetriile pozitive şi negative. Este foarte important să
nu încercăm doar o singură explicaţie pentru o anumită formă de
asimetrie de la modelul normal de distribuţie. Asimetria pozitivă
presupune „îngrămădirea” valorilor spre zona de din stânga, cea a
performanţelor slabe si modeste, dacă ne-am raporta la rezultatele
unui test de aptitudini. Dacă nu cunoaştem contextul în care s-a făcut
o anumită cercetare, am putea înclina să adoptăm ceam mai la
îndemână explicaţie, anume aceea că subiectii sunt în mare majoritate
slabi. În schimb, forma distribuţiei de acest fel poate fi consecinţa
utilizării unui test psihologic conceput pentru supradotaţi la subiecţi
normali. Asimetria de stânga sau asimetria negativă presupune
„îngrămădirea” subiecţilor în zona valorilor înalte, situaţie care nu
certifică valoarea deosebită a subiecţilor, ci utlizarea unui test

4
psihologic de dificultate scăzută(care se poate afla în perioada de
verificare
Se impune o precizare în legătură cu utilizarea datelor
dihotomice sau dihotomizate în scala ordinală, spre deosebire de scala
nominală. Specifice scale nominale sunt dihotomii precum „bolnav”
contra „sănătos” când măsurăm sănătatea, „vinovat” contra
„nevinovat” când apreciem judecata unei curţi cu juri,
„adevărat”/”fals” când măsurăm valoarea de adevăr şi, pe de altă parte
date nedihotomice consistând într-un spectru de valori, precum
„complet de acord”, „ mai degrabă de acord” ….”dezacord total”, atunci
când întocmim dispozitive de răspuns pentru întrebările chestionarelor
de opinii. În 1946 Stevens observă că măsurarea psihologică, precum
măsurarea opiniilor, este operată prin scala ordinală.; deci media şi
abatareas standard sunt nonvalide, dar ele pot fi folosite pentru a
neface o idee pentru a vedea cum să operaţionalizăm variabilele
folosite în chestionare. Cele mai multe date psihologice colectate prin
instrumente psihometrice şi teste măsoară aptitudini cognitive şi alte
aptitudini., sunt ordinale. Cu toate acestea anumiţi teoreticieni au
argumentat că ele pot fi tratate ca scale de interval sau de raport.
Există o evidenţă prima facie(la o primă apreciere, la o primă privire,
prima abordare) sugerează că astfel de atribute nu sunt nimic mai
mult decât ordinale. IQ+urile reflectă o scală ordinală, în care toate
scorurile au semnificaţie doar pentru comparare. Nu există 0 absolut.
Scala de interval
Specific: în cadrul unor valori care îndeplinesc exigenţele scale de interval,
variantele de variație au caracteristica de a fi ordonate, putându-se preciza în
plus că una din ele este mai mare decât alta, dar şi cu cât este mai mare decât
alta. Dacă avem variantele de variație 10 şi 4, putem spune că 10 este mai mare
decât 4, că 10 este mai mare cu 6 decât 4, dar nu putem spune că 10 este de 2,5
ori mai mare decât 4. Deci, diferența între ele nu este relevantă. Variabilele de
interval sunt calificate drept variabile cantitative sau numerice. Prezența
valorii 0 este arbitrară. Dacă analizați temperaturile în grade Fahrenheit, să
zicem 20-40 grade și 40-60 grade, există o ordine și o diferența semnificativă
dintre variabile, dar prezența zero este arbitrară. Cum este zero arbitrar? Zero
grade pe scara Fahrenheit (și Celsius) nu este o constantă universală, ci, în
schimb, atribuită pentru a reprezenta temperatura la care saramura formată
din părți egale de gheață, apă și sare îngheață. Este ușor de reținut obiectivul
acestei scale, deoarece „interval” se referă la intervalul (sau distanța) dintre
două variabile. O altă modalitate de a ne aminti această scală este că datele
dintre două variabile pot fi adăugate sau scăzute, dar nu multiplicate sau
împărțite. Variantele de variație ale unei scale de interval sunt legate printr-o
relaţie de ordine şi permit toate operaţiile aritmetice, iar distanţele între două
variante de variație ordonate sunt egale

Exemple de scale de interval discontinue:


◦ Scorurile la probele psihometrice (discriminare
auditivă, de vizualizare spaţială, de vocabular, de
fluiditate verbală, Scorurile la chestionarele cu alegeri
multiple. Toate constructele psihologice precum
răbdarea, extraversiunea, empatia, agresivitatea ,
inteligența, reziliența, perseverența.

5
◦ Scorurile de memorizare a unei liste de cuvinte sau
cifre;
◦ Cel mai frecvent aceste scoruri sunt constituite după
schema „totul sau nimic”.(reuşită/eşec la itemi,
memorizare/ lipsa memorizare a unui cuvânt. Se
observă că nu se pot obţine rezultate decât sub forma
întreagă(subiectul nu poate să aibă un semi-
comportament sau un sfert de comportament de acel
gen).
◦ Cercetări care fac apel la liste de
itemi(comportamente, trăsături de personalitate)
pentru a produce o evaluare permiţând, dincolo de
analiza item cu item, de a ajunge la scoruri care au
statut de măsură de interval(număr total de trăsături
selecţionate, număr de trăsături pozitive, număr de
trăsături negative)
◦ Parametri de ordin fiziologic, cum sunt bătăile inimii
în studiu asupra emoţiilor;
Exemple de scale de interval continue:
◦ Timpul scurs pentru a realiza o probă (ex. DM-ul lui
Jean MauriceLahy) şi timpul necesar pentru a detecta
un stimul(timpul de reacţie verbală, timpul de
identificare);
◦ Aprecierea vitezei în cursul unui studiu de etologie
referitor la comportamentele de fugă;
◦ Distanţele(studii asupra distanţelor de intimitate, de
comunicare);
◦ Măsurarea anumitor parametri în cazul studiilor
psiho-farmacologice (concentrarea neuro-
mediatorilor) sau psihofiziologice(analiza anumitor
unde cerebrale).
Fiind vorba de o scală cantitativă se face distincţia între variabile discontinue
sau discrete şi variabile continue.
În privinţa indicatorilor sunt premise şi posedă sens indicatorii de nivel
valoare mod, mediana şi media aritmetică, în timp ce indicatorii de împrăşţiere cuprind
pe cei din scalele ierarhic inferioare, plus amplitudinea varianţa şi abatarea standard.
Se pot calcula indicatorii Sqweness şi Kurtosis. Operaţiile aritmetice care pot fi aplicate
asupra valorilor aparţinând acestui tip de scală: adunare, scădere, diviziune şi
multiplicare. Pe date cu valoare scalar de interval se poate constitui un ansamblu de
tehnici de modelare şi tehnici multivariate avansate.
Exemplu: variabila „clase de vârstă” poate fi exprimată prin intervale egale:
◦ 19 - 23 ani;
◦ 24 – 28 ani;
◦ 29 – 33 ani;
◦ 34 – 38 ani
◦ Diferenţa dintre 19 -23 este aceiaşi ca diferenţa dintre 34 – 38

Scala de raport
Scara de raport are o valoare naturală absolută zero. Are ordine și valoare la fel
de distanțată între unități. Caracteristica punctului zero face relevant sau semnificativ
să se spună „un obiect are de două ori lungimea celuilalt” sau „este de două ori mai
lung”.
Scara de raport nu are un număr negativ, spre deosebire de scala de intervale
datorită caracteristicii punctului zero. Pentru a măsura orice obiect pe această scală,
cercetătorii trebuie mai întâi să vadă dacă obiectul îndeplinește toate criteriile pentru
scala de intervale plus o caracteristică de zero absolut.

6
Scara de raport oferă posibilități unice pentru analiza statistică. În această scară,
variabilele pot fi adăugate, scăzute, multiplicate și împărțite în mod sistematic
(raport). Toate analizele statistice, inclusiv media, modul, mediana pot fi calculate
folosind aceasta. De asemenea, chi-pătratul poate fi calculat pe această variabilă de
scară.
Scara de raport are unități care au mai multe proprietăți unice și utile. Unul
dintre ele este că permit conversia unității.

Exemple: greutatea, vârsta, venitul financiar, viteza de reacție, temperatura pe


scala Kelvin.
În cadrul scalei de interval nu putem vorbi de un punct natural 0. Dacă există un
asemenea punct, atunci acesta este construit, este convențional. De exemplu, putem
măsura capaccitatea de efort pe o scală de la 0 la 125, însă o putem măsura și pe o
scală cu diviziuni de la 2 la 150, caz în care punctul 0 „dispare”
Scala absolută. Are toate caracteristicile scalei de raport și, în plus, în cadrul
acestei scale există o unitate de măsurare naturală. Exemplele școlare, numărul
atacurilor de panică, numărul de țigări fumate zilnic. În psiholgie esste folosită adesea
pentru măsurarea comportamentului: gesturi de jenă, nr. de adjective apreciative.
Caracteristica suplimentară este exprimată frecvent sub forma de „număr de”.

7
A= X -X
max min
A=X -X +1.
max min
A = 81-22+1= 60.

Tabel cu date organizate pe intervale de variație

8
1 2 3 4 5 6

Nr.crt. Interval Centru f f% fcٕ↓ f

1 21-27 24 5 5,43 5

2 28-34 31 13 14,13 18

3 35-41 38 12 13,04 30

4 42-48 45 17 18,48 47

5 49-55 52 10 10,87 57

6 56-62 59 16 17,39 73

7 63-69 66 9 9,78 82

8 70-76 73 5 5,43 87
9 77-83 80 5 5,43 92
Total N=92

Exigențe ale tabelului statistic


 Să faciliteze percepţia rapidă şi exactă a informaţiilor prezentate;
 Să cuprindă numai informaţii strict necesare caracterizării
fenomenului studiat;
 Să aibă un titlu scurt, clar, care să sintetizeze conţinutul
informativ al datelor;
 Să fie numerotat, pentru a fi uşor identificat în textul de analiză;
 Textul care însoţeşte tabelul trebuie să precizeze, dacă este cazul,
unitatea de măsură în care se exprimă datele;
 Să fie însoţit de note explicative care să explice noţiunile cu mai
multe sensuri;
 Notele explicative trebuie să indice sursa datelor;
 Liniile şi coloanele trebuie numerotate pentru a putea fi uşor
identificate ;
 Nu se admit rubrici incomplete

9
10
Exemplificare protocoale de înregistrare a datelor

 protocol de tip “subiect-rezultat global”


 protocol derivat al unui protocol de structură”subiect-rezultat global”
 protocol de structură S<G>
 protocol derivat al protocolului de structură S<G>(distribuţia frecvenţelor simple )
 protocol de bază de tip „subiecţi – condiţii de investigaţie”

Reprezentarea grafică a datelor


• Reprezentările prin figuri geometrice, naturale sau simbolice a datelor sunt
realizate asupra datelor unui tabel statistic. Reprezentările grafice în
statistică nu sunt destinate să înlocuiască tabelele statistice, ci să le
completeze. Folosirea lor este limitată prin posibilitățile de reprezentare
într-un singur plan. În general, nu se poate înregistra grafic decât un
singur fenomen sau fenomene juxtapuse. Transpunerile grafice sunt
realizate în scală aritmetică(naturală) și în scale logaritmice.
• Transpunere datelor statistice în grafice constituie o modalitate de studiu
avantajoasă, din următoarele motive:
• Oferă o imagine sintetică asupra fenomenelor investigate
• Facilitează comparațiile între elemente
• Evidențiază caracteristicile lor(structuri, relații, tendințe,
regularități)
• Conduce la descoperirea unor anomalii sau erori
• Îndeplinesc și funcții de calcul statistic, determinând mai
simplu valori statistice pentru care nu se cere o precizie
prea mare
• Reprezintă un auxiliar prețios pentru activitatea curentă de
planificare și de previziune(Vladimir Trebici Mică

11
enciclopedie de statistică, Editura științifică și
enciclopedică, București, 1985, p. 81.
• În cercetarea psihologică se utilizează un număr restrâns de
procedee de reprezentare grafică comparativ cu ansamblul
investigațiilor statistice.

12
• Indicator: Indicatorul statistic este expresia numerică a unui fenomen,
proces sau a unei categorii economico-sociale, definite în timp, spaţiu şi
structură organizatorică. El este rezultatul procesului investigării
sistematice și are o formulă de calcul şi o formă specifică de exprimare
• Indice: număr caracteristic obţinut ca raport între mărimea unui
indicator statistic la momentul t(mărime curentă sau de comparat) şi
mărimea lui la momentul 0(mărime de bază sau de referinţă). Se exprimă
obişnuit în procente. Se foloseşte şi cu accepţiunea de indicator. (Vladimir
Trebici, Mică Enciclopedie de demografie, Editura ştiinţifică şi
enciclopedică, Bucureşti, 1975, p. 54 -55)

După G.U. Yule și M.G. Kendal, o medie trebuie să satisfacă o serie de


condiţii:
• O medie trebuie să fie definită în mod precis. Această cerinţă nu
poate fi lăsată doar pe seama simplei aprecieri subiective a celui
care efectuează operaţia de observare;
• O medie trebuie să fie expresia tuturor observaţiilor făcute. În caz
contrar, ea nu poate fi, în mod real, o valoare tipică a întregii
repartiţii;
• Este de dorit ca media să posede proprietăţi simple şi evidente,
făcând posibil sensul său general; O medie nu poate să aibă un
caracter matematic prea abstract;
• Este de dorit ca media să poată fi calculată cu uşurinţă şi
rapiditate. Dintre două medii, cu proprietăţi asemănătoare, va fi
preferată aceea care poate fi calculată mai uşor. Însă, nu trebuie să
acordăm o prea mar atenţie uşurinţei în calcul, în detrimentul altor
factori;
• Este de dorit ca media să fie afectată cât mai puţin de fluctuaţiile
de selecţie. În eşantioanele extrase din aceeaşi populaţie, mediile
vor fi rareori identice, iar o anumită formă de medie poate conduce
la diferenţe mai mari decât alta, Dintre două forme de medii, va fi
mai bună aceea care prezintă mai multă stabilitate;

13
• O medie trebuie să poată fi rapid studiată cu ajutorul calculului
algebric

Folosirea mediei în cercetarea psihologică este frecventă în trei tipuri


de situaţii;
• A situa o observaţie într-o distribuţie. Exemplu: o notă este
superioară sau inferioară mediei;
• A compara un grup de observaţii cu un alt grup. Exemplu; în
procesul de învăţare care comportă încercări succesive pot să
fie lăsate intervale de timp(învăţare distribuită) sau nu(învăţare
masată). În general, se constată că media rezultatul unui grup
de subiecţi în învăţarea distribuită este superior rezultatului în
învăţarea masată. Dacă cercetătorul consideră că această
diferenţă este prea mare pentru a putea fi explicată doar prin
variaţii fortuite, atunci această situaţie trebuie să conducă la o
explicaţie psihologică;
• În situaţia în care observaţiile au fost supuse la o sursă de
variaţie sistematică sau la mai multe. În această situaţie se
poate calcula valoarea medie asociată la fiecare din stările
acestei surse. Această valoare medie permite de a descompune
variaţiile observate în mai multe abateri(care se numesc
„ efecte”) şi de a analiza astfel importanţa relativă a diferitelor
surse sistematice sau fortuite. Posibilitatea unei astfel de
analize este esenţială pentru explicarea fenomenelor observate

Dezavantajele utilizării mediei aritmetice sunt următoarele:


• Are o mare sensibilitate la valorile aberant de mari şi
aberant de mici, în acest caz devine nereprezentativă;
• In cazul distribuţiilor cu asimetrie pronunţată, media
pierde din reprezentativitate în favoarea medianei şi
valorii mod;
• În cazul distribuţiilor în formă de U, media aritmetică
îşi pierde reprezentativitate
Media – utilizarea mediei în condiţii inadecvate poate duce la confuzii
şi erori de interpretare. Media poate fi folosită doar în cazul în care datele se
află la cel puţin un nivel de măsurare de interval

• În cercetările socio-umane se foloseşte o variantă a mediei numită


media ponderată. Mai ales la scorurile testelor psihologice,
rezultatele sunt ponderate în funcţie de influenţa diferenţiată a
fiecărui test asupra rezultatului global. Astfel, dacă în cadrul unei
baterii de teste avem rezultatele la 5 teste psihologice(inteligenţă,
atenţie, memorie, dexteritate manuală şi oboseală neuropsihică) şi
subiecţii obţin în ordinea amintită rezultatele 5, 9, 8, 6, 10 , media
aritmetică se obţine prin adunarea cifrelor şi împărţirea lor la 5.
Media aritmetică este 7,6. Pentru a calcula media ponderată,
trebuie ca fiecare test să aibă o „greutatea” diferită sau o anumită
pondere. Astfel dacă primul test are ponderea 2, al doilea ponderea
3, al treilea ponderea 5, al patrulea ponderea 6 şi al cincilea
ponderea 4, vom obţine următoarea medie ponderată :

14
Valoarea mod
• Este valoarea sau modalitatea care revine cel mai frecvent într-o distribuție
• Exemplu: 2,4,6,1,6.6,5,6, 6,3,4,8,9,6,6, Valoarea mod este valoarea 6
• Există:
• distribuții unimodale: ex. 5, 5, 7 ,6, 5, 5, 5, 7, 9, 2, 1, 5, 5.
Valoarea 5
• Distribuții bimodale: 5, 9, 7, 5, 4, 3, 2, 6, 6, 9, 9, 10, 5 .
Valorile 5 și 9
• Distribuții multimodale, în cazul în care există mai mult de
două valori mod.
• Valoarea mod nu există în mod obligatoriu. Ex. 3, 4, 5, 6 , 7 ,9, 10, 1, 14.
• Valoarea mod nu este cea mai mare valoare.
• Valoarea mod se referă atât la valori numerice cât și la caracteristici sau
modalități.

Mediana
• Indicator de nivel al unei distribuţii care are particularitatea de a fi
împărţi valorile ordonate în două părţi egale. Mediana are teoretic
50% din valori mai mici decât ea şi 50% din valori mai mari decât
ea.
• Înaintea operaţiei de stabilire a medianei, datele neorganizate ale
unei distribuţii se ordonează crescător sau descrescător
• Exemplu: date neordonate cu volum impar: 5, 12,3, 9,14,17,1, 13,
8,6, 4,
• Ordonare:1, 3, 4,5,6,8,9,12,13,14,17.
• Exemplu de date cu volum par: 2,5,3,7.11,14.16,4, 6,8,13,17, 9
• Ordonare: 2, 3,4,5,6,7,8,9,11,13,16, 17

Volum impar V
Ordonare Rang Mediana Ordonare Ra
1 1 2 1
Me  X N 1
3 2 ( ) 3 2
2
4 3 4 3
5 4 5 4
6 5 6 5
8 Rangul 6 7 6

9 7 8 7

15
Me  X N N 2
( ; )
2 2

12 8 78 9 8
Me   7,5
2
13 9 11 9
14 10 13 10
17 11 16 11

Indicatori de împrășiere
Abaterea medie. Este un indicator de împrăștiere care reprezintă media abaterilor de
la medie(luate ăn valoare absolută)

16
AM 
 XX
N Formulă pentru date
neorganizate

AM 
 f *XX
N Formulă pentru date organizate
pe variante de variație. X reprezintă o valoare brută, X media distribuției de valori și f
frecvența unei variante de variație. Cu AM se notează abaterea medie

Calcul abatere medie

X x │x│
4 -6 6
7 -3 3
5 -5 5
4 -6 6
9 -1 1
13 3 3
10 0 0
12 2 2
11 1 1
17 7 7

17
13 3 3
15 5 5
ΣX= Σ│x│=42
120

AM 
 x

42
 3,5
N 12
Exemplu pentru calculul abaterii medii pentru date organizate pe variante de variație

X f fX x │x│ f│x

4 5 20 -9.63 9.63 48.


5 7 35 -8.63 8.63 60.
7 9 63 -6.63 6.63 59.
9 11 99 -4.63 4.63 50.
11 15 165 -2.63 2.63 39.
13 17 221 -0.63 0.63 10.
15 19 285 1.37 1.37 26.
17 16 272 3.37 3.37 53.
18 12 216 4.37 4.37 52.
19 9 171 5.37 5.37 48.
21 7 147 7.37 7.37 51.

18
23 4 92 9.37 9.37 37.
Σf =131 ΣfX=1786 Σf│x│=

X 
 f X

1786
 13,63
N 131

X 
 f X

1786
 13,63
N 131

19
Abaterea standard este o mărime ce rezultă din extragerea rădăcinii pătrate
din media abaterilor pătratice de la medie. Formula pentru date neorganizate
este următoarea:

s
 x 2

N Abaterea standard este apreciată în strânsă


legătură cu varianța, care este media abaterilor pătratice de la medie. Formula
varianței este următoarea:

s 2  x 2

N
Tabelul care cuprinde rubricile necesare calculării varianței și abaterii
standard(date negrupate) este următorul

Nr. crt. X x(X- X ¿ ¿ 2


x

1 12 -5 25

2 22 5 25

3 20 3 9

4 15 -2 4

5 16 -1 1

6 19 2 4

7 18 1 1

8 17 0 0

9 14 -3 9

10 21 4 16

11 13 -4 16

Cu x am notat variabila de deviație de la medie. Rezultatul este următorul:

20
s2 
 x 2


110
 10 s
x 2


110
 10  3,16
N 11 N 11
Formula de calcul a varianţei şi abaterii standard - date grupate pe
variante de variaţie

s 2

 f *x 2

s
 f *x 2

N
Tabel cuprinzând rubricile necesare calculării varianței și abaterii
standard pentru date grupate pe variante de variație

Nr,crt. X f f*X x 2
x

1 8 3 24 - 5,85 34,22

2 9 7 63 - 4,85 23.52

3 11 11 121 - 2,85 8,12

4 13 15 195 - 0,85 0,72

5 14 19 266 0,15 0,02

6 16 13 208 2,15 4,62

7 17 8 136 3,15 9,92

8 19 5 95 5,15 26,52

21
9 21 2 42 7,15 51,12

Σf*X=1150

Derulare calcule pentru determinarea varianţei şi abaterii standard


pentru date grupate pe variante de variaţie

X 
 f *X

1150
 13,85
N 83

s 2

 f *x 2


742,06
 8,90 s
f *x 2

 8,90  2,98
N 83 N

Tabel care cuprinde rubricile necesare calculării varianţei şi abaterii


standard pentru date organizate pe intervale de variaţie

22
 318  6  
2

   252,83  0,003  70,5


2
s  25 *  
109  109  

• O proprietate importantă a abaterii standard este folosită pentru crearea de


clase standard normalizate. Proprietatea abaterii standard este
următoarea:
1. în intervalul creat între media unei distribuţii normale Gauss-
Laplace și +- o abatere standard se află aproximativ 68% din
aria suprafeţei, deci 68% din valorile unei distribuții;
2. în intervalul creat de medie și +- 2 abateri standard se află 95%
din valorile unei distribuţii;
3. în intervalul creat de medie și +- 3 abateri standard se află quasi-
totalitatea valorilor unei distribuţii, adică aproximativ 99,958%
din valori.
• Deci, amplitudinea unei distribuţii normale Gauss Laplace este aproximată
satisfăcător de 6 abateri standard. Să presupunem că media unei distribuţii
normale este 36,28 și abaterea standard este de 8,39 și ne-am propus să
stabilim două variante de clase normalizate, în număr impar(7) și în număr
par(8). Primul pas în stabilirea claselor normalizate este calcularea
amplitudinii și a bazei de gradaţie

23
24

S-ar putea să vă placă și