Sunteți pe pagina 1din 14

Construirea bazei de date

Obiectivul general: cunoaşterea modului de construire a unei baze de


date.

Obiectivele specifice:

Cunoaşterea modului de definire a variabilelor


Cunoaşterea modului de construire a unei baze de date
Cunoaşterea modului de introducere a datelor

Structura modulului:
 Tipuri de date în psihologie
 Măsurarea în psihologie și scale de măsură
 Construirea bazei de date

2.1 Tipuri de date în psihologie


2.1.1 Măsurarea în psihologie

Măsurarea este un aspect esenţial al realizării unei cercetări în psihologie. Este nevoie
să măsurăm (1) efectul unui program de intervenţie, (2) dacă două aspecte psihice sunt
relaţionate sau (3) dacă există diferenţe între două condiţii ale unei comparaţii (ale unui
experiment). Măsurarea este procesul prin care atribuim valori numerice unor
caracteristici, trăsături sau atribute psihice. Pentru a putea să atribuim valori numerice
unui aspect psihic, avem nevoie să trecem de la nivelul teoretic al conceptelor, la nivelul
concret al faptelor, prin procesul de operaţionalizare. A operaţionaliza înseamnă a transpune
un concept teoretic în ceva concret şi măsurabil.

Planul Concepte Ipoteza cercetării


teoretic

Aspecte concrete Dovezile (datele)


Planul şi măsurabile prin care testăm ipoteza
concret
Figura 2.1 Relaţia dintre planul teoretic şi planul concret într-o cercetare psihologică

Pagina | 1
De exemplu:
Memoria este un concept teoretic. Pentru a măsura memoria avem nevoie să
operaţionalizăm conceptul, adică să precizăm cum putem să „observăm”
memoria cuiva şi cum putem cuantifica acest lucru numeric. O modalitate de a măsura
memoria cuiva este de a vedea câte cuvinte îşi aminteşte corect dintr-o listă de cuvinte:
numărul de cuvinte amintite corect reprezintă modul de operaţionalizare a memoriei.

Măsurarea este procesul prin care atribuim valori numerice unor


caracteristici, trăsături sau atribute psihice.

A operaţionaliza înseamnă a transpune un concept teoretic în ceva


concret şi măsurabil.

2.1.2 Scalele de măsură

La fel cum în fizică avem mai multe modalităţi de a măsura lungimea: în metri,
picioare, mile etc., şi în psihologie avem mai multe modalităţi de măsurare pe care le numim
scale de măsură. Scalele de măsură pot să fie nominale, ordinale, de interval şi de proporţii. În
psihologie folosim mai degrabă primele trei tipuri de scale.

Tabelul 2.1 Caracteristicile scalelor de măsură


Scalele nominale
caracteristici exemple
categorii sex, regiune geografică, tip de tulburare,
apartenenţa religioasă
Scalele ordinale
caracteristici exemple
categorii + ordine ordinea într-un concurs, ordinea pe listele
de admitere
deloc, puţin, mediu, mult, foarte mult
Scalele de interval
caracteristici exemple
categorii + ordine + unitate de măsură vârsta, scorul la un chestionar, numărul de
răspunsuri corecte, timpul de reacţie
Scalele de proporţii
caracteristici exemple
categorii + ordine + unitate de măsură + Metrul sau kilogramul în fizică
zero absolut

Exerciţii 1. Notaţi scala de măsură corespunzătoare răspunsului la fiecare din

Pagina | 2
umrmătoarele întrebări:
Exemplul 1. Aţi lucrat şi în altă parte?
– Da
– Nu
Avem o scală: _______________________________________________

Exemplul 2. De câte ori aţi schimbat locul de muncă? De _________ ori?


Avem o scală: _______________________________________________

Exemplul 3. În cele ce urmează sunt prezentate o serie de afirmaţii. Notaţi


în ce măsură aceste afirmaţii sunt adevărate în cazul dumneavoastră:
a = absolut deloc
b = puţin
c = moderat (adică uneori)
d = deseori
e = foarte adevărat
Avem o scală: _______________________________________________

În procesul de prelucrare a datelor, datorită cerinţelor programelor de analiză a datelor


sau în scopul simplificării muncii, de multe ori se întâmplă să transformăm scalele nominale
şi scalele ordinale în scale de interval (numerice).

Scale nominale sau calitative – definesc primul nivel al măsurării, de fapt al pre-
măsurării. Acesta este nivelul curent în observaţie şi anchete. A utiliza o scală nominală
înseamnă a clasifica sau repartiza datele (rezultatele), după o serie de nume sau categorii
diferite (disjuncte), astfel încât fiecare element (răspuns, observaţie etc.) să-şi găsească
locul într-o categorie şi numai într-una singură. Orice tipologie constituie în acest sens o
scală nominală. De exemplu, tipologia temperamentelor, a tipurilor constituţionale etc. În
locul denumirii categoriilor se utilizează de regulă un cod numeric (01, 02,...) care nu
formează propriu-zis obiectul calculelor, ci serveşte la individualizarea acestor grupări, la
reperarea lor în cursul prelucrării statistice. Aşadar, nivelul nominal al măsurării comportă
atribuire de numere doar pentru a denumi clase de echivalenţă. Desigur, calculele
obişnuite au loc, dar ele se fac asupra efectivelor sau frecvenţelor ce se stabilesc în cadrul
diverselor categorii (clase), individualizate printr-un cod numeric.

Pagina | 3
Exemplu:
Se dă un chestionar referitor la orientarea profesională la o colectivitate de şcolari.
Elevii sunt solicitaţi să răspundă în scris asupra profesiunii spre care doresc să se îndrepte.
Se obţine un ansamblu de răspunsuri care vor fi grupate, repartizate în diferite categorii,
după o listă sau un repertoriu de profesiuni care va constitui cadrul de clasificare. Aşadar,
efectuând ancheta, mulţimea de răspunsuri obţinute se va repartiza într-un număr de clase
disjuncte, indicate prin denumirea profesiei ori printr-un simbol ales în mod convenţional
(cod numeric) care, evident, nu face obiectul calculului. Fiecare răspuns în parte
consemnat în chestionar va fi repartizat într-una din aceste categorii sau profesii. În
ancheta concretă, opţiunile exprimate nu acoperă în mod necesar întreg repertoriul de
profesiuni existent la un moment dat într-o societate; acest repertoriu este de regulă mai
larg decât protocolul obţinut. În final se numără răspunsurile din fiecare categorie sau
rubrică întâlnită şi se stabilesc frecvenţele corespunzătoare sau efectivele.

Nivelul cel mai răspândit al măsurării în cercetarea psihologică este acela al scalelor
ordinale sau, pe scurt, nivelul ordinal. Variabilele psihologice – notează Faverge (1965) –
sunt în majoritatea lor variabile având valori simplu ordonate. Caracteristică acestui nivel
– pe lângă proprietăţile treptei anterioare – este posibilitatea de a stabili relaţii de ordine
totală între lucruri (date). Astfel, fiind date elementele A, B, C, ... semnul “>“ aşezat între
ele poate însemna: A superior lui B, B superior lui C etc., sau A este preferat lui B, B
x
Pxy
preferat lui C ş.a.m.d. Notând, în general, vom citi “x superior lui y”, “x preferat lui
y” sau “x înaintea lui y” etc. Probele sau criteriile de care ne servim conduc la clasamente
ierarhice: scale de capacitate, scale de preferinţe, scale de produse, scale de atitudini
ş.a.m.d.

Exemplul 1°:
Când Alferd Binet lansa în 1905 cunoscuta sa “Scală metrică a inteligenţei”, el
pornea de la următoarele consideraţii: “... calităţile intelectuale nu se măsoară ca
lungimile, ele nu sunt superpozabile” (în limbajul nostru, ele nu satisfac cerinţa
aditivităţii); scala metrică permite – spunea Binet – “un clasament ierarhic între inteligenţe
diferite; şi pentru nevoile practicii acest clasament echivalează cu o măsurare” (p. 194-
195).

Pagina | 4
Exemplul 2°:
Ordonarea subiecţilor cu privire la atitudinile pe care le adoptă într-un domeniu
sau altul presupune o ordonare a întrebărilor ce le sunt adresate. De aici ideea de a întocmi
şi prezenta anumite grupaje sau baterii de întrebări care să se refere la aceeaşi temă, la
acelaşi domeniu, pe scurt, la aceeaşi variabilă. Un asemenea grupaj, numit test sau scală
de atitudini, trebuie să constituie el însuşi o scală ordinală. Răspunsurile posibile se
grupează şi ele într-o ierarhie.

Cel de-al treilea nivel al măsurării este definit de scalele de interval. Acest nivel nu
constituie practic nivelul curent în psihologie. Relaţiei de ordine i se adaugă, în acest caz,
mărimea exactă a intervalelor sau a distanţei care separă toate elementele situate pe scală,
ceea ce presupune o unitate de măsură comună şi constantă (L. Coombs,1963). O
procedură experimentală care să traducă practic exigenţa amintită nu este uşor de realizat.
Ea se întâlneşte în domeniul psihofiziologiei senzoriale, în experienţe de laborator în care
se înregistrează timpul de reacţie, numărul de erori, forţa sau amplitudinea reacţiei motorii
etc. De asemenea, în anumite probleme de psihologie aplicată, cum sunt cele legate de
producţie, când interesează exclusiv performanţele comparabile, făcându-se abstracţie de
orice alte considerente, utilizarea scalelor de interval este posibilă.

(Radu, I. (2002). Metodologie psihologică şi analiza datelor. Curs universitar)

De exemplu:
Răspunsurile măsurate pe scale nominale sau ordinale pot fi codificate numeric
astfel:

1 2 3 4 5 6
De mai În fiecare zi În cele maiÎn unele zile Foarte rar Niciodată sau
multe ori multe zile aproape
pe zi niciodată

Sexul:
1 – masculin
2 – feminin

Răspunsurile posibile la întrebarea unui chestionar:

Pagina | 5
0 – deloc tensionat, calm şi relaxat
1 – foarte puţin tensionat
2 – puţin tensionat
3 – destul de tensionat (tensionat cam 40%)
4 – tensionat moderat
5 – destul de tensionat
6 – extrem de tensionat

2.2 Construirea bazei de date

În subcapitolul anterior am văzut ce formă pot lua datele pe care le adunăm într-o
cercetare psihologică pentru a susţine o ipoteză. Însă, pentru a putea spune ceva despre datele
adunate avem nevoie să le organizăm. Înaintea erei computerelor organizarea datelor
presupunea ordonarea manuală a acestora în ordine crescătoare, urmând ca apoi să se poate
face asupra lor o serie de operaţii aritmetice sau de reprezentare grafică. Mai nou, organizarea
datelor înseamnă construirea unei baze de date în format electronic cu ajutorul unui soft, fie
că este vorba de Excel, SPSS, PSPP sau alt program care permite prelucrări statistice.
Pentru a construi o bază de date în PSPP vom porni programul, ceea ce va duce la
deschiderea unei ferestre ca şi cea de mai jos:

Figura 2.2 Fereastra de start a programului PSPP

În partea sângă, jos, apare scris „Data View” şi „Variable View”, după cum se poate
vedea în Figura 2.2. Sunt cele două ferestre cu care vom lucra:

Pagina | 6
 Pentru a defini variabilele – „Variable View”
 Pentru a introduce datele – „Data View”.

2.2.1 Definirea variabilelor

Pentru a putea introduce datele subiecţilor, în primul rând trebuie să definim


variabilele. Acestea ne vor spune ce reprezintă datele introduse. În cazul fiecărei variabile
vom introduce numele variabilei, tipul acesteia, numărul de caractere sau cifre, numărul de
zecimale, eticheta, valorile posibile în cazul variabilelor care iau valori discrete şi valorile
lipsă.

Figura 2.3 Fereastra de definire a variabilelor în PSPP

Pentru a înţelege mai uşor modul de construire a bazei de date vom lua exemplul
concret al unei cercetări fictive.

De exemplu:
Pentru a testa ipoteza: „Persoanele care au citit un text scris cu roşu îşi vor aminti mai multe cuvinte
decât persoanele care au citit un text scris cu negru.”, cercetătorul realizează un studiu în care
manipulează culoarea textului. În acest sens, va lua două loturi de subiecţi: un lot de subiecţi care
va citi o listă de cuvinte scrisă cu negru şi un alt lot de subiecţi care va citi o listă de cuvinte scrisă cu roşu. La
două minute după citirea textului, pentru a vedea dacă există vreo influenţă a culorii textului asupra capacităţii de
memorare, cercetătorul va cere subiecţilor să scrie pe o foaie de hârtie tot ce îşi amintesc. Apoi va puncta
numărul de cuvinte corect reamintite.

Pagina | 7
În urma aplicării acestui experiment, cercetătorul obţine rezultatele de mai jos, pe care urmează să le
introducă într-o bază de date şi să le prelucreze. Valorile reprezintă numărul de cuvinte corect reamintite.
Lista de cuvinte scrise cu roşu: 2, 7, 12, 9, 7, 8, 3, 6, 10, 5, 8, 3, 11, 7, 6, 5, 9, 4, 7, 8, 6, 10, 5, 7, 6, 9, 4, 8.
Lista de cuvinte scrise cu negru: 4, 4, 0, 8, 3, 5, 1, 4, 6, 2, 1, 3, 7, 4, 0, 5, 3, 6, 3, 2, 7, 1, 5, 4, 5, 2, 6, 3, 4, 7, 5, 3,
2, 4, 6.

Numele variabilei va fi scurt şi nu va cuprinde spaţii sau alte caractere speciale (doar
litere şi cifre). De asemenea, la fel ca şi în SPSS, programul nu permite ca numele variabilei
să înceapă cu o cifră. Pentru a şti ce reprezintă acest nume scurt şi codificat al variabilei, în
câmpul destinat pentru etichetă (Label) se va nota numele variabilei în întregime. Acest lucru
ne va permite să ne reamintim ce semnifică o variabilă la o utilizare ulterioară a bazei de date.
În plus, denumirea completă a unei variabile va permite şi altor persoane să înţeleagă şi să
utilizeze baza de date. De aceea este foarte important ca în definirea variabilelor să fim cât
mai expliciţi.

Figura 2.4 Denumirea variabilei

Figura 2.5 Explicitarea numelui variabilei în câmpul etichetă (Label)

Tot aici se notează tipul variabilei, care poate să fie de tip numeric (valoarea aleasă
automat de program), şir de caractere (string), dată etc. Pentru variabilele codificate numeric,
tipul variabilei este numeric, în cele mai multe situaţii.

Pagina | 8
În cazul unei variabile independente şi a unui design intersubiecţi, ale cărei modalităţi
le codificăm numeric, este important să notăm ce înseamnă valorile introduse în baza de date.
Astfel, pentru exemplul nostru, avem variabila independentă culoarea textului, cu
modalităţile: a1 – roşu şi a2 – negru. Vom nota în câmpul „valori” (Values) semnificaţia
numerelor atribuite. În acest sens, dăm dublu-click pe dreptunghiul gri care apare în câmpul
valori în dreptul variabilei noastre, după cum apare în imaginea de ma jos.

Figura 2.6 Definirea modalităţilor unei variabile independente sau etichetă

În urma acestei acţiuni se va deschide o ferestră de dialog ca în Figura 2.7, unde ni se


cere să întroducem valoarea numerică (Value) şi seminificaţia acesteia (Value label).

Figura 2.7 Fereastra de definire a modalităţilor variabilei independente/ etichetă

Pagina | 9
Pentru a codifica culoarea roşie a textului, notăm în câmpul Value cifra 1, iar în
câmpul Value label cuvântul „roşu”. După care dăm click pe butonul Add pentru ca programul
să reţină codificarea.

Figura 2.8 Introducerea primei modalităţi

După care urmează să introducem codificarea pentru textul scris cu negru. Prin
urmare, vom nota cifra 2 în câmpul Value şi cuvântul „negru” în câmpul Value Label.
Adaugăm şi această codificare cu ajutorul butonului Add şi apăsăm butonul OK.

Figura 2.9 Introducerea celei de-a doua modalităţi

Am definit, astfel, prima variabilă. Urmează să definim şi variabila dependentă, care


în exemplul dat este numărul de cuvinte corect reamintite (reactualizate). Pe al doilea rând
vom nota numele variabilei, ţinând cont de caracteristicile pe care trebuie să le aibă numele
unei variabile: scurt şi nu va cuprinde spaţii sau alte caractere speciale (doar litere şi cifre), nu
va începe cu o cifră. Prin urmare, am ales să numim variabila dependentă: „nrcuv”. Numele
explicit al variabilei îl vom nota în câmpul etichetă (Label): „numărul de cuvinte corect
reamintite”. Pentru că acestă variabilă este măsurată pe o scală numerică şi nu o variabilă

Pagina | 10
măsurată pe o scală nominală şi codificată numeric de către noi, de această dată nu este nevoie
să trecem nimic în câmpul de valori (Values).

Figura 2.10 Introducerea variabilei dependente pe a doua linie

După ce am definit variabilele, revenim în fereastra de introducere a datelor: „Data


View”. În aceastră fereastră ne apar acum cele două variabile definite: cultext şi nrcuv. În
continuare putem începe să introducem datele.

Figura 2.11 Fereastra de introducere a datelor după definirea variabilelor

Pagina | 11
Pentru a introduce datele, ne amintim că pe coloane avem variabilele, iar pe linii avem
subiecţii/ participanţii. Vom introduce pe o linie toate informaţiile pe care le avem despre un
subiect.
În exemplul dat, ştim din ce grup face parte subiectul (cel care primeşte textul scris cu
roşu sau cel care primeşte textul scris cu negru) şi câte cuvinte îşi aminteşte corect. Prin
urmare, în coloana „cultext” vom introduce 1 dacă subiectul a primit textul scris cu roşu sau 2
dacă subiectul a primit textul scris cu negru. În coloana „nrcuv” vom introduce numărul de
cuvinte corect reamintite, adică cifra corespunzătoare din lista de rezultate. Pentru a trece de
la un subiect la altul, sau de la o coloană la alta, vom folosi săgeţile: sus, jos, sânga, dreapta.

Figura 2.12 Introducerea datelor pentru fiecare subiect/ participant

Dacă avem mai multe date, vom fi puşi în situaţia în care ajungem la sfârşitul paginii,
şi nu putem să trecem la următorul subiect cu săgeata în jos. Pentru a putea continua, ne
poziţionăm cursorul pe linia cea mai de jos din fereastră şi apoi, dând click pe butonul Insert
Cases (încercuit în figura de mai jos) inserăm atâtea cazuri câte ne lipsesc pentru a completa
baza de date. De exemplu, în problema discutată, am introdus 13 subiecţi. În total avem 63 de
subiecţi în cele două grupuri. Urmează să mai introducem încă 50 de subiecţi folosind butonul
Insert Cases.

Pagina | 12
Figura 2.13 Inserarea unor noi cazuri

După ce am introdus subiecţii din primul grup, vom continua cu subiecţii din al doilea
grup, notând pe prima coloană cifra 2, care reprezintă grupul subiecţilor care primesc un text
scris cu negru.

Figura 2.14 Continuarea bazei de date prin introducerea subiecţilor din al doilea grup

Valorile numerice ale variabilelor codificate de noi, pot fi vizualizate şi sub forma
semnificaţiei lor. Adică, putem să facem ca în loc de 1 şi 2 să ne apară semnificaţia acestor

Pagina | 13
valori, culoarea textului: roşu şi negru. Pentru a trece de la o formă de vizualizare la alta nu
trebuie decât să apăsăm butonul Value Labels, ca şi în figura de mai jos.

Figura 2.15 Vizualizarea valorilor variabilei indepedente sub formă de etichetă

După ce am introdus toate datele subiecţilor, putem spune că am construit baza de


date. Datele sunt, astfel, pregătite pentru a putea fi analizate şi interpretate.

Pagina | 14

S-ar putea să vă placă și