Documente Academic
Documente Profesional
Documente Cultură
Prelucrările descriptive
Obiectivele specifice:
Structura modulului:
Tipuri de analiză a datelor
Realizarea prelucrărilor descriptive
Indicii tendinţei centrale
Indicii de împrăştiere
Realizarea prelucrărilor descriptive cu ajutorul programului PSPP
Reprezentarea grafică a datelor – poligonul de frecvenţe şi histograma
Pagina | 1
Statistica
De exemplu:
La întrebarea „Cât de stresat aţi fost în ultimele 2 săptămâni?” putem obţine
răspunsuri pe o scală de la 0 la 10, unde 0 înseamnă „deloc stresat” şi 10
înseamnă „extrem de stresat”.
Având următoarele răspunsuri de la un grup de subiecţi, ce putem spune despre aceste
date?
4 7 7 7 8 8 7 8 9 4 7 3 6 9 10 5 7 10 6 8 7 8 7 8 7 4 5 10 10 0 9 8 3 7 9 7
9 5 8 5 0 4 6 6 7 5 3 2 8 5 10 9 10 6 4 8 8 8 4 8 7 3 7 8 8 8 7 9 7 5 6 3
4 8 7 5 7 3 3 6 5 7 5 7 8 8 7 10 5 4 3 7 6 3 9 7 8 5 7 9 9 3 1 8 6 6 4 8 5
10 4 8 10 5 5 4 9 4 7 7 7 6 6 4 4 4 9 7 10 4 7 5 10 7 9 2 7 5 9 10 3 7 2 5
9 8 10 10 6 8 3
Constatăm că nu putem să spunem nimic despre aceste date înainte să le prelucrăm.
Pentru a putea să spunem ceva despre nivelul de stres al persoanelor investigate, va trebui
să parcurgem paşii prezentaţi mai sus.
1. ordonarea datelor
a. identificăm valoarea minimă şi valoarea maximă din setul de date. Acestea sunt: 0
(minim) şi 10 (maxim)
Pagina | 2
Statistica
m=∑x/ N
unde m este media, x este valoarea răspunsului bifat de un subiect şi N este numărul de
subiecţi.
Mediana, notată cu „med”, este valoarea de pe poziţia centrală din şirul ordonat de
date.
Mediana este un alt indice al tendinţei centrale, care se utilizează mai ales când avem de-a face cu distribuţii
asimetrice. De exemplu, în cronometrări se înregistrează succesiv timpul de execuţie a unei operaţii de
producţie la un muncitor; distribuţia empirică obţinută este, de regulă, asimetrică şi atunci se reţine mediana
ca măsură a timpului de lucru.
Pentru a găsi mediana – pe care o notăm cu med – trebuie să aranjăm, în cazuri mai simple, toate
datele (valorile) în ordine crescândă sau descrescândă.
Mediana este acea valoare care împarte şirul ordonat în două grupe egale ca număr. Cu alte
cuvinte, mediana se găseşte la mijlocul şirului: jumătate din valori se află deasupra, iar cealaltă jumătate
dedesubt. Locul sau rangul pe care îl ocupă mediana în şirul ordonat se determină cu ajutorul formulei
(N+1)/2 (care nu este formula de definiţie pentru med).
Când valorile constituie un număr fără soţ, mediana va corespunde determinantei din mijloc. Astfel,
în seria valorilor: 4, 4, 5, 6, 6, 7, 7, 7, 7, 8, 9, med = 7 pentru că 7 este valoarea care împarte şirul ordonat
exact în două. Formula (N + 1)/2 ne indică locul pe care se găseşte mediana. În cazul nostru med este
Pagina | 3
Statistica
Modul este valoarea cu frecvenţa cea mai mare, adică cu numărul cel mai mare de
apariţii în setul de date. Putem să avem două valori care au frecvenţa cea mai mare – în
această situaţie spunem că avem o distribuţie bimodală. Dacă există mai multe valori cu
frecvenţa cea mai mare vom spune că avem o districuţie multimodală.
După cum se poate vedea din figura de mai sus, rezultatele a trei grupuri de subiecţi au
aceeaşi medie, dar împrăştierea datelor este diferită. Cea mai mare abatere standard (sd=1,5) o
are distribuţia reprezentată cu roşu, iar cea mai mică abatere standard (sd=0,7) o are
distribuţia notată cu albastru.
Abaterea standard (dispersia) se calculează după formula:
Sd=
Pagina | 4
Statistica
Dacă analizăm formula de definiţie a dispersiei ne dăm seama că numai expresia de la numărător, adică
suma pătratelor abaterilor de la medie, ridică probleme mai dificile pentru calcul. Vom numi pe scurt această
expresie suma pătratelor.
Determinarea sumei pătratelor -când se lucrează manual- nu se face utilizând expresia de definiţie
Σ(x-m)2 deoarece comportă operaţii laborioase şi de cele mai multe ori cu numere zecimale (calculatorul are
propriile sale programe). Transformând expresia de definiţie, se obţine o formulă convenabilă de calcul:
T2
( x m) 2
x2
N
în care notaţiile sunt deja cunoscute. Σx2 reprezintă totalul pătratelor celor N rezultate (valori) care compun
grupul iniţial de date.
Formula de calcul a dispersiei devine astfel:
T2
x 2
N
2
N 1
Pagina | 5
Statistica
Pagina | 6
Statistica
Pagina | 7
Statistica
În această fereastră de dialog vom defini variabila pentru care dorim să facem
prelucrările descriptive. Vom selecta variabila şi o vom trece în câmpul Variable(s) cu
ajutorul săgeţii dintre câmpuri. În câmpul Statistics vom bifa prelucrările pe care dorim să le
realizăm: media, mediana, modul, abaterea standard, minim şi maxim.
Figura 3.7 Precizarea variabilei dependente şi a prelucrărilor descriptive care să fie realizate
Pentru a cunoaşte care sunt frecvenţa şi procentul cu care apare fiecare valoare, avem
nevoie de realizarea tabelului de frecvenţe. Acesta este selectat automat de către program. În
situaţia în care a fost deselectat, îl putem selecta din nou de la butonul Frequency Table,
bifând opţiunea Always a câmpului Display frequency tables, după cum este ilustrat în figura
3.8.
Pagina | 8
Statistica
Pentru a selecta calcularea modului, în câmpul Statistics, vom merge cu cursorul în jos
până întâlnim opţiunea Mode, ca şi în figura de mai jos. Bifăm această opţiune.
La fel procedăm şi pentru selectarea altor prelucrări, precum mediana, minim, maxim
sau varianţă.
Pagina | 9
Statistica
Pagina | 10
Statistica
Pagina | 11
Statistica
În urma alegerii acestei opţiuni se deschide o fereastră de dialog ca şi cea din figura
3.13. Constatăm că automat este selectată opţiunea de analizare a tuturor cazurilor: Analyze
all cases. Do not create groups.
Pentru a preciza care sunt grupurile în funcţie de care vrem să fie grupate rezultatele,
va trebui să specificăm care este variabila care ne defineşte grupurile. Întotdeauna aceasta va
fi variabila independentă. În cazul exemplului dat, aceasta este culoarea textului. Prin urmare,
vom selecta culoarea textului (cultext) şi o vom trece cu ajutorul săgeţii în câmpul: Groups
based on, după care dăm click pe butonul Ok.
Pagina | 12
Statistica
Pagina | 13
Statistica
În fereastra de rezultate, acestea vor fi prezentate separat pentru fiecare grup în parte,
după cum se poate vedea în Figura 3.18.
Pagina | 14
Statistica
În situaţiile în care avem un design intrasubiecţi, adică acelaşi grup de participanţi este
evaluat în mod repetat, există mici diferenţe faţă de situaţiile în care avem două grupuri
diferite.
Având următorul exemplu vom prezenta diferenţele şi asemănările faţă de prelucrările
deja explicate:
Un cercetător a dorit să vadă dacă pentru populaţia românească se menţine stereotipul conform căruia
persoanele rele sunt urâte. În acest scop le-a arătat unor subiecţi imagini cu persoane considerate frumoase,
respectiv urâte şi le-a cerut să evalueze în ce măsură este posibil ca persoanele respective să comită acte
criminale. Cu cât punctajul acordat de subiecţi era mai mare, cu atât actele comise erau mai criminale.
Subiect 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Urâte 7 5 6 9 7 6 7 10 4 9 7 8 5 6 8
Frumoase 9 2 5 8 6 5 4 4 5 7 6 7 3 4 5
Pagina | 15
Statistica
În dreptul fiecărui subiect vom introduce punctajul acordat pentru persoanele urâte,
respectiv, pentru persoanele frumoase. Baza de date obţinută este ilustrată în figura 3.20
Pagina | 16
Statistica
Figura 3.20 Baza de date pentru exemplul dat în cazul designului intrasubiecţi
Pagina | 17
Statistica
Poligonul de frecvenţă este graficul prin care reprezentăm frecvenţa cu care apare
fiecare valoare în setul de date. În figura umătoare avem reprezentat un poligon de frecvenţă.
Observăm că valorile obţinute (nivelul de stres) sunt reprezentate pe axa orizontală, iar
frecvenţa este reprezentată pe axa verticală. Pentru fiecare din cele 11 valori care reprezintă
nivelul stresului marcăm frecvenţa. Unind punctele astfel obţinute, trasăm graficul care poartă
denumirea de poligon de frecvenţe.
Pagina | 18
Statistica
30
25
20
Frequency
15
10
5
0
0 2 4 6 8 10
Stress Rating
Figura 3.24 Reprezentarea aceloraşi date sub formă de histogramă şi poligon de frecvenţe
Pagina | 19
Statistica
Pagina | 20
Statistica
Pagina | 21
Statistica
Pagina | 22