Sunteți pe pagina 1din 29

Analiza de frecvenţă şi

reprezentările
grafice
- Statistica descriptivă –este definită ca fiind un ansamblu de tehnici
şi proceduri destinate organizării şi prezentării sumative a datelor.
Constituie în acelaşi timp şi o etapă pregătitoare în fundamentarea
procedurilor statisticii inferenţiale(destinată verificării ipotezelor
statistice) de care ne vom ocupa mai târziu.Principalele componente
ale statisticii descriptive sunt: tehnicile de organizare şi
prezentare a datelor şi indicatorii numerici sumativi.
Statistici descriptive globale:
I – Analiza de frecvenţe şi reprezentările grafice cuprind tehnici
descriptive de tip global, cu ajutorul cărora se realizează
prezentarea şi analiza tuturor valorilor unei distribuţii
statistice. Acestea sunt la rândul lor, de două feluri:
 Numerice (distribuţia de frecvenţe simple, absolute şi grupate);
 Grafice (histograme; grafice de tip bară, linie, circulară de tip
“plăcintă”, histograma stem-and-leaf, etc.).
ANALIZA DE FRECVENŢE
Distribuţia simplă de frecveţe
-Sortarea valorilor în ordine descrescătoare sau
crescătoare:10,10,9,9,8, 8, 8,8 ,8,7,7,7,6,6,6,6,6, 6,6,5,4,4,4,4,2;
2,4,4,4,5,6,6,6,6,6,6,6,7,7,7,8,8,8,8,8,9,9,10,10-reprezintă o primă
operaţie de organizare a datelor obţinute(o “serie sau distribuţie
statistică”, ca rezultat primar al măsurării, a 25 de subiecţi cu note
pe o scală de raport de la 1-10 puncte, denumite în această fază, de
prelucrare a datelor, valori, note sau scoruri brute).
- Valoarea maximă (10) şi valoarea minimă(2) reprezintă
limitele distribuţiei de valori;
- Tabelul frecvenţelor simple(v. Tab.1) cu 2 coloane: valoare (în
ordine descrescătoare) şi frecvenţa absolută, simplă (fa), Σfa = N
( totalul valorilor obţinute într-o sesiune de evaluare,verificare-care
pot fi, de exemplu, notele la lucrarea de matematică ale elevilor
unei clase).
TABELUL1. FRECVENŢE SIMPLE (absolute)
 Valoare, scoruri brute  fa
 10  2
 9  2
 8  5
 7  3
 6  7
 5  1
 4  4
 3  0
 2  1
 Total  Σfa=N=25
 Frecvenţa cumulată (fc). Este constituită din totalul
frecvenţelor(repetărilor de note, valori) care se cumulează
începând de la valoarea(nota) cea mai mică până la valoarea(nota)
cea mai mare din tabel(Tab.2).
 De exemplu, valoarea(nota) 7, cumulează pînă la ea 16
valori(note),dintre care, 3 valori egale cu ea şi restul mai
mici.Nota (valoarea)10, ca valoare maximă, cumulează pînă la
nivelul ei, 25 de valori, dintre care, 23 sunt mai mici decît ea,
adică 92% din totalul notelor obţinute de elevii acestei clase la
matematică, sunt mai mici de nota 10(v. Frecvenţa relativă
cumulată procentuală-frc%-Tab.2)
 Frecvenţa relativă raportată la unitate fr(1) a unei valori este
raportul dintre frecvenţa absolută şi suma frecvenţelor absolute
(fa/Σfa).
Exemple:
 Pentru o valoare 10: fa/Σfa=2/25=0,08;
 Pentru valoarea 7: fa/Σfa=3/25=0,12.
 Frecvenţa relativă, cumulată, raportată la unitate frc(1) a
unei valori este similară frecvenţei cumulate absolute, cu
deosebirea că în acest caz se cumulează frecvenţele relativ
raportate la unitate ( plecând de la fr(1) a valorii celei mai mici,
adică de jos în sus.
Exemple:
 Pentru valoarea 7, frc(1) = 0,4+0+0,16+0,04+0,28+0,12 =0,64.
 Frecvenţa relativă procentuală fr(%): exprimă
procentul valorilor care se situează ( se repetă) în
dreptul unei valori distincte din cadrul distribuţiei
de valori. Se calculează fie prin înmulţirea fr(1) cu
100, fie prin calcularea directă a procentului pe care
îl reprezintă o anumită valoare raportată la totalul
valorilor dintr-o distribuţie. Suma frecvenţei relative
procentuale a unei distribuţii este întotdeauna egală
cu 100.
Exemple (tabelul 2):
- 8% dintre elevi au obţinut nota 10 la lucrarea de
matematică;
- 28% dintre elevi au obţinut nota 6
 Valoa  Fa  Fc  Fr  frc(1  Fr(%)  Fr
re ) c
 (1)
 (
 10  2  25  0,0  1,00  8% 10
%0
 9  2  23 8
 0,0  0,92  8%  )92
%
 8  5  21 8 
 0,2 %
0,84  20%  84
 7  3  16 0 
 0,1 %
0,64  12%  64
 6  7  13 2 
 0,2 %
0,52  28%  52
 5  1  6 8 
 0,0 %
0,24  4%  24
 4  4  5 4 
 0,1 %
0,20  16%  20
 3  0  1  6
0  0,04  0%  %4
 2  1  1  0,0  0,04  4%  %
4
 Tota  Σfa 4
 Σfr  Σfr %
l =25 =1 %=100
 Frecvenţa relativă cumulată procentuală
frc(%)
Exprimă procentul frecvenţei valorilor care se
cumulează plecând de la valoarea ce a mai mică
până la o anumită valoare ( inclusiv aceasta).
Valoarea maximă are frc(%) egal cu 100.
Exemple:
 52% dintre elevi au obţinut o notă egală sau mai
mică de 6;
 92% dintre elevi au obţinut cel puţin nota 9
Frecvenţa relativă procentuală cumulată a unui
scor (punctaj) la un test se numeşte rang percentil.
-De exemplu: scorul 19 la testul de eficienţă
intelectuală se află în rangul percentil 50;
- Altfel spus rangului percentil 50 îi corespunde în
cadrul distribuţiei scorurilor la testul de eficienţă
intelectuală, scorului de 19 puncte.
- Rangurile percentile 25%, 50% şi 75% se mai
numesc şi quartile (sferturi de distribuţie).Acestea
împart întreaga distribuţie în qurtilele I, II, III şi
IV.
 Reprezintă o modalitate de etalonare (normare) a
rezultatelor unor evaluări, chiar şi a notelor şcolare.
De exemplu nota 10 în cadrul distribuţiei de note
( valori) analizate – corespunde percentilului
( centilului) 100.
Nota 9 corespunde centilul 92;
Nota 6 corespunde centilul 52;
Nota 2 corespunde centilul 4;
Nota 8 corespunde centilul 84.
În cadrul etalonului pe baza percentilelor (centilelor),
o importanţă în procesul de evaluare psihologică îl au
percentilele 25, 50 şi 75, numite şi quartile, care
împart întreaga distribuţie în 4 quartile.
 1  9  8  1  1  1  9  1  9  1
0 4 7 1 1 1 1 1 6 0
1 7 5 6 3 5
 9  1  1  1  9  1  1  1  1  1
2 0 1 1 8 1 0 1 0 0
7 8 4 2 1 4 7 9
 9  1  1  1  1  1  1  1  1  8
7 0 2 0 1 1 1 0 0 9
9 4 2 8 3 6 6 8
 1  1  1  9  9  1  1  1  1  1
0 0 1 2 7 0 0 0 0 1
6 8 5 2 8 2 9 4
 1  1  1  1  1  1  1  8  1  1
0 0 1 0 0 2 2 6 0 2
7 4 0 1 1 1 5 9 3
 Se face diferenţa dintre valoarea
cea mai mare şi valoarea cea mai
mică
 125 – 86 = 39
 Se împarte valoarea obţinută la  39/2 =19,5 ~20 clase (prea multe)
mărimea posibilă a intervalului de  39/3 =13 clase ( variantă posibilă)
clasă (2,3,4 sau 5) pentru a realiza
numărul de clase al noii distribuţii
 39/4=9,75, poate fi rotunjit la 9 clase,
v. preferabilă, pt.numărul impar de
clase
 39/5 =7,8 ~8 clase (variantă
acceptabilă)
 Se selectează mărimea  Vom alege 4, pentru că produce o
intervalului care conduce la un distribuţie cu 9 clase care este mai
număr de clase cuprins între 5 şi uşor de analizat şi manipulat
15.
 Se determină limita inferioară a
primului interval (trebuie să 
includă valoarea minimă a Alegem valoarea 85(86) ca limită
distribuţiei) inferioară
 Se determină limita superioară a  Dacă mărimea intervalului este de 4,
primului interval limita superioară va fi 89
(85,86,87,88,89)
 Se construiesc intervalele de clasă pentru fiecare interval (vezi coloana
“clase” din tabelul 3)
 Se aplică analiza de frecvenţe ca în cazul frecvenţelor simple, aplicată la clase
 Clase  Fa  Fr%  Frc%
125 -  1  2%  100%
 120
129–  3  6%  98%
 115124
- 119  7  14%  92%
 110 - 114  7  14%  78%
 105 –
109–
 13  26%  64%
 100
104
 8  16%  38%
 95 – 99  4  8%  22%
 90 – 94  4  8%  14%
 85 - 89  3  6%  6%
 Σfa = 50  Σfr% =
100
Tipuri de reprezentări grafice
1. Graficul de tip bară
2. Histograma
3. Poligonul de frecvenţe
4. Graficul frecvenţei cumulate
5. Graficul circular(“plăcintă”-pie graph)
6. Graficul te tip “stem and leaf”(tulpină şi
frunze)
Graficul de tip bară

 Imagine inclusă într-un sistem de axe


perpendiculare
 Axa orizontală (OX) pe care sunt reprezentate
valorile (grupate pe clase) ale distribuţiei;

 Axa verticală (OY) pe care sunt reprezentate


frecvenţele fiecărei valori (clase de valori), sub
forma unei bare rectangulare.
Histograma
La prima vedere, histograma este asemănătoare cu graficul de
tip bară, este mai adecvată pentru situaţiile când variabila pe
care dorim să o reprezentăm este de tip “continuu” ( adică
poate lua orice valoare pe scală numerică, de ex. număr de
răspunsuri corecte, timpul de reacţie, lungimea, etc..).
În exemplul nostru, în histograma distribuţiei de frecvenţe din
tabelul 4, efectuată cu programul SPSS, care a realizat
automat o grupare de frecvenţe, este afişată pe axa Ox
limita minimă a intervalului ca “etichetă” acestuia.
Se constată că histograma redă mai bine tendinţa de uşoară
înclinare spre dreapta a curbei de distribuţie, ceea ce arată
că IQ-ului grupului de studenţi evaluat este uşor peste
nivelul mediu(IQ=100).
Poligonul de de frecvenţe
Este o reprezentare alternativă. Punctele centrale ale
suprafeţelor rectangulare care reprezintă frecvenţa
sunt unite cu o linie care deilitează suprafaţa
poligonului.
Poligonul alăturat prezintă distribuţia de
frecvenţe grupate din tabelul de mai jos, cifrele
1,2,3,4,5,6,7,8,9 reprezentând denumirea
convenţională a fiecărei clase
Graficul frecvenţei cumulate

 Este un grafic de tip liniar care reprezintă valorile


frecvenţei absolute cumulate. Pe acest grafic se
vede cu uşurinţă câte valori se află până la o
valoare din distribuţie ( datele reprezentate sunt
cele din tabelul 3, fiecare interval de clasă fiind
etichetat convenţional cu cifre de la 1 la 9.
Graficul circular(pie graph)
Este utilizat în situaţiile în care valorile sunt “ parte
a unui întreg”. De exemplu, poate fi utilizat la
reprezntarea distribuţiei de frcvenţe grupate mai
sus, pentru a avea o imagine directă a ponderii
frecvenţei fiecărei clase de interval în raport cu
celelalte.
Graficul alăturat reprezintă frecvenţa absolută
a claselor de interval ale aceleiaşi distribuţii. Pe
un grafic de acest tip se pot reprezenta fie valori
absolute, fie procentajul fiecărei clase raportat la
întreg.
Reprezentarea de tip stem and leaf
(stem plot)
 Este o reprezentare care încearcă să îmbine
expresia numerică cu cea grafică. Scopul principal
a fost acela de a oferi nu doar o imagine a
distribuţiei ci şi o metodă de explorare a cesteia..
Ea este din ce în ce mai utilizată de psihologi,
motiv pentru care considerăm necesar să o
prezentăm aici.
Reprezentarea de tip stem-and-leaf( pe scurt stem
plot),are tocmai avantajul de a realiza graficul
distribuşiei cu păstrarea valorilor individuale.
Reprezentarea de tip stem and leaf
(stem plot) Modul de realizare
 1  1  1  1  1  1
 9  8  9  9
0 1 1 1 1 0
4 7 1 6
1  1  1  71 5  61  1  31  1  5
1
 9  9
0 1 1 1 0 1 0 0
2 8
 7
1  8
1  41  1  21  11  4
1  71 9
 9  8
0 2 0 1 1 1 0 0
7 9
 1  91  41 2 8  31  61  6
1  81  1
 9  9
0 0 1 0 0 0 0 1
2 7
 61  8
1  51  1  1  21  81 2  91  4
1
 8
0 0 1 0 0 2 2 0 2
6
7 4 0 1 1 1 5 9 3
Observăm că valorile sunt cuprinse între 86 şi 125.

Alegem o valoare convenabilă pentru tulpină,


care va juca rolul de interval de clasă, şi, în cazul
nostru poate fi 10.

“ Tulpina” reprezentării stem plot este în acest caz


numărul de zeci din fiecare valoare individuală.
Reprezenterea de ansamblu apare ca o histogramă orizontală. Stem
(axa verticală) indică numărul de zeci al scorului la test, iar cel
din coloana leaf(axa orizontală), numărul de unităţi al
scorurilor(valorilor), dar şi frecvenţa acestor scoruri(valori).
Stem/leaf
8. 679
9. 224
9. 6778
10. 11122245
10. 667778889999
11. 023344455
11. 66788
12. 1345

S-ar putea să vă placă și