Sunteți pe pagina 1din 20

Statistica Descriptivă

Noțiuni elementare:
• Frecvența
• Prezentări grafice ale datelor
Recapitulare
Ce este o variabilă?
Câte feluri de variabile
există?
Cum măsurăm variabilele în
științele sociale?
Tipuri de variabile în funcție de nivelul de
măsurare

Nominal Ordinal Scala

Ce fel de Ce fel de variabile?


Ce fel de variabile? Variabile numerice
variabile? Variabile numerice
de interval (uneori)
Variabile adesea de interval, rar
variabile categoriale variabile numerice
categoriale de raport

Ce putem face cu Ce putem face cu ele? Ce putem face cu ele?


Putem număra, putem Număra, desena,
ele? desena, putem calcula calcula, ordona,
Putem număra, câte ceva și putem ierarhiza, compara,
desena ordona valorile. asocia și rar prezice.
Numărătoarea și desenele
Frecvența – este cea mai cunoscută formă de
numărătoare.
Dacă duminica viitoare ar avea loc alegeri pentru Preşedintele ţării, dvs. pe cine aţi vota?

Cumulative
Frequency Percent Valid Percent Percent

Valid Adrian Năstase
Traian Băsescu
491
163
27,3
9,1
45,8
15,2
45,8
61,1
C.V. Tudor 148 8,2 13,8 74,9
Candidatul Alianţei D.A. 11 ,6 1,0 75,9
Gheorghe Ciuhandu 5 ,3 ,5 76,4
Emil Constantinescu 1 ,1 ,1 76,5
Dan Voiculescu 1 ,1 ,1 76,6
Gheorghe Dinu 2 ,1 ,2 76,8
Mircea Geoană 12 ,7 1,1 77,9
Frecventa absoluta: 1, 2,
Gigi Becali 2 Frecventa relativa: tot in
,1 ,2 78,1
Ion Iliescu 33 1,8 3,1 81,1
3, 4...n
Mugur Isărescu 1 ,1 %, DAR raportat la n
,1 81,2
Marko Bela 6 ,3 ,6 81,8
Frecventa procentuala:
Teodor Meleşcanu 1 ,1adica esantionul care a
,1 81,9
Petre Roman 4 ,2 ,4 82,3
1%, 2%, 3%, ...., n%
Candidatul PSD 5 inregistrat valori valide
,3 ,5 82,7
Theodor Stolojan 184 10,2 17,2 99,9
Ion Mânzatu(întotdeauna raportata la
1 ,1 ,1 100,0
Total 1071 59,5 100,0
Missing Nu votez N, adica populatia 108 6,0

investigata.
Nu m-am hotărât 580 32,2
NR 41 2,3
Total 729 40,5
Total 1800 100,0
Exercițiu
Citiți următorul tabel și răspundeți pe rând la următoarele
întrebări:
1. Ce fel de variabilă este prezentată în tabel? (categorială sau
numerică)
2. Cum este ea măsurată? (nominal, ordinal sau pe o scală)
3. Câti oameni au spus că Regele Carol I a facut bine
României?
4. Care este ponderea relativă a oamenilor care cred că Nicolae
Titulescu a facut bine României?
5. Care este ponderea celor care au o opinie și cred ca Traian
Basescu a facut bine României?
6. Care este personalitatea din tabel despre care nu ați auzit
niciodată?
Exercițiul 2
Realizați un tabel de frecvențe în care să inventariați următoarele date:
30 de persoane au fost rugate să numească un ONG cunoscut. Acestea sunt
răspunsurile lor:
Asociația Pro Crucea Roșie Nu îmi UNICEF UNICEF
Democrația amintesc
(APD)
UNICEF Asociația Pro Crucea Roșie Asociația Pro Salvați Copii
Democrația Democrația
(APD) (APD)
Asociația Pro Salvați Copii Crucea Roșie Nu îmi Asociația Pro
Democrația amintesc Democrația
(APD) (APD)
Salvați Copii Crucea Roșie Agenția Crucea Roșie Agenția
Împreună Împreună
UNICEF Nu îmi Salvați Copii Salvați Copii Asociația Pro
amintesc Democrația
(APD)
Agenția Asociația Pro Salvați Copii Crucea Roșie Salvați Copii
Împreună Democrația
(APD)
Rezultat

Denumire ONG Frecvență Frecvență relativă Frecvență relativă


(procentuală) validă

Asociația Pro
7 23% 26%
Democrația (APD)
Crucea Roșie 6 20% 22%
UNICEF 4 13% 15%
Salvați Copii 7 23% 26%
Agenția Împreună 3 10% 11%
Nu îmi amintesc 3 10% -
Total 30 100% 100%
Cand frecventele sunt prea multe...
... le putem grupa
Re
gu la g
𝟐𝒌 ≥𝒏 r up
ări
În cuvinte: i
k = numărul de clase / grupe
n = numărul de cazuri

Cu alte cuvinte, puterea la care îl ridicăm pe 2 trebuie să


producă un rezultat care să fie mai mare sau egal cu numărul
de cazuri înregistrate în baza de date.
𝐦𝐚𝐱 −𝒎𝒊𝒏
𝑾≅
𝒌
În cuvinte:
W= dimensiunea / intervalul unui grup
Max = valoarea maximă înregistrată de variabilă
Min = valoarea minimă înregistrată de variabilă
k = numărul de grupe
Dimensiunea (intervalul) fiecărui grup este determinat de raportul dintre
diferența între valoarea maximă și cea minimă înregistrate de o variabile și
numărul de grupe, rotunjit la valoarea întreagă.
... De exemplu
1196 de oameni au fost întrebați câți ani au... Ei au
declarat vârste între 18 și 93 de ani. Să calculăm:
𝟐𝒌 ≥𝒏
1.
𝐦𝐚𝐱 −𝒎𝒊𝒏 93 − 18 75
𝑾≅ 𝑊≅ ≅ ≅ 6 , ( 81 ) ≅ 6
𝒌 11 11

În cuvinte: vom împărți mulțimea observațiilor efectuate în 11


grupe, fiecare grupă cuprinzînd un interval de câte 6 ani...
...rezultat

Am
înc reus
a pe i t, t
pe abe
un lul
slid sing
e ur
Ati observat o diferenta intre....??
Variabilele masurate NOMINAL sau ORDINAL pot fi
cu usurinta descrise cu ajutorul frecvențelor. De regula
formula matematica pe care o putem aplica este de
tipul:
(frecventa procentuala %) sau (proportie)
f = frecvența absolută (adică numărul de observații cu aceeași valoare)
N=numărul total de observații

Variabilele masurate pe SCALE, de regula, nu pot fi


descrise cu ajutorul tabelelor de frecventa. Valorile
observatiilor trebuie grupate in clase de valori.
... le putem desena
Tipuri de grafice...

Graficul cu bare (bar chart)


 Îl folosim pentru a prezenta frecvența valorilor
unei variabile
 Este util în comparația vizuală a frecvenței
valorilor uneia sau a mai multor variabile

Graficul plăcintă(pie chart)


 Îl folosim pentru a prezenta frecvența valorilor
unei variabile
 Este util în descrierea vizuală a ponderii unor
caracteristici ale unei variabile analizate
Graficul cu linii (line chart)
 Îl folosim pentru a prezenta evoluția unei
anumite caracteristici a unei variabile
 Este util în comparația vizuală a evoluției unor
variabile în timp
Un fel de reguli privind graficele
Un grafic trebuie întotdeauna sa exprime clar o singura
dimensiune / caracteristică...poate două dacă e obligatoriu. Nu
încărcați niciodată un grafic
Graficul în sine nu este important, informația pe care doriți să o
transmiteți prin grafic este importantă. Nu colorați prea mult un
grafic.
Graficul trebuie să fie întotdeauna clar și să nu fie încărcat cu
ajutoare vizuale (linii, grile) sau informații inutile. Nu folosiți
etichete, optiuni, legende decât dacă ele sunt obligatorii pentru a
înțelege ce e în grafic.
Alegeți întotdeauna tipul de grafic adecvat, în funcție de
informația pe care doriți să o prezentați. Nu folosiți grafice cu
bare pentru a prezenta date pe serii de timp și nu folosiți linii
pentru a prezenta frecvențe.
Alte tipuri de grafice
Grafice cu puncte
(probability plot si
scatterdot “nor de
puncte”)

Grafice cu bare (box


plot si histograma)
Alte tipuri de grafice

Inventat și folosit pentru prima oară


Graficul radar sau pânză de
de o asistentă medicală britanică,
păianjen, este folosit fie pentru
Florence Nightingale, pentru a
a ilustra distribuții fie pentru a
ilustra diferența numărului de morți
compara cu ușurință variația
în timpul războiului din Crimea
valorilor a cel puțin două
(1853-1856)...
variabile...
Grafice cu.... cifre

Popularizat în perioada anilor


1970 – 1980 de către John
Tukey, graficul ramura cu frunze
(stem and leaf plot) este un
instrument primitiv dar puțin
utilizat astăzi de afisare a unei
distributii...
...În episodul următor

S-ar putea să vă placă și