Sunteți pe pagina 1din 27

Concepte

fundamentale ale
analizei datelor
statistice

1
 Statistica este știința care se ocupă cu studiul
fenomenelor bine determinate în timp şi spaţiu,
atât din punct de vedere cantitativ, cât și
calitativ.
 Cuvântul statistică provine din limba italiană
(statista) desemnând persoana care se ocupa de
afacerile statului.
 În cadrul unei analize statistice se urmărește
parcurgerea unor etape de:
- observare și de culegere a datelor statistice,
- sistematizare şi prelucrare,
- analiză şi interpretare a rezultatelor obținute
- formulare de concluzii.

2
 statistica descriptivă care sintetizează şi
structurează datele de observaţie şi
informaţia conţinută în acestea, utilizând
tabele, grafice, indicatori numerici etc;
 statistica inferenţială prin intermediul
căreia datele obţinute la nivelul unui
eşantion se generalizează la populaţia
statistică totală cu marje specifice de
incertitudine.

3
 Un studiu realizat de R. Allison şi K. Uhl, în 1965,
în SUA, pe un eşantion reprezentativ de 326
băutori de bere (bărbaţi ce consumau bere de
cel puţin trei ori pe săptămână) a incercat să
răspundă întrebării “Cum vă place berea, cu
etichetă sau fără etichetă?”
Studiul s-a desfășurat astfel:
 în prima săptămână consumatorii au băut bere
din sticle etichetate ale diverselor mărci de
prestigiu din domeniu și au apreciat pe o scală
preferinţa pentru fiecare dintre acele mărci de
bere;
 în următoarea săptămână experimentul s-a
repetat, de data aceasta însă consumatorii au
apreciat din nou preferinţa pentru o anume
bere, fără a şti cărei marcă aparţine (neavând la
îndemână etichetele pe sticlele de bere).
4
 Concluzia studiului a fost că persoanele
consumatoare de bere nu au fost capabile să
identifice o anume marcă de bere numai pe
baza gustului, fiind influențați mai mult de
imaginea mărcii unui produs decât de
calităţile senzoriale ale acestuia.
 De asemenea, metodele statistice le-au
permis cercetătorilor să extindă rezultatul
obținut la toți băutorii de bere în general, nu
numai celor 326 luaţi în calcul în studiu.
 Ulterior, astfel de studii s-au făcut şi pentru
băuturi răcoritoare (Coca-Cola şi Pepsi),
precum şi pentru mărci celebre de cafea

5
 Colectivitatea statistică (sau populaţia
statistică) reprezintă totalitatea elementelor de
aceeaşi natură, bine determinate în timp şi
spaţiu care au trăsături esenţiale comune şi care
sunt supuse unui studiu statistic.
 Statistica operează cu colectivităţi finite,
colectivităţi numărabile sau colectivităţi
infinite.
 Fiecare element al populaţiei statistice se
numeşte unitate statistică sau individ.
 Dacă populaţia statistică studiată este finită,
atunci numărul unităţilor care o compun se
numeşte volumul (sau efectivul) populaţiei
statistice.

6
 Caracteristica (sau variabila) statistică
reprezintă proprietatea comună tuturor
unităţilor unei colectivităţi. Aceasta poate
varia ca valoare (sau nivel) de la o unitate a
colectivităţii la alta.
 Valoarea (sau varianta) caracteristicii
reprezintă nivelul concret pe care îl poate
lua o variabilă la nivelul unei unităţi (sau
grup) de unităţi statistice.
 Măsurare−procesul prin care se obţin valorile
variabilelor sau atribuirea de valori
caracteristicilor indivizilor potrivit unorreguli;
 Cercetare−studiul variabilelor şi a relaţiilor
dintre ele.

7
N = volumul populației statistice, numărul
total al unităților statistice;
 x = o caracteristică studiată;
 x1, x2,…,xm = valorile caracteristicii x;
 n 1, n2, ... ,nm = numărul de unități
corespunzător valorilor caracteristicii

8
 Variabile calitative−variabilele ale căror valori
sunt exprimate prin cuvinte care desemnează
apartenenţa individului la una din categoriilescalei
(exemple:calificativul, profesia, starea civilă etc.).
Variabilele calitative sunt de 2 tipuri:
- nominale şi
- ordinare.
 Variabile cantitative−variabilele ale căror valori
se exprimă numeric(exemple: vârsta, salariul,
inaltimea, etc.).
Variabilele cantitative sunt de 2 tipuri:
-de interval şi
- de raport

9
Clasificarea variabilelor după numărul
de valori (saua variantelor de
răspuns):
 Dihotomice (binare, alternative) − variabile
calitative scala cărora e compusă din 2 valori
antonime
Exemple: da –nu, prezent –absent, aprins
–stins etc.).
Noţiunea de variabilă binară provine de la
codificarea valorilor acestora cu 0 şi 1.
 Nealternative (categoriale)− celelalte
variabile calitative, ce nu posedă proprietăţi
ale variabilelor dihotomice.

10
 Primare−variabile obţinute în etapa de
culegere a datelor (exemplu: vârsta
înregistrată în ani, notele primite la
examenele din sesiune etc.);

 Derivate (auxiliare)−variabile obţinute în


urma procesului de prelucrare a variabilelor
primare (exemplu: vârsta calculată pe grupe
de vârstă, nota medie la sesiune etc.).

11
 discrete, care nu pot lua decât anumite valori
pe scala lor de variaţie, de regulă numere
întregi (exemple: numărul de copii dintr-o
familie, numărul de produse, etc.);
 continue, care pot lua orice valoare din scala
lor de variaţie (exemple: înălţime, greutate,
etc.).

12
 variabile calitative care pot lua un număr finit
de valori neordonate sau variabile care permit
doar clasificarea observaţiilor.
Exemplu: categorii de produce alimentare
(lactate, produse de panificație, produse din
carne, băuturi, etc.)
Observaţii:
 În vederea prelucrării, valorile variabilelor
nominale se codifică, de regulă, cu numere
întregi. În acest caz tipul variabilei nu se
modifică prin utilizarea unei astfel de
codificări.
 La acest nivel nu sunt permise nici ordonarea
și nici operațiile aritmetice.

13
 variabile calitative ale căror valori sunt
ordonate dar nu se poate defini distanţa
dintre oricare două valori.
Exemplu: calificativele: insuficient, suficient,
bine, foarte bine).
Observaţii:
 la codificarea valorilor (ordonate) ale
variabilelor ordinare se folosesc şiruri
ordonate de numere întregi.
 La acest nivel este permisă numai ordonarea,
fără a cunoaște distanţa dintre valorile scalei
de măsurare.
14
 variabile cantitative (numerice), utilizând o valoare
0 convenţională.
Exemplu: temperatura măsurată în grade Celsius
(intervalele dintre valori sunt egale, dar punctul 0
este convenţional ales, ca fiind temperatura la
care apa îngheaţă).
Observaţii:
 valorile variabilelor numerice nu se codifică: în
calitate de “cod”se ia chiar valoarea variabilei.
 La compararea valorilor găsim răspuns la
întrebări de tipul: “Cu cât e mai mare?”sau “Cu cât
e mai mic?”
 La acest nivel sunt permise, în plus față de
ordonare, operaţii de adunare, scădere

15
Variabile cantitative (numerice), utilizând o valoare 0
naturală.
 Exemple: distanţă, greutate, profit, au punctul de
pornire în 0 (0 km, 0 kg, 0 lei).
Observaţii:
Valoarea 0 indică inexistenţa variabilei.
La compararea valorilor găsim răspuns şi la întrebări
de tipul: “De câte ori e mai mare?” sau “De câte ori e
mai mic?”
La acest nivel sunt permise toate operaţiile
aritmetice
Existenţa unui zero absolut permite formularea unor
afirmaţii în termeni de proporţii între valorile
caracteristicii.
16
Măsurarea fenomenelor statistice se realizează cu
instrumente de măsurare a fenomenelor, și anume scalele,
care pot avea următoarele forme:
Scala de Caracterizare Exemple
măsurare
Scala este o scală nominală, da/nu, adevărat / fals
dihotomică fiind aplicabilă barbaţi/femei,
variabilelor care nu au mediul urban/mediul
decât două variante rural.
Scala este utilizată în cazul în vârsta
trihotomică care dihotomia da/nu 20-40 ani, 40-60 ani şi
admite şi o poziţie peste 60
neutră „nu ştiu”, sau
când variabilele sunt
aduse la trei stări:
Scala operează cu un număr 1-3 unități, 4-6 unități,
polihotomică multiplu de variante mai mult de 6 unități.
17
Scala de Caracterizare Exemple
măsurare
Diferenţiala este exprimată printr-o scală distribuţie a aprecierilor
semantică cu un număr impar de trepte referitoare la
(3, 5, 7 sau 9) plasate între caracteristicile ale unui
perechi de adjective. produs, apreciate cu
Variantelor li se asociază calificativele: Foarte
cifrele 5, 4, 3, 2 şi 1 favorabil (foarte bun),
favorabil, satisfăcător,
nefavorabil, foarte
nefavorabil
Scala Likert măsoară aprecierile cu “Produsul A este bun.”
privire la o informative, printr- Faţă de acestă afirmaţie,
o scală cu un număr impar consumatorii pot alege
de trepte, față de care ca variante: acord total,
respondenții pot fi sau nu de acord, indiferent,
accord. Pentru prelucrarea dezacord şi dezacord
informaţiilor, se acordă celor total.
cinci trepte valori numerice
+2, +1, 0, -1, -2.

18
Scala de Caracterizare Exemple
măsurare
Scala de Plasarea pe locurile I, II sau Plasarea pe
ordonare III asigură o anumită ordine locurile I, II sau III
a obiectelor studiate. Locului a unui produs, în
I i se acordă 3 puncte, funcţie de gust.
locului II 2 puncte, iar locului
III 3 puncte
Scala se realizează prin Se pot compara
comparaţiilor compararea variantelor două câte două
perechi luate două câte două. mai multe tipuri de
produse
Scala cu sumă se realizează prin
constantă repartizarea a 100 de
puncte între mai multe mărci
ale unui produs
Scala rezultă prin aplicarea
combinată succesivă a scalei de
ordonare şi diferenţialei
semantice
19
Metoda ordonării rangurilor
Într-un supermarket se efectuează sondarea aprecierilor
consumatorilor asupra unui nou tip de iaurt cu fructe, expus în două
variante. Cercetarea se desfăşoară pe un eşantion de 500
persoane, cărora li s-a cerut să indice ordinea de importanţă (locul
I, II, III sau IV) în evaluarea celor patru caracteristici ale iaurtului cu
fructe: gust, conţinut în pulpă de fructe, preţ şi ambalaj.
Răspunsurile subiecţilor sunt centralizate în tabelul următor

24
Precizia reprezinta gradul de rafinament cu care este
efectuata o operatie (sau o masuratoare).
Când efectuam diferite statistici trebuie sa avem grija ca
precizia raspunsului studiului respectiv sa nu depaseasca
precizia datelor analizate.
De exemplu daca am masurat înaltimea unor oameni în
cm si am calculat media, trebuie sa raportam aceasta medie tot
în cm sau cel mult cu o singura zecimala.
O mare parte a statisticii are de-a face cu acuratetea
(exactitatea).
De exemplu, cât de siguri suntem ca media înaltimii
calculata folosind un esantion de 10 elevi ai unei clase este o
reprezentare exacta a mediei înaltimii acelei clase?
Pentru a putea face o distinctie între precizie si
acuratete, putem face o analogie cu modul in care este atinsa o
tinta de un tragator dupa cum se observa în figura următoare.

26
A - Precizie inacurata (precizie B - Precizie acurata (precizie exacta);
inexacta)

C - Imprecizie inacurata (imprecizie D-Imprecizie acurata (imprecizie


inexacta) exacta)

27

S-ar putea să vă placă și