Sunteți pe pagina 1din 15

STATISTICĂ

CURS 2

Concepte de bază utilizate în statistică

1
Concepte de bază
1. POPULAŢIA STATISTICĂ (colectivitate generală)= totalitatea
elementelor de aceeaşi natură care au trăsături esenţiale comune şi
care sunt supuse unui studiu statistic.
 Termenul de populaţie se referă o colectivitate de obiecte, persoane, păreri,
gânduri, evenimente, opinii etc.
 O colectivitate devine, în general, finită, prin delimitarea sa în timp, spaţiu şi ca
formă organizatorică.
 Unele colectivităţi, deşi finite, sunt atât de numeroase, încât pot fi considerate
infinite.

2. EŞANTIONUL (colectivitate parţială, colectivitate de selecţie)=


submulţimea de elemente selectate dintr-o colectivitate statistică.

3. UNITATEA STATISTICĂ = elementul constitutiv al unei colectivităţi


statistice care este purtătorul unui nivel al fiecărei caracteristici supuse
observării şi cercetării statistice.

 Unitatea statistică trebuie definită clar pentru a face posibilă atât identificarea ei
exactă, cât şi înregistrarea datelor.
 Unităţile statistice pot fi simple sau complexe. Unităţile complexe sunt rezultate
ale organizării sociale ori economice a colectivităţii statistice (exemplu: familia).
2
Concepte de bază
4. VARIABILA (CARACTERISTICA) STATISTICĂ = trăsătura,
proprietatea, însuşirea comună tuturor unităţilor unei colectivităţi şi
care variază, ca nivel, variantă sau valoare, de la o unitate a
colectivităţii la alta. Este denumită şi variabilă .

 Variabilele statistice sunt CALITATIVE şi CANTITATIVE


 Caracteristicile calitative (nenumerice) oferă răspunsuri categoriale la întrebari de tipul:

„Aveţi asigurare de viaţă?” (variantele de răspuns sunt limitate la „da” şi „nu”)

„Ce ziar cotidian cumpăraţi în mod frecvent?” (sunt mai multe variante de
răspuns)

 Caracteristici cantitative (numerice) oferă răspunsuri sub formă de valori numerice la


întrebări de tipul

„Ce înălţime aveţi?”

„La câte ziare sunteţi abonat?”

3
Concepte de bază
 Variabilele cantitative pot fi de tip continuu sau discret
 Datele discrete sunt răspunsuri numerice care apar în urma unui proces de numărare (date a
căror variaţie se manifestă prin salturi, pot lua doar anumite valori pe scara lor de variaţie care
este o submulţime a mulţimii numerelor întregi).
numărul de copii pe care îi are o familie
numărul de oraşe dintr-un judeţ
numărul de abonamente la ziare

 Datele continue sunt răspunsuri numerice care apar în urma unui proces de măsurare (date
care pot lua orice valoare din scara lor de variaţie care este un interval de numere reale).
greutatea unei persoane
cifra de afaceri a unei firme
rata şomajului la nivel de judeţ
înălţimea unei persoane
 În practică, continuitatea unor variabile poate să fie limitată de precizia măsurătorilor
(exemplu: vârsta în ani împliniţi). Unele variabile, deşi discrete, au salturile discontinuităţii atât
de mici în raport cu ordinul de mărime al lor, încât pot fi considerate continue (exemplu:
populaţia unei ţări).

4
Concepte de bază
 Variabilele statistice sunt, în funcţie de numărul variantelor de
răspuns, alternative (binare) sau nealternative
 Variabilele alternative sunt acelea care pot avea două variante de răspuns,
după modelul adevărat/fals din logică:
sex (M/F),
stagiul militar (efectuat/neefectuat),
mediul de rezidenţă (urban/rural);
 Variabilele nealternative sunt cele care pot lua mai multe valori/variante de
răspuns:
salariu,
profesie,
cifră de afaceri,
categorie de confort hotelieră etc.
 O caracteristică nealternativă poate fi transformată într-una alternativă, printr-un
proces de dihotomizare: salariul până la 4000 lei/peste 4000 lei.

5
Concepte de bază
5. DATELE STATISTICE pot fi clasificate:
A) După numărul de variabile cu care caracterizăm o unitate statistică:
 Datele univariate se referă la o singură variabilă statistică, adică înregistrăm o
singură valoare pentru fiecare unitate statistică.
Metodele statistice vor fi folosite pentru:
- sistematizarea datelor,
- analiza trăsăturilor esenţiale ale setului de date (tendinţa centrală)
- analiza variabilităţii datelor
- analiza distribuţiei valorilor observate în raport cu valorile tipice determinate.
 Datele bivariate sunt cele care se referă la două variabile statistice şi pentru
fiecare unitate statistică din colectivitate avem exact câte două valori.
Metodele statistice vor fi folosite pentru a caracteriza separat datele pentru fiecare variabilă (ca în
cazul datelor univariate), dar şi pentru a studia legătura, dependenţa dintre cele două variabile
considerate.
 Datele multivariate sunt cele care se referă la trei sau mai multe variabile
statistice, obţinând deci câte trei sau mai multe valori pentru fiecare unitate
statistică din colectivitatea studiată.
Deşi sunt multivariate, datele pot fi analizate separat (pentru fiecare variabilă), sau în
interdependenţă unele cu altele.

Pentru angajaţii unei firme, salariul, sexul, vechimea, profesia reprezintă un set de date
multivariate, ce pot fi folosite în explicarea diferenţelor dintre venituri.

6
Concepte de bază
B) Din punct de vedere cronologic în:
 Datele de tip profil (date de tip secvenţă sau de tip secţiune) reprezintă
rezultatul unor măsurători efectuate la un anumit moment dat de timp asupra
uneia sau mai multor variabile de interes pentru populaţia studiată.
Acest tip de date constituie „tăieturi informaţionale” transversale în raport cu axa timpului
(adică nu includ influenţa timpului asupra caracteristicilor studiate), efectuate într-o populaţie
statistică la un moment dat.
Numărul observaţiilor concide, în acest caz, cu numărul unităţilor statistice din colectivitatea
studiată.
 Datele de tip serii de timp (serii cronologice) reprezintă rezultate ale unor
măsurători efectuate asupra caracteristicilor unităţilor populaţiei studiate, la
momente succesive sau la anumite intervale de timp.
Aceste date sunt clasificate în date de tip stoc sau de tip flux şi reprezintă secţiuni
informaţionale longitudinale în raport cu axa timpului.
 Datele de tip panel sunt combinaţii ale datelor de tip profil şi serii de timp.
Aceste date reprezintă rezultate ale măsurătorilor efectuate asupra caracteristicilor unităţilor
statistice dintr-un panel (eşantion fix), la anumite momente succesive de timp. Se obţin
astfel, tăieturi informaţionale transversale şi longitudinale în raport cu axa timpului, trăsătura
principală a acestor date fiind simultaneitatea.

7
Concepte de bază
6. FRECVENŢA DE APARIŢIE a unei variante/valori reprezintă numărul
de apariţii al acestei variante/valori în colectivitate.
7. STATISTICA DESCRIPTIVĂ poate fi definită ca totalitatea metodelor
de culegere, prezentare şi caracterizare a unui set de date, în scopul de
a descrie principalele trăsături ale setului de date.
8. STATISTICA INFERENŢIALĂ poate fi definită ca totalitatea
metodelor ce permit estimări, luarea unor decizii, realizarea unor
previziuni sau alte generalizări pentru colectivitatea generală, pe baza
rezultatelor obţinute pe un eşantion.
9. PARAMETRUL STATISTIC reprezintă un indicator statistic descriptiv
calculat pentru o colectivitate totală (generală). Indicatorul statistic ce
este calculat într-un eşantion şi pe baza căruia se estimează
parametrul colectivităţii generale se numeşte statistică.
10. ESTIMATORUL reprezintă un indicator statistic calculat pe un eşantion
care reprezintă aproximarea valorii adevărate şi necunoscute a unui
parametru ce caracterizează colectivitatea generală.

8
Măsurarea in statistica. Tipuri de scale
 Prelucrarea statistică ţine cont de tipul datelor şi de scala pe care
acestea sunt măsurate.
 Toate datele statistice colectate sunt transpuse pe o scală de
măsurare
 Măsurarea presupune, în anumite cazuri, asocierea unor numere
variantelor/valorilor variabilei de interes
 Indicatorii statistici calculaţi pentru o variabilă depind de nivelul de
scalare utilizat.
 Patru niveluri de măsurare sunt utilizate (de la cea mai slabă la cea mai
puternică:
1. scala nominală,
2. scala ordinală
3. scala de interval
4. scala de raport.
 Prelucrarea datelor statistice se va face în mod distinct, în funcţie de
gradul de „rafinament” al scalei.

9
SCALA NOMINALĂ
 SCALA NOMINALĂ (de clasificare sau scala denumirilor) este utilizată
pentru măsurarea variabilelor de tip nenumeric (calitativ) .
 Ea clasifică subiecţii în grupe ai căror membri diferă după caracteristica
scalară (nenumerică), fără să implice existenţa unei gradări sau distanţe
între grupe.
 Numerele ataşate unor observaţii reprezintă eticheta categoriei respective.
 Scala nominală oferă cea mai slabă formă de măsurare, deoarece nu se
pot determina diferenţe între clase şi nici nu se poate face o ordonare
între categorii.
 Exemple: ocupaţia, sexul, statutul marital, tipul de asigurare etc.
 Deşi variantele sunt convertite în numere, caracteristicile rămân de tip
nenumeric, calitativ şi orice prelucrare aritmetică este lipsită de sens.
Presupunem că pentru variabila „ocupaţia”, s-au stabilit variantele de răspuns
codificate: actor – 1, muncitor – 2, inginer – 3, economist – 4, şi 10 persoane au fost
întrebate ce ocupaţie au, înregistrându-se variantele: 3; 1; 3; 4; 4; 2; 4; 3; 2; 2.
Media acestor valori este 2,8 – valoare lipsită complet de semnificaţie. Tot ceea ce
putem face cu aceste date este să numărăm de câte ori apare fiecare variantă de
răspuns şi să calculăm (în acest exemplu) proporţia persoanelor care se încadrează
în fiecare categorie ocupaţională.

10
SCALA ORDINALĂ
 SCALA ORDINALĂ este utilizată pentru măsurarea variabilelor de tip
nenumeric (calitativ) ale căror variante de răspuns pot fi ordonate.
 Unităţile pot fi înşiruite una relativ cu cealaltă şi se poate realiza, astfel,
o ierarhizare, dar distanţa între numerele acordate nu este obligatoriu
egală.
 Numerele pe scala ordinală nu reprezintă intervale egale pe scala de
măsurare.

Variabilă Clase Clase


Variabilă ordinală
ordinală ordonate ordonate
*
Primare
**
Gimnaziale Categorii ale
Studii ***
Liceale hotelurilor
****
Universitare
*****

11
SCALA DE INTERVALE

Celsius vs Fahrenheit

C -20 -10 0 10 20
F 32 14 32 50 68
SCALA DE INTERVALE
 SCALA DE INTERVALE (sau cardinală) este prima scală numerică,
ce foloseşte unităţi de măsurare egale.
 Permite nu numai interpretarea ordinii notărilor pe scală, dar şi a
diferenţelor dintre ele.
 În plus, faţă de scala nominală şi cea ordinală, intervalele dintre
categoriile de pe scală sunt presupuse a fi egale.
 O caracteristică a scalei de interval este absenţa unui punct zero
absolut.
 Pe scala de interval, numerele stabilite pe scală sunt arbitrare. Chiar
dacă unui punct de pe scală i se atribuie valoarea „0“, acest lucru nu
reprezintă absenţa absolută a caracteristicii măsurate.
Punctul „0“ pe scala de temperatură Celsius sau Fahrenheit ilustrează acest lucru.

 Judecăţi comparative ca „de două ori mai mult”, „de patru ori mai
puţin” etc. nu pot fi făcute pentru compararea valorilor specifice
măsurate pe o scală de interval.
 Nu are sens multiplicarea sau divizarea valorilor.

13
SCALA DE RAPORT
 SCALA DE RAPORT (proporţională) se utilizează pentru măsurarea
variabilelor numerice, fiind scala care permite ca afirmaţiile făcute
pe baza operaţiilor de adunare, diferenţă, multiplicare sau divizare să
aibă sens.
 Pentru variabilele măsurate pe această scală putem afirma, cu precizie, că, de pildă, o
persoană cu vârsta de 30 ani are de două ori mai mult decât cea de 15. Punctul zero nu este
neapărat necesar să fie o valoare măsurată a variabilei; este suficient să existe efectiv pe
scală.
 Timpul de alergare pe distanţa de 50 metri este măsurat pe o scală de raport (proporţională),
deşi nimeni nu poate practic parcurge distanţa de 50 metri în 0,00 secunde.

 Un punct zero absolut sugerează absenţa totală a caracteristicii sau însuşirii care
este studiată.
Variabilă numerică Nivel de măsurare
Greutatea (în kg) Raport
Vârsta (în ani sau zile) Raport
Salariul (în lei, EUR etc.) Raport

14
Bibliografie

 A. ISAIC-MANIU, C. MITRUŢ, V. VOINEAGU, STATISTICĂ, Ed.


Universitară, Buc., 2004, pag.19-32

 E. ŢIŢAN, STATISTICĂ. TEORIE ŞI APLICAŢII ÎN SECTORUL


TERŢIAR, Ed. Meteor Press, Buc., 2005, pag.14-23

 V. VOINEAGU, E. ŢIŢAN, S. GHIŢĂ, C. BOBOC, D. TODOSE,


STATISTICĂ. BAZE TEORETICE ŞI APLICAŢII, Ed. Economică,
Buc., 2007, pag.9-21

15

S-ar putea să vă placă și