Sunteți pe pagina 1din 32

Statistica socio-economică

Dr. lector. CEMP


Oleg FRUNZE
Necesitatea măsurărilor sociologice
• Măsurarea în ştiinţele socio-umane are un caracter
subiectiv şi nu se poate compara cu măsurarea din
lumea fizică. Deoarece nu putem măsura direct
fenomenele sociale, ci prin intermediul unor
indicatori observabili, care ar avea legătură cu
fenomenul investigat, apare firească întrebarea cu
privire la modul în care aceşti indicatori chiar
reprezintă fenomenul studiat,
• De asemenea, cât de precis îl reprezintă. Aceasta
este, de fapt, problema validităţii şi cea a fidelităţii.
Validitate
• Autenticitate, valabilitate;
• a verifica valabilitatea (unui test).
• 1. calitatea de a fi valid.
• 2. (log.) proprietate a unei expresii de a fi
adevărată, corectă. ◊ (în log. simbolică)
proprietate a unor expresii logice de a fi
adevărate prin introducerea lor în orice
interpretare a variabilelor componente.
Fidelitate
• 1. statornicie, credință (în convingeri, în
sentimente etc.); devotament; exactitate.
• 2. exactitate (în prezentarea, în
reproducerea unui text, a sunetelor etc.). ♦
înaltă ~ = calitate a unor aparate
electroacustice de a reda cât mai fidel
semnalele sonore înregistrate.
• 3. (biol.) atașament al unei specii de un
anumit grup sau asociație.
Decizii corecte
• Un instrument de cercetare sau unul de
diagnostic pentru care nu există studii
serioase de validitate şi de fidelitate, este
un instrument pe cât de inutil, pe atât de
periculos, deoarece, în baza rezultatelor
obţinute, nu se pot lua decizii corecte.
Relația dintre fidelitate și validitate
Validitate

Fidelitate
Erori
• Orice cercetare efectuată, va fi afectată de două surse de
eroare: erori aleatorii şi erori nealeatorii (sistematice).
• Erorile aleatorii reprezintă influenţe ale factorilor externi
care pot afecta măsurătorile. Cu cât influenţa erorilor
aleatorii este mai mare, cu atât instrumentul este mai
puţin fidel, reciproca fiind, de asemenea, valabilă.
• Erorile nealeatorii, numite şi erori sistematice, au un
caracter constant şi sunt legate, de cele mai multe ori,
de instrumentul de cercetare.
• controlul erorilor sistematice (nealeatorii) ţine
de validitatea unui instrument (figura cu ţinta),
în timp ce minimizarea influenţei erorilor
aleatorii reprezintă o problemă de fidelitate.
Există două tipuri de erori, tipul unu () şi
tipul doi ().
• Erorile de tip  apar atunci când cercetarea
procesului conduce la concluzia privind calitatea
aparent inadecvată însă în realitate calitatea
este bună.
• Erorile de tip unu induc costuri de revizuire şi
ajustări a procesului, atunci când nu este nevoie
de acestea. Probabilitatea de apariţie a erorilor
de tip  se determină din considerentele
cheltuielilor necesare pentru fiecare eroare de
acest tip.
Erorile de tip 
• Erorile de tip  apar atunci când cercetarea
procesului conduce la concluzia, calitatea este
adecvată, însă în realitate calitatea nu este
adecvată. Aceste erori conduc la investiţii mari
de fonduri în producţie, care se va dovedi a fi
de calitate joasă. În consecinţă acţionează şi
asupra siguranţei produsului dacă defectele nu
sunt detectabile.
Decizii…
Starea Remediere Continuarea
procesului procesului
Adecvată Eroare tip  Decizie
corectă
Defectivă Decizie Eroare tip 
corectă
Teoria erorilor
• Procedeele de observare statistica pot fi
afectate de erori. Mai mult, prelucrarea
statistica a datelor, adica ansamblul de
operatii matematice care urmează a fi
efectuate cu datele respective, contribuie cu
o anumita cantitate de erori. Prin urmare,
atât erorile de observare statistica cât si cele
de calcul, vor afecta rezultatele obtinute din
prelucrarea si interpretarea datelor.
Erori experimentale
În timpul efectuarii măsuratorilor se pot produce erori care
au aceeași marime, când procesul de masurare se
efectueaza în conditii identice, sau erori care au mărimi
variabile, variatia acestora fiind supusă unei anumite legi
de variatie.
Dupa modul de aparitie, erorile de masurare se clasifica în:
- erori grosolane (greseli);
- erori sistematice;
- erori aleatoare (accidentale, întâmplatoare).
Erori grosolane (aberante)
• Constau în abateri foarte mari, cu probabilitate
mică de aparitie si care produc denaturări
puternice ale rezultatelor măsuratorilor. Ele pot
proveni din manipulări greșite în timpul
măsuratorilor, din neatenția sau lipsa de instruire a
operatorului, din aplicarea unor metode de calcul
inexacte, din citiri eronate. Pentru a preveni
distorsionarea rezultatului general, aceste erori
trebuie eliminate si refăcute măsuratorile. La o
repetare a măsurarilor, erorile grosolane (sau
valorile aberante) au probabilitatea foarte mica de
a se reproduce, ceea ce permite depistarea lor.
Erori sistematice
• Sunt acele erori care nu variază la repetarea
măsurarii în aceleași condiții sau variază în mod
determinabil odată cu modificarea condițiilor. Ele se
datorează unor cauze determinate (reglarea sau
etalonarea incorecta a aparatelor de masurare,
masurarea la o temperatura diferita de cea la care
a fost etalonat sau reglat), se produc întotdeauna
în acelasi sens, au valoare constanta în marime și
semn sau variabilă dupa o lege bine determinată si
pot fi eliminate prin aplicarea unor corecții.
• Erorile sistematice pot fi:
• - erori sistematice obiective;
• - erori sistematice subiective.
Erorile sistematice obiective
Erori de aparat (instrumentale), datorate unor caracteristici
constructive ale aparatelor, incorectei etalonari, uzurii. Limitele lor
de variație sunt cunoscute din specificațiile tehnice date de
furnizorul aparatului și sunt, prin urmare, cel mai ușor de evaluat de
către operator;
Erori de metodă, aparute ca urmare a principiilor pe care se bazează
metoda de măsurare, a introducerii unor simplificări sau utilizării
unor relații empirice. Ele apar la metodele indirecte de masurare;
Erori produse de factori externi (erori de influență), deosebit de
greu de evaluat, deoarece nu întotdeauna pot fi cunoscute cauzele si
legile de variație a condițiilor de mediu (temperatura, presiunea,
umiditatea, câmpuri magnetice, etc.). Ele se mai numesc si erori de
instalare. Pentru eliminarea lor se impune asigurarea conditiilor de
mediu normale impuse pentru instalațiea de masurat.
Erori sistematice subiective
• (de operator), provenind din modul subiectiv în
care operatorul apreciază anumite efecte
(coincidențe de repere la citirea rezultatelor,
intensități luminoase, nuanțe) si care țin de
gradul sau de oboseală, de starea sa psihică
sau de anumite deficiențe ale organelor de
percepție.
• Erorile sistematice sunt foarte grave deoarece
ele nu se elimină când se repetă măsurarea si
când se adoptă ca valoare a mărimii măsurate
media aritmetică a rezultatelor măsuratorilor.
Erori aleatoare
• Sunt erorile care au valori și semne diferite într-o
succesiune de măsuratori efectuate în aceleași
condiții. Ele nu sunt controlabile și pot proveni ca
urmare a variabilității naturale a proceselor si a
interactiunilor cu alte procese si fenomene ce se
desfășoară simultan.
• Orice proces de măsurare este influențat de o
multitudine de factori. Influența individuală a
fiecărui dintre factori este neglijabilă, din care
cauză nu este posibilă depistarea si înlăturarea
lor, efectul fiind producerea unor erori aleatorii.
• Dupa modul de exprimare, distingem
următoarele tipuri de erori:
• erori absolute,
• erori relative.
• Erorile absolute, pot fi la rândul lor:
• erori reale;
• erori conventionale.
Erori reale
• Erorile reale sunt definite ca diferenta dintre
valoarea reala (adevarata) a unei marimi Y si
valoarea masurata (aproximativa) a marimii Y’
Y=Y-Y’.
• Daca, YY’ marimea respectiva este aproximata prin
adaos iar daca, YY’ aproximatia este prin lipsa.
• Prin incertitudine de masurare (Y) se întelege
intervalul în care se estimeaza, cu o anumita
probabilitate, ca se afla valoarea adevarată a mărimii
.
Eroare absolută
• De cele mai multe ori nu se cunoaste semnul erorii, de
aceea se foloseste noțiunea de eroare absolută.
• Eroarea absoluta are aceleasi dimensiuni fizice ca si
marimea masurata si se exprima in aceleași unități de
măsură.
• Eroarea absolută cu semn schimbat se numește
corecție.
• Daca Y nu este cunoscut, relatia pentru eroarea
absolută nu poate fi utilizată. În astfel de cazuri este
util a se introduce notiunea de eroare absoluta limita .
Eroare absoluta limita
• Se numeste eroare absoluta limita , a
numarul aproximativ , cel mai mic număr
pozitiv care conține una sau două cifre
semnificative, ales în așa fel, încât sa
putem fi siguri că eroarea absolută
comisă, în cazul respectiv, nu depășește
acest număr. Prin urmare:
• Y’-  ≤Y ≤ Y’+ 
Erori conventionale
• În realitate valoarea adevărată a unei
mărimi nu poate fi cunoscută si, de aceea,
este necesar să se adopte o valoare de
referință, care are un caracter
convențional. Se definește astfel eroarea
convențională ca diferență dintre valoarea
măsurată si valoarea de referință admisă.
• Yconv=Yconv-Y’
Erori relative (adimensionale)
• Eroarea relativă se definește ca raportul
dintre eroarea absolută și valoarea
absolută a mărimii exacte, adica:
• =Y/Y
• =100%Y/Y, %
Erori de calcul numeric
• Prin interpretarea matematică a datelor se înțelege totalitatea
operațiilor matematice pe care trebuie sa le efectuam pentru
obținerea unui anumit rezultat, în vederea căruia au fost
efectuate măsurarile respective.
• În timpul efectuării acestor calcule, se pot comite anumite erori
care se vor adauga la erorile experimentale, obligând valoarea
măsurată sa se abată si mai mult față de mărimea adevarată.
• Se disting urmatoarele categorii de erori de calcul:
• - erori inerente;
• - erori de metodă;
• - erori de rotunjire.
Erori interne
• Erorile inerente sunt erorile legate de
cunoastere aproximativă a unor valori
provenite din măsuratori sau din faptul ca se
folosesc numere irationale (). Rezultatul
oricăror calcule depinde si de precizia datelor
de intrare. Ca erori inerente pot fi considerate
si erorile de conversie făcute la trecerea în
baza 2 (sistem binar) a unor numere care se
introduc în memoria calculatoarelor numerice.
Erori de metoda sau de trunchiere
• Tratarea matematică a unor fenomene naturale
este supusă unor ipoteze în legatură cu
condițiile în care se desfașoară fenomenele
respective. Aceste ipoteze pot fi mai mult sau
mai putin în conformitate cu realitatea, unele
dintre ele fiind facute în vederea simplificării
tratării matematice a problemei respective.
Neconcordanța dintre natura reală a
fenomenului si ipotezele respective, va conduce
la asa-numitele erori de punere a problemei sau
erori de metodă. Functiile care figureaza în
anumite formule matematice, se obtin prin
trunchierea seriilor la un anumit rang.
Erori de rotunjire
• Erorile de rotunjire sunt legate de posibilitățile
limitate de reprezentare a numerelor în
calculatoarele numerice. În general, orice
calculator poate reprezenta numerele cu un
număr redus de cifre semnificative, depinzând
de lungimea cuvântului (numarul de biți) utilizat
la stocarea unui număr. În mod curent se
lucreaza cu un echivalent de circa 7 cifre
semnificative în simpla precizie si de circa 15
cifre semnificative în dubla precizie.
Ipoteze asupra datelor ce se prelucreaza
a) Datele experimentale sunt siruri statistice de valori ale unor variabile aleatorii care se
exprima într-o singura dimensiune (o singura caracteristica) sau doua;
b) sirurile de valori obtinute în urma masurarilor nu sunt functie de timp, adica toate
determinarile experimentale s-au facut în aceleasi conditii, desi ele sunt decalate în timp;
c) Toate datele trebuie sa corespunda valorilor numerice ale unei aceleiasi caracteristici si
sa fie omogene, adica sa apartina unei aceleiasi populatii, constituind evenimente
independente, produse de experiente repetate, realizate ca urmare a unui complex
repetat de conditii pe cât posibil identice;
d) Mijloacele de masurare (aparatele) au functionat corect, în conditii de precizie egale
(deci datele au egala pondere), determinarile nefiind afectate de erori sistematice sau
grosolane;
e) Datele supuse prelucrarii apartin unei legi de repartitie normala sau care poate fi
considerata, în mod justificat, ca aproape normala;
f) Rezultatele masurarilor sunt autentice si reprezentative pentru fenomenul ce se
cerceteaza;
g) Numarul datelor care se prelucreaza este suficient de mare încât poate fi considerat un
esantion de volum mare al unei selectii dintr-o populatie statistica originara, necunoscuta
Șiruri de date
Șirurile simple de date experimentale sunt siruri statistice de valori
ale unor variabile aleatorii discrete sau continui, care se exprimă
într-o singura dimensiune, sirurile simple de date pot fi:
a) sir (sau siruri) de date experimentale, care reprezintă măsurări
individuale ale unei aceleiași caracteristici, efectuate în aceleasi
condiții, pe n elemente identice ale populatiei statistice. Datele
furnizează informații referitoare la repartiția valorilor caracteristicii
considerate;
b) sir (sau siruri) de date experimentate, care reprezinta măsurări
repetate în condiții pe cât posibil identice, ale unei aceleiasi
caracteristici numerice, efectuate pe aceeași unitate statistica.
Datele reprezinta valorile unei variabile aleatorii, având caracterul
unei erori de masurare, a unei marimi.
Concluzie
• Media aritmetica a datelor dintr-un șir de tip a)
tinde catre o valoare care este suma algebrica a
valorii reale a marimii si a erorii sistematice a
rezultatelor masurarii (gradul de fidelitate), iar în
cazul unui sir de tip b) tinde catre o valoare care
este eroarea sistematica (sau parte din ea) a
măsurarii mărimii (nivel de validitate).
Multumesc pentru atenție!
• Întrebări???

S-ar putea să vă placă și