Documente Academic
Documente Profesional
Documente Cultură
CONCEPTE DE BAZĂ
1. Populația statistică
a) Populația statistică = mulțimea elementelor simple sau complexe, de aceeași natură, care au
una sau mai multe însușiri esențiale comune, proprii elementelor cât și populației privită ca
un tot unitar.
b) Unitatea statistică
În exemplele de mai sus unitățile statistice sunt : persoana, gospodăria, consumatorul, societatea
producătoare sau concurentă, societatea distribuitoare, angajatul.
c) Volumul populației
Volumul populației = numărul unităților statistice care alcătuiesc populația statistică. Acesta
poate fi finit sau infinit, în funcție de tipul populației care poate fi la fel finită sau infinită.
d) Eșantionul
Eșantionul = o submulțime a unei populații statistice, constituită după criterii bine stabilite.
2. Variabila statistică
Variabila statistică = o însușire sau o trăsătură comună tuturor unităților unei populații
Se notează cu majusculele de la sfârșitul alfabetului, X, Y, Z etc.
Fie X o variabilă statistică oarecare, atunci cu x1, x2, ..., xR se vor nota stările variabilei respective.
Clasificare :
variabilă calitativă
• este variabila ale cărei stări se exprimă prin cuvinte sau coduri, care desemnează apartenenta
unitatii la una dintre categoriile scalei de masurare.
• poate fi:
• nominală : dacă stările se exprimă prin cuvinte, între cuvinte existând o ordine întâmplătoare
• ordinală : stările se exprimă prin cuvinte sau coduri ordonate după anumite reguli
c) după modul de variaţie variabila numerica poate fi:
nominală
este o variabilă numerică ale căror este o variabilă calitativă ale căror
valori au o origine bine definită, între stări sunt ordonate, dar nu se poate
stările variabilei se pot calcula defini distanța
dintre oricare două stări.
rapoarte. De fapt este variabila
numerică în adevăratul sens,
raport Variabilă ordinală
De exemplu: cât de mulțumiți sunteți
putându-se efectua toate operațiile de un serviciu (foarte
statistico-matematice. mulțumit/mulțumit/indiferent/nemulțu
De exemplu: salariul angajaților, cifra mit/foarte nemulțumit), cum apreciați
de afaceri a firmelor etc. calitatea unui produs etc
interval
Seria statistică = o construcţie care redă fie distribuţia unei populaţii în raport cu una sau mai multe
variabile, fie variaţia unei mărimi în timp, în spaţiu sau de la o categorie la alta.
Ni – frecvența absolută
Fie seria X formată cu frecvențele relative, de forma:
Formule:
SAU
fi – ne arată ponderea unităților din populație care au înregistrat pentru variabila X starea xi
Serie formată cu frecvențe absolute cumulate:
FN(xi) – exprimă ponderea unității populației studiate pentru care variabila a înregistrat valori ce nu
depășesc valoarea xi
Ni. - numărul de unităţi pentru care Y = yi, indiferent de nivelul înregistrat de variabila X
N.j - numărul de unităţi pentru care X = xj, indiferent de nivelul înregistrat de variabila Y
Seria statistică de variație = redă variaţia unei mărimi, în timp, în spaţiu sau de la o categorie la alta
Indicatorul de nivel (Y) este o mărime ce reflectă nivelul unui fenomen analizat.
De exemplu: producția diferitelor produse, veniturile populației, cheltuielile totale ale unei firme,
suprafața cultivată cu principalele culturi, cantitatea de marfă transportată, volumul exportului,
volumul importului etc.
Diferența absolută a unei mărimi ( ∆𝐘 ) exprimă diferența dintre nivelul cercetat și nivelul bază de
comparație al mărimii analizate. Se exprimă în aceeași unitate de măsură în care este cuantificat
fenomenul analizat și ne arată cu cât s-a modificat acesta de la un nivel la altul.
Indicele statistic al unei mărimi ( IY ) exprimă raportul dintre nivelul cercetat și nivelul bază de
comparație al mărimii analizate. Ne arată de câte ori se modifică acea mărime, de la un nivel la
altul. În cazul seriilor cronologice interpretăm în sensul în care o mărime crește sau scade de la un
moment la altul, iar în cazul seriilor teritoriale interpretăm în sensul că o mărime ce caracterizează
un spațiu e mai mare sau mai mică decât mărimea analizată aferentă altui spațiu.
Diferența relativă a unei mărimi ( RY ) exprimă raportul dintre diferența absolută a mărimii
respective și nivelul bază de comparație al acesteia. Ne arată cu cât la sută se modifică mărimea de
la un nivel la altul.
Indicatorul relativ de intensitate (d) se definește ca raport între doi indicatori de nivel de natură
diferită și arată gradul de răspândire a fenomenului cuantificat de indicatorul de la numărător în
raport cu fenomenul cuantificat de indicatorul de la numitor.
De exemplu: producția diferitelor culturi / ha, densitatea populației, producţia principalelor produse
/ locuitor, rata șomajului, productivitatea angajaţilor etc.
4. Seriile cronologice
Seria statistică de spațiu = o construcţie statistică ce reflectă variaţia în spaţiu a unei mărimi
La baza seriei de spaţiu se găsesc atât mărimi absolute (indicator de nivel, diferenţa absolută), cât şi
mărimi relative (indicator relativ de intensitate, indicele statistic, diferenţa relativă şi greutate
specifică).
Titlul
se folosește pentru a explicita graficului
reunește mulțimea
folosirea semnelor, culorilor
tuturor punctelor
sau diverselor hașuri folosite în
scara de cotate (valorile
graficul în cauză, se plasează legenda
reprezentare variabilelor x si y
înafara graficului, în colțul din
reprezentate in
stânga sau dreapta jos.
grafic)
Elelmentele unui
grafic
permite identificarea cu
trebuie să fie scurtă și uşurinţă în plan sau în
semnificativă și plasată cât rețeaua spaţiu a punctelor
inscripția graficului
mai bine în raport cu corespunzătoare valorilor
elementul din grafic pe care îl înregistrate de variabilele
explicitează Semnele în cauză. Sistemul axelor
convenționale rectangulare (în plan sau
spaţiu) constituie cele
mai uzuale reţele în
reprezentarea grafică a
se pot materializa într-o reprezentare grafică seriilor statistice.
prin inscripții, fie printr-o legendă.
1. Histograma
Histograma = graficul specific seriilor care au la bază o variabilă continuă (de intervale)
se construiește într-un sistem de axe rectangulare după cum urmează:
• pe abscisă se trec intervalele de variaţie
• pe ordonată se trasează scara frecvențelor
Pentru fiecare interval de variaţie a seriei (xi-1 – xi) se construiește un dreptunghi a cărui bază este
chiar lungimea intervalului, iar cealaltă latură se determină din condiția proporționalității ariei
dreptunghiului cu mărimea indicatorului în clasa respectivă
2. Poligonul frecvențelor
Norul statistic
constituie o modalitate de reprezentare Cronograma
grafică a seriilor atributive de repartiţie categorie foarte importantă de serii o
bidimensionale. În sistemul de axe constituie seriile cronologice, a căror
rectangulare xOy se marchează toate reprezentare grafică se realizează prin
punctele de coordonate (xj, yi ); cronograme
IV. PARAMETRII DISTRIBUȚIILOR
•populația este reprezntată •populația este reprezntată •populația este reprezntată sub
sub formă de listă de sub formă de listă de formă de listă de observații:
observații: observații:
N-
impar
RANGUL
N-par
- calcularea valorii medii va permite aflarea intervalului in care se află valoarea medie, numit
INTERVAL MEDIAN
- se cumulează frecvențele absolute până când este respectată inegalitatea
3. Valoarea modală
NOTAȚIE :
- reprezintă aceea valoare a variabilei X căreia îi corespunde frecvenţa cea mai mare
=>valoarea modală va fi acea valoare a variabilei X pentru care frecvența este cea mai mare
Parametrii de structură
Parametrii statistici, în forma cea mai generală, folosiţi în caracterizarea structurii unei populaţii
poartă denumirea de valori quantile.
Valorile quantile ale unei serii de repartiţie unidimensionale sunt acele mărimi înregistrate de variabila
X, care împart seria în n părţi egale
Se vor calcula n-1 quantile.
Fie o serie de repartiție, care are la bază o variabilă X discretă, de următoarea formă:
DACA
p*N- nu
divide
cu n
În cazul seriilor care au la bază o variabilă continuă, se determină intervalele cărora aparțin
quantilele
- Se calculează rangul
Amplitudinea/Varianța maximă
- se notează cu W
-se notează cu
- varianța minimă
C
- se particularizează în:
- dispersia/varianța
Abaterea interquartilă
- este media aritmetică simplă a segmentelor Me – Q1 şi Q3 – Me,
- forma relativă:
(coef de variație
Interquartilic)
Abaterea interdecilă
- se notează cu D
- forma relativă:
(coef de variație
Interdecilic)
PARAMETRII CONCENTRĂRII
Indicele Hirschman-Herfindhal
- Acest parametru se calculează ca și sumă a pătratelor ponderilor tuturor
componentelor unei populații statistice
- forma relativă:
0<=Er<=1
Er se apropie de 1 => atunci populaţia respectivă este caracterizată de un grad
înalt de concentrare;
Er se apropie de 0 => populaţia în cauză se caracterizează printr-o
concentrare
minimă.
PARAMETRII FORMEI
Legătura statistică
- Se mai numește şi
Legătura nulă
stocastică sau probabilistă
Semnifică lipsa oricărei
- Fiecărei valori xi a
legături între două sau mai
variabilei X îi corespunde o Clasificarea multe fenomene sau
distribuție de valori ale legăturilor variabile care cuantifică
variabilei Y.
- Matematic, o astfel de
dintre variabile fenomenele cov(x, y) = 0.
legătură se exprimă sub
forma y =f (x) + E, unde am
notat prin E componenta
aliatoare reziduală
Legătura deterministă
spunem că între variabilele
X şi Y există o legătură
deterministă dacă unei
valori a lui X îi corespunde o
singură valoare a lui Y.
• Variabila efect, cea pe care dorim să o explicăm prin intermediul altor factori se
numește variabilă endogenă (sau explicată sau dependentă) și obișnuim să o notăm
cu Y
• Factorii de influență (cei cuantificabili), variabilele prin care explicităm fenomenul,
se numesc variabile exogene (sau explicative sau factoriale). Obișnuim să le notăm
cu X , X ,..., Xn
• Variabilele care au influență asupra fenomenului cercetat, a variabilei endogene,
dar care nu pot fi identificate sau cuantificate, se grupează sub forma unei variabile
reziduale, notată cu 𝜺
Analiza legăturilor pentru variabilele cantitative
• <=>
2. Raportul de corelație
• folosim varianţa explicită ca o mărime absolută a intensităţii legăturii dintre X şi Y şi
ponderea varianţei explicite în varianţa totală ca o mărime relativă
• <=>
• primă etapă în acest demers este formularea unei ipoteze cât mai verosimile
cu privire la forma legăturii.
• în acest scop, pe baza tabelului de corelație construim norul statistic și linia
poligonală a mediilor condiționate ale variabilei dependente.
•
Funcția de regresie poate avea diferite expresii matematice. Vom da în cele ce
urmează câteva exemple, însoțite de forme posibile ale norilor de puncte
corespunzătoare:
Particularizarea calculului coeficienților de regresie liniară pentru un
model liniar simplu
În ipoteza în care legătura dintre Y și factorii săi de influență X1 , X2 ,..., Xn este
liniară, ecuația de regresie va fi de forma:
Pentru orice formă a funcţiei de regresie şi orice număr de variabile explicative, folosim
notaţiile:
- Varianța totală:
- varianța reziduală
- Varianța explicită:
Raportul de determinare:
• Un prim instrument ce ne stă la îndemână este tabelul de corelaţie, un table cu două intrări,
reprezentând o repartiţie bidimensională.
• Urmărim dacă frecvenţele absolute ij N iau valori apropiate în tot tabelul, caz în care nu există
legătură între variabilele X şi Y,
Calcularea frecvențelor teoretice:
• Variabilele ordinale sunt tot variabile calitative, dar ale căror stări sunt ierarhizabile
!!! pentru a putea utiliza acest indicator toate unităţile populaţiei trebuie să poată fi
ordonate în raport cu variabilele pentru care cercetăm intensitatea legăturii
• Seria de timp (sau seria cronologică) = o secvență de observații asupra unei variabile
ordonate cronologic, după parametrul timp
• Aceasta este prezentată sub forma:
▪ T este momentul
▪ Yt este valoarea observată la momentul t
1. Prezentarea grafică
Cronograma =
- T – tendința
- C- componenta ciclică
- S- componenta sezonieră I – componenta aleatoare
Tendința = redă modificările
persistente, pe termen lung, in
nivelul variabilei
Tendința
Componenta
sezonieră
- pentru a măsura calitatea modeluli elaborat de a genera valori adecvate se utilizează indicatori
sintetici ai erorilor de previziune, cei mai frecvent întâlniţi fiind:
4. Estimarea tendinței prin funcții elementare
5. Estimarea parametrilor tendinței
Seria desezonalizată
- se obţine prin extragerea componentei sezoniere din date, respectiv:
Componenta aleatoare
- se deduce în consecinţă, ţinând seama de forma modelului:
VIII. INDICATORII SPECIFICI SERIILOR DE TIMP
- Considerăm o seria cronologică, ce redă evoluţia variabilei Y:
Diferența
absolută
Indicatori
absoluți și
- se calculează ca raport
indicatori dintre nivelul variabilei în
Diferența
relativă
relativi Indicele
perioada t şi cel din perioada
de referinţă j
(ritm)
Indicele
mediu
Indicatorii
medii
diferența
Ritmul
absolută
mediu
medie
Reversibilitatea
Identitatea (reflexivitatea)
Circularitatea
Indicele variației integrale
Indicii factoriali