Sunteți pe pagina 1din 6

GLOSAR TERMENI STATISTICA

DISCRIPTIVA

 Abatere - Prin abatere se înţelege diferenţa dintre o dată şi o valoare de


referinţă (de regulă media).
 Abatere standard -Abaterea standard a unei mulţimi de numere este
rădăcina medie pătrată (RMS) a mulţimii abaterilor fiecărui element de
la media mulţimii.
 Abaterea standard a populaţiei - Parametru reprezentând abaterea
standard a valorilor unei variabile pentru o populaţie.
 Amplitudine - Este definită ca xmax–xmin, unde xmax şi xmin sunt
valorile extreme ale unui set de numere observate. Oferă o imagine a
“întinderii” datelor, dependentă însă de numărul de valori observate. Cu
cât se măsoară mai multe elemente, cu atât şansa de a observa valori
mai depărtate creşte, deci şansa de a obţine o amplitudine mai mare.
 Asociere -Două variabile sunt asociate dacă repartiţia valorilor luate de o
variabilă este diferită după domenii de valori distincte ale celeilalte
variabile. În această situaţie se poate interpreta că o parte din
variabilitatea uneia poate fi explicată de cealaltă variabilă. Vizual,
asocierea poate fi detectată printr-o diagramă de împrăştiere
(scatterplot) în care norul de puncte prezintă configuraţii particulare,
interpretabile ca tendinţe (forme liniare, curbilinii etc.).
 Asocierea liniară- poate fi măsurată prin coeficientul de corelaţie (o
asociere de tipul mare–mare, mic–mic este o asociere pozitivă, în timp
ce o asociere mare–mic, mic–mare este o asociere negativă) Două
variabile sunt asociate liniar dacă o modificare a unei variabile este
asociată cu o midificare proporţională în cea de a doua variabilă, factorul
de proporţionalitate fiind constant în domeniul măsurat. Gradul de
asociere liniară este măsurat prin coeficientul de corelaţie (liniară), cu
valori în [-1,+1], valorile extreme însemnând asocieri perfecte, negative
sau pozitive.
 Asociere neliniară -Relaţia dintre două variabile este neliniară dacă o
modificare în una dintre variabile este asociată cu o modificare a
celeilalte variabile, modificare dependentă de valoarea primei variabile.
Situaţia contrară este cea a unei asocieri liniare, în care modificările sunt
proporţionale, factorul de proporţionalitate fiind constant (deci
independent).
 Aşteptare, Valoare aşteptată -Valoarea aşteptată a unei v.a. este media
ei, gândită ca media la limită a valorilor v.a. obţinute în experimente
independente repetate. Se notează uzual cu Exp(X) sau cu E(X). În cazul
unei v.a. discrete, valoarea aşteptată este media poderată a valorilor
posibile, ponderile fiind probabilităţile cu care v.a. ia diferitele valori. Se
poate gândi valoarea aşteptată a unei v.a. ca punctul de echilibru al
histogramei probabilităţilor, dacă aceasta ar fi o placă tăiată dintr-un
material uniform.
 Coeficient de corelaţie - Coeficientul de corelaţie este o măsură a
asocierii liniare dintre două variabile, cu alte cuvinte a gradului în care
reprezentarea bivariată sub forma unei diagrame de împrăştiere se
apropie de o dreaptă. Notând cu X şi Y cele două variabile şi cu xi , yi ,
i=1,…,n, valorile variabilelor
 Date multivariate -Un set de măsurători efectuate asupra a două sau mai
multor variabile, o observaţie fiind ansamblul valorilor pentru un anumit
element (individ) din eşantion.
 Dispersie - Dispersia unei liste de valori este pătratul abaterii standard,
adică media pătratelor abaterilor numerelor de la media lor. Dispersia
unei variabile aleatoare X, notată Var(X), este valoarea aşteptată a
diferenţei pătrate dintre variabilă valoarea ei aşteptată: Var(X) = Exp((X –
E(X))2 ). Dispersia unei variabile aleatoare este pătratul erorii standard
(SE) a variabilei .
 Distribuţie binomială - O variabilă aleatoare are o distribuţie binomială
cu parametrii n şi p, notată uneori Bi(n,p), dacă reprezintă numărul de
"succese" într-un număr fixat n de încercări aleatorii independente,
fiecare încercare având aceeaşi probabilitate p de a produce un "succes"
 Distribuţie de frecvenţe - Fie o variabilă discretă care are (grupate sau
nu) k nivele sau o variabilă continuă care este prezentată grupat în k
intervale. Se numeşte distribuţie de frecvenţe ansamblul {f1, f2, …, fk},
unde fi notează numărul de observaţii din nivelul k, sau din intervalul k
(frecvenţa absolută a clasei k). Dacă frecvenţele sunt exprimate relativ,
ca raport fi / n, n fiind volumul eşantionului, atunci se vorbeşte de o
distribuţie de frecvenţe relative. Pentru o variabilă continuă, frecvenţele
pot fi cumulate (absolute sau relative), frecvenţa cumulată a unui
interval reprezentând suma frecvenţelor (absolute sau relative) pentru
toate intervalele anterioare (inclusiv intervalul curent). O distribuţie de
frecvenţe se prezintă sub formă tabelară sau sub formă grafică de
histogramă sau de poligon de frecvenţe.
 Distribuţie de probabilitate - Distribuţia de probabilitate a unei v.a
specifică, în general, probabilităţile cu care v.a. ia valori în orice
submulţime de numere reale. Pentru o v.a. discretă, distribuţia de
probabilitate poate specificată precizând probabilităţile cu care v.a. ia
valorile posibile. Pentru v.a. continue, distribuţia de probabilitate poate
fi caracterizată prin densitatea de probabilitate.
 Distribuţie de sondaj - Distribuţia de sondaj a unui estimator este
distribuţia de probabilitate a valorilor estimatorului calculate pentru
toate eşantioanele de acelaşi volum. De exemplu, pentru a obţine
distribuţia de sondaj a mediei, se vor considera toate eşantioanele de
acelaşi volum n, se va calcula media fiecărui eşantion şi se determină
distribuţia de probabilitate a valorilor astfel obţinute. Dacă variabila
studiată are o repartiţie normală N(, 2 ), sau dacă n este mai mare
decât 30, distribuţia de sondaj este normal.
 Distribuţie multimodală O distribuţie cu mai mult de o valoare mod.
Histograma unei distribuţii multimodale are mai multe “vârfuri”.
 Distribuţie Poisson - Distribuţia Poisson este o distribuţie de
probabilitate discretă care depinde de un parametru, m. Dacă X este o
v.a. având distribuţia Poisson cu parametrul m, atunci P(X = k) =e -m × m
k /k!, k = 0, 1, 2, . . . , şi 0 pentru alte valori ale lui k. Valoarea medie
(aşteptată) a distribuţiei Poisson este m (valoarea parametrului), iar
abaterea standard este m ½ .
 Distribuţie uniformă -Este aceea în care probabilitatea de apariţie a
oricărei valori este aceeaşi (constantă), rezultatele sunt egal probabile.
Histograma conţine în acest caz dreptunghiuri de înălţimi egale, motiv
pentru care distribuţia uniformă mai este denumită dreptunghiulară
(rectangulară).
 Eşantioane independente -Eşantioane independente sunt acelea în care
probabilitatea ca un element să fie selectat nu depinde de faptul că un
alt element a fost deja selectat în celălalt eşantion. Nu există nici o
corelare între elementele celor două eşantioane.
 Eşantioane perechi - Două eşantioane în care elementele sunt clar
perechi (de exemplu măsurători efectuate pe perechi de gemeni
identici), sau în care elementele unui eşantion sunt selectate pentru a se
potrivi elementelor celuilalt eşantion. O situaţie specială este atunci
când acelaşi eşantion este evaluat înainte şi după o acţiune suplimentară
(aceieaşi atleţi evaluaţi înainte şi după o cursă), aici perechea find
măsurătorile efectuate pe acelaşi element. Se mai utilizează denumirea
de eşantioane corelate sau dependente.
 Eşantion -Prin eşantion se înţelege o colecţie (submulţime) de elemente
din populaţie.
 Eşantion aleator -Un eşantion aleatoriu este un eşantion ale cărui
elemente sunt selectate aleatoriu dintr-o populaţie dată în aşa fel încât
şansa obţinerii oricărui eşantion particular poate fi calculată. Numărul de
elemente din eşantion se numeşte volumul eşantionului. Un eşantion
aleatoriu poate fi obţinut cu sau fără repunerea elementului selectat
între extrageri.
 Eşantion aleator simplu - Un sondaj aleatoriu simplu de n unităţi dintr-o
populaţie constă în extragerea elementelor eşantionului printr-o
procedură care asigură aceeaşi probabilitate de selecţie pentru orice
submulţime de n unităţi a populaţiei. Eşantionul astfel obţinut se
numeşte aleator simplu.
 Eşantion probabilist - Eşantion obţinut printr-un mecanism aleatoriu,
astfel încât fiecare element al populaţiei are o şansă cunoscută de a fi
selectat.
 Eşantion sistematic Un eşantion sistematic se obţine prin numerotarea
elementelor mulţimii unităţilor de selecţie şi extragerea fiecărui al k-lea
element. Eşantioanele sistematice nu sunt aleatorii, dar dacă ordinea în
care se face numerotarea este sistematică, atunci eşantioanelor sunt ca
şi cum ar fi aleatorii.
 Eşantion stratificat Un eşantion obţinut în urma unui sondaj stratificat.
 Estimator - Un estimator este o regulă de ghicire, pe baza datelor dintr-
un eşantion aleator, a valorii unui parametru al populaţiei. În general, o
statistică este utilizată ca estimator. Estimatorul este o variabilă
aleatoare tocmai pentru că valoarea lui depinde de eşantionul obţinut în
mod aleatoriu. Un exemplu este media eşantionului, care estimează
media populaţiei. Cele trei caracteristici importante ale unui estimator
sunt deplasarea (bias), consistenţa şi eficienţa relativă.
 Eveniment Un eveniment este o submulţime a spaţiului ieşirilor. Un
eveniment determinat de o v.a. este de forma A=(X  A). Atunci când
v.a. X este observată, se interpretează că evenimentul A s-a realizat dacă
X  A şi că A nu s-a realizat dacă X  A. O colecţie de evenimente {A1,
A2, A3, . . . } este exhaustivă dacă se realizează întotdeauna cel puţin un
eveniment din colecţie.
 Histogramă de probabilitate - Într-o histogramă de probabilitate se
reprezintă grafic probabilităţile cu care v.a. aparţine la intervalele de
grupare (în loc de frecvenţele relative se utilizează probabilităţile).
 Independenţă - Două evenimente A şi B sunt independente statistic dacă
P(AB) = P(A)P(B). Aceasta este echivalent cu a spune că apariţia unui
eveniment nu dă nici o informaţie despre realizarea celuilalt eveniment:
P(A|B) = P(A). Două v.a. X şi Y sunt independente dacă toate
evenimentele determinate de acestea sunt independente (de exemplu,
evenimentul {a < X <= b} este independent de {c < Y <= d} pentru orice a,
b, c şi d. Cu alte cuvinte valoarea luată de o variabilă nu oferă nici o
informaţie despre valoarea luată de cealaltă variabilă. O colecţie de mai
mult de două v.a. este independentă dacă pentru orice submulţime
proprie de v.a. orice eveniment determinat de variabilele din
submulţime este independent de orice eveniment determinat de
variabilele din mulţimea complementară. Două sau mai multe v.a. {X1,
X2, . . . , } sunt independente şi identic distribuite dacă variabilele au
aceeaşi distribuţie de probabilitate şi sunt independente. Două
observaţii sunt independente dacă obţinerea primei observaţii nu
influenţează obţinerea celeilalte observaţii. Echivalent, includerea în
eşantion a unui element nu influenţează includerea altui element. Două
statistici sunt independente dacă sunt calculate din eşantioane
independente (sunt formate din observaţii independente). Este evident
că această precizare completează definiţia dată la independenţa
variabila.
 Invarianţă, rezistenţă, stabilitate a unei statistici -O statistică se zice
rezistentă (stabilă) dacă prin modificarea (coruperea) unei date statistica
nu se modifică prea mult. De exemplu, media nu este rezistentă, în timp
ce mediana este.
 Împrăştiere - Arată gradul de modificare a valorilor unei variabile de la o
observaţie la alta. Ca termeni sinonimi sunt varianţa, variabilitatea,
dispersia. Importanţa aprecierii gradului de împrăştiere este dată de
însăşi motivaţia statisticii: pentru o variabilă constantă nu este nevoie de
statistică. Pentru măsurarea împrăştierii se utilizează diferiţi indicatori
statistici: IQV, quantile, dispersia, abaterea standard etc. Este de notat,
totuşi, că nu există o măsură absolută a împrăştierii, gradul de
împrăştiere poate fi apreciat doar relativ, prin comparare. Intuitiv, gradul
de împrăştiere a unei variabile poate fi apreciat prin asimilarea
histogramei cu o grămadă de nisip, despre împrăştierea căreia ne
formăm imediat o părere.
 Siguranţă statistică - Este probabilitatea ca un interval de încredere al
unui parametru să conţină valoarea adevărată a parametrului. Este
notată uzual cu 1-,  fiind pragul (nivelul) de încredere al intervalului.
Sensul este acela că dacă se construiesc în mod repetat intervale de
încredere plecând de la eşantioane diferite, procentajul intervalelor care
conţin valoarea adevărată a parametrului va tinde către siguranţa
statistică.
 Statistică inferential- Conţine metodele prin care se obţin informaţii
despre o populaţie pe baza datelor unui eşantion aleator din populaţia
de interes. Principalele metode sunt estimarea şi testarea ipotezelor.
Este partea principală a statisticii, deoarece interesul unui cercetător
este îndreptat, de regulă, către cunoaşterea populaţiei şi nu către
eşantion.
 Tendinţă centrală - Indicatorii de tendinţă centrală sunt măsuri pentru
localizarea “mijlocului” sau “centrului” distribuţiei. Deoarece noţiunea
de “centru” este suficient de vagă, indicatorii n      n N N n 1 de
tendinţă centrală cuprind statistici diverse, cele mai uzuale fiind media,
mediana, valoarea mod, media redusă, fiecare oferind o caracterizare
diferită pentru datele procesate.
 Unimodală -O distribuţie este unimodală dacă are exact o singură
valoare mod.
 Volumul eşantionului -Volumul eşantionului este numărul de elemente
din eşantion.

S-ar putea să vă placă și