Abatere - Prin abatere se înţelege diferenţa dintre o dată şi o valoare de
referinţă (de regulă media). Abatere standard -Abaterea standard a unei mulţimi de numere este rădăcina medie pătrată (RMS) a mulţimii abaterilor fiecărui element de la media mulţimii. Abaterea standard a populaţiei - Parametru reprezentând abaterea standard a valorilor unei variabile pentru o populaţie. Amplitudine - Este definită ca xmax–xmin, unde xmax şi xmin sunt valorile extreme ale unui set de numere observate. Oferă o imagine a “întinderii” datelor, dependentă însă de numărul de valori observate. Cu cât se măsoară mai multe elemente, cu atât şansa de a observa valori mai depărtate creşte, deci şansa de a obţine o amplitudine mai mare. Asociere -Două variabile sunt asociate dacă repartiţia valorilor luate de o variabilă este diferită după domenii de valori distincte ale celeilalte variabile. În această situaţie se poate interpreta că o parte din variabilitatea uneia poate fi explicată de cealaltă variabilă. Vizual, asocierea poate fi detectată printr-o diagramă de împrăştiere (scatterplot) în care norul de puncte prezintă configuraţii particulare, interpretabile ca tendinţe (forme liniare, curbilinii etc.). Asocierea liniară- poate fi măsurată prin coeficientul de corelaţie (o asociere de tipul mare–mare, mic–mic este o asociere pozitivă, în timp ce o asociere mare–mic, mic–mare este o asociere negativă) Două variabile sunt asociate liniar dacă o modificare a unei variabile este asociată cu o midificare proporţională în cea de a doua variabilă, factorul de proporţionalitate fiind constant în domeniul măsurat. Gradul de asociere liniară este măsurat prin coeficientul de corelaţie (liniară), cu valori în [-1,+1], valorile extreme însemnând asocieri perfecte, negative sau pozitive. Asociere neliniară -Relaţia dintre două variabile este neliniară dacă o modificare în una dintre variabile este asociată cu o modificare a celeilalte variabile, modificare dependentă de valoarea primei variabile. Situaţia contrară este cea a unei asocieri liniare, în care modificările sunt proporţionale, factorul de proporţionalitate fiind constant (deci independent). Aşteptare, Valoare aşteptată -Valoarea aşteptată a unei v.a. este media ei, gândită ca media la limită a valorilor v.a. obţinute în experimente independente repetate. Se notează uzual cu Exp(X) sau cu E(X). În cazul unei v.a. discrete, valoarea aşteptată este media poderată a valorilor posibile, ponderile fiind probabilităţile cu care v.a. ia diferitele valori. Se poate gândi valoarea aşteptată a unei v.a. ca punctul de echilibru al histogramei probabilităţilor, dacă aceasta ar fi o placă tăiată dintr-un material uniform. Coeficient de corelaţie - Coeficientul de corelaţie este o măsură a asocierii liniare dintre două variabile, cu alte cuvinte a gradului în care reprezentarea bivariată sub forma unei diagrame de împrăştiere se apropie de o dreaptă. Notând cu X şi Y cele două variabile şi cu xi , yi , i=1,…,n, valorile variabilelor Date multivariate -Un set de măsurători efectuate asupra a două sau mai multor variabile, o observaţie fiind ansamblul valorilor pentru un anumit element (individ) din eşantion. Dispersie - Dispersia unei liste de valori este pătratul abaterii standard, adică media pătratelor abaterilor numerelor de la media lor. Dispersia unei variabile aleatoare X, notată Var(X), este valoarea aşteptată a diferenţei pătrate dintre variabilă valoarea ei aşteptată: Var(X) = Exp((X – E(X))2 ). Dispersia unei variabile aleatoare este pătratul erorii standard (SE) a variabilei . Distribuţie binomială - O variabilă aleatoare are o distribuţie binomială cu parametrii n şi p, notată uneori Bi(n,p), dacă reprezintă numărul de "succese" într-un număr fixat n de încercări aleatorii independente, fiecare încercare având aceeaşi probabilitate p de a produce un "succes" Distribuţie de frecvenţe - Fie o variabilă discretă care are (grupate sau nu) k nivele sau o variabilă continuă care este prezentată grupat în k intervale. Se numeşte distribuţie de frecvenţe ansamblul {f1, f2, …, fk}, unde fi notează numărul de observaţii din nivelul k, sau din intervalul k (frecvenţa absolută a clasei k). Dacă frecvenţele sunt exprimate relativ, ca raport fi / n, n fiind volumul eşantionului, atunci se vorbeşte de o distribuţie de frecvenţe relative. Pentru o variabilă continuă, frecvenţele pot fi cumulate (absolute sau relative), frecvenţa cumulată a unui interval reprezentând suma frecvenţelor (absolute sau relative) pentru toate intervalele anterioare (inclusiv intervalul curent). O distribuţie de frecvenţe se prezintă sub formă tabelară sau sub formă grafică de histogramă sau de poligon de frecvenţe. Distribuţie de probabilitate - Distribuţia de probabilitate a unei v.a specifică, în general, probabilităţile cu care v.a. ia valori în orice submulţime de numere reale. Pentru o v.a. discretă, distribuţia de probabilitate poate specificată precizând probabilităţile cu care v.a. ia valorile posibile. Pentru v.a. continue, distribuţia de probabilitate poate fi caracterizată prin densitatea de probabilitate. Distribuţie de sondaj - Distribuţia de sondaj a unui estimator este distribuţia de probabilitate a valorilor estimatorului calculate pentru toate eşantioanele de acelaşi volum. De exemplu, pentru a obţine distribuţia de sondaj a mediei, se vor considera toate eşantioanele de acelaşi volum n, se va calcula media fiecărui eşantion şi se determină distribuţia de probabilitate a valorilor astfel obţinute. Dacă variabila studiată are o repartiţie normală N(, 2 ), sau dacă n este mai mare decât 30, distribuţia de sondaj este normal. Distribuţie multimodală O distribuţie cu mai mult de o valoare mod. Histograma unei distribuţii multimodale are mai multe “vârfuri”. Distribuţie Poisson - Distribuţia Poisson este o distribuţie de probabilitate discretă care depinde de un parametru, m. Dacă X este o v.a. având distribuţia Poisson cu parametrul m, atunci P(X = k) =e -m × m k /k!, k = 0, 1, 2, . . . , şi 0 pentru alte valori ale lui k. Valoarea medie (aşteptată) a distribuţiei Poisson este m (valoarea parametrului), iar abaterea standard este m ½ . Distribuţie uniformă -Este aceea în care probabilitatea de apariţie a oricărei valori este aceeaşi (constantă), rezultatele sunt egal probabile. Histograma conţine în acest caz dreptunghiuri de înălţimi egale, motiv pentru care distribuţia uniformă mai este denumită dreptunghiulară (rectangulară). Eşantioane independente -Eşantioane independente sunt acelea în care probabilitatea ca un element să fie selectat nu depinde de faptul că un alt element a fost deja selectat în celălalt eşantion. Nu există nici o corelare între elementele celor două eşantioane. Eşantioane perechi - Două eşantioane în care elementele sunt clar perechi (de exemplu măsurători efectuate pe perechi de gemeni identici), sau în care elementele unui eşantion sunt selectate pentru a se potrivi elementelor celuilalt eşantion. O situaţie specială este atunci când acelaşi eşantion este evaluat înainte şi după o acţiune suplimentară (aceieaşi atleţi evaluaţi înainte şi după o cursă), aici perechea find măsurătorile efectuate pe acelaşi element. Se mai utilizează denumirea de eşantioane corelate sau dependente. Eşantion -Prin eşantion se înţelege o colecţie (submulţime) de elemente din populaţie. Eşantion aleator -Un eşantion aleatoriu este un eşantion ale cărui elemente sunt selectate aleatoriu dintr-o populaţie dată în aşa fel încât şansa obţinerii oricărui eşantion particular poate fi calculată. Numărul de elemente din eşantion se numeşte volumul eşantionului. Un eşantion aleatoriu poate fi obţinut cu sau fără repunerea elementului selectat între extrageri. Eşantion aleator simplu - Un sondaj aleatoriu simplu de n unităţi dintr-o populaţie constă în extragerea elementelor eşantionului printr-o procedură care asigură aceeaşi probabilitate de selecţie pentru orice submulţime de n unităţi a populaţiei. Eşantionul astfel obţinut se numeşte aleator simplu. Eşantion probabilist - Eşantion obţinut printr-un mecanism aleatoriu, astfel încât fiecare element al populaţiei are o şansă cunoscută de a fi selectat. Eşantion sistematic Un eşantion sistematic se obţine prin numerotarea elementelor mulţimii unităţilor de selecţie şi extragerea fiecărui al k-lea element. Eşantioanele sistematice nu sunt aleatorii, dar dacă ordinea în care se face numerotarea este sistematică, atunci eşantioanelor sunt ca şi cum ar fi aleatorii. Eşantion stratificat Un eşantion obţinut în urma unui sondaj stratificat. Estimator - Un estimator este o regulă de ghicire, pe baza datelor dintr- un eşantion aleator, a valorii unui parametru al populaţiei. În general, o statistică este utilizată ca estimator. Estimatorul este o variabilă aleatoare tocmai pentru că valoarea lui depinde de eşantionul obţinut în mod aleatoriu. Un exemplu este media eşantionului, care estimează media populaţiei. Cele trei caracteristici importante ale unui estimator sunt deplasarea (bias), consistenţa şi eficienţa relativă. Eveniment Un eveniment este o submulţime a spaţiului ieşirilor. Un eveniment determinat de o v.a. este de forma A=(X A). Atunci când v.a. X este observată, se interpretează că evenimentul A s-a realizat dacă X A şi că A nu s-a realizat dacă X A. O colecţie de evenimente {A1, A2, A3, . . . } este exhaustivă dacă se realizează întotdeauna cel puţin un eveniment din colecţie. Histogramă de probabilitate - Într-o histogramă de probabilitate se reprezintă grafic probabilităţile cu care v.a. aparţine la intervalele de grupare (în loc de frecvenţele relative se utilizează probabilităţile). Independenţă - Două evenimente A şi B sunt independente statistic dacă P(AB) = P(A)P(B). Aceasta este echivalent cu a spune că apariţia unui eveniment nu dă nici o informaţie despre realizarea celuilalt eveniment: P(A|B) = P(A). Două v.a. X şi Y sunt independente dacă toate evenimentele determinate de acestea sunt independente (de exemplu, evenimentul {a < X <= b} este independent de {c < Y <= d} pentru orice a, b, c şi d. Cu alte cuvinte valoarea luată de o variabilă nu oferă nici o informaţie despre valoarea luată de cealaltă variabilă. O colecţie de mai mult de două v.a. este independentă dacă pentru orice submulţime proprie de v.a. orice eveniment determinat de variabilele din submulţime este independent de orice eveniment determinat de variabilele din mulţimea complementară. Două sau mai multe v.a. {X1, X2, . . . , } sunt independente şi identic distribuite dacă variabilele au aceeaşi distribuţie de probabilitate şi sunt independente. Două observaţii sunt independente dacă obţinerea primei observaţii nu influenţează obţinerea celeilalte observaţii. Echivalent, includerea în eşantion a unui element nu influenţează includerea altui element. Două statistici sunt independente dacă sunt calculate din eşantioane independente (sunt formate din observaţii independente). Este evident că această precizare completează definiţia dată la independenţa variabila. Invarianţă, rezistenţă, stabilitate a unei statistici -O statistică se zice rezistentă (stabilă) dacă prin modificarea (coruperea) unei date statistica nu se modifică prea mult. De exemplu, media nu este rezistentă, în timp ce mediana este. Împrăştiere - Arată gradul de modificare a valorilor unei variabile de la o observaţie la alta. Ca termeni sinonimi sunt varianţa, variabilitatea, dispersia. Importanţa aprecierii gradului de împrăştiere este dată de însăşi motivaţia statisticii: pentru o variabilă constantă nu este nevoie de statistică. Pentru măsurarea împrăştierii se utilizează diferiţi indicatori statistici: IQV, quantile, dispersia, abaterea standard etc. Este de notat, totuşi, că nu există o măsură absolută a împrăştierii, gradul de împrăştiere poate fi apreciat doar relativ, prin comparare. Intuitiv, gradul de împrăştiere a unei variabile poate fi apreciat prin asimilarea histogramei cu o grămadă de nisip, despre împrăştierea căreia ne formăm imediat o părere. Siguranţă statistică - Este probabilitatea ca un interval de încredere al unui parametru să conţină valoarea adevărată a parametrului. Este notată uzual cu 1-, fiind pragul (nivelul) de încredere al intervalului. Sensul este acela că dacă se construiesc în mod repetat intervale de încredere plecând de la eşantioane diferite, procentajul intervalelor care conţin valoarea adevărată a parametrului va tinde către siguranţa statistică. Statistică inferential- Conţine metodele prin care se obţin informaţii despre o populaţie pe baza datelor unui eşantion aleator din populaţia de interes. Principalele metode sunt estimarea şi testarea ipotezelor. Este partea principală a statisticii, deoarece interesul unui cercetător este îndreptat, de regulă, către cunoaşterea populaţiei şi nu către eşantion. Tendinţă centrală - Indicatorii de tendinţă centrală sunt măsuri pentru localizarea “mijlocului” sau “centrului” distribuţiei. Deoarece noţiunea de “centru” este suficient de vagă, indicatorii n n N N n 1 de tendinţă centrală cuprind statistici diverse, cele mai uzuale fiind media, mediana, valoarea mod, media redusă, fiecare oferind o caracterizare diferită pentru datele procesate. Unimodală -O distribuţie este unimodală dacă are exact o singură valoare mod. Volumul eşantionului -Volumul eşantionului este numărul de elemente din eşantion.