Documente Academic
Documente Profesional
Documente Cultură
Ediia
a 7, in lucru
Capitolul 2
CONCEPTE STATISTICE DE BAZ
Conceptele statistice fundamentale, prezentate n acest capitol, sunt:
unitate statistic
populaie statistic
caracteristic variabil sau variabil,
eantion
ir statistic sau serie statistic i
eantioane independent prelevate
distribuie de frecvene
eantioane de observaii perechi
Statistica studiaz mulimi de observaii efectuate asupra unor obiecte denumite uniti
statistice care prezint anumite caracteristici variabile. Unitile statistice pot fi clasate,
ordonate sau msurate n raport cu caracteristicile respective. Mulimile de observaii se
numesc iruri sau serii statistice.
Exemplul 2.
ntr-un acvariu, petii (unitile statistice) prezint, printre altele, urmtoarele caracteristici:
Specia. Datele acestea se claseaz.
O not de frumusee a exemplarelor. Se ordoneaz.
Lungimea sau greutatea. Se msoar.
Variabile (pur) calitative sau nominale sau categoriale = variabile ale cror
variante pot fi (doar) clasate (nu ordonate sau msurate).
Exemple:
Variabila culoarea ochilor cu variantele negri, cprui, albatri, verzi.
Variabila sex cu variantele masculin, feminin.
2.
Variabile cantitative = variabile ale cror valori pot fi ordonate sau chiar msurate.
Cele care pot fi doar ordonate se numesc i semicantitative sau ordinale, iar valorile
respective se numesc ranguri.
Exemple:
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
2 Scalele de reprezentare
Fie dou obiecte (uniti statistice n.t.) A i B i o variabil X care are, pentru cele dou
obiecte. scorurile xA, respectiv, xB.
a. O scal nominal face doar distincie ntre clase. Astfel, pentru A i B se poate spune
doar c xA = xB ori xA xB.
b. O scal ordinal induce o relaie de ordine ntre obiecte. Astfel, n plus fa de
diferenierea ntre xA = xB i xA xB, n cazul inegalitii se poate spune dac
xA > xB ori xA < xB.
c. O scal interval atribuie o msur semnificativ a diferenei ntre dou obiecte. Se
poate spune, nu numai c xA > xB ci i c A este cu xA - xB uniti mai mare ca B.
d. O scal raport este o scal interval cu un punct zero semnificativ. Dac xA > xB se
poate spune c A este de xA / xB ori mai mare ca B.
Aceste definiii de scale sunt ordonate ascendent de la cea nominal la scala raport.
Fiecare scal are toate proprietile tuturor scalelor inferioare ei. Prin urmare, renunnd la o
parte din informaie se poate reduce o scal la o oricare scal inferioar
Variabilele de pe o scal nominal sau ordinal sunt denumite, n mod frecvent, variabile
categoriale sau calitative, adeseori cu ambiguitate asupra faptului dac exist sau nu o relaie
de ordine. Pentru contrast, variabilele pe scale interval sau raport sunt adesea referite drept
variabile cantitative. [1] (Sublinierile ne aparin.)
O bservm c o scal interval are o origine arbitrar (zero) i, deci, poate permite valori
negative. n schimb, o scal raport are un zero absolut i, deci, nu permite valori negative.
Exemplele 2.1.2.
a. Rasa, sexul, culoarea prului, specia, varietatea, tratamentul.
b. Scala duritii mineralelor a lui Mohs: "mineralul A este mai dur dect B dac A zgrie pe
B", ierarhia militar, nota (pentru c putem spune c un student care a primit nota 10 este
mai pregtit dect unul cu 9, dar nu putem spune care este diferena. Dac nota ar fi
reprezentabil pe o scal interval ar nsemna c am putea afirma c diferena de pregtire
ntre cei doi de un punct este egal cu diferena de pregtire ntre un student cu nota 5 i
unul cu nota 4 tot de un punct. Aceste puncte, intervale nu sunt egale.
c. Anul calendaristic dup Cristos (pentru c exist i ani nainte de Cristos), temperatura n
grade Celsius sau n grade Fahrenheit (pentru c nu au 0 absolut).
d. Greutatea, nlimea, temperatura n grade Kelvin, (pentru c au 0 absolut i, deci, nu pot
avea valori negative). Putem spune c 20K indic o temperatur dubl fa de cea de10K,
deoarece aceste valori exprim dublarea gradului de agitaie molecular (ceea ce nu se poate
afirma n cazul gradelor Celsius sau Fahrenheit).
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
b.
c.
d.
calitativ
ordinal
cantitativ (
d iscontinu:
numrtoare sau
contor [31]
continu:
msurtoare sau
dimensiune)
variante
ranguri
n nr. finit
discontinue
discontinue
valori
nominal
ordinal
interval sau
raport
nonmetrice,
neparametrice
metrice,
parametrice
continue
Variabila ordinal are o situaie special deoarece rangurile pot proveni fie din
variante nzestrate cu o relaie de ordine, fie din valori pentru care ignorm proprietile scalei
interval.
Exemple
Pentru prima situaie, variantele mic, mediu, mare primesc n mod natural o relaie de ordine.
Glosarul IIS1 de termeni statistici numete aceste date categorizare ordonat.
Pentru a doua situaie putem considera situaia primilor trei clasai la un concurs sportiv. Ei se plaseaz
astfel pentru c au obinut cele mai mari scoruri, fr a conta ns valorile propriu-zise ale scorurilor,
mai precis, intervalele dintre acestea - proprietatea definitorie a scalei interval. Glosarul IIS de termeni
statistici numete aceast procedur statistic de ordine.
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
c.
Exemplele 2.2.2
Revenind la exemplul 2,
a. {crap, caras, crap, crap}, {7, 9, 6, 8} i {1,2 Kg; 0,3 Kg; 0,7 Kg; 1,5 Kg} sunt trei iruri
statistice de specii, note, respectiv, greuti;
crap caras
9
7
crap
este un ir statistic de specii i note;
6
8
crap caras crap crap
9
6
8
c. 7
este un ir statistic de specii, note i greuti.
1,2Kg 0,3 Kg 0,7Kg 1,9Kg
crap
Exemplu
irul care conine caracteristicile (specie, not de frumusee, lungime i greutate) pentru petii
observai i msurai este un ir multivariat, nu multidimensional, deoarece doar lungimea i
greutatea sunt dimensiuni.
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
Exemple
- Mulimea numerelor reale, utilizat n statistic ca suport al rezultatelor posibile ale procesului de
msurare, este o mulime teoretic matematic.
- Mulimea tuturor submulimilor cu un numr fixat de uniti statistice posibil a fi extrase dintr-o
anumit mulime de uniti statistice este o mulime teoretic statistic.
- Mulimea exemplarelor posibile dintr-o anumit specie este o mulime teoretic biologic.
Populaiile statistice reale sunt n marea majoritate a cazurilor foarte mari iar cele mai
multe populaii teoretice sunt infinite. Deoarece nu este economic s studiem exhaustiv
populaiile reale i este practic imposibil s studiem toate unitile statistice ale unei populaii
infinite se recurge la eantioane.
Eantion, mostr, prob, colectivitate de selecie sau lot = o mulime de uniti
statistice la care NU se limiteaz orizontul nostru de INTERES, fiind o parte dintr-o
populaie statistic, pe care o studiem cu INTERESUL de a obine informaii cu privire la
ntreaga populaie.
Un studiu complet (exhaustiv) asupra unei populaii statistice produce rezultate certe
n privina populaiei respective. Dimpotriv, un studiu care utilizeaz doar un eantion ofer
rezultate care sunt incerte n privina populaiei respective.
Altfel spus, deosebirea fundamental ntre studiile exhaustive i cele prin eantioane
este aceea c primele produc rezultate cu grad de certitudine unitar (1 sau 100%), n timp ce
ultimele aduc rezultate despre populaia respectiv cu grad de certitudine strict subunitar
(probabilitate < 1 sau < 100%).
Extrapolarea rezultatelor obinute pe eantioane la populaii - ceea ce presupune un
proces logic de inducie2 - se poate face:
empiric, fr a putea exprima numeric gradul de certitudine;
tiinific, exprimnd numeric gradul de certitudine.
Exprimarea numeric a gradului de certitudine, inclusiv cu posibilitatea verificrii sale
obiective, nu se poate face dect prin inferene statistice n cadrul statisticii infereniale,
numit i statistic inductiv, statistic analitic sau statistic matematic. Aceasta se bazeaz
pe teoria probabilitilor i poate exprima obiectiv gradul de certitudine numai pentru aa(Un eantion este denumit eantion probabilist dac i se
numitele eantioane probabiliste.
poate calcula probabilitatea de a fi obinut.)
Studiul incomplet al populaiilor statistice prin intermediul eantioanelor probabiliste
este scopul statisticii inductive. Aceasta se bazeaz pe statistica descriptiv i pe teoria
probabilitilor.
n concluzie, statistica clasic este structurat n trei demersuri specifice: statistic
Inducia este procesul logic de trecerea de la particular la general, aici, de la eantion la populaie.
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru
Exemplele 2.4.
a. Compararea unui operator atestat cu unul neatestat, pentru eventuala atestare a celui de-al
doilea.
b. Compararea unui aparat de msur neetalonat cu un aparat etalonat se poate face apelnd la
cuplul de msurtori executate asupra aceluiai eantion cu primul, respectiv, cu cel de-al
doilea aparat.
c. Aa numitele "studii longitudinale" antropologice care urmresc probleme de
cretere-dezvoltare prin cte dou eantioane de observaii perechi primul eantion fiind
format din n copii la o anumit vrst v, iar al doilea din aceiai n copii, un an mai trziu.
c1. Cuplul de eantioane produse de orice experiment clasic de studiu al eficacitii unei
substane medicamentoase. Se ia un lot de n subieci crora li se msoar o anumit
caracteristic (de exemplu tensiunea arterial) naintea tratrii cu substana respectiv (un
hipotensiv n cazul exemplului nostru) i dup. Primul eantion va fi format din valorile
msurate naintea tratamentului, iar cel de-al doilea din valorile de dup tratament.
Exemplul 2.4.
d. Dac ne intereseaz s comparm circumferina toracic cu cea abdominal ntr-o anumit
populaie uman sau animal vom reine ntr-un eantion circumferinele toracice ale celor n
indivizi selectai n lot i n cel de-al doilea eantion circumferinele abdominale ale acelorai
n indivizi.
Exemplul 2.4.
e. Pentru a determina care dintre cei doi soi ai unui cuplu are n medie un IQ (coeficient de
inteligen) mai mare, primul eantion va conine valorile coeficientului la cei n soi selectai
n lot, iar al doilea eantion va conine cei n coeficieni ai soiilor acestora.
Pentru anumite probleme din cadrul exemplelor anterioare se pot imagina i perechi de
eantioane independent prelevate.
Exemplele 2.4.
a. Problema a nu poate fi rezolvat dect ca mai sus.
Din Dragomirescu L., Drane J. W., 2009, Biostatistic pentru nceptori. Vol I. Biostatistic descriptiv. Ediia
a 7, in lucru