Sunteți pe pagina 1din 47

Conf.dr.

Livia SANGEORZAN
Facultatea de MI
livia.sangeorzan@gmail.com
sangeorzan@unitbv.ro
NOTE DE CURS
BIOSTATISTIC

DR. LIVIA SNGEORZAN


STATISTIC APLICAT
dr.Livia Sngeorzan

CUPRINS
Distribuia normal...............................................................................................................................................3

IV. STATISTICA DESCRIPTIVA................................................................................4


.1 Caracteristica calitativ.................................................................................................................................6

2. Caracteristica cantitativ...........................................................................................................................9
Prima metod....................................................................................................................................................9
A doua metod (gruparea datelor n clase).......................................................................................................9
2.1. Analiza statistic a unei caracteristici cantitative utiliznd prima metod.............................................9
Reprezentarea box-and-whisker plot..............................................................................................................15
2.2. Analiza statistic a unei caracteristici cantitative utiliznd a doua metod..........................................16
Gruparea pe clase............................................................................................................................................16
a) lungimi de clas diferite.........................................................................................................................18
b) lungimi de clas egale........................................................................................................................18

3. Mrimile medii..........................................................................................................................................19
3.1. Clasificarea mrimilor medii..................................................................................................................19
Media aritmetic.............................................................................................................................................19
Mediana..........................................................................................................................................................20
Modulul...........................................................................................................................................................22
Relaia dintre media aritmetic, modul i median.......................................................................................23
3.2 Indicatorii variaiei.................................................................................................................................23

4. Masurarea tendintei centrale i a variaiei................................................................................................25

5 Conceptul de baza ale tehnicilor statistice.................................................................................................26


5.1 Asimetria ( Skewness)...........................................................................................................................26
5.2 Boltirea (Kurtosis)..................................................................................................................................27
5.3 Funciile tehniciilor statistice.................................................................................................................27
5.4 Metode statistice....................................................................................................................................27

6. Interval de siguran...................................................................................................................................27
6.1 Prag de semnificaie...............................................................................................................................27
6.2 Comparaia statistic, ipoteza nul, testul de semnificaie...................................................................28
Ipoteza nul.....................................................................................................................................................28
DISTRIBUTIA NORMALA...........................................................................................................................35
DISTRIBUTIA t..............................................................................................................................................40

BIBLIOGRAFIE...........................................................................................................53

Distribuia normal
O repartitie deosebit de importanta e repartiia normal (lege sau distribuie normal) care
se definete astfel: .

2
STATISTIC APLICAT
dr.Livia Sngeorzan
Fie X o variabila aleatoare continu, x (-,+) i avnd densitatea de repartiie

1 ( x m )2
f(x)= . 2 2
2 e
unde:
m - valoarea medie a variabilei aleatoare X
- dispersia variabilei aleatoare X

Funcia f(x) are forma unui clopt (clopotul lui Gauss).

1. Daca m=0 atunci legea normal se spune c este centrat;


2. m=0, =1 se spune c legea normal e redus sau normalizat i n acest caz
densitatea de repartiie are forma de mai jos:

1 x2
f(x) = .e 2
2

Curba ce reprezinta densitatea de probabilitate are urmatoarele caracteristici


Are un maxim n X=m
Are puncte de inflexiune n X=m
Este simetric fa de x=m
Axa OX e asimptot
Aria de sub curb are valoarea 1

IV. Statistica descriptiva

Scopul statisticii descriptive este:


1. reprezentarea datelor sub forma de diagrame(bastonase, pie(plcint),
boxplot,etc.);
2. calcularea unor mrimi speciale(ex.: medii, dispersii, etc.);
3. reducerea datelor(mprirea datelor n clase).

Vom numi populaie statistc orice mulime care formeaz obiectul unei analize
statistice.
Elementele unei populaii statistice se numesc uniti statistice sau indivizi.
Trstura comun tuturor unitilor unei populaii care ne intereseaz n cadrul unei
analize statistice se numete caracteristic.

Tipuri de caracteristici

3
STATISTIC APLICAT
dr.Livia Sngeorzan

calitative cantitative

nominal ordinal discret continuu


Fig.1 Prezentarea arborescen a tipurilor de caracteristici

Exemple:
Caracteristici calitative
indicarea tipurilor fr utilizarea unei numerotri;
exprimarea verbal a tipurilor unor caracteristici calitative; ex:cel mic, ru,
suficient, eventual, etc.;

Caracteristica nominal
rspuns: da , nu
caracteristica binar:1,0
confesiune :ortodox,catolic

Caracteristica ordinal
tipurile pot fi diferite ntre ele i pot fi puse ntr-o ordine de rang (scala rang sau
scala ordinal), ex:foarte bun,bun,mulumitoare ...

Caracteristica cantitativ
tipurile caracteristicilor sunt aici numere;
scala tipurilor este din domeniul numerelor reale .

Caracteristica continu
toate valorile X sunt dintr-un interval de nume reale.

Caracteristica discret
tipurile caracteristicilor sunt valori finite sau numrabile, ex:numrare (numrul de
studeni dintr-o universitate)

Exemplu
Bifai caracteristicilor din tabelul de mai jos tipul corespunztor:

calitativ cantativ
Caracteristic

4
STATISTIC APLICAT
dr.Livia Sngeorzan
nominal ordinal continu discret

Lungime drum X
Ani de studiu X
Alegere meserie X
Religie X
Retribuie X
Durata de via a unei
maini X
Lungimea firului de pr
X
Feele unui zar
X

Vrsta X
Numr telefon X

Tab.2 Exemple de tipuri de caracteristici

Caracteristica calitativ

Fie A1 , A2 , ....... Ak tipuri ale caracteristicii caltitative i x1 , x 2 ,........ x n ; k n , valori


luate de acestea i unde n reprezinta frecvena absolut, adica numrul de uniti statistici
(sau indivizi) pe care i studiem.
k
n ni
i 1

Reprezentarea datelor x1 ,...,xn se poate face sub form de:


i)reprezentarea n batoane (bastonae);
ii)diagrama prin forme geometrice 3D (prisme, paralelipipede, cilindrii, etc. );
iii)diagrama circular(sector de cerc , pie);
iv)boxplot.

Notaii:
Frecvena absolut a tipului de caracteristic calitativ se noteaz cu ni, adic
numrul absolut de elemente corespunztoare lui Ai ;

5
STATISTIC APLICAT
dr.Livia Sngeorzan
ni
Frecvena relativ hi := hi , cu 0hi1;
n
Frecvena procentual P:=hi100
Exemplu:
Fie o populaie statistic format din 10 uniti statistice ( indivizi).Populaia este format
din indivizi cu o anumit culoare a pielii i anume: alb, galben, roie i neagr.
S se studieze aceast caracteristic calitativ.
Avem 4 tipuri ale caracteristicii cantitative reprezentand culoarea pielii:

A1 alb
A2 galben x1 x2 x3 x4 x5 x6 x7 x8 x9 x10
i
A3 rosu a g g n r a a a n n
A4 negru

Pentru valorile date vom ntocmi un tabel (Tab.3) si vom reprezenta grafic valorile din
tabel.

Tabelul (Tab.3) pentru aceste valori arat astfel:


A ni hi P

A1 alb (a) 4 4 40%


= 0,4
(1) 10
A2 galben (g) 2 2 20%
= 0,2
(2) 10
A3 rosu (r) (3) 1 1 = 0,1 10%
10
A4 negru (n) (4) 3 3 = 0,3 30%
10
Diagram a sub form a de "pie"(placinta)Tab.3 Organizarea datelor

calitative ntr-un tabel
10 1 100%

Observaie : Din tabelul 3 putem citi c 40% din populaia statistic are culoare alb.
0.3

0.4
Reprezentarea grafica a datelor din tabelul 3 poate fi unul dintre graficele de mai jos

0.1

0.2

1 2 3 4
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig.1 Reprezentarea grafic a datelor din Tab.3

Caracteristica cantitativ
Fie o caracteristic cantitativ pentru care se dau x1 , x 2 ......x n valori obinute printr-o
msurare.
Exemplu de caracteristic cantitativ X poate fi :greutatea, nlimea, salt n lungime,
venit, etc.

Datele observate se vor ordona cresctor, astfel vom obine un ir ordonat cresctor de
forma:
x(1)x(2)...x(n-1)x(n)
x(i) := o valoare observat.
Studiul acestei caracteristici cantitative se poate face prin dou metode.

Prima metod
1. Ordonm irul cresctor.
2. Se face o reprezentare a datelor utiliznd frecvena relativ. Se reprezint
frecvena relativ pe axa OY (aa cum am fcut reprezentarea n cazul
caracteristicii calitative).

A doua metod (gruparea datelor n clase)


1. Ordonam irul cresctor;
2. Se face o grupare a datelor n clase.

2.1. Analiza statistic a unei caracteristici cantitative utiliznd prima


metod
Fie un ir de date a unei caracteristici cantitative i avnd urmtoarele valori:

7
STATISTIC APLICAT
dr.Livia Sngeorzan
500 1000 1200 1300 800 1200 700 1000 900 1500
x1 x2 x3 x 10
700 800 800 900 900 900 1000
x11.. x17

Etape de lucru :
1. Ordonm irul n mod cresctor
500 700 700 800 800 800 900 900 900 900
x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10)

1000 1000 1000 1200 1200 1300 1500


x(11) x(12) x(13) x(14) x(15) x(16) x(17)

Datele le vom trece n tabelul 4 de mai jos P(X<=700)=3/17

Date de ni hi Fn(x)=h1+h2+...+hi
intrare frecvena frecvena Sume pariale Si
absolut relativ
500 1 1/17 1/17
700 2 2/17 3/17
800 3 3/17 6/17
900 4 4/17 10/17
1000 3 3/17 13/17
1200 2 2/70 15/17
1300 1 1/70 16/17
1500 1 1/17 17/17
17 1
Tab. 4 Organizarea datelor cantitative ntr-un tabel

Interpretare
Din tabelul 4 putem citi urmtoarea probabilitate i anume ca variabila
aleatoare X s ia valori mai mici sau egale cu 700 este definit astfel :
3
P( X 700) 0,1764 17,64%
17
Astfel, putem spune c, 17,64% din totalul valorilor de 17 sunt mai mici sau egale cu 700.
Calculm urmtoarea expresie: 0,1764*17 = 2,99 adic 3 valori , ceea ce este i adevrat
dac analizm tabelul 4.

8
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig.2 Funcia empiric de distribuie a datelor din tab.4

9
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig.3 Reprezentarea datelor din tab.4 sub form de bastonae i paralelipiped

10
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig.4 Reprezentarea datelor din tab.4 sub form de diagram pie

Statistica sumar folosind MedCalc cu reprezentarea Box-plot a datelor din tab.4

Fig.5 Statistica sumar i reprezentarea datelor din tab.4 sub form box-plot

11
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig.6 Datele din tab.4 i Summary statistics


pentru reprezentarea sub form de
histogram

Fig.7 Histograma datelor din fig.6 (am folosit 4 clase i nu 9)

12
STATISTIC APLICAT
dr.Livia Sngeorzan
Reprezentarea box-and-whisker plot

Reprezentarea datelor sub form de box-and-whisker plot este un grafic exploratoriu ce a


fost creat de John W. Tukey i folosit pentru a prezenta distribuia unui set de date.
In cele 2 figuri (fig.8 i fig.9) sunt prezentate modul de interpretare a graficului box-plot.
Fig.8 prezint o reprezentare concret i anume referitoare la numrul de caractere din 50
de eMailuri. Fig.9 prezint modul de interpretare a unei reprezentri box-plot. Aceast
reprezentare este o reprezentare tipic pentru domeniul statisticii.

Fig. 8. Reprezentarea box-plot a numrului de caractere citite n 50 de eMailuri

[David M. Diez, Christopher D Barr, Mine Cetinkaya-Rundel, OpenIntro Statistics,


Second Edition, June 2013, http://openintro.org]

13
STATISTIC APLICAT
dr.Livia Sngeorzan

Fig. 9 Interpretarea reprezentrii box-plot


[http://flowingdata.com/2008/02/15/how-to-read-and-use-a-box-and-whisker-
plot/ ]

2.2. Analiza statistic a unei caracteristici cantitative utiliznd a


doua metod

Gruparea pe clase
Fie un interval [a,b]. Presupunem c toate valorie variabilei cantitative se afl n intervalul
[a, b] adic xi [a, b] , i=1...n. Discretizarea ( = Gruparea datelor pe clase) intervalului
a,b=e0,ek,cu ei-1xei:

a e0 e1 e2 e3 .. ei 1 ei ei 1 .. ek 1
ek b

A1 A2 Ai Ai 1 Ak
unde
n numrul de uniti statistice;
a e0 este inceputul intervalului;
e k b este sfritul intervalului;

14
STATISTIC APLICAT
dr.Livia Sngeorzan
k este numarul de clase pentru n uniti statistice care poate fi stabilit astfel:
o k = 4(0,75(n-1))1/5 , se utilizeaz pentru n>250;
o k=1+3,322 lgn ;
o k=[n/5] formula lui Hahn Shapiro
o dac n<250 se recomand 10 clase
Ai este clasa i ;
ni numrul de uniti statistice a clasei Ai ;
hi este frecventa relativ pentru clasa i ;
di lungime clasei care se poate determina astfel

di = (b a ) / (1 + 3,322 lgn )( relaia Sturgers) lg este logaritm n baza


10 ;
ba
pentru clase echidistante d e ;
k
hi
ki reprezinta nlimea clasei n histogram;
di

Datele astfel grupate pot fi trecute ntr-un table conform tabelului de mai jos

Clasa Interval de Mijlocul Frecvena Frecven Lungime Fn


i clas intervalu absolut a relativ clas Funcia de
Ai (ei-1,ei lui i ni hi distribuie
A1 e0,e1) 1 n1 h1 d1 h1
A2 [e1,e2) n2 h2 d2 h1+ h2
. . 2 . . .
. . . .
. . . . . .
Ak [ek-1,ek nk dk
. .

. hk

k
h1+ h2++ hk
1

n 1

Not : Mijlocul intervalului I se calculeaz astfel: i = (ei-1+ei)/2.

15
STATISTIC APLICAT
dr.Livia Sngeorzan
Aplicaie :
Fie urmtoarele valori:
500 700 700 800 800 800 900 900 900 900
x(1) x(2) x(3) x(4) x(5) x(6) x(7) x(8) x(9) x(10)

1000 1000 1000 1200 1200 1300 1500


x(11) x(12) x(13) x(14) x(15) x(16) x(17)

Alegem numrul de clase k=4.

a) lungimi de clas diferite


Clasa Intervalul de Frecvena Frecvena Limea nlimea
i clas (ei-1,ei absolut relativ clasei coloanei ki
hi di

1 500,700 3 3/17 200 0,000882


2 (700,900 6 6/17 200 0,001765
3 (900,1200 5 5/17 300 0,000983
4 (1200,1500 3 3/17 300 0,000588
17 1 1000

b) lungimi de clas egale


Clase echidistante de = (b-a)/k , unde: a := nceput interval

Clasa Interval de Frecvena Frecvena Lime


i clas (ei-1,ei absolut ni relativ hi clas ki
di
1 500,750) 3 3/17 250 0.0008
2 [750,1000) 7 7/17 250 0.0016
3 [1000,1250) 5 5/17 250 0.0012
4 [1250,1500] 2 2/17 250 0.0005
17 1 1000

Observaie
n cazul n care nu se indic numrul de clase este util a se alege ntre 3 si 5 clase.
Dac k este foarte mare frecvena absolut devine foarte mic!

16
STATISTIC APLICAT
dr.Livia Sngeorzan
3. Mrimile medii
Mrimile medii sunt instrumente statistice.
Aceste mrimi exprim n mod sintetic i generalizat cea ce este :
o normal;
o esenial
o general
n evoluia fenomenelor.
Media sintetizeaz normalul i ocup poziie central spre care tind unitile unei
colectiviti. Media mai poart denumirea de speran matematic.

3.1. Clasificarea mrimilor medii


Clasificarea mrimilor medii se face n funcie de rolul pe care l au n analiza statistic i
dup modul de obinere a lor (E.Jaba, 1998) :

1. dup modul lor n analiza statistic :


1. mrimi medii fundamentale: media aritmetic, modul, mediana
2. mrimi medii cu aplicaii speciale: media geometric, media armonic,
media ptratic, media progresiv, media cronologic, medii mobile;
2. dup modul de obinere pot fi :
3. mrimi medii de calcul: media aritmetic, media geometric, media
armonic;
4. medii de poziii: modul, mediana, mediala.

Media aritmetic
Este cea mai utilizat form i se folosete cnd fenomenul supus cercetrii nregistreaz
modificri aproximativ constante.
Media aritmetic este de dou feluri : simpl i ponderat.
(i) Media aritmetic simpl:
n x
x i 1 i , i 1,..., n
n
unde : n-numrul de observaii:

Exemplu: media aritmetic a unui ir


x = (500+700+800+900+1000+1000+1200+1200+1300+1500)/10
x = 1010

(ii)Media aritmetic ponderat xp


n ni n n
xp i 1 n x i i xi , i 1
i 1 i 1
unde:

17
STATISTIC APLICAT
dr.Livia Sngeorzan
n-numrul de observaii:x1,x2,...,xn
n ponderi:1,2,...,n.

Mediana
Mediana este termenul din mijlocul irului, ordonat cresctor. Dac irul are numr par de
elemente, mediana este media aritmetic a celor doi termini din mijlocul irului.
Mediana prezint unele avantaje fa de medie, i anume :
aceasta nu este afectat de fluctoaiile seleciei;
ea se poate determin graphic prin construirea curbei frevenelor cumulate,
iar din punctul corespunztor lui (ni +1 )/0.5 coborm o perpendiculare
pe abscis unde se afl mediana. Se mai poate construi ogiva frecvenelor,
din al crei punct de intersecie coborm o perpendicular pe abscis i
aflm valoarea medianei.
Exemplu
n=17,
500 700 700 800 800 800 900 900 900 900
1000 1000 1000 1200 1200 1300 1500

mediana = 900

18
STATISTIC APLICAT
dr.Livia Sngeorzan

Mediana pentru date grupate se calculeaza dup formula de mai jos :

n
( (f )1 ) c
Mediana L 2
1
f median
unde :

L1 valoare de nceput al intervalului n care se afl mediana


n - numrul total de uniti statistice
(f)1 suma frecvenelor , a tutoror claselor mai mici dect clasa ce include mediana
fmedian - frecvena clasei n care se afl mediana
c - lungimea intervalului de clas a medianei.

Fie exemplu de mai sus mprit pe clase conform tabelului de mai jos :

Vom calcula mediana din tablel astfel:


19
STATISTIC APLICAT
dr.Livia Sngeorzan
avem 17 valori, deci mediana se afla la mijlocul irului , deci pe poziia 9, caut
clasa in care sunt 9 elemente
clasa medianei este [750, 1000] , deoarece 7+3=10
L1 = 750
n = 17
(f)1= 3
fmedian= 7
c=250
(8,5 3) 250
Mediana = 750 982,14
7
Exemplu: Reprezentarea mediei aritmetice i a medianei ntr-o histogram i n
reprezentarea box-plot. [David M. Diez, Christopher D Barr, Mine Cetinkaya-Rundel,
OpenIntro Statistics, Second Edition, June 2013, http://openintro.org]

Modulul
Modulul este valoarea cu frecvena cea mai mare. Fie un ir cu n=17 uniti statistice i
anume
500 700 700 800 800 800 900 900 900 900
1000 1000 1000 1200 1200 1300 1500
Modulul este valoarea 900 deoarece apare de 4 ori.

Modulul pentru date grupate se calculeaza dup formula de mai jos :

1 c
L1
Modulul 1 2

unde :
L1 valoare de nceput al intervalului n care se afl modulul

20
STATISTIC APLICAT
dr.Livia Sngeorzan
n - numrul total de uniti statistice
1 diferena dintre frecvena clasei n care se afl modulul i frecvena clasei
inferioar acesteia
2 diferena dintre frecvena clasei n care se afl modulul i frecvena clasei
superioare acesteia
c - lungimea intervalului de clas a medianei.

Fie exemplu de mai sus mprit pe clase conform tabelului de mai jos :

Vom calcula mediana din table astfel:


clasa cu frecvea cea mai mare este [750, 1000) , aceasta este clasa modulului;
L1 = 750
1 = 7-3= 4
2 = 7-5= 2
c = 250

4 250
750 916,66
Modulul = 42

Relaia dintre media aritmetic, modul i median


Media aritmetic Modul = 3 ( Media aritmetic Median)

3.2 Indicatorii variaiei


Indicatorii statistici ai variaiei sunt ntlnii n literatura de specialitate i sub denumirea
indicatori ai mprtierii sau ai dispersiei.
Dispersia exprim gradul de mprtiere a valorilor individuale ale unei distribuii n jurul
valorii centrale i este datorat influenei factorilor aleatori.
Indicatorii de variaie aduc un plus de informare asupra:
verificarea reprezentativitii mediei ca valoare tipic a unei serii de repartiie
verificarea gradului de omogenitate a seriei;

21
STATISTIC APLICAT
dr.Livia Sngeorzan
comparri n timp sau spaiu a mai multor serii de repartiie dup caracteristrici
independente sau interdependente;
cunoaterii gradului de influen a cauzelor eseniale de cauzele ntmpltoare.
Dup gradul de generalitate se disting :

indicatori simplii ai variaiei:

Amplitudinea absolut a varianei (A) este diferena dintre valoarea


maxim i valoarea minim a seriei A = xmax xmin;

Amplitudinea relativ a varianei (A%) se exprim n coefficient sau n


procente i este raportul dintre amplitudinea absolut a variaiei i valoarea
A
medie A% media aritmetica
100

Abaterile individuale absolute d = x media aritmetic


i i

d
Abaterile individuale relative d % media aritmetica 100
i
i

indicatori sintetici ai variaiei (ai mprtierii) caracterizeaz gradul de


variaie, lund n considerare toi termenii seriei:
| xi media aritmetica |
abaterea mediei d ml i 1
n
;
n
deviaia standard (abaterea medie ptratic) , este radical din dispersie
( xi media aritmetica ) 2 ni
2 i 1
n
n
dispersia (variana) ;
ni
i 1
coeficientul de variaie (V) se calculeaz ca raport procentual ntre
abaterea medie liniar sau abaterea medie ptratic i media aritmetic :
d ml
V
media aritmetica
100
;


V
media aritmetica
100

Coeficientul de variaie arat cte uniti din abaterea medie liniar sau
din cea ptratic revin la 100 de uniti de medie.Coeficientul de variaie
poate lua valori cuprinse ntre 0 100 %.Dac coeficientul de variaie

22
STATISTIC APLICAT
dr.Livia Sngeorzan
tinde spre zero, se consider o variaie slab, o colectivitate omogen i o
medie cu un grad ridicat de reprezentativitate. Dac coeficientul de variaie
tinde apre 100%, se consider o variaie intens, o colectivitate eterogen
i o medie cu un grad redus de reprezentativitate. Putem stabili
urmtoarele praguri de semnificaie:

o 0% <V< 17% media este strict reprezentativ (omogenitate mare);


o 17%<V < 35% media este moderat reprezentativ (puinomogen);
o 35%< V < 50% media este reprezentativ n sens larg (maipuinomogen) ;
o V>50% media nereprezentativ (lipsde omogenitate).

4. Masurarea tendintei centrale i a variaiei


Cnd avem un ir de date i dorim s folosim un singur numr pentru a reprezenta tot
irul. Acest numr este media aritmetic, mediana sau modulul.

In interiorul irului de date fiecare rezultat individual va fi diferit ntr-un anumit grad fa
de tendina central. Gradul de diferen este egal cu variabilitatea datei respective.

Termeni care descriu variabilitatea sunt :


- abaterea standard (radical din dispersie)
- dispersia (momentul centrat de ordinul n)

Tendina central a datelor : media( aritmetica,mediana sau modulul)


Variabilitatea datelor din punct de vedere statistic, abaterea standard se calculeaz astfel

s= ( X m)
1
2
(abaterea standard experimentala)
n 1

Media si abaterea standard reprezint descriptori de date pentru un ir de date.


Daca abaterea standard e mare media nu e buna pentru reprezentarea sirului respectiv.
_ _
Aproximativ 68% dintre valori trebuie s se gseasc n intervalul [x-s , x + s].
_ _
Aproximativ 95% dintre valori trebuie s se gseasc n intervalul [x-2s , x + 2s].
_ _
Aproximativ 99% dintre valori trebuie s se gseasc n intervalul [x-3s , x + 3s].

In cazul unei aprecieri, mediana si media pot fi utilizate mpreuna. Dac mediana, modulul
i media aritmetic sunt identice atunci irul urmeaz legea normal care se noteaz N(,
) .

23
STATISTIC APLICAT
dr.Livia Sngeorzan
eroare standard (SE), variabilitatea din cadrul eantioanelor de aceiai dimensiune se
numete eroare standard.
s
SE ,
n
unde
s este abaterea standard al eantionului n studiu;
n este mrimea eantionului.

5 Conceptul de baza ale tehnicilor statistice


Metode statistice:
Exista dou categorii de teste statistice i anume :

1. teste statistice parametrice care presupun 2 condiii importante privind


distribuia datelor:
a. populaia din care este eantionul e distribuit normal
b. eantionul selectat din populaia respectiv trebuie s aib aceiai varian
a variabilei de interes

2. teste statistice neparametrice fr distribuie (nu indeplinesc cele 2 condiii).


In cazul n care cele dou condiii de mai sus, sunt ndeplinite, sunt preferate
testele statistice parametrice, deoarece sunt mai stabile, ceea ce nseamn
creterea ansei de a respinge o fals ipoteza nul.

Cele dou condiii enunate pentru testele parametrice pot fi verificate prin estimarea
asimetriei i boltirii curbei normale.

5.1 Asimetria ( Skewness)


Asimetria distribuiei descrie direcia n care e deplasat cocoaa curbei de distribuiei fa
de mijloc i natura cozilor acesteia.
Cnd cocoaa e deplasat la stnga i coada lunga e la dreapta rezulta asimetrie pozitiv
(+) in caz contrar asimetrie negativ (-).

5.2 Boltirea (Kurtosis)


Boltirea este dat de panta curbei de distribuie. Boltirea sau excesul, este deci o msur a
formei serii sau distribuiei de valori, care msoar nlimea aplatizrii (sau botiri) unei
distribuii n comparaie cu o distribuie normal.
Aceasta poate fi ascuit sau plat. Cnd media se gsete n centrul distribuiei (z=0)
50% din distribuie e deasupra mediei.

24
STATISTIC APLICAT
dr.Livia Sngeorzan
5.3 Funciile tehniciilor statistice
Tehniciile statistice in general raspund la dou intrebari:
- efectul sau relaia pe care dorim s le studiem sunt valabile (dac experimentul se va
repeta se vor gasi aceleai rezultate)
- ct de important e efectul de care suntem interesati
Importana unei relatii nu e interesant pn cnd nu dovedim c ea e semnificativ.

5.4 Metode statistice


Metodele statistice sunt grupate in doua categori:
-metode statistice pentru o testa relaii ntre mai multe variabile dintr-un grup de
subieci (regresia,corelaia)

-metodei studiate pentru a analiza diferene dintr-un grup de subieci (testul t si


analiza de varian).

6. Interval de siguran
Estimaia unui parametru al populaiei nu este punctiform. Nu se poate afirma c acest
parametru are o valoare i numai una. Nu se poate determina cu siguran absolut c
media populaiei este M. Se poate determina doar un interval, n care media M poate lua
valori cu o probabilitate dat. Adic, aceast medie M , nu este mai mic dect o limit
superioar Msup i nu este mai mare dect o limit inferioar M inf. Acest interval (Minf ,
Msup) se numete interval de siguran.

6.1 Prag de semnificaie.


De fiecare dat intervalul de siguran este legat de o probabilitate. Putem spune c media
M se afl n intervalul (Minf, Msup) cu o probabilitate de 95%. Acest lucru nseamn c
fcnd un numr mare de extracii de eantioane din populaia respectiv, n 95% din
cazuri media se afl n acel interval de siguran i numai n 5% din cazuri riscm s
greim. Aceast probabilitate de a greii se numete prag de semnificaie.

Cu ct pragul de semnificaie este mare cu att mai mare este riscul de a grei i invers.

6.2 Comparaia statistic, ipoteza nul, testul de semnificaie.


In practic se pune problema de a face comparaie ntre
doi parametrii ( un parametru i valoarea lui admis teoretic);
dou distribuii de frecven;
aciunea unui factor nainte i dup ;
etc.

In cazul comparaiei situaiei nainte i dup aciunea unui factor , se rezolv prin
ipoteza nul.
25
STATISTIC APLICAT
dr.Livia Sngeorzan
Ipoteza nul
Presupunem c dou eantioane provin din aceiai populaie i c diferena dintre
parametrii lor se datorete ntmplrii extragerii acestora, dar c n realitate diferena este
nul.
In cercetarea statistica testul e raportat la o tabel de probabilitate pentru a stabili ansele
ca rezultatul la care s-a ajuns sa fie datorat ntmplri.

Inainte s se nceap studiul se stabilete un nivel acceptabil al probabiliti de apariii


neateptate (). Acest nivel poate oscila dar nu poate fi ignorat.
Pentru orice studiu sau cercetare exist totdeauna probabilitatea ca rezultatele s se
datoreze ntmplri.
Probabilitatea de apariie ntmpltoare e ales 0,05 sau 0,01, adica ansa ca
apariia s se datoreze ntmplrii este 5 % sau 1%.
Valorile lui sunt folosite pentru a controla erorile de tip I.

Intr-un studiu se pot face doua tipuri de erori :


- tipI este de a respinge ipoteza nula cand ea este adevarata
- tipII este de a accepta ipoteza nula cand ea este falsa

Decizia corect e acceptarea ipotezei nule adevarate sau respingerea uneia false.
Pentru evitarea erorilor de tipI trebuie s se fac un control prin modul de alegere a lui .
In practic se respect urmtoarele valori:

1. dac probabilitatea este mai mare de 0,05 (5%) ipoteza este aceptat,
diferena este nesemnificativ;
2. dac probabilitatea este mai mic de 0,01 (1%) ipoteza se respinge, diferena
este semnificativ;
3. dac probabilitatea este curins ntre 0,01 i 0,05 atunci situaia este
ndoielnic. Cercetri ulterioare, prin mrirea numrului de date, pot clarifica
situaia.

Exemplu IPOTEZA NULA Interval de ncredere pentru o medie aritmetic

Fie un eantion format din 50 de studeni dintr-un colegiu. Acetia au fost ntrebai n
cte relaii exclusive de prientenie sunt implicai. In urma chestionrii a acestora s-a
constat c au n medie 3,2 relaii de prietenie exclusive cu o abatere standard de 1,74.
S-a constata c distribuia este uor asimetric spre stnga . S se determine valoare
medie a relaiilor exclusive de prietenie adevrate bazndu-ne pe acest eantion i
folosind un interval de ncredere de 95%.

Avem urmtoarele informaii: n 50; x 3,2; s 1,74; SE 0,246

26
STATISTIC APLICAT
dr.Livia Sngeorzan
S se determine
1) intervalul de ncredere de 95% a mediei aritmetice ;
2) probabilitatea p, n ipoteza nul i alternativ .

P( X 3,2 | H 0 : 3)

Soluie :
1) n=50 ; s=1,74 ; x 3,2 ;
s 1,74
Calculm SE astfel SE 0,246
n 50

Determinm intervalul de ncredere de 95% pentru media aritmetic astfel :

IntervalDeIncredere95% x z * SE 3,2 1,96 (0,246) 3,2 0,48 (2,72 ; 3,46)

Obs. 95% are z*=1,96


90% are z*=1,65
99% are z*=2,58

Interpretare: Suntem 95% siguri c studenii n medie sunt n relaii de


prietenie exclusive in intervalul de la 2,72 la 3,46.

Determinarea valorii critice pentru 95% ncredere :

27
STATISTIC APLICAT
dr.Livia Sngeorzan

Valoarea 1,96 (valoarea critic pt. Increderea de 95%) se poate obine n


dou moduri :
utiliznd B1 Normal Probability Tables i anume astfel se caut
n tabel valoarea 0,025 dup care pe linia i coloana respectiv se
citete valoarea corespunztoare, adic n acest caz -1,9 ;
se folosete funcia qnorm() din R n care ca i parametru se introduce
0,025 (pt. Exemplu dat mai sus), adic qnorm(0.025).
2) Determinm p utiliznd SE, astfel efectum urmtorii pai :
Calculm
x 3,2 3
a) Z 0,81
SE 0,246

b) p P( Z 0,81) 1 0,7910 0,209


Not :
P( Z 3,50) 0,0002

P ( Z 3,50) 0,9998

Valoarea de 0,209 se determin utiliznd tabelul statistic B1 Normal Probability


Tables i proprietile disribuiei normale. Deoarece aceast valoare p este mare dect
0,05 atunci NU PUTEM RESPINGE IPOTEZA NULA .

28
STATISTIC APLICAT
dr.Livia Sngeorzan
Interpretare: In fapt, studenii au fost n medie, n 3 relaii de prietenie
exclusive i c exist 21% anse ca un eantion ales la ntmplare de
dimensiune 50 s aib o medie aritmetic de 3,2 sau chiar mai mare de 3,2.
Putem spune c aceast medie aritmetic de 3,2 sau chiar mai mare de 3,2 se
datoreaz ansei sau variabilitii eantionului.

Obs. S calculm

p P( X 3,2 OR X 2,8 | H 0 : 3) P(Z 0,81) P(Z 0.81) 0,209 0,209 0,41


Exemplu IPOTEZA NULA Interval de ncredere pentru dou medii care sunt
pereche

Exemplu 1
Au fost selectti 200 de subieci dintr-un liceu. Aceti studeni au fost testai privind
citirea i scrierea. Se pune ntrebarea dac scorul ntre distribuia de citire i scriere sunt
similare i cum sunt diferite.
Dac avem cu dou seturi de observaii care au o anumit corespondena (nu
indepentente) spunem ca SUNT PERECHE.
In analiza acestor date pereche vom face diferena ntre valorile observate pentru fiecare
subiect, n cazul nostru avem diff = read write.

29
STATISTIC APLICAT
dr.Livia Sngeorzan

sdiff
IntervalDeIncredere 95% x diff z * SEdiff x diff z *
ndiff
0.545 1,96 0,628 (1,78 , 0,69)

sdiff 8,887
SEdiff 0,6284
ndiff 200

Se analizeaz ipoteza H0 i HA, concluzia este dat mai jos.


P(diff>0) =P(Z >(-0,545/0,6284))=P(Z>-0,867)=1-0,1949=0,8051
H 0 : diff 0
H A : diff 0
p P ( x diff 0.867) 1 P ( x diff 0.867) 1 0,1949 80,51%
H 0 este acceptata deoarece p 0,05

Interpretare
Intervalul de ncreder de 95% pentru diferen este (-1,78 , 0,69)

Exist o ncredere de 95% c diferena ntre scorul privind diferena dintre media de
citire i scriere este ntre -1,78 spre 0,69.
==========================================================

30
STATISTIC APLICAT
dr.Livia Sngeorzan
Exemplu IPOTEZA NULA Interval de ncredere pentru dou medii care NU sunt
pereche (dou exemple)
Exemplu 1
S-a analizat % de grsime din corp (BodyFat%=BF%) dintr-o populaie n mrime de
13601 subieci n intervalul de vrst [20, 80] i pe gen (masculin, feminin).
Dimensiunea eantionului de gen masculin este de 6580 i eantionului de gen feminin
este de 7021. Procentul de grsime BF% pentru genul masculin este de 23,9 i
pentru genul feminin este de 35.
Eroarea standard a diferenei ntre media aritmetic de BF% ntre genul masculin i
feminin este de 0,114. Analiznd datele putem observa o diferena de a BF% n medie.
Considerm c distribuia a estimrii punctuale este aproape normal.

1Enunam urmtoarele ipoteze:


H 0 : mas fem H A : mas fem

2 Calculm estimarea punctul


xmas x fem 23,9 35 11,1

11,1 0
3 Z
0,114
97,36

p P( Z 97,36) 0,0002 p P( Z 97,36) 0

4 Concluzie
Deoarece p< 1% H0 este respins, ceea ce indic, c diferena de BF% este diferit
ntre genul masculin i feminin.

Exemplu 2. Dorim s estimm diferena medie privind timpul de alergare la brbai i la


femei cu o ncredere de 95%. Au fost extrase aleator dou eantioane de 45 de brbai
i 55 de femei dintre toi alergtorii din 2012 de la Cherry Blossom Run. In tabelul de
mai jos se prezin summary statistics i box-plot pentru fiecare eantion n parte.

31
STATISTIC APLICAT
dr.Livia Sngeorzan
ME se numete EROAREA MARGINALA
Intervalul de ncredere este ( 9,05 , 19,91)

Interpretare Cu 95% ncredere putem spune c brbaii alearg n medie ntre 9,05 i
19,91 minute mai repede dect femeile.

DISTRIBUTIA NORMALA

Distributia normala N ( 0, 1) se numete distribuia normala standard


si se numesc parametrii distribuiei.

Folosim o tehnica de standardizare numit scorul Z.


x
Z

Exemplu: Fie X o v.a cu N ( 3, 2) pp ca avem x=5,19 (a) sa se determine
scorul Z pt aceasta valoare x.
5,19 3
Soluia este z 1,095
2

O variabil aleatoare X care urmeaz legea normal se noteaz N(, ), unde ,


sunt cei doi parametrii care caractereizeaz aceast lege, adic este media
aritmetic i este abaterea standard. Dac o distribuie normal are media
aritmetic , i abaterea standard scriem c distribuia variabilei aleatoare X este
N(, ).

Aplicaii:
1. S se scrie distribuia normal cu (a) media aritmetic 5 i abaterea standard 3; (b)
media aritmetic -110 i abaterea standard 2,5 (c) media aritmetic 0 i abaterea standard
1.

Soluie: (a) N(=5, =3); (b) N(=-110, =2.5); N(=0, =1);

2. Dac avem o variabil aleatoare X care urmeaz o distribie normal N(=5, =3).
Se dorete a se determina (a) P(X<4) (b) P(X>6); (c) P( 4<X<6) trebuie s se aplice
standardizarea cu variabila Z.
Variabila aeatoare Z urmeaz o distribuie normal N(=0, =1) pentru care avem date
tabele statistice. Transformarea variabilei X ntr-o variabil Z se face astfel :
x
Z . Pentru a putea rezolva problema de mai sus vom parcurge dou etape, o

etap de transformare n scorul Z i n determinarea probabilittii folosim B.1 Normal
Probability Table :
(a) Transformarea variabilei X cu N(=5, =3) ntr-o variabil Z cu N(=0, =1) astfel

32
STATISTIC APLICAT
dr.Livia Sngeorzan
45
Z 0,33 deci P(X<4)=P(Z<-0,33)=0,3707=37,07%;
3
(b) Transformarea variabilei X cu N(=5, =3) ntr-o variabil Z cu N(=0, =1) astfel
65
Z 0,33 deci P(X>6)=P(Z>0,33)=1-0,6293=37,07%;
3
(c) Transformarea variabilei X cu N(=5, =3) ntr-o variabil Z cu N(=0, =1) astfel
45 65
Z1 0,33 ; Z 2 0,33 deci P(4<X<6)=P(-0,33<Z<0,33)=
3 3
P(Z<0,33)-P(Z<-0,33)=0,6293-0,3707=0,2586=25,86%;

Distributia Normala deplasat la stnga, simetric i deplasat la dreapta (Asimetria)

33
STATISTIC APLICAT
dr.Livia Sngeorzan

34
STATISTIC APLICAT
dr.Livia Sngeorzan

35
STATISTIC APLICAT
dr.Livia Sngeorzan

36
STATISTIC APLICAT
dr.Livia Sngeorzan
DISTRIBUTIA t

Aceast distribuie este centrat n zero ( la fal ca i distribuia normal) i are un


parametru numit grade de libertate (df). Aceast distribuie se aplic pentr n<30.

Gradele de libertate determina grosimea cozii

Distribuia t aproximeaz distribuia normal.

Regresia liniar i coeficientul de corelaie

Dac pentru o populaie avem dou seturi de date corespunztoare formmperechile de


date (x; y), unde care x este valoarea primei variabile i y este valoarea celei de-a doua
variabile. De exemplu, x este nlimea i y este greutatea.
Pereche ordonat de date (x; y) se numete dat bidimensional. Variabila X avnd
valorile x e numete variabil de intrare i este variabil independent, iar variabila Y
avnd valorile y se numete variabil de ieire i este variabila dependent.
Metoda statistic care care permite studierea i msurarea, relaiei dintre dou sau mai
multe variabile se numete analiza de regresie. Aceast metod permite estimarea
valorilor unei variabile n funcie de alt variabil sau de mai multe.
Analiza dependenei funcionale a unei valori de alta sau mai multe valori se realizeaz
prin urmtorii pai:
1. Reprezentarea grafic a perechilor printr-un nor de puncte sau o diagram de
mprtiere. Daca pentru valorile x crescnde ale variabilei de intrare X nu exista

37
STATISTIC APLICAT
dr.Livia Sngeorzan
o deplasare clar ale valorilor y ale variabilei Y , atunci spunem c nu avem
corelaie sau c nu exist legtur ntre X i Y . Legtura dintre cele dou variabile
se determin cu ajutorul coeficientului de corelaie.

2 Dac punctul 1 este ndeplinit atunci se stabilete tipului de regresie i se


determin dependena liniar ntre variabile.

Formule pentru determinarea coeficientului de corelaie i a parametrilor dreptei de


regresie

Notaii:
1 n
x xi
n i 1
(1) - media aritmetic a valorilor variabilei X;

1 n 2
x2 x i
n i 1
( 2) - media aritmetic a valorilor la ptrat variabilei X;

1 n
xy xi y i
n i 1
(3) - media aritmetic a valorilor variabilei XY;

Abaterea standard empiric

2 1 n
s xx x 2 x
n i 1
( xi x ) 2 ( 4)

1 n
s xy xy x y ( xi x)( yi y )
n i 1
(5)

Coeficientul de corelaie:

s xy
rxy 1 rxy 1 (6)
s xx s yy

Coeficientul de determinaie:

2 s xy 2
rxy 0 rxy 2 1 (7 )
s xx s yy

Interpretare:

38
STATISTIC APLICAT
dr.Livia Sngeorzan

rxy 2 1 exist o corelaie liniar foarte bun;

rxy 2 0 corelaia liniar este proast;

rxy 0 indic faptul c dac variabila X crete varabila Y descrete;

Ecuaia dreptei de regresie liniar:

y a b x (8)

unde coeficienei dreptei de regresie , a i b, se pot determina astfel:

s xy
b (9)
s xx
a y b x (10)

Aplicaie:
Fie urmtorul tabel cu perechi de date (xi,yi), i=1,...,9 msurate [ Andre Tropartz,
Statistik I, Theorie und Aufgaben, :Verlag Shaker, Editura Dr.Chaled Shaker, Achen,
Germania,1994]

i 1 2 3 4 5 6 7 8 9
xi 0 1 2 3 4 5 6 7 8
yi 25 16 9 4 1 4 9 16 25

a) S se determine dreapta de regresie a lui y n funcie de x i invers;

b) Perechile de date sunt corelate sau necorelate?

c) Descriei legtura dintre x i y.

Soluie:
a) Dreapta de regresie a lui y n funcie de x

y=a +bx;

Se realizeaz urmtorul tabel:

39
STATISTIC APLICAT
dr.Livia Sngeorzan

i xi yi xi2 yi2 xi yi
1 0 25 0 625 0
2 1 16 1 256 16
3 2 9 4 81 18
4 3 4 9 16 12
5 4 1 16 1 4
6 5 4 25 16 20
7 6 9 36 81 54
8 7 16 49 256 112
9 8 25 64 625 200
36 109 204 1957 436
1
x4 1 1 4 4
n y 12 x 2 22 y 2 217 x y 48
9 3 9 9

1 2
s xx 22 42 6
3 3
4 1
s yy 217 (12 ) 2 70,768
9 9
1 1
s xy 48 4 12 0
9 9
0
b 0
2
6
3
1
a 12
9
1
y 12 0 x
9

b) Observaiile sunt necorelate deoarece s xy 0 , deci rxy 2 0 i vom avea c X i Y


sunt empiric necorelate.
Autorul englez Gosset ( ce avea pseudonimul Student) a propus introducerea unui
parametru t.. Distribuia acestui parametru nu depinde de nici un parametru al populaiei,
ci numai de efectivul n al eantionului.

Parametrul t este definit astfel:

40
STATISTIC APLICAT
dr.Livia Sngeorzan

xe xp
t
e
n 1

unde :

x e - este media eantionului (lotului);


x p - este media populaiei ;
n - este efectivul eantionului,

Valoarea GL= (n-1) se numete grad de libertate.

Testu t , permite s se asigure o mai mare certitudine a indicilor statistici, n cazul


eantioanelor cu numr mic de subieci. Pentru a afla valoarea testului t n funcie de
mrime eantionului i de pragul de semnificaie propus trebuiesc studiate tabelele gata
calculate ( vezi tabelul de mai jos).

Valorile lui t pentru diferite grade de libertate (GL)


i prag de semnificaie ( 0,05 i 0,01 ) ( [5])

Grade de libertate Prag de semnificaie ( )


(GL)
n-1 0,05 0,01
1 12,7 63,66
2 4,30 9,93
3 3,18 5,84
4 2,78 4,60
5 2,57 4,03
6 2,45 3,71
7 2,37 3,50
8 2,31 3,35
9 2,26 3,25
10 2,23 3,17
11 2,20 3,11
12 2,18 3,01
13 2,16 2,98
14 2,15 2,95
15 2,13 2,92
16 2,12 2,90
41
STATISTIC APLICAT
dr.Livia Sngeorzan
17 2,11 2,88
18 2,10 2,86
19 2,09 2,85
20 2,09 2,83
21 2,08 2,82
22 2,07 2,81
23 2,07 2,80
24 2,06 2,79
25 2,06 2,78
26 2,06 2,77
27 2,05 2,77
28 2,05 2,76
29 2,05 2,76
30 2,04 2,75
1,96 2,58

Exemplu ( [1] ):
Enun :
Fie msurat nlimea a 20 de persoane , pentru care s-a determinat :

x = 170 cm i p = 7 cm.
Pentru GL= (n-1) grade de libertate , adic GL = 19 valoarea lui t pentru = 0,05 este t=
2,09 iar pentru =0,01 valoarea aestuia este t=2,85.

Concluzie:
La un prag de semnificaie de 5% intervalul de siguran al mediei este:

7 7
170 2,09. < x < 170 + 2,09.
19 19

166,6 < x < 173,4
Not:
cea mai bun estimaie pentru media populaiei este media eantionului;
se determin intervalul de siguran pentru acest parametru, legat de un prag
de semnificaie;
pentru n<30 se folosete tabelul parametrului t, pentru GL= n-1;
pentru n>30 se folosete tabelul curbei normale;.

Exemplu:
Sunt cunoscute coeficientul de inteligen (IQ) a 16 studeni de la o anumit universitate.
S-au determintat :

42
STATISTIC APLICAT
dr.Livia Sngeorzan
_
- media aritmetic ( x1 ), n valoare de 107 ;
- abaterea standard ( s1) n valoare de 10.

Sunt cunoscute coeficientul de inteligen a 14 studeni de la o alt universitate. S-au


determintat :
_
- media aritmetic ( x 2 ), n valoare de 112 ;
- abaterea standard (s2)n valoare de 8.
Se pune urmtoarea ntrebare:
- exist o diferen semnificativ, ntre coeficienii de inteligen a celor dou
grupe ?
- Care este pragul de semnificaie?
Soluie
Avem de ales ntre dou ipoteze:
H0 : 1 2 , nu exist diferene eseniale ntre loturi ;
H1 : 1 2 , exist diferene eseniale ntre loturi ;
Lund in considerare H0 :, determinm valoarea lui t conform relaiei de mai sus, astfel:

16(10) 2 14(8) 2
9,44
16 14 2

112 107
t 1,45
9,44 1 16 1 14
Pentru = 0.01, vom putea respinge ipoteza H0 , dac t=1,45 ( t 0.995 , t 0,995 ) .
Pentru GL = n1+n2-2 = 16+14-2= 28, avem t 0, 995 2,76 ( vezi tabel Valorile lui t pentru
diferite grade de libertate (GL) )Deoarece t=1,45, acesta aparine intervalului (-2,76 ,
+2,76) deci nu putem respinge ipoteza H0.
Pentru = 0.05, vom putea respinge ipoteza H0 , dac t=1,45 ( t 0.995 , t 0,995 ) .
Pentru GL = n1+n2-2 = 16+14-2= 28, avem t 0, 995 2,05 ( veti tabel Valorile lui t pentru
diferite grade de libertate (GL) )Deoarece t=1,45, acesta aparine intervalului (-2,05 ,
+2,05) deci nu putem respinge ipoteza H0.
Concluzie
Nu putem respinge ipoteza H0 pentru cele dou praguri de semnificaie. Deci putem trage
concluzia, c nu exist nici o diferen semnificativ ntre IQ-urile celor dou loturi.

43
STATISTIC APLICAT
dr.Livia Sngeorzan
Metode de eantionare
Dac elementele componente ale unei populii sunt de acelai tip aceasta se numete
omogen, sau neomogen la care elementele componente sunt de tipuri diferite. Metodele
statistice se aplic numai populaiilor omogene.

Exemplu de eantionare greit : Landon (Republican) si Franklin Delano Roosvelt


Jurnalul theLiteraryDigest -a declarat castigator pe Landon , dar a ctigat FDR cu
62%. Eantionarea a fost fcuta greit. Jurnalul a trimis chestionarul celor care citeau
acest jurnal, acestia fiind oameni ce fceau partea din prima i a doua ptur a societii i
care aveau cu tottul i cu totul alte opiuni dect majoritatea popultiei.

Exist 3 metode de eantionare:


aleatoare simpl
stratificat
cluster

44
STATISTIC APLICAT
dr.Livia Sngeorzan

Aleatoare simpl

Fiecare caz are aceeai ans de a fi ales.

45
STATISTIC APLICAT
dr.Livia Sngeorzan

Stratificat

Imprim populaia n straturi omogene i din fiecare strat alegem aleator indivizi
statistici. De exemplu straturile sa fie masculin si feminin.

46
STATISTIC APLICAT
dr.Livia Sngeorzan

Cluster

Impart populaia in clustere (grupuri) , aleg aleator cateva grupuri dupa care aleg aleator
indivizi din aceste grupuri. Nu sunt grupuri omogene. De exemplu regiuni geografice
sunt aceste clustere

BIBLIOGRAFIE

Acad. Marius Iosifescu, Tiberiu Postelnicu, Curs de Biomatematic, Note curs,


Facultatea de Medicina , Universitatea Ecologic Bucureti, 1990
Marius Iosifescu, C. Moineagu, V. Trebici, E. Ursianu, Mic Enciclopedie de
statistic, ed. Stiinific i Enciclopedic, Bucureti, 1985
Radu Trmbia, Metode statistice, ed. Presa universitar Clujean, 2000
Acad. Gh. Mihoc, N. Micu, Elemente de teoria probilitilor i statistic , ed.
Didactic i pedagogic , 1971, Bucureti
Vasile Dumitrescu, Metode statistico-matematice n sport, Ed. Stadion, 1970,
Bucureti
Sangeorzan Livia, Statistic aplicat n educaie fizic i sport curs ID, Ed.
Transilvania Braov, 2005, Braov

47