Sunteți pe pagina 1din 25

TESTE STATISTICE

Ecologie general

email: andreea.nita@cc.unibuc.ro
Variabilele
Pentru c ne intereseaz s msurm aproape tot ce se poate msura,
caracteristicile ale cror trsturi vrem s le aflm trebuie privite ca variabile.
Acestea sunt de fapt categorii care urmeaz s fie msurate. Variabilele sunt de cel
putin 4 tipuri:
- Nominale sunt acele caracteristici sub form de nume sau simboluri, care nu pot
fi ordonate ntre ele. De exemplu: genul unei persoane este variabil nominal cu
valorile 1=masculin, 2=feminin. ns aici valoarea 2 nu este neaprat superioar
valorii 1. Un alt exemplu de variabil nominal este canalul de informatie folosit cel
mai des. Valorile pot fi: 1-televiziunea, 2-internetul, 3-presa scris, 4-radio, 5-
altele. Ordinea ntre valori poate fi schimbat oricnd.
- - Ordinale sunt acele caracteristici care presupun o ordine natural (intrinsec) a
valorilor. Educatia este un exemplu de variabil ordinal. Valorile sunt n ordine, de
la 1-scoal primar, 2-gimnaziu, 3-scoal profesional, 4-liceu, 5-postliceal, 6-
facultate etc. Totusi, pentru variabilele ordinale nu putem face mprtiri, deoarece
distantele ntre liceu si postliceal).
- - De intervale variabile ordinale, dar cu diferent egal ntre valori. De mentionat
c pentru aceste variabile nu exist valoarea 0 absolut pe scal. De exemplu,
coeficientul de inteligen este o variabil de intervale.
- - De rapoarte variabile pur numerice, cum ar fi greutatea, vrsta, nltimea.
Deseori, n practic, nu se face o diferentiere ntre variabile de intervale si de
rapoarte, ambele fiind considerate variabile cantitative, numerale sau scalare
Ipoteza
O propozitie care stabilete o relatie ntre dou variabile si
sensul acesteia.
Acestea trebuie s apar n form explicit n planul lucrrii, n
introducerea ei, dar i n prezentarea ei final.
Trebuies fie cuantificabile, demonstrabile, s nu fie excesiv de
generale i s nu prezinte nite adevruri evidente (care nu mai
au nevoie de o demonstraie).
Scatterplot
O posibilitate de a prefigura legtura dintre 2 variabile este si aceea
de a face un grafic de tip Scatterplot, adic norul de puncte, unde
punctele sunt intersecia valorilor de pe cele dou variabile,
pentru fiecare caz.
Dacpunctele rezultate sunt relativ grupate n jurul unei drepte
imaginare, ascendent sau descendent, nseamn c exist o
legtur ntre variabile, care poate fi testat ulterior.
Testul Anova
Compar n acelai timp mediile mai multor eantioane.
H0: m1 = m2 = m3 = m4 (pentru 4 eantioane)
H1: cel puin dou medii difer semnificativ
Rezultatul este un numr p care se interpreteaz la fel ca
la celelalte teste:
Dac p>0,05 nu se respinge H0, diferena este
nesemnificativ la pragul de semnificaie de 95%
Dac p<0,05 se respinge H0 cu pragul de semnificaie de
95%. Cel puin dou medii difer semnificativ
Dac p<0,01 se respinge H0 cu pragul de semnificaie de
99%. Cel puin dou medii difer semnificativ
Dac p<0,001 se respinge H0 cu pragul de semnificaie de
99,9%. Cel puin dou medii difer nalt semnificativ
Exemplu
n trei comune ale judeului Dolj au fost colectate date despre
obiceiurile alimentare i legtura lor cu obezitatea i diabetul.

Printre alte date s-au nregistrat greutatea indivizilor i date


despre fumat

Indivizii, indiferent de sex sau grup de vrst, au fost


mprii n patru categorii: nefumtori, foti fumtori, uor
fumtori (sub 10 igarete pe zi) i fumtori (peste 10 igarete
pe zi)
O ntrebare a fost aceea dac exist o legtur ntre obiceiul
fumatului i greutatea corporal la aceti indivizi.
H0: Indiferent dac fumeaz sau nu, greutatea corporal este
aceeai
H1: Cel puin dou categorii din cele 4 au greuti corporale
diferite
Alte posibile operatii de corelare:
Regresia
Aceasta este o operatiune prin care se ncearc explicarea unei
variabile (s zicem rezultatele la nvttur) prin plasarea ei ca
rezultat al unei functii, n care apar alte variabile cu rol explicativ.
Astfel, putem testa n raport cu rezultatele la nvttur
dependenta de alte dou variabile: coeficientul de inteligent i
prezena la cursuri.
Astfel, practic plasm pe o singur linie (functia), toate punctele
din scatterplot (desigur o putem face doar dac observm din
grafic c punctele sunt ct de putin grupate dup acea dreapt
imaginar). Dreapta imaginar din scatterplot este dreapta de
regresie, care are la baz o formul.
Distribuii de probabilitate
Distribuii de probabilitate
continue
Exemple de distribuie continu
Distribuia normal
Distribuia normal
Intervale de ncredere
Distribuia normal. De ce o folosim?
Multe variabile ecologice urmeaz o distribuie normal.
Distribuia normal este bine neleas din punct de vedere
matematic.
Estimarea punctual O valoare a parametrului teoretic estimat
x m (media e antionului) este un estimator punctual al mediei
popula iei ( ) Este influenat de fluctuaiile de eantionare
Poate s fie foarte departe de valoarea real a parametrului
estimat
Intervalul de ncredere - De ce?
Se recomand ca estimarea unui parametru teoretic s se
realizeze prin intermediul unui interval nu a unei singure valori.
Acest interval se numete interval de confiden.
Parametrul estimat aparine cu o probabilitate mare intervalului
de confiden.
Definiie
Unir de valori al unui estimator de interes calculat astfel nct
pentru o probabilitate de eroare aleas s includ valorile
adevrate ale variabilei.
P [valoarea critic inferioar < estimatorul < valoarea critic
superioar] = 1- unde = nivelul de semnificaie.
Intervaluldefinit de valorile critice va cuprinde estimatorul
populaiei cu o probabilitate de 1-.
Se aplic n cazul variabilelor distribuite normal!
Intervale de ncredere:
Interpretare
Dac 0 este coninut n intervalul de ncredere, diferena dintre
cele dou estimri (medii, proporii, raii, etc.) este zero.
Dac zero nu este con inut n intervalul de ncredere, diferena
dintre cei 2 estimatori punctuali nu este egal cu zero.
Cnd aceeai procedur se repet pe mai multe eantioane,
intervalul de ncredere (care va fi diferit pentru fiecare eantion)
va cuprinde in 95% din cazuri valoarea real a estimatorului
punctual.
De reinut!
Estimarea corect a unui parametru statistic se face cu ajutorul intervalului
de ncredere.
Intervalul de ncredere depinde de volumul eantionului i de eroarea
standard.
Cu
ct eroarea standard este mai mare cu att intervalul de ncredere este
mai larg.
Cu ct volumul eantionului este mai mic cu att intervalul de ncredere este
mai larg.
Eroarea standard a mediei este egal cu deviaia standard mprit la
radicalul volumului eantionului
Dac deviaia standard este mare, ansa de eroare n estimator este mare.
Dac volumul eantionului este mare, ansa erorii n estimator este mic.
Distribuia Student
Distribuia Student
Distribuia Student
Discuii
Discuii comparai irurile
Discuii comparai irurile
Aplicaii practice
Exercitiul_1 Scatter_plot
Exercitiul_2 Correlations:
Exercitiul_3 Analysis of Variance (ANOVA):
Exercitiul_4 Regresie Liniara

S-ar putea să vă placă și