Testarea Ipotezelor Statistice

UNIVERSITATEA DE STIINTE AGRONOMICE SI MEDICINA VETERINARA
BUCURESTI
FACULTATEA DE ZOOTEHNIE
SPECIALIZARE: TEHNOLOGII SPECIALE IN INDUSTRIA ALIMENTARA
CONTROLUL STATISTIC AL CALITATII

TESTAREA IPOTEZELOR STATISTICE
STUDENT : VELCEA ALINA EMILIA
BUCURESTI 2017
DEMERSUL TESTARII UNEI IPOTEZE STATISTICE.
Demersul testarii unei ipoteze presupune parcurgerea unor etape si rezolvarea problemelor
pe care le implica, si anume (Jaba, Elisabeta, 2002, p. 331-336):
Se formuleaza ipotezele, in functie de problema pusa;

Se alege un test statistic in functie de distributia de selectie a statisticii considerate;
Se alege un prag de semnificatie pentru test;
Se stabilesc regulile de decizie, definind regiunile de acceptare si de respingere a
ipotezei H0;
Se calculeaza valoarea statisticii test, folosind datele inregistrate prin sondaj;
Se compara valoarea calculata a statisticii test cu valoarea teoretica;
Se ia decizia de a nu respinge sau de a respinge ipoteza admisa.
In urma extragerii unui esantion dintr-o populatie statistica prin prelucrarea datelor
provenite din sondaj se obtine un estimator al parametrului urmarit in populatia de origine.
Problema care se pune este in ce masura parametrul estimat pe baza rezultatelor sondajului
asigura credibilitatea aprecierilor facute asupra intregii colectivitati.
Estimatorul este, o presupunere a parametrului, adica, o ipoteza statistica.
Se numeste ipoteza statistica ipoteza care se face cu privire la parametrul unei repartitii
sau la legea de repartitie pe care pe care o urmeaza variabilele aleatoare.
Ipoteze statistice:
Ipoteza nula
Ipoteza alternativa.
In toate domeniile stiintelor aplicate este necesar sa se recurga la experimentarea unor noi
metode, tehnologii, produse, facandu-se presupuneri asupra superioritatii lor fata de
procedeele curent folosite in vederea luarii unei anumite decizii. Totodata este necesar sa
verificam daca in timp s-au produs modificari in ceea ce priveste parametrii populatiei sau
exista diferente semnificative intre diferite grupuri ale aceleiasi populatii. Toate aceste
presupuneri constituie niste ipoteze a caror valabilitate trebuie verificata si deoarece aceasta
verificare se face statistic (operandu-se cu date obtinute in urma unei selectii statistice dintr-o
populatie) ele se denumesc ipoteze statistice.
Verificarea concordantei rezultatelor experientei cu una dintre ipoteze se face pe baza
unui criteriu statistic furnizat de un ansamblu de reguli de prelucrare a datelor numit test
statistic. Cu ajutorul lui se ajunge la decizia de a respinge o ipoteza si a accepta alta. Luarea
unei decizii cu privire la o ipoteza statistica se numeste testarea ipotezei.
O ipoteza se numeste simpla daca ea determina in mod univoc repartitia specificata a
variabilei aleatoare si compusa daca este formata dintr-un numar finit de ipoteze simple.
Testele statistice furnizeaza criterii pe baza carora se accepta sau se respinge o ipoteza
cu privire la o populatie statistica pe baza observatiilor facute intr-un esantion aleator extras
din ea.
Alegerea testului nu depinde de esantion, de aceea procedeul de testare a ipotezei si
ipoteza se pot specifica inainte de selectie.
Trebuie subliniat faptul ca printr-un test statistic nu se stabileste adevarul ci doar daca
rezultatele selectiei sprijina ipoteza formulata si cu ce probabilitate.
CONCEPTE SI ERORI IN TESTAREA IPOTEZELOR STATISTICE
In statistica, ipotezele apar intotdeauna in perechi: ipoteza nula si ipoteza alternativa.

Ipoteza statistica ce urmeaza a fi testata se numeste ipoteza nula si se noteaza H0.
Ea consta intotdeauna in admiterea caracterului intamplator al deosebirilor, adica in
presupunerea ca nu exista deosebiri esentiale.
Respingerea ipotezei nule implica acceptarea unei alte ipoteze numita alternativa, notata cu
H1.
Definitie: Procedeul de verificare a unei ipoteze statistice se numeste test sau criteriu de
semnificatie.
Verificarea ipotezei nule se face pe baza unui esantion de volum n, extras din populatia X.
Daca punctul definit de vectorul de sondaj x1, x2, , xn cade in regiunea critica Rc, ipoteza H0
se respinge, iar daca cade in afara regiunii critice Rc, ipoteza H0 se accepta.
Eroarea pe care o facem eliminand o ipoteza nula, desi este adevarata se numeste eroare
de genul intai.
Probabilitatea comiterii unei astfel de erori reprezinta riscul de genul intai () si se
numeste nivel sau prag de semnificatie.
Nivelul de incredere al unui test statistic este (1- ), iar (1- )100 reprezinta
probabilitatea de garantare a rezultatelor. (Sava, 2004).
Eroarea pe care o facem acceptand o ipoteza nula, desi este falsa se numeste eroare de
genul al doilea, iar probabilitatea (riscul) comiterii unei astfel de erori se noteaza cu . Puterea
testului statistic este (1- ).
Erorile de tip I pot fi micsorate de cercetator fixand nivelul de semnificatie cat mai mic.
Erorile de tip II pot fi micsorate prin cresterea volumului esantionului. Daca variatia selectiei
este mai mica se reduc ambele erori.
Deoarece evitarea unui tip de eroare sporeste sansa celeilalte devine important de stiut care
tip de eroare trebuie mai atent evitat.
TESTE DE CONCORDANTA
Acest subcapitol se refera la concordanta, potrivirea dintre valorile calculate in esantion

si valorile parametrilor din colectivitatea generala.
Testele de concordanta se mai numesc teste de ajustare, care exprima potrivirea unei
distributii empirice la o distributie asteptata sau teoretica.
Fie populatia de interes, notata cu P1. pentru orice esantion se poate considera o
populatie de baza, P2, din care esantionul va fi extras.
Problema este daca se poate considera ca P2 concorda cu P1. ipoteza nula va afirma ca
P1 si P2 concorda. Respingerea ipotezei nule va avea in practica doua consecinte:
se va considera ca esantionul nu este reprezentativ pentru populatia de interes, populatie

considerata stabila si se va extrage un alt esantion
se va considera ca populatia P1 s-a schimbat, noua populatie de referinta este P2.
Eroarea standard estimata a mediei

In testul erorii standard al mediei, se presupune ca sunt indeplinite conditiile care asigura
mediei de sondaj o repartitie normala (esantion n30) sau aproape normala. De aceea variabila
aleatoare z urmeaza o distributie normala standard (z este variabila normala normata).
Eroarea standard:
* Este un indice pentru variabilitatea mediilor in cazul mai multor esantioane extrase din
populatie; ea este media masurii cu care media esantioanelor difera fata de media populatiei
din care au fost extrase;
* Este folosita in cea mai mare parte ca un pas intermediar in alte tehnici statistice (cum ar
fi testul t);
* La fel ca si abaterea standard si variatia poate fi folosita ca un indice pentru variabilitatea

scorurilor unei variabile;
Compararea a doua esantioane de scoruri corelate/relationate. (Testul t)
Testul este publicat in 1908 de W.S. Gosset sub pseudonimul Student. Principala diferenta
intre distributiile de esantionare ale statisticilor z si t este aceea ca distributia t are o cantitate
de variabilitate mai mare decat z.
Testul t:
* Este folosit pentru evaluarea semnificatiei statistice a diferentei dintre mediile pentru
doua seturi de scoruri; ele ajuta la elucidarea intrebarilor comune ale cercetatorilor daca
valoarea medie pentru un set de scoruri difera de valoarea medie pentru alt set de scoruri;
Deoarece, in cercetare, in mod invariabil, se lucreaza cu esantioane de oameni extrase din

populatia latenta, trebuie sa estimam daca orice diferenta pe care o obtinem intre cele doua
seturi de valori este semnificativa statistic.
Exista doua variante ale testului t:
1. Pentru esantioane perechi
- folosit cand cele doua seturi de scoruri ce trebuie comparate provin dintr-un singur esantion;
- cand coeficientul de corelatie intre cele doua seturi este mare.
Uneori ne lovim de situatii in care esantioanele din care provin mediile ce trebuie
comparate sunt dependente (procedeul de selectie al unui esantion este legat de procedeul de
selectie al celuilalt).
Cand elementele celor doua esantioane sunt asociate intr-un anumit mod doua cate doua
(de exemplu: rezultatele inregistrate inainte si dupa actiunea unui factor experimental),
procedeul cel mai simplu consta in a rationa asupra diferentelor pe care le prezinta fiecare
pereche de date asociate, corelate.(Bentea,M, Munteanu, G, 2007).
2. Pentru esantioane independente
- se foloseste cand cele doua seturi de valori provin din grupuri diferite de participanti, pentru
a calcula daca mediile acestora sunt diferite semnificativ una fata de cealalta.
In cazul esantioanelor independente, probele de semnificatie difera in functie de doua situatii:
Cand numarul de masuratori (N) in fiecare esantion este destul de mate (mai mare ca 30);
Cand numarul de masuratori sau volumul esantionului este mai mic decat 30.
Testul Chi-square
(Diferente intre frecventele esantioanelor)

In general, testul chi-square este folosit pentru evaluarea existentei unei diferente
semnificative intre doua sau mai multe esantioane care sunt formate din date de frecventa
(date nominale). Altfel spus, este testul statistic uzual care analizeaza tabelele de asociere sau
contingenta pe baza a doua variabile categoriale nominale.
De asemenea, poate fi folosit si pentru testarea faptului ca un singur esantion este
semnificativ diferit fata de o populatie cunoscuta.
Observatie: Aceasta aplicatie este cea mai putin comuna, deoarece caracteristicile unei
populatii sunt rareori cunoscute in cercetare.
Observatie: Trebuie avut in vedere faptul ca o analiza chi-square trebuie sa includa datele
fiecarui individ o singura data. Frecventele totale trebuie sa fie egale cu numarul de persoane
folosite in analiza.
Testul Z pentru esantioane independente, dispersii cunoscute
Cand am discutat de abaterea standard, am vazut ca aceasta reprezinta un mijloc de

raportare a modului in care rezultatele se imprastie in jurul ei. De asemenea, am spus ca,
daca cunoastem media si abaterea standard, putem foarte usor sa precizam probabilitatea ca
un scor para se situeze intr-o anumita pozitie. Pentru disciplinele socio-umane, acest lucru
este vital, deoarece atunci cand masuram, practic precizam pozitia pe care o are un subiect in
raport cu o populatie de referinta.
Este ideal ca aceasta pozitie sa poata fi prezentata intr-o maniera standardizata. Acest
lucru poate fi usor de indeplinit daca avem in vedere conceptual de note standardizate.
La baza acestui concept stau notele z. Notele z reprezinta diferenta dintre scorul
observat si medie, in termeni de abatere standard, cu alte cuvinte, notele z nu sunt altceva
decat distantele la care se situeaza scorurile particulare in raport cu media grupului iar aceasta
distanta este exprimata standardizat.
Teoretic, notele z sunt note obtinute pe o curba cu media 0 si abaterea standard 1. In
acest caz, o distributie normala are practic notele z cuprinse intre -3 si +3, intre aceste note
regasindu-se peste 99% din populatie, dupa cum observati in figura de alaturi.(C.Opariuc-
Dan, 2009, p. 164).
Multe cazuri de analiza statistica implica o comparatie intre mediile a doua colectivitati
generale.
Exemplu: Un patron al unui restaurant doreste sa vada daca exista diferente intre vanzarile
realizate inainte si dupa o campanie de publicitate;
Exemplu: Un grup de consumatori doreste sa vada daca exista o diferenta semnificativa intre
consumul electric pentru doua tipuri de cuptoare cu microunde.
Notele z au si ele o serie de proprietati cu aplicabilitate practica de-osebita, dintre care:
Media unei distributii z este egala cu zero, afirmatie ce rezulta din proprietatea acestui
indicator de a se diminua atunci cand scadem o constanta din fiecare scor particular. Deoarece
din formula rezulta aceasta diferenta (se scade fiecare scor particular din medie), in final
media va ajunge la valoarea zero;
Abaterea standard a unei distributii z este intotdeauna 1. Si aceasta afirmatie rezulta din
proprietatile abaterii standard. Stim ca daca impartim abaterea standard la o constanta,
valoarea acesteia se divide corespunzator. Din formula, observam ca acea constanta la care
impartim este chiar abaterea standard iar impartirea a doua numere egale are ca rezultat 1.
Notele z sunt note direct calculabile, utilizandu-se media si abaterea standard si reprezinta
temelia oricarui proces de standardizare.

Testarea Ipotezelor Statistice

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Testarea Ipotezelor Statistice

Încărcat de

Drepturi de autor:

Formate disponibile

UNIVERSITATEA DE STIINTE AGRONOMICE SI MEDICINA VETERINARA

CONTROLUL STATISTIC AL CALITATII

STUDENT : VELCEA ALINA EMILIA

Se formuleaza ipotezele, in functie de problema pusa;

In statistica, ipotezele apar intotdeauna in perechi: ipoteza nula si ipoteza alternativa.

Acest subcapitol se refera la concordanta, potrivirea dintre valorile calculate in esantion

se va considera ca esantionul nu este reprezentativ pentru populatia de interes, populatie

Eroarea standard estimata a mediei

* La fel ca si abaterea standard si variatia poate fi folosita ca un indice pentru variabilitatea

Compararea a doua esantioane de scoruri corelate/relationate. (Testul t)

Deoarece, in cercetare, in mod invariabil, se lucreaza cu esantioane de oameni extrase din

Exista doua variante ale testului t:

1. Pentru esantioane perechi

2. Pentru esantioane independente

(Diferente intre frecventele esantioanelor)

Testul Z pentru esantioane independente, dispersii cunoscute

Cand am discutat de abaterea standard, am vazut ca aceasta reprezinta un mijloc de

Notele z au si ele o serie de proprietati cu aplicabilitate practica de-osebita, dintre care:

S-ar putea să vă placă și