Sunteți pe pagina 1din 36

Capitolul 7 Testele n analiza statistic aplicat Analiza statistic presupune aplicarea unor metode de calcul datelor sau irurilor

de date statistice n vederea: testrii anumitor caliti, caracteristici ale acestora stabilirii existenei unei relaii ntre acestea determinarea tipului de relaii dintre acestea determinarea semnificaiei relaiei dintre date

Aminteam la sfritul capitolului precedent faptul c n statisic exist dou categorii de teste: parametrice i neparametrice. Testele parametrice sunt teste care se utilizeaz mai ales n tiinele exacte , aplicndu-se n general dalor intervale cu frecvene absolute. Datele crora li se aplic trebuie s aib o distribuie normal. Sunt cunoscute ca fiind teste foarte riguroase, cu greutate tiinific. Datorit acurateii privind calitatea datelor aceste teste se utilizeaz mai rar n tiinele sociale i deci i n turism sau geografia uman. Testele neparametrice. Acestea se aplic tuturor categoriilor de caracteristici (nominale, ordinale sau intervale). Distribuia normal a datelor nu este o condiie pentru a putea fi utilizate n testele non parametrice. Aceste teste sunt mai puin pretenioase n ceea ce pvivete calitatea datelor ca cele parametrice dar sunt mult mai robuste i flexibile. n turism aproape toate metodele aplicate sunt neparametrice. Cu alte cuvinte n acest curs de statistic aplicat se vor utiliza numai metode i tehnici neparametrice 7.1. Corelaia 7.1.1. Introducere Definiii. Corelaia... reprezint un test utilizat pentru exprimarea gradului de asociere sau a intensitii unei relaii existente ntre dou valori sau mai multe variabile(Goodall 1987) Corelaia ... este o metod... de descriere a gradului de asociere dintre 2 seturi de valori pereche (Hammond and McCullagh 1982) Corelaia este o metod eficient de a detecta i nsuma relaiile dintre dou variabile. Aspectul cel mai important privind corelaia este acela privind citirea lor, adic interpretarea

rezultatului obinut. Acest rezultat, de fapt , msoar legtura dintre variabile; stabilete gradul de legtur dintre ele. Aceast msurtoare sau grad se numete , coeficient. Exist un numr mare de coefcieni de corelaie n statistic, n funcie de natura variabilelor , a legturii, a modului de colectare a datelor etc. Toi coeficienii de corelaie n final detecteaz dac valorile unor variabile co-variaz (variaz mpreun). Adic indic dac diferenele aprute la nivelul valorilorilor unei variabile tind s se asocieze cu diferenele aprute la nivelul alteia. Odat stabilit corelaia, aceast NU presupune automat, faptul c o variabil este determinat sau cauzat de cealalt. Corelaia stabilete prezena de relaii cauzale, dar nu este suficint pentru a demonstra cauzalitatea unei relaiI. Cu alte cuvinte corelaia poate indica prezena unei relaii de cauzalitate dar nu o demonstreaz. n afar de faptul c prin corelaie se stabilete co-variaia, coeficienii de corelaie pot furniza trei tipuri de informaie asupra relaiei descoperite: 1. intensitatea relaiei, indicat de valoarea coeficentului de corelaie; cu ct acesta este mai mare cu att relaia este mai puternic 2. direcia relaiei (mai ales pentru datele ordinale i intervale), pozitiv sau negativ 3. linearitatea, tendina de distribuia a datelor variabile, liar sau non-linear Mai concret: n statistic corelaia are un neles, semnificaie, specific/. Presupune automat faptul c , spre exemplu ,n timp ce o variabil crete sau descrete ca valoare a doua variabil crete sau descrete i ea. Pentru exemplificare privii figura de mai jos. ( Fig. 7.1.) Ea reprezint un exemplu de distribuie a dou variabile A i B. Vizual, se poate detecta vreo relaie, corelaie ntre ele? Adic putem spune c se ntmpl ceva cu A n timp ce cu B se ntmpl ceva sau altceva? Exist o relaie de covariaie? Fig. 7.1.

18 16 14 12 Variabila B 10 8 6 4 2 0 0 2 4 6 8 Variabila A 10 12 14 16

Rspuns corect: nu ! Dar n figura de mai jos? Fig. 7.2.

25

20

15

10

0 0 2 4 6 8 10 12 14

Rspuns corect: da! Mai mult observm c atunci cnd una crete, cealalt crete i ea. n limbaj statistic avem de a face cu o corelaie pozitiv ntre cele 2 variabile.

Repetm jocul observaei i cu figura de mai jos! (Figura 7.3.) Exist vreo relaie, corelaie ntre variabilele de mai jos? Fig. 7.3.

25 20 15 10 5 0 0 2 4 6 8 10 12 14

Rspuns corect: da! Mai mult observm c atunci cnd una scade, cealalt scade i ea. n limbaj statistic avem de a face cu o corelaie negativ ntre cele 2 variabile. Pn n acest stadiu am putut determina doar vizual existena sau inexistena unei covariaii i direcia. Firete pentru a determina aspecte privind intensitatea relaiei i linearitatea ei este nevoie de mult mai mult dect o observaie vizual. Este nevoie de obinerea prin calcul a coeficientului de corelaie. Corelaia ca i metod de calcul statistic va avea ntotdeauna ca rezultat o valoare numeric cuprins ntre -1 i +1 Acesta poart denumirea de coeficient de corelaie i se noteaz cu r i va avea precum aminteam mai sus valori ce se pot nscrie/reprezenta pe axa de mai jos -1____________ 0 ___________+1 Ca urmare n funcie de valorile nregistrate de r, n teoria modelelor de corelare apar situaiile ideale i anume: corelaia perfect negativ i cea perfect pozitiv, cu distribuie perfect linear ; adic valorile ambelor variabile se distribuie perfect linear ascendent sau descendent (cu inclusiv situaia exccepional cnd cele dou variabile se suprapun ca valoare). Privii figurile 7.4a, 7.4b.

Fig. 7.4a : Corelaia perfect negativ (r = -1) 16 14 12 Variabila B 10 8 6 4 2 0 0 5 10 Variabila A 15 20

Fig .7.4b: Corelaie perfect pozitiv (r = +1)


16 14 12 Variabila B 10 8 6 4 2 0 0 5 10 VariabilaA 15 20

Ele reprezint modelele ideale, perfecte de corelare. Acestea sunt evident situaiile de exccepie, n realitate, relaia dintre variabile nregistrnd intensiti, direcii i lineariti diferite comportndu-se ca atare! Aa cum aminteam anterior, exist un numr foarte mare de metode statistice de corelare ! Cele mai cunoscute i utilizate sunt:

1)

Coeficientul de corelaie produs-moment, Person (Pearsons Product Moment

Correlation Coefficient). Acesta este un coeficient de corelaie parametric, adic mai rar utilizat n tiinele sociale i deci i n turism (prezentat n capitolul anterior, vezi capitolul 6). 2) Coeficientul de corelaie cu rang, Spearman (Spearmans rank Correlation Coefficient). Formula acestuia ca variant simpl linear este: 6

rs = 1 -

n3 n

( d )
2

7.1.2. Coeficientul de corelaie cu rang, Spearman: condiii de aplicare - date (variante) pentru 2 variabile. - acelai numr de valori pentru ambele variabile. - minimum 4 perechi de valori. - date ordinale sau intervale. Calculul formulei coeficientului de corelaie presupune 12 stadii ! Studiu de caz Rmania, perioada 1991 - 2000 Variabila 1: PNB (per cap loc.) Variabila 2: Numr vizitatori strini An 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 PNB(US$) 1243 859 1159 1323 1564 1563 1565 1872 1585 1645 Numr vizitatori strini 5,359,000 6,401,000 5,786,000 5,898,000 5,445,000 5,205,000 5,149,000 4,831,000 5,224,000 5,264,000

Dorim s vedem dac exist vreo relaie/corelaie ntre PNB i numrul de vizitatori strini, adic dorim s stabilim dac cele dou variabile co-variaz.

Stadiul 1 Se ntocmete reprezentarea grafic de distribuie a valorilor celor 2 variabile pentru analiz vizual. Dac distribuia nu pare s ia o form corelativ nseamn c nu exist o corelaie i calculul nu se mai justific. Adic : dac aparent nu putem stabili c cele 2 variabile co-variaz, c dezvolt vreo relaie atunci calculul coeficientului de corelaie este inutil! Pentru studiul nostru de caz distribuia valorilor se prezint ca n figura (fig. 7.5.) de mai jos: Fig. 7.5.

7000 6000 Numar vizitatori 5000 4000 3000 2000 1000 0 0 500 1000 PNB 1500 2000

Aparent ele co-variez, avnd o tendin descendent, direcie negativ. adic pare s existe o relaie ntre cele dou, o relaie cu tendin neativ, descresctoare. Stadiul 2 Observnd datele i distribuia acestora situaia este aparent i neclar. n acest caz, se formuleaz o ipotez. aceasta de regul se bazeaz pe observaia efectuat. se numete ipotez iniial i se noteaz cu Hi. n cazul de fa o ipotez Hi , evident. ar putea fi : Exist o relaie ntre PNB i numrul de vizitatori strini n Romnia n perioada 1991 2000

Conform conveniei statistice n rigoare aceast ipotez se exprim ntotdeauna negativ. Adic invers dect pare s fie situaia. . Aceasta ipotez se numete ipoteza nul i se noteaz cu HO. i dac aparent exist o relaie ntre cele dou, ipoteza nul se va exprima: Nu exist nici un fel de relaie ntre PNB i numrul de vizitatori strini n Romnia n perioada 1991 2000 Stadiul 3 Se construiete un tabel cu 6 coloane n care se nscriu mai nti datele exsitente, utiliznduse primele 2 coloane (1 i 2) Variabila (PNB) 1243 859 1159 1323 1564 1563 1565 1872 1585 1645 Stadiul 4 Se acord rang de mrime valorilor variabilei 1 (i.e. cea mai mare valoare =1, urmtoarea = 2 etc). nscriei rangul fiecrei valori n coloana 3. Stadiul 5 n mod similar acordai rang de mrime valorilor variabilei 2. nscriei rangul fiecrei valori n coloana 4. Tabelul va arta acum aa! Variabila 1 (PNB) 1243 859 Variabila 2 (numr vizitatori) 5,359,000 6,401,000 Rang Variabila 1 8 10 Rang Variabila 2 5 1 1 Variabila (vizitatori) 5,359,000 6,401,000 5,786,000 5,898,000 5,445,000 5,205,000 5,149,000 4,831,000 5,224,000 5,264,000 2

1159 1323 1564 1563 1565 1872 1585 1645 Stadiul 6

5,786,000 5,898,000 5,445,000 5,205,000 5,149,000 4,831,000 5,224,000 5,264,000

9 7 5 6 4 1 3 2

3 2 4 8 9 10 7 6

Se calculeaz diferena dintre ranguri (rang 1 rang 2). Adic din coloana 3 se scade coloana 4. Diferena de rang se noteaz cu d i se nscrie n coloana 5. Variabila 1 (PNB) 1243 859 1159 1323 1564 1563 1565 1872 1585 1645 Stadiul 7 Se ridic la ptrat d (diferena de rang). Aceasta se noteaz cu d2 i se nscrie n coloana 6. Variabila 1 (PNB) 1243 859 1159 1323 1564 1563 1565 1872 1585 1645 Variabila 2 (numr vizitatori) 5,359,000 6,401,000 5,786,000 5,898,000 5,445,000 5,205,000 5,149,000 4,831,000 5,224,000 5,264,000 Rang Variabila 1 8 10 9 7 5 6 4 1 3 2 Rang Variabila 2 5 1 3 2 4 8 9 10 7 6 3 9 6 5 1 -2 -5 -9 -4 -4 9 81 36 25 1 4 25 81 16 16 d d2 Variabila 2 (numr vizitatori) 5,359,000 6,401,000 5,786,000 5,898,000 5,445,000 5,205,000 5,149,000 4,831,000 5,224,000 5,264,000 Rang Variabila 1 8 10 9 7 5 6 4 1 3 2 Rang Variabila 2 5 1 3 2 4 8 9 10 7 6 3 9 6 5 1 -2 -5 -9 -6 -4 d

Stadiul 8: Se calculeaz d2 adic suma tuturor valorilor d2. d2 = 294 Stadiul 9: Utilizai datele obinute n formula urmtoare: rs = 1 6 n3 n

( d )
2

unde rs = este coeficientul de corelaie) n = numrul de perechi ale variabilelor 1i 2 (sau A i B) 6 294 1000 10 1764 = 1 990 = 1 1,78 = 0,78 = 1 rs = - 0.78 (aceasta este Coeficientul de de corelaie) Stadiul 10: Se analizeaz semnificaia coeficientului de corelaie. Analiza semnificaiei presupune n primul rnd testarea semnificaiei. Testarea semnificaiei presupune sigurana, corectidunea, ncrederea n rezultatul obinut. Aceasta se exprim prin gradul de confiden al coeficientului de corelaie. De regul n tiinele sociale este nevoie de un grad de confiden de cel puin 95% nainte s se accepte un coeficient. n statistic gradul de confien este notat cu p. El este pre calculat i se gsete n tabele consacrate. Un grad de confiden de 95% se noteaz n aceste tabele sub forma de p = 0.05. Gradul de confiden este menionat ntotdeauna n interpretare i analiz i nscris obligatoriu n forma p = 0.05 Pentru o siguran i o rigoare tiinific mai mare se poate merge la 99% grad de confiden asupra rezultatului. Acesta se noteaz cu p = 0.01 Cu ct valoarea lui p este mai mic cu att gradul de confiden este mai mare ceea ce implic o siguran mai mare i rigoare de calcul mai mare. Gradul de confiden cu care se lucreaz se stabilete nc din

stadiile incipiente de calcul n funcie de natura variabilelor i numrul de perechi de date disponibile. n general pentru studiul proceselor, fenomene sociale cu caracter amplu, general cnd sunt disponibile puine perechi de date i ne raportm la perioade de timp mari, se lucreaz cu p = 0,05. Cnd se studiaz procese, fenomene de detaliu cu numr mare de perechi de date,pe perioade mici de timp se lucreaz c cu p = 0,01. Tabelul de mai jos reprezint o variant simplificat a unui tabel consacrat cu grade de confiden. Pentru stabilirea semnificaiei din studiul nostru de caz se utilizeaz coloana 1 n care se afl N = numrul de perechi de variabile. n studiul nostru de caz am utilizat 10 perechi. Astfel urmrim pentru N = 10, valorea de semnificaie pentru p = 0.05. N (numr perechi variabile) 5 6 7 8 9 10 12 14 16 de de 1.000 0.886 0.786 0.738 0.683 0.648 0.591 0.544 0.506 1.000 0.929 0.881 0.833 0.794 0.777 0.715 0.665 95% (p = 0.05) 99% (p= 0.01)

Se raporteaz valoarea lui r la valorile p = 0.05 pentru N =10. Dac coeficientul de corelaie r este egal sau mai mare dect valoarea lui p [se ignor semnul lui r (plus sau minus)] SE RESPINGE IPOTEZA NUL. Coeficientul de corelaie r, este 0.78, mai mare dect valorea lui p = 0,05 ( de 95%) aceasta fiind de0.648. n concluzie se respinge ipoteza nul (Nu exist nici un fel de relaie ntre PNB i numrul de vizitatori strini n Romnia n perioada 1991 2000) i se accept ipoteza iniial, (Exist o relaie ntre PNB i numrul de vizitatori strini n Romnia n perioada 1991 2000) Dac s-ar fi ales ca grad de confiden p = 0,01 situaia ar fi fost coplect diferit. S-a stabilit ca grad de confiden p = 0,05 deoarece: variabilele se refer la indicatori destul de ampli, la nvel de ar pe o perioad destul de limitat de timp cu valori la nivel anual.

n concluzie se poate spune c cele dou variabile sunt corelate cu un grad de confiden de 95% Stadiul 11 Cel mai important lucru din punct de vedere al tiinelor sociale i deci i al turismului este interpretarea i analiza rezultatelor. Ce nseamn valoarea lui rs i faptul c am acceptat Hi ? n final oricine poate calcula un coeficient de corelaie. Important este cum este interpretat rezultatul i ce nseamn el! Pn aici s-a stabilit (ce-i drept, tiinific) faptul c exist o relaie. Care este, ns natura relaiei dintre PNB i numrul vizitatorilor strini din Romnia n perioada 1991-2000? De ce numrul turitilor strini pare s scad n timp ce al PNB-ului s creasc? Ce putem spune despre contribuia turismului la PNB-ul Romniei? Stadiul 12: Se scriu intepretrile. Aici este locul i momentul n care se folosete coeficientul de corelaie, pentru interpretarea rezultatelor De regul se folosete formula: Exist o puternic corelaie negativ ntre PNB inumrul de vizitatori strini n Romnia n perioada 1991 2000 (rs = -0.78, p = 0.05). Acest fapt se datoreaz 7.2. Testele neparametrice de semnificaie. Semnificaia statistic . Definiie Semnificaia statistic reprezint una dintre cele patru funcii de baza ale statisticii. n literatura de specialitate aceast tema se mai gsete i sub denumirea de testarea semnificaiei statistice sau testarea diferenei la nivel de set de date 7.2.1. Introducere Pentru a pune ntreaga tem ntr-un context clar i logic este necesar n acest moment o trecere n revist a teoriei funciilor statisticii. Din punctul de vedere al tiinelor sociale (inclusiv a turismului i ) statistica devine util prin cele 4 funcii de baz ale sale:

funcia descriptiv funcia deductiv funcia semnificaiei funcia prognozrii

n primele capitole ale cursului s-a insistant n mod deosebit asupra teoriei datelor i operaiilor statistice elementare sau a primelor stadiile de operare statistic. La o privire mai atent se poate concluziona c acestea reprezint de fapt instrumente ale funciei descriptive. Ele nu fac altceva dect s descrie ntr-o msur mai mic sau mai mare, mai superficial sau mai profund elemente, componente, procese sau fenomene ale activitii sociale sau .turistice n cazul nostru. A fost prezentat anterior i o metod de determinare i stabilrea existenei unei relaii ntre dou variabile care nu a reprezentat altceva dect un exemplu aplicativ al funciei deductive . Astfel de metode se mai numesc i metode statistice deductive sau pur i simplu statistici deductive ca urmare a faptului c pornesc de la o supoziie (deducie) stabilit (demonstrat) ulterior i verificat printr-un rezultat. n turism ca i n geografie, specialitii lucreaz preponderent cu date selective (obinute prin generare) i care nu sunt exhaustive. Adic aceste date reprezint eantioane (sunt obinute eantionat) dintr-o populaie ntreag; sunt iruri finite; incomplete deoarece totalitatea lor absoluta este imposibil a fi obinut. Exemplu: comportamentul decizional n alegerea destinaiei de vacan pentru o anume grup de vrst de turiti sau grup social. A obine datele statistice pentru ntreaga populaie , adic toi potenialii turiti fie i ai unui ora este aproape imposibil. Se selecteaz astfel un eantion reprezentativ asupra cruia se genereaz datele statistice necesare iar cu datele respective se fac aprecieri, deducii, n funcie de anumii factori sau situaii luate n calcul, pentru a se demonstra comportamentul decizional. Acest comportament poate fi corelat n evoluia sau desfurarea sa cu anumii ali factori etc (co-variaia). Selectarea, eantionarea presupune obligatoriu probabilitatea existenei unui anumit grad de eroare n msurtoare i n deducia final (a se revedea toat teoria cu gradul de confiden). Probabilitatea este conceptul statistic care deosebete datele selective, (finite, obinute prin eantionare) de cele exhaustive (absolute, complete, obinute n tiinele exacte din msurtorile de laborator i care reprezint toat populaia nu un eantion). Prin urmare datele selective, eantioanele, includ o probabilitate de eroare n timp ce cele exhaustive NU (acestea fiind cele folosite n metodele parametrice). Metodele de analiz statistic precum coeficienii de corelaie stabilesc o relaie i serie de caracteristici dar nu dau posibilitatea aprofundrii cauzalitii sau a

altor aspecte relaionale. n concluzie funcia deductiv presupune c: n condiii specifice, probabilitatea unei presupuneri/ipoteze (deducii) efectuate pe baza unor eantioane de populaie , s fie valid. Profunzimea analizei statistice este dat n continuare de ndeplinirea funciei semnificaiei.

7.2.2 Semnificaia statistic Aspectele privind semnificaia statistic a unor mrimi, valori, variabile sau mai frecvent cea a semnificaiei diferenei dintre dou mrimi, valori, variabile atunci cnd se compar , presupune c cel puin una dintre ele se obine prin eantionare. Acest ultim fapt presupune la rndul su ideea de probabilitate de eroare. Semnificaia statistic reprezint una dintre cele mai puternice funcii din punct de vedere al tiinelor socio-geografice i deci i turistice. Aceasta stabilete dac diferena sau relaia dintre dou seturi de date selective (eantioane) este semnificativ. Ea presupune n primul rnd comparaia ntre valori (cel puin una) determinate la nivel de eantion, adic acele valori care nu reproduc perfect i absolut caracteristicile populaiei statistice. Aceste valori presupun prin natura lor o marj de variaie adic un interval pe care se gsesc valorile efective ale populaiei. Undeva apare o diferen! Pentru a fi siguri c diferena dintre valorile n eantion reflect o diferen real de valori n populaii, distana dintre mrimile comparate trebuie s depeasc mrimea intervalului pe care se afl , cu o anumit probabilitate, valorile din populaie. Cu alte cuvinte o diferen este semnificativ dac depete eroarea maxim admis, adic ea nu poate fi pus (integral) pe seama fluctuaiilor fireti de eantionare. n caz contrar se va spune c diferena nu este semnificativ (exclus a se folosi nesemnificativ). O diferen care nu este semnificativ reflect o deosebire despre care nu se poate spune cu o probabilitate suficient de mare c este real, acesta nu nseamn c ea nu este real. 7.2.3. Testele de semnificaie sau testarea diferenei la seturi de date/eantioane Ce presupun testele de semnificaie sau testarea unei diferene la seturi de date/eantioane? Obiectivul final al acestora este acela de a explica diferena aparent. nainte de a se cuta

explicaii cauzale, semnificativ este ea.

se dorete a se determina ct de mare este aceast diferen ct de

n domeniul turismului i al studiilor privind recreerea, n mod frecvent i de regul se folosesc date relevante pentru comparaie ca de exemplu : locaii diferite, ori asupra unor grupe umane diferite sau nainte i dup un anume eveniment. n astfel de situaii apare necesitatea determinrii semnificaiei diferenelor dintre valori, mrimi, variabile; adic a se testa diferenele presupuse, (incluse, implementate ori induse) de seturile respective de eantioane de date. Exemple de eantioane de date utilizate: Preul mediu hotelier la cazare n 2 staiuni diferite. Comportamentul decizional asupra destinaiei de vacan a 2 grupe sociale diferite. Grupele de vrst ale vizitatorilor unui obiectiv din zilele cu eveniment sau fr Atitudini ale turitilor privind destinaia de vacan nainte i dup vizitarea acesteia.

eveniment. Practic avem date asupra a 2 locaii diferite sau grupe umane, diferenele presupuse de acestea pot fi evidente strict valoric numeric dar nu indic nimic despre semnificaia diferenei dintre ele prin prisma intervalului de raport la valorile probabile ale populaiilor respective (total necunoscute n cazul de fa i total lipsite de altfel de relevan) n limitele maxime acceptabile de eroare. Cu alte cuvinte dorim s testm aceast diferena dintre ele i din punct de vedere al semnificaiei statistice (cuantificarea calitii diferenei). Exist 3 teste de semnificaie statistic mai bine cunoscute: Testul T, un test parametric Testul U sau Mann Whitney, un test neparametric Testul Wilcoxen sau testul perechilor legate de asemenea un test neparametric sau neparametric

7.2.4. Testul Usau Mann Whitney Fiind un test de semnificaie statistic va presupune automat compararea a dou eantioane de date, probabilitatea unei erori datorate de presupusa diferen dintre caracteristicile acestora i cele ale populaiilor respective, diferen arbitrat de o marj de eroare maxim, acceptat.

Include n calcul mediile aritmetice sau medianele seturilor de date. Varianta cea mai cunoscut de formul pentru testul U este: na ( na + 1) ra 2

U = nanb +

Condiii de aplicare: a) Date ordinale sau intervale b) 2 seturi de date necesar a fi comparate ( nu este necesar un numr egal de perechi de variabile) c) Minimum 4 valori din fiecare set de variabil d) IPOTEZE, Ho - ca punct de pornire, n replic pentru Hi. Ipoteza nul (H0) presupune ntotdeauna c; nu exist nici o diferen ntre cele 2 seturi de date. Cu alte cuvinte, diferena dintre cele 2 seturi de date nu este semnificativ. Obiectivul final al testului este acela de a respinge H0. n ideea acceptrii Hi care presupune existena unei diferene semnificative, acceptabil n raport cu marja maxim acceptabil de eroare. Studiu de caz aplicativ pentru testul U sau Mann-Whitney Studiul de caz presupune testarea semnificaiei diferenei pentru numrul de turiti romni cazai n Bile Herculane i Drobeta Turnu Severin din 1991 pn n 2000 Dorim deci s testm dac din punct de vedere statistic exist o diferen semnificativ la nivelul numrului de vizitatori din cele 2 locaii n aceeai perioad de timp. Atenie, nu este vorba despre diferen ca operaie aritmetic, aceasta nu are nici o semnificaie, n afara celei pur matematice. Semnificaia statistic presupune la un loc ideea de eantion, de perioad de timp ,de locaii diferite ce pot implica la nivelul raportrii n populaia statistic respectiv anumite aspecte cu caracter social. Observai tabelul de mai jos ! Sunt ndeplinite condiiile de aplicare? Da iar aplicarea testului poate continua chiar i condiiile absenei unei valori la ultima valoare a variabile 2, respectiv turitii romni cazai la Drobeta Turnu Severin.

Anul 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 Stadiul 1:

Turiti romni cazai la Bile Herculane 72211 42968 72352 113242 95085 96631 66268 75441 100606 110286

Turiti romni cazai la Drobeta Turnu Severin 64537 56566 39182 40989 46227 47271 48885 32293 31515 -

n funcie de tipul de date pe care le deinem se calculeaz media aritmetic sau mediana. n studiul de caz de mai sus dispunem de date intervale; se calculeaz media aritmetic pentru fiecare dintre cele dou variabile. Dac Am dispune de date ordinale se va calcula, mediana pentru fiecare coloan de date. Rezultatele se compar. n mod evident, dac diferena dintre medii/mediane nu este semnificativ continuarea testului este inutil. Astfel: Pentru variabla A (B. Herculane): media aritmetic = 84.509 Pentru variabla B (D.T.Severin): media aritmetic = 45.274 Diferen valoric semnificativ! Stadiul 2: Se stabilete ipoteza nul pe baza inversrii uneia iniiale care presupune existena unei diferene semnificative. Astfel: Ipoteza nul este nu exist o diferen semnificativ ntre numrul turitilor cazai la Bile Herculane i cei cazai la D.T. Severin n perioada 1991 2000 Stadiul 3: Se ntocmete un tabel cu 4 coloane. Variabila A se nscrie n coloana 1 iar variabila B n coloana 3, dup cum urmeaz:.

Variabla A (Turiti romni cazai la Bile Herculane) 72211 42968 72352 113242 95085 96631 66268 75441 100606 110286 Stadiul 4:

Variabla B (Turiti romni cazai la Drobeta Turnu Severin) 64537 56566 39182 40989 46227 47271 48885 32293 31515

Acordai ranguri de importan tuturor valorilor, n ordine cresctoare. Pentru acordarea rangului de importan se iau n consideraie valorile ambelor variabile. Cu alte cuvinte rangul NU se acorda separat pe coloane ci la ambele mpreun. Astfel valoarea cea mai mic va primi rangul 1, urmtoarea ca mrime va primi rangul 2 ...amd. Rangurile acordate pentru valorile variabilei A se plaseaz n coloana 2. Acesta se noteaz cu ra Rangurile acordate pentru valorile variabilei B se plaseaz n coloana 4. Acesta se noteaz cu rb. Variabla A (Turiti romni cazai la Bile Herculane) 72211 42968 72352 113242 95085 96631 66268 75441 100606 110286 12 5 13 19 15 16 11 14 17 18 ra Variabla B (Turiti romni cazai la 10 9 3 4 6 7 8 2 1 Drobeta Turnu Severin) 64537 56566 39182 40989 46227 47271 48885 32293 31515 rb

n cazul n care apar valori identice se procedeaz la calcularea mediei rangurilor acestora indiferent de numrul lor. Vezi tabelul de mai jos (caz didactic ipotetic, nu are nici o legtur cu studiul de caz, este folosit ca exemplu). calculul mediei rangurilor. (3 + 4) : 2 = 3,5 VA 30 35 45 50 75 80 ra 1 2 3,5 5,5 11 12 Stadiul 5: Se calculeaz separat suma ranguilor variabilei A, notat cu ra. ra = Stadiul 6: n mod similar se calculeaz suma rangilor variabilei B, notat cu rb. rb = 50 Stadiul 7: Formula pentru testul U este: na ( na + 1) ra 2 na este numrul de valori al variabile A, nb este numrul de valori al variabile B Ea se aplic fiecrei variabile n parte! n cazul nostru, pentru variabila A: 140 VB 45 50 58 62 69 70 rb 3,5 5,5 7 8 9 10 Valoarea 45 apare de 2 ori i ar primi rangul 3 ca mrime de importan. Rangul urmtor, 4, nu se nscrie niciunde i se folosete la

U = nanb + unde:

U = (10 9) +

10 11 140 2

= 90 + 55 140 = 5 Stadiul 8: Variabila B: nb ( nb + 1) rb 2 10 11 50 2

U = nanb +

U = (10 9 ) +

= 90 + 55 50 = 95 Stadiul 9: Dintre cele dou valori U se alege prin convenie valoarea cea mai mic. n cazul studiului de caz de mai sus, este vorba despre Ua = 5

Stadiul 10: Se decide nivelul gradului de confiden la care dorim s avem rezultatul. De regul n tiinele sociale se lucreaz cu cel puin 95% adic p = 0.05 Stadiul 11: Se face apel la tabelele consacrate cu valori critice ale gradului de confiden pentru testul U n vederea stabilirii acestora la p = 0.05 (95%)

nbna

10

11

12

1 2 3 4 5 6 7 8 9 10 11 12

0 0 0 0 1

0 1 1 2 2 3 3 4

0 1 2 3 4 4 5 6 7

0 1 2 3 5 6 7 8 9 11

1 2 3 5 6 8 10 11 13 14

1 3 5 6 8 10 12 14 16 18

0 2 4 6 8 10 13 15 17 19 22

0 2 4 7 10 12 15 17 20 23 26

0 3 5 8 11 14 17 20 23 26 29

0 3 6 9 13 16 19 23 26 30 33

1 4 7 11 14 18 22 26 29 33 37

Valoarea critic pentru un test cu 10 variante n variabile unde p 005 = 20 Stadiul 12: Dac valoarea de test U aleas (cea mai mic dintre cele dou calculate) este mai mic sau egal cu valoarea critic RESPINGEREA ipotezei nule. n acest caz valoarea critic este 20 iar valoarea de test U = 5. Ipoteza nul = nu exist o diferen semnificativ ntre numrul turitilor cazai la Bile Herculane i cei cazai la Dr.Tr. Severin n perioada 1991 2000; se respinge. Se accept ipoteza iniial, conform creia exist o diferen semnificativ ntre numrul turitilor cazai la Bile Herculane i cei cazai la Dr.Tr. Severin n perioada 1991 2000 Stadiul 13: Iportant! Interpretarea rezultatului final este mai important dect faptul c dup o serie de calcule am respins o ipotez nul i am acceptat una iniial. n cazul de fa rezultatul final este exist o diferen ntre cele dou seturi de date. Ce semnificaie are aceast diferen? De ce exist aceast diferen semnificativ? Stadiul 14 a gradului de confiden stabilit, p = 0,05 atrage dup sine

Interpretarea i analiza rezultatului includ ntotdeauna argumente sau explicaii. Exprimarea acestora se face de regul prin formula de debut: Exist o diferen statistic semnificativ ntre numrul turitilor romni cazai la Bile Herculane i cei cazai la Drobeta Turnu Severin (U = 5, p = 0,05), fapt datorat.......spre exemplu faptului c cele dou locaii reprezint atracii diferite n care se practic dou tipuri diferite de turism: turimul balnear i respectiv cel de tranzit, de conferin i week end. n analiz i argumentare se utilizeaz informaie ct mai exact asupra celor dou locaii. Testul U sau Mann Whitney mai este cunoscut i sub denumirea de test al nivelului de semnificaie. 7.2.5. Testul Wilcoxen sau testul perechilor legate Acest test se aplic doar datelor intervale, fapt pentru care este privit ca un test mai special. El se deosebete i prin condiiile pe care le pune la nivelul datelor intervale ce urmeaz a fi testate. Constituie o metod statistic util n testarea diferenelor la nivel de serii de date, deseori folosit n tiinele sociale. Acest test este la fel de important ca cel anterior mai ales prin faptul c testeaz semnificaia eantionului. Pentru turism el este adesea crucial ca importana, cu precdere n situaiile de sondaje la scar medie i mic. Condiii de aplicare: Obligatoriu numai date intervale. Cel puin 6 perechi de date. ntre cele dou iruri de date (sau variabile) trebuie s existe o anume (presupus, dedus) legtur, tendin. Cu alte cuvinte s formeze un anume tip de pereche, s se cupleze conform unui criteriu comun. ntre seriile de date sau ntre datele aceleiai variabile trebuie s existe, cel puin aparent, un anume gen de relaie, legtur. Exemple: Ex 1: Vizitatori europeni n Romnia n anii 1999 i 2000

Austria Belgia Danemarca

1999 63,000 18,000 9,000

2000 66,000 19,000 10,000

n acest caz relaia este stabilit de cei 2 ani, caz n care dac pentru o ar numrul de vizitatori a fost redus n 1999 este probabil s fie redus i n 2000. Ex 2 Gradul de ocupare al hotelurile de pe litoralul romnesc al Mrii Negre (%) 2000 25 30 50 2001 20 29 48

Ianuarie Februarie Martie

Dac gradul de ocupare a fost redus n ianuarie al unui an este foarte probabil s fie redus i n alt an relaia aparent dintre seturile de date, suficient pentru a forma perechi. Dac a) ntre date nu exist o relaie aparent prin prisma creia ele s poat forma perechi dintrun anumit punct de vedere sau de un anume tip sau b) Datele sunt nominale sau ordinale Testul Wilcoxen NU se poate aplica i se apeleaz n schimb la testul Mann-Whitney sau U n aplicarea acestui test analiza teoretic a relaiei aparente dintre variabile este foarte imoprtant. Semnificaia aparent a relaiei este ceea ce se cere de la la testul U i ce fel de diferen privim acolo n antitez cu perechea de la Wilcoxen. Astfel se poate concluziona c felul datelor sau mai bine spus a relaiilor aparente dintre ele, dinamismul i tendina evoluiei acesteia determin ntr-o oarecare msur alegerea testului ce urmeaz a fi utilizat.

Mod de calcul Studiu de caz: serii de date privind gradul de ocupare (%) al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada 1991-2000 Bile Herculane 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 36 31 38 41 43 35 29 37 41 45 Drobeta Severin 45 30 24 38 32 32 54 49 44 43 Turnu

Exist o relaie aparent ntre datele de aici? Evident! Fiind vorba de 2 localitii situate n aceeai zon turistic i gradul de ocupare al hotelurilor acestora se presupune c gradul de ocupare la nivelul amndurora are cam acelai comportament pentru aceeai perioad de timp. Gradul de ocupare (n aceast situaie) pentru aceeai categorie de unitate de cazare, este criteriul de mperechere Presupusa relaie de reprezint punctul de plecare n stabilirea ipotezei nule pe baza creia se poate trece la calculul acestui test Stadiul 1: Se formuleaz ipoteza nul (Ho) asupra seriilor de date n concordan cu o ipotez iniial (.Hi). ( Ho ntotdeauna exprim negativul/inversul ipotezei iniiale Hi ): Ex. Nu exist o diferen semnificativ n gradul de ocupare al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada 1991-2000 Stadiul 2:

Se construiete un tabel cu 6 coloane. n coloanele 1 i respectiv 2 se introduc seriile de date (denumite pentru convenien variabile: A=Bile Herculane i respectiv B=Drobeta Turnu Severin) A (Herculane) 36 31 38 41 43 35 29 37 41 45 Stadiul 3 Se calculeaz diferena aritmetic dintre A i B (A-B). Rezultatul obinut amplaseaz n coloana 3 ignornd semnul (+;-) B (Turnu Severin) 45 30 24 38 32 32 54 49 44 43

A 36 31 38 41 43 35 29 37 41 45

B 45 30 24 38 32 32 54 49 44 43

A-B 9 1 14 3 11 3 25 12 3 2

Stadiul 4

Dac n coloana (A-B) avem valori egale cu 0, acestea se exclud din analiz (se exclud i perechile cu totul, utilizndu-se restul perechilor). Cu meniunea c n acest caz se reduce numrul de perechi luat n calcul! n studiul de caz nu exist astfel de situaii, calculul continundu-se fr alte modificri de condiii. Stadiul 5 Se acord rang de importan valorilor din coloana (A-B) pornindu-se de la valoarea cea mai mic creia i se atribuie rangul 1. Valorile rangurilor se nscriu n coloana 4. n cazul valorilor identice se procedeaz la calcularea mediei rangurilor valorilor variabilor identice ca valoare indiferent de numrul acestora. A 36 31 38 41 43 35 29 37 41 45 Stadiul 6 Se compar pe rnd valorile din perechile variabilelor A i B. Acolo unde valoarea lui A este mai mare dect a lui B se nscrie rangul atribuit diferenei (A-B) n coloana 5. Unde valoarea lui B este mai mare dect a lui A rangul atribuit diferenei (A-B ) se nscrie n coloana 6. B 45 30 24 38 32 32 54 49 44 43 (A B) 9 1 14 3 11 3 25 12 3 2 Rang de (A-B) 6 1 9 4 7 4 10 8 4 2

A 36 31 38

B 45 30 24

A-B 9 1 14

Rang de A-B 6 1 9

A>B

B>A 6

1 9

41 43 35 29 37 41 45 Stadiul 7

38 32 32 54 49 44 43

3 11 3 25 12 3 2

4 7 4 10 8 4 2

4 7 4 10 8 4 2

Se calculeazi suma rangurilor pe fiecare coloan n parte (A>B i B>A din coloanele 5 i 6). A B A-B Rank of A-B A>B B>A

36 31 38 41 43 35 29 37 41 45

45 30 24 38 32 32 54 49 44 43

9 1 14 3 11 3 25 12 3 2

6 1 9 4 7 4 10 8 4 2

6 1 9 4 7 4 10 8 4 2

Suma din coloana A>B (5) = 27 Suma din coloana B>A (6)= 28 Stadiul 8 Se selecteaz valoarea cea mai mic dintre cele 2 sume i se notez cu T T = 27 Stadiul 9

Se decide cu ce grad de confiden se lucreaz (95% sau 99%) pentru stabilirea semnificaiei rezultatului. Se continu fcnd apel la tabelele consacrate, ale valorilor critice pentru testul Wilcoxen. n cazul n care a fost redus numrul de perechi n timpul calcului el se reduce i la interpretare. Exempl daca au fosrt eliminate 2 perechi din calcul la interpretare n loc de 10 perechi se va urmri valoarea critic pentru 8 perechi.

Nr perechi A i B 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

P=0.05 0 2 4 6 8 11 14 17 21 25 30 35 40 46 52

P=0.01 0 2 3 5 7 10 13 16 20 23 28 32 38

Dac valoarea obinut pentru T este mai mic dect valoarea critic (pentru numrul corect de perechi i la gradul de confiden ales) se respinge ipoteza nul. n orice alt situaie aceasta se accept. Conform studiului de caz T = 27, valoare critic = 8 (95%) sau 3 (99%): IPOTEZA NUL SE ACCEPT! Adic nu exist o diferen semnificativ n gradul de ocupare al hotelurilor celor 2 locaii. Stadiul 9 Interpretarea rezultatului obinut:

n studiul de caz de mai sus s-a demonstrat statistic faptul c nu exist o diferen, semnificativ, n gradul de ocupare al hotelurilor din Bile Herculane i Drobeta Turnu Severin n perioada .... (n ciuda faptului c aparent exista o diferen valoric). De ce? Stadiul 10 Analiza i exprimarea rezultatului final: Dac ar fi existat o diferen semnificativ analiza ar fi fost exprimat ncepndu-se cu formularea: Exist o diferen (relaie) semnificativ ntre gradul de ocupare din Bile Herculane i Drobeta Turnu Severin; T = 2, p = 0.01. Aceasta se datoreaz...... n cazul nostru nu exist o diferen semnificativ ntre cele dou pentru T = 2, p = 0.01. Aceast realitate se datoreaz faptului c n calcul este luat gadul de ocupare i dei cele dou locaii sunt diferite ca destinaie turistic, caracterizndu-se prin tipuri dierite de turism ele se afl n aceeai zon turistic, la distan relativ mica una de cealalt. Factorul care ns determin inexisten diferenei semnificative este raportul numr locuri cazare destinaie turistic. 7.2.6. Testarea semnificaiei diferenei la nivel de set de date absolut independente. Testul 2

Aminteam anterior faptul c testarea semnificaiei statistice presupune n primul rnd procesul de comparaie. Testele precedente de semnificaie statistic au stabilit semnificaia diferenei la nivelul datelor selective (eantioane) asemntoare sau parte din aceeai mare categorie. n general a fost vorba despre date asemntoare. Cu alte cuvinte s-a pornit de la ideea comparrii unor date asemntoare (unii autori le denumesc dependente) pentru a se determina diferena de semnificaie statistic dintre ele (n final demonstrat sau nu prin acceptarea sau respingerea ipotezei nule). Acelai proces de comparaie statistic (att de util n ndeplinirea funciei de semnificaie statistic) mai presupune i situaia invers: se compar/testeaz semnificaia statistic la nivelul datelor ne asemntoare sau independente pentru a se determina asemnarea lor. Cu alte cuvinte pentru a se determina n ce msur ele au ceva n comun, i ce presupune acest lucru (n final fapt demonstrat sau nu prin acceptarea sau respingerea ipotezei nule). Acest proces se efectueaz prin ceea ce este cunoscut i sub denumirea de: Testul de contingen Ce este contingena? Contingena Contingena msoar gradul de relaionare sau intensitatea legturii dintre dou elemente, fenomene, procese,n final dintre variabile/seturi de date selective/eantioane. Cu alte cuvinte fiind vorba de date independente, contingena msoar modul n care un aspect, o variabil, un set de date influeneaz sau este influenat de un altul/a. Astfel n limbajul de specialitate apar formulri de genul: unele variabile sunt contingente cu altele sau dein un contingent asupra altora. EX: Clasa social are contingent asupra numrului de vacane pe care o familie i le poate permite. Sezonalitatea este contingen cu gradul de ocupare al unui hotel. Contingena ns nu este acelai lucru cu corelaia. Reamintim ce exprim corelaia i aume o co-variaie. Aceasta indic pur i simplu faptul c o variabil prezint o anumit tendin sau are un anumit comportament iar cealalt sau cellalte prezint i ele o anumit tendin sau are un anumit comportament.Corelaia nu spune nimic despre cauzalitate sau cum se determin ori se influeneaz variabilele ntre ele.

Cel mai cunoscut test pentru investigarea/cunatificarea contingenei este testul chi2 sau testul 2 Testul 2 Condiii de utilizare: n cazul necesitii investigrii tipului de relaie ntre dou aspecte, fenomene, indici, indicatori INDEPENDENI etc (adic a modului n care ceva/cum ceva, se leag de altceva, influeneaz. n cazul n care avem la dispoziie 2 variabile independente. Avem la dispoziie date nominale, ordinale sau intervale. Testul 2 sau Chi2 este un test non-parametric ale crui cteva caracteristici implic aspecte precum: Datele exprim categorii numrabile de elemente. Chi2 este foarte util mai ales n analiza statistic a datelor chestionarelor (unde sunt necesare cel puin 100 de chestionare pentru relevana analizei)

Mod de aplicare Chi2 pornete ntotdeauna de la ipoteza iniial, Hi, conform creia exist o relaie ntre datele analizate fapt pentru care ipoteza nul, Ho, va avea ntotdeauna forma conform creia NU exist nici o relaie ntre variabile analizate. i clasific datele utilizate n: OBSERVATE (notate cu O) reprezint datele prezente, aflate la dispoziie; i PRESUPUSE (notate cu P) - determinate pe baza celor observate. Datele presupuse reprezint datele la care se ateapt testul , sau pe care testul le prognozeaz n cazul n care nu ar exista nici o legtur ntre ele sau cu alte cuvinte n cazul n care ipoteza nul ar fi adevrat. Comparnd datele, testul X2 stabilete n final dac cele ntre cele dou variabile exist sau nu o relaie i care este ea.

Elemente necesare pentru aplicarea testului X2 1) 2) Date pentru 2 variabile. Datele trebuie s exprime categorii de elemente numrabile. NUMERE REALE. 3) 4) Indiferent de forma n care se afl datele acestea se introduc ntr-un tabel de contingen. Datele nu pot avea form de procente

Studiu de caz Date provenite de la Comisia Naional pentru Statistic privind numrul vizitatorilor strini n Romnia pentru anii 1985 i respectiv 1995, n funcie de motivaia vizitei. n acest caz se poate discuta despre o posibil relaie existent ntre date: dinamica motivelor pentru care strinii doresc s viziteze Romnia n perioada respectiv. Datele sunt: Mii turiti strini n vacan: 1985 = 2498 1995 = 2274 1985 = 2607 1995 = 2838

Mii turiti strini sosii n Romnia pentru alte motive:

Testul 2 sau Chi2 presupune pentru aplicare12 stadii Stadiul 1 Formularea ipotezelor iniial i respectiv nule (Hi, Ho) pentru datele luate ca baz de studiu. Reamintim ca : Ipoteza nul Ho exprim ntotdeauna negativul, inversul ipotezei iniiale Hi n cazulacestui studiu de caz Ho este :nu exist nici relaie (din punct de vedere al semnificaiei statistice aceasta este tot o diferen, diferena dintre date chemat s arate o asemnare, aceeai dinamic a motivelor vizitei) ntre numrul turitilor strini venii n Romnia pentru o vacan i cei sosii pentru alte motive att n timpul perioadei comuniste ct i dup ncheierea acesteia.

Stadiul 2 Construirea tabelului de contingen pentru cele dou variabile prin simpla introducere a datelor prezente i calcularea totalurilor coloanelor i rndurilor tabelului obinut. 1985 Vizite pentru vacan Vizite pentru alte motive Total 2498 2607 5105 1995 2274 2838 5112 Total 4772 5445 10217

Aceste date se numesc datele cu valori OBSERVATE Stadiul 3 Se examineaz valorile observate. n cazul n care exist valori egale cu 0 ntregul test devine invalid! Stadiul 4 Se calculeaz valorile PRESUPUSE. (adic valorile ATEPTATE sau presupuse de test n cazul n care nu ar exista nici o relaie ntre cele 2 variabile) n calculul valorilor presupuse se pornete ntotdeauna de la valorile observate. Pentru fiecare dat observat se calculeaz echivalentul presupus dup cum urmeaz : Valoarea presupus = (Total rnd) x (Total coloan ) Total general 1985 O pentru 2498 P 2384.4 2720.6 1995 O 2274 2838 P 2387.6 2724.4 Total

Vizite

4772 5445

vacan Vizite pentru alte 2607 motive

Total Stadiul 5

5105

5112

10217

Se examineaz valorile presupuse. n cazul n care exist valori mai mici dect 5, testul devine invalid i se abandoneaz. Stadiul 6 Se calculeaz X2 dup formula:

( O P) =
P

Practic pentru fiecare valoare observat: Se calculeaz diferena (O P) Se ridic la ptrat fiecare rezultat Acesta se mparte la valoarea presupus respectiv Se calculeaz suma tuturor rezultatelor obinute 1985 O Vizite pentru vacan Vizite pentru alte motive Total 2498 2607 5105 1995 O 2274 2838 5112

P 2384.4 2720.6

P 2387.6 2724.4

2 5.4 4.7

Total 4772 5445 10217

5.4 4.7

Valoarea total 2 = 5.4 + 4.7 + 5.4 + 4.7 = 20.2 Stadiul 7 Se calculeaz gradul de libertate (gf), revenindu-se la stadiul 2 (tabelul de contingen), ignornd totalurile. Formula gradului de libertate este: gf = (nr) - 1 x (nc) 1

Unde : nr = numr de rnduri nc = numr de coloane Pentru acest studiu de caz :gf = (2-1) x (2-1) = 1 Stadiul 8 Se alege gradul de confiden. 95% (p= 0.05) 99% (p=0.01) 99.9%(p=0.001) 95% reprezint gradul minim de confiden acceptat n tiinele sociale . Stadiul 9 Se face apel la tabelul valorilor critice al gradului de confiden pentru testul X2. 95% (p=0.05) Grad de libertate 1 2 3 4 5 6 7 8 Stadiul 10 Dac valoarea 2 este mai mare dect valoarea critic se respinge ipoteza nul. Dac valoarea 2 este mai mic dect valoarea critic se accept ipoteza nul 3.84 5.99 7.82 9.49 11.07 12.59 14.07 15.51 99% (p=0.01) 6.64 9.21 11.34 13.28 15.09 16.81 18.48 20.09 99.9% (p=0.001) 10.83 13.82 16.27 18.46 20.52 22.46 24.32 26.12

n acest studiul de caz - 2 = 20.2 pentru o valoare critic de 3,84 , l grad de libertate 1, cu grad de confiden 95%, fapt ce atrage dup sine respingere ipotezei nule cu grad de confiden 95% Stadiul 11 Interpretarea rezultatului ntotdeauna se face apel la tabelul cu valorile observate i presupuse dar i la toate toate informaiile colaterale venite de acolo. Ex: n 1985 numrul vizitatorilor strini pentru alte motive, a fost mai mare dect al celor (O=2607 , P = 2720.6) dar mai mic dect al celor sosii n vacan n 1995 numrul vizitatorilor strini sosii pentru o vacan a fost mai mare dect al celor (O=2274 , P = 2387.6) i mai mic dect al celor sosii pentru alte motive Concluzia: odat cu cderea comunismului un numr mai mare de vizitatori strini au sosit n Romnia pentru vacan dect pentru alte motive. Stadiul 12 Se argumenteaz concluzia anterioar utilizndu-se ca baz de pornire expresii precum: Exist o relaie semnificativ ntre motivaia vizitrii Romniei i anul n care are loc vizita (2 = 20.2, p=0.001) deoarece... Se poate observa c acest test este primul test cu o dimensiune de prognozare. Este o form incipient i insuficient pentru ndeplinirea funciei statistice de prognoz. Aceast funcie se ndeplinete odat cu trecerea la tehnici de regresie i analiz factorial.

S-ar putea să vă placă și