Sunteți pe pagina 1din 21

ACADEMIA DE STUDII ECONOMICE, BUCURETI

FACULTATEA DE CIBERENTIC, STATISTIC I INFORMATIC ECONOMIC

STATISTIC NEPARAMETRIC
Profesor coordonator, Boboc Cristina
5 mai 2014

ECHIPA NR.1
COMPONENA ECHIPEI:
- IORDACHE MIHAELA OANA
- LEPDATU ALEXANDRA ANDREEA

CUPRINS
1. Introducere

2. Problematici de analizat
- Descrierea datelor: analiza descriptiv, transformarea datelor
unde este necesar
- Aplicarea metodelor pentru testarea ipotezelor enunate n
introducere
2.1 Exist o legtur semnificativ ntre nivelul de fericire i
activitatea religios a unui individ? Dac da, care este
intensitatea i direcia acesteia?
2.2 Exist vreo relaie semnificativ ntre nivelul de fericire i
msura n care o persoan este liber s decid cum s-i triasc
viaa? Dac da, care este intensitatea acesteia?
2.3 n ce msur genul unui individ are vreo influen asupra
participrii la vot?
2.4 n ce msur probabilitatea de a aparine unui grup
discriminant este influenat de gen, vrst, statut profesional i
nivel de educaie?
2.5 n anul 2002 distribuia dup nivelul religios al individului era
urmtoarea:
a.Deloc religios: 12%
b.Mediu religios 81,5%
c.Foarte religios 6,5%
n ara i anul dvs de analiz distribuia a rmas aceeai?
2.6 Exst diferene de opinie ntre persoanele de sex masculin i
cele de sex feminin n ceea ce privete nivelul educaiei n ara i
perioada analizat? Dar n ceea ce privete nivelul de sntate?
2.7 n perioada i ara analizat, cine este perceput mai
favorabil: democraia sau economia?
2.8 Cum influeneaz nivelul studiilor prinilor, nivelul
educaional al persoanelor analizate?
2.9 Exista diferente semnificative intre persoanele de sex
masculin si cele de sex feminin in ceea ce priveste nivelul de
fericire?
2.10 Testai urmatoarele ipoteze:
-barbaii sunt mai adesea membrii unor partide politice decat
femeile.
-persoanele mai vrstnice sunt mai adesea membrii unor partide
politice dect persoanele tinere

-persoanele educate sunt mai adesesa membrii unor partide


politice.

3.Concluzii
1. Introducere
n multe cazuri, actul decizional se prezint sub forma unor alternative, nsoite de formularea
unor ipoteze. O ipotez este o afirmaie despre parametrul unei populaii sau despre repartiia
unei caracteristici a populaiei, afirmaie al crei adevr se testeaz pe baza unui eantion
aleator.
Ipoteza nul, H0, este afirmaia referitoare la valoarea cea mai nefavorabil, fa de valoarea
real a parametrului.
Ipoteza alternativ, H1, este afirmaia conform creia parametrul ia alte valori dect cea
specificat n H0.
Testarea ipotezelor sau testul statistic reprezint evaluarea statistic a deciziei de respingere a
ipotezei nule H0 (presupus adevrat). Etapele testului statistic sunt urmtoarele: formularea
ipotezelor H0 i H1, alegerea pragului de semnificaie , stabilirea repartiiei pentru testarea
ipotezelor i definirea regiunilor critice, stabilirea regulii de decizie (raportul critic) i
efectuarea calculelor.
Ipotezele se stabilesc nainte de procedura de eantionare. Rezultatele obinute pe baza
eantionului pot s confirme sau s infirme ipotezele emise.
Testele de semnificaie pot fi: univariate, cnd un singur parametru face obiectul ipotezelor
sau bivariate, cnd se testeaz relaii existente ntre dou variabile.
Testele neparametrice sunt independente de caracteristicile distribuiei. n toate cazurile n
care variabila dependent este de tip ordinal sau nominal (categorial), ipotezele statistice se
testeaz utiliznd testele neparametrice. Ele se caracterizeaz prin dou trsturi principale:

Nu se bazeaz pe utilizarea parametrilor unei distribuii (medie, abatere standard)

Nu implic condiii de distribuie la fel de rigide. Anumite teste neparametrice nu


implic nicio condiie, fiind cunoscute ca teste independente de condiii de distribuie.
Utilizarea testelor neparametrice nu poate fi evitat dac variabila dependent este una de tip
nominal sau ordinal. Dac, ns, este masurat pe o scal de interval/raport, se pune problema
de a alege ntre un test parametric si unul neparametric. n acest caz, criteriul principal de
decizie este normalitatea distribuiei la nivelul populaiei. Mai ales pentru eantioanele mici,
atunci cnd avem motive s ne ndoim de normalitatea distribuiei la nivelul populaiei, vor fi
preferate testele neparametrice.

n proiectul nostru, am folosit testele neparametrice pentru a verifica existena


legturilor dintre variabilele date, intensitatea i sensul, pe datele din Spania, din anul
2010.

2. Problematici de analizat
2.1. Pentru a verifica dac exist legtur semnificativ ntre activitatea religioas a unui
individ i nivelul de fericire resimit de acesta,vom aplica coeficientul de asociere Gamma i
coeficientul de corelaie al rangurilor al lui Kendall, deoarece ambele variabile sunt
ordinale.
Ipotezele:
H0: variabilele x i y nu sunt asociate
HA: variabilele x i y sunt asociate

Regula de decizie:
z z/2 se respinge H0
z < z/2 se accept H0

Approx Sig=0.000<0.01 (acceptm H1) , rezult c exist o legtur semnificativ direct


(0.21>0) ntre activitatea religioas a unui individ i nivelul de fericire resimit de acesta, dar
de intensitate slab (0.21),pentru un nivel de semnificaie de 99%. Legtura direct
semnific faptul c atunci cnd o persoan particip la activiti religioase, acesta este mai
fericit.

2.2 Pentru a verifica dac exist o relaie semnificativ ntre nivelul de fericire i msura n
care o persoan este liber s decid cum s-i triasc viaa vom aplica testele Kendall si
Gamma, deoarece ambele variabile sunt ordinale.

Ipotezele:
H0: variabilele x i y nu sunt corelate
HA: variabilele x i y sunt corelate

Regula de decizie:
z z/2 se respinge H0
z < z/2 se accept H0
Approx Sig=0.051>0.05 (acceptm Ho), rezult c nu exist o legtur semnificativ ntre
nivelul de fericire i msura n care o persoan este liber s decid cum s-i triasc viaa,
pentru un nivel de semnificaie de 95 %.

Gamma= -0.052, de unde rezult o asociere slab, cu o legtura invers, dar


nesemnificativ. Pentru c legtura este invers, putem aprecia c libertatea de decizie n
modul unei persoane de a-i tri viaa este invers proporional cu nivelul de fericire al
acesteia.

2.3. Pentru a verifica n ce masura genul unui individ are vreo influen asupra participrii la
vot vom aplica coeficentul de contingen 2 ,deoarece cele 2 variabile incluse n analiz
sunt nominale.
Ipotezele:
H0: nu exist asociere ntre variabilele x i y
HA: variabilele x i y sunt asociate

2 2 ; r 1 s 1
Regula de decizie

se respinge H0

Dac

2 2 ; r 1 s 1

Dac

se accept H0

Approx Sig=0.866>0.05 (acceptm Ho), rezult c genul unui individ nu influeneaz


participarea la vot, pentru un nivel de semnificaie de 95 %.
Contingency Coefficient= 0.012, de unde avem o asociere slab, dar nesemnificativ.

n acest caz, mai putem aplica urmatoarele teste, care confirm rezultatul obinut anterior.

2.4. Pentru a verifica n ce msur probabilitatea de a aparine unui grup discriminant este
influenat de gen, vrst, statut profesional i nivel de educaie aplicm coeficentul de
contingen 2

Ipotezele:
H0: nu exist asociere ntre variabilele x i y
HA: variabilele x i y sunt asociate

Approx Sig=0.341>0.05 (acceptm Ho), rezult c genul nu influeneaz probabilitatea de a


aparine unui grup discriminant, pentru un nivel de semnificaie de 95%.
Contingency Coefficient= 0.022, de unde avem o asocierea slab ntre cele 2 variabile, dar i
nesemnificativ.

Asymp Sig=0.847>0.05 (acceptm Ho), rezult c vrsta unui individ nu influeneaz


probabilitatea de a aparine unui grup discriminant, pentru un nivel de semnificaie de 95 %.
Contingency Coefficient =0.184, de unde avem c asocierea ntre cele 2 variabile este slab
i nesemnificativ.

Asymp Sig=0.013<0.05 (acceptm H1), rezult ca nivelul educaiei influeneaz


probabilitatea de a aparine unui grup discriminant, rezultat garantat cu o probabilitate de
95%.
Contingency Coefficient= 0.116, de unde avem c asocierea dintre cele 2 variabile este
slab, dar semnificativ.

Asymp Sig=0.797>0.05 (acceptm Ho), rezult c statutul profesional nu influeneaz


probabilitatea de a aparine unui grup discriminant, pentru un nivel de semnificaie de 95%.
Contingency Coefficient= 0.346, de unde asocierea ntre cele 2 variabile este slab i
nesemnificativ.

2.5. a) Pentru a analiza dac distribuia a rmas aceeai i pentru Spania n 2010,vom aplica
testul Kolmogorov-Smirnov, ntruct avem date ordinale, pentru compararea distribuiei
observate a rspunsurilor obinute cu o distribuie definit a priori F .
Pentru a putea compara variabila analizat rlgdgr din Spania n anul 2010,cu distribuia:
-deloc religios=12%=0
-mediu religios=81.5%=1
-foarte religios=6.5%=2
Vom transforma variabila studiat n variabila rel cu urmtoarele intervale:
-0-2=0;
-3-7=1
-8-10=2
Ipotezele testate:
H0: datele sunt distribuite F;
H1: datele nu sunt distribuite F

Regula de decizie:

2 2 ;k 1

2 2 ;k 1

se respinge H0

se accept H0

Asymp Sig=0.00<0.01, rezult c se respinge H0 cu o probabilitate de 99%. Deci acceptm


H1, iar aceast ipotez ne spune c n Spania n anul 2010 nu se pastreaz aceeai distribuie,
rezultatul garantndu-se cu o probabilitate de 99%.
b) Pentru a analiza dac distribuia a rmas aceeai i pentru Spania n 2010,vom aplica testul
de concordan 2, ntruct vom trasforma datele din ordinale n nominale, pentru a
compara distribuia observat a numrului de observaii pe variante cu o distribuie
predeterminat F.

Asymp Sig=0.00<0.01, rezult c se respinge H0 cu o probabilitate de 99%. Deci acceptm


H1, iar aceast ipotez ne spune c n Spania n anul 2010 nu se pstreaz aceeai distribuie,
rezultatul garantndu-se cu o probabilitate de 99%.

2.6. a) Pentru a vedea daca exist diferene de opinie ntre persoanele de sex masculin i cele
de sex feminin n ceea ce privete nivelul de sntate vom aplica testul Mann
Whitney,variabila de interes fiind ordinal, ntruct dorim s testm dac cele 2 eantioane
au aceeai prere raportat la nivelul de sntate.
Ipotezele testate:
H0: eantioanele provin din aceeai populaie
HA: eantioanele nu provin din aceeai populaie

Regula de decizie:
U > z/2 se respinge H0
U z/2 se accept H0
Asymp Sig=0.000<0.01 (acceptm H1) ,rezult c exist diferene de opinie ntre
persoanele de sex masculin i cele de sex feminin n ceea ce privete nivelul de sntate,
rezultat garantat cu o probabilitate de 99%.
b) Pentru a vedea daca exist diferene de opinie ntre persoanele de sex masculin i cele de
sex feminin n ceea ce privete nivelul educaiei n Spania 2010 vom aplica testul Mann
Whitney.

Asymp Sig=0.162>0.05 (acceptm Ho), rezult c nu exist diferene de opinie ntre


persoanele de sex masculin i cele de sex feminin n ceea ce privete nivelul educaiei n
Spania 2010, pentru un nivel de semnificaie de 95%.

2.7. Pentru a analiza cine este perceput mai favorabil dintre economie i democraie vom
aplica testul Median i vom compara medianele ntre ele.
Ipotezele testate:
H0: med1 == medk
HA: exist ij astfel nct medi medj

2 2 ,k 1
Regula de decizie:

se accept H0

2 2 ,k 1

se respinge H0

Asymp Sig=0.000<0.01(acceptm H1),rezult c exist diferene semnificative ntre


medianele celor 2 variabile, rezultat garantat cu o probabilitate de 99%.

Pentru c testul Median ne arat c opiniile persoanelor referitoare la cele 2 variabile sunt
diferite,vom calcula media celor 2 variabile, excluznd valorile extreme.

Media economiei=3.36,iar cea a democraiei este 5.09,deci concluzionm c persoanele


intervievate au o parere mai bun despre democraie decat despre economie.

8. Cum influeneaz nivelul studiilor prinilor, nivelul educaional al persoanelor


analizate?
Pentru a analiza dac nivelul studiilor prinilor influeneaz nivelul educaional al
persoanelor analizate vom aplica testul Wilcoxon,variabilele analizate fiind ordinale,
observnd unitile statistice sunt observate nainte i dup eveniment.
Ipotezele:
H0: nu s-a produs nici o schimbare n urma aciunii factorului;
HA: au avut loc schimbri n urma aciunii factorului;

Regula de decizie: Pentru un nivel de semnificaie si n volumul eantionului se extrage din


tabelul valorilor critice ale testului Wilcoxon T;n

T > T,n

se respinge H0

T T,n

se accept H0

Approx Sig=0.013<0.05 (acceptm H1), rezult c nivelul de educaie al prinilor


influeneaz nivelul educaional al copiilor, rezultat garantat cu o probabilitate de 95%.

9. Formulai o ntrebare la care s putei rspunde folosind testele statistice.

Exist diferene semnificative ntre persoanele de sex masculin i cele de sex feminin n
ceea ce privete nivelul de fericire?
Pentru a vedea dac exist diferene semnificative vom aplica testul Mann Whitney i testul
Kruskall-Wallis.
Ipotezele testate:
H0: eantioanele provin din aceeai populaie
HA: eantioanele nu provin din aceeai populaie

Regula de decizie:
U > z/2 se respinge H0
U z/2 se accept H0
n ambele cazuri, Asymp Sig=0.461>0.05 (acceptm Ho), de unde rezult ca exist
diferene semnificative ntre persoanele de sex feminine i cele de sex masculine n ceea ce
privete nivelul de fericire resimit, pentru un nivel de semnificaie de 95%.
10. Formulai o ntrebare la care s puteti rspunde folosind modelul de regresie
logistic.
Pentru a aplica modelul de regresie logistic vom testa dac:
-barbaii sunt mai adesea membrii unor partide politice dect femeile.
-persoanele mai vrstnice sunt mai adesea membrii unor partide politice dect
persoanele tinere
-persoanele educate sunt mai adesesa membrii unor partide politice.
Variabilele incluse n analiz vor fi:
Variabila dependent:

Y=1 dac persoana este membr a unui partid politic


Y=0, altfel

Variabilele independente:
Sex: X1= (1 pentru sex masculin i 2 pentru sex feminin)

Varst: X2 = vrst n numr de ani


Educaie: X3 =nivelul educaiei

Odds (membru intr-un partid politic) crete cu 36,5% pentru persoanele de sex masculin,
comparativ cu cele de sex feminin.
Sig=0.353>0.05, rezult c variabila nu este semnificativ pentru model, pentru un model de
semnificaie de 95%.
Percentage corect= 98% - probabilitatea de a nu fi ntr-un partid politic.

Odds(membru ntr-un partid politic) crete cu 0,5% la creterea vrstei cu o unitate.

Sig=0.593>0.05, rezult c variabila nu este semnificativ pentru model, pentru un model de


semnificaie de 95%.
Percentage corect= 98% - probabilitatea de a nu fi ntr-un partid politic.

Odds(membru ntr-un partid politic) scade cu 0,1% la creterea nivelului de educaie cu o


unitate.
Sig=0.039<0.05, rezult c variabila este semnificativ pentru model, pentru un nivel de
semnificaie de 95 %.
Percentage corect= 98% - probabilitatea de a nu fi ntr-un partid politic.

3.Concluzii
n urma testelor aplicate asupra datelor din Spania, din 2010, am gsit legturi semnificative
ntre activitatea religioas a unui individ i nivelul de fericire resimit de acesta, nivelul
educaiei influeneaz probabilitatea de a aparine unui grup discriminant, existnd diferene
semnificative ntre persoanele de sex feminine i cele de sex masculine n ceea ce privete
nivelul de fericire resimit.
De asemenea, am observat c exist diferene de opinie ntre persoanele de sex masculin i
cele de sex feminin n ceea ce privete nivelul de sntate.
Totodat, contrar celor de mai sus, am observat faptul c nu exist legturi semnificative ntre
nivelul de fericire i msura n care o persoan este liber s decid cum s-i triasc viaa,
genul unui individ nu influeneaz participarea la vot, vrsta unui individ sau statutul
profesional nu influeneaz probabilitatea de a aparine unui grup discriminant, nu exist

diferene de opinie ntre persoanele de sex masculin i cele de sex feminin n ceea ce privete
nivelul educaie i nu exist diferene de opinie ntre persoanele de sex masculin i cele de sex
feminin n ceea ce privete nivelul educaiei.
De asemenea, s-a mai observat faptul c marea majoritate a persoanelor consider mai
favorabil democraia, dect economia din Spania, 2010.