2 Cer%$!e+e -ro%e)!"+"%. Alegeti din Anuarul Statistic al Romaniei sau din baza de date TEMPO online serii de timp a I!S de pe site"ul ###inssero 2 $ariabile a%late intr"o oarecare dependenta una de alta& pentru toate cele '( )udete *%ara municipiul +ucuresti, -olosind SPSS& introduceti datele si analizati. Indicatorii medii si ai $ariatiei pentru %iecare din cele doua $ariabile %olosind metode di%erite de analiza E%ectuati gra%ice speci%ice pentru cele doua distributii si pentru indicatorii calculati E%ectuati o analiza bi$ariata a datelor selectate Analizati legatura dintre cele doua $ariabile si stabiliti care este cel mai potri$it model de regresie / Pentru proiectul de %ata am ales ca $ariabile de pe site"ul ###inssero supra%ata culti$ata cu grau in anul 2001 si productia de grau in acelasi an Am desc2is o sesiune de lucru in SPSS si am de%init $ariabilele in %ereastra Variable View. Primul pas dupa de%inirea $ariabilelor a %ost stabilirea atributelor %iecarei $ariabile in parte Pentru $ariabila Judet am ales ca tip String *al%a numerica, cu o lungime de 30 de carcatere Pentru $ariabilele Suprafata_cultivata si Productie am stabilit tipul $ariabilei ca %iind Numeric/ lungimea de (4 caractere si numarul de zecimale egal cu zero ' Am introdus etic2etele *Label, pentru %iecare $ariabila in parte
I$#%)(!or%% 0e#%% % (% '(r%(!%e% -e$!r" f%e)(re #%$ )e+e #o"( '(r%(1%+e/ fo+o%$# 0e!o#e #%fer%!e #e ($(+%2(& 3 S"-r(f(!( )"+!%'(!e Primul pas in calculul indicatorilor a %ost desc2iderea %erestrei Analyze->Decriptive Statitic- >!re"uencie Am mutat in casuta Variable#$ supra%ata culti$ata& apoi am intrat in optiunea Statistics unde am bi%at urmatorii indicatori. 5uartiles& Mean& Median& Mode& Sum& Std 6e$iation& 7ariance& Range& Minimum& Ma8imum si S9e#ness 4 N : '( "; baza de date cuprinde '( de )udete analizate Me($ : '<0=< "; supra%ata medie culti$ata in cele '( de )udete este de '<0=< 2ectare Me#%($ : //212 "; )umatate din )udetele analizate au o supra%ata culti$ata sub //212 2ectare si )umatate peste Mo#e : 41/4 "; a$em module multiple si de aceea este indicata doar cea mai mica $aloare S!#& De'%(!%o$ : 30021 "; apro8imati$ 41> dintre )ude?e au o supra%a?@ culti$at@ cu grau cuprins@ Antr"un inter$al egal cu media plus sau minus $aloarea abaterii medii p@tratice& respecti$. '<0=< BC" 30021D V(r%($)e : 23021/404' S3e4$e : 2 R($5e 6 2223=( "; di%eren?a dintre cea mai mare si cea mai mic@ supra%a?@ culti$at@ cu grau este de 2223=( 2ectare * amplitudinea,D M(,%0"0 : 22<'0= "; cea mai mare supra%a?@ culti$at@ cu grau este de 22<'0= 2ectare M%$%0"0 : 41/4 "; cea mai mica supra%a?@ culti$at@ cu grau este de 41/4 2ectare = Optiunea Analyze->Decriptive Statitic-> Decriptive%
1 Optiunea Analyze->&eport-> 'ae Summarie%
Se obser$a ca prin toate cele / metode rezultatele sunt aceleasi < Pro#")!%e #e 5r(" Primul pas in calculul indicatorilor a %ost desc2iderea %erestrei Analyze->Decriptive Statitic- >!re"uencie Am mutat in casuta Variable#$ productia& apoi am intrat in optiunea Statitic unde am bi%at urmatorii indicatori. 5uartiles& Mean& Median& Mode& Sum& Std 6e$iation& 7ariance& Range& Minimum& Ma8imum si S9e#ness
(0 N : '( "; baza de date cuprinde '( de )udete analizate Me($ : (/'=4< "; productia medie obtinuta in cele '( de )udete este de (/'=4< tone Me#%($ : =422( "; )umatate din )udetele analizate au obtinut o productie de grau de sub =422( tone si )umatate peste Mo#e : ('//'"; a$em module multiple si de aceea este indicata doar cea mai mica $aloare S!#& De'%(!%o$ : (/3=4' "; apro8imati$ 41> dintre )ude?e au o productie de grau cuprins@ Antr"un inter$al egal cu media plus sau minus $aloarea abaterii medii p@tratice& respecti$. (/'=4< BC" (/3=4'D V(r%($)e : (1'/(1(=30< S3e4$e : 2 R($5e 6 331032 "; di%eren?a dintre cea mai mare si cea mai mic@ productie de grau obtinuta este de 331032 tone * amplitudinea,D M(,%0"0 : 3=2/14 "; cea mai mare productie de grau obtinuta este de 3=2/14 tone M%$%0"0 : ('//' "; cea mai mica productie de grau obtinuta este de ('//' tone Efe)!"(!% 5r(f%)e -e)%f%)e -e$!r" )e+e #o"( #%!r%1"!%% % -e$!r" %$#%)(!or%% )(+)"+(!%& (( S"-r(f(!( )"+!%'(!( 7%!o5r(0( Eistograma realizat@ pentru $ariabila supra%a?a culti$at@ cu grau prin comanda. (rap) 89 Le*acy Dialo* 89+ito*ram (2
,nterpretarea rezultatelor. 6istributia seriei dup@ ni$elul supra%e?ei culti$ate cu grau prezint@ o asimetrie spre dreapta& predominFnd supra%e?ele mai mici culti$ate cu grau (/ Bo,-+o! +o8plot realizat pentru $ariabila supra%a?a culti$at@ cu grau prin comanda. (rap) 89 Le*acy Dialo* 89-o.plot (' ,nterpretarea rezultatelor: distributia seriei dupa ni$elul supra%etei culti$ate cu grau prezinta o asimetrie puternica :8: P+o! (3 ,nterpretarea rezultatelor: An cazul supra%e?ei culti$ate cu grau gra%icul se apropie de normal (4 Pro#")!%( o1!%$"!( 7%!o5r(0( (= ,nterpretarea rezultatelor. 6istributia seriei dup@ ni$elul productiei de grau obtinute prezint@ o asimetrie spre dreapta& predominFnd productiile mai mici de grau Bo,-+o! (1 ,nterpretarea rezultatelor: distributia seriei la ni$elul productiei de grau obtinute prezinta o asimetrie puternica (< :8: P+o! ,nterpretarea rezultatelor: An cazul productiei de grau obtinute gra%icul se apropie de normal 20 Gr(f%) -e$!r" (01e+e '(r%(1%+e S)(!!er-+o! 2( ,nterpretarea rezultatelor: 6iagrama ne arata ca intre cele 2 $ariabile e8ista o legatura liniara& directa si stransa 22 Efe)!"(!% o ($(+%2( 1%'(r%(!( ( #(!e+or e+e)!(!e S"-r(f(!( )"+!%'(!( ; 5r"-(re -e %$!er'(+e ma8 min 22<'0= 41/4 2223=( 334'2& 1 ' ' x x n
= = = Pentru a cuprinde in cadrul inter$alelor atat $aloarea minima& cat si cea ma8ima& am ales ca dimensiune a inter$alului $aloarea de 31000 2/ 2' Pro#")!%( o1!%$"!( ; 5r"-(re -e %$!er'(+e ma8 min 3=2/14 ('//' 331032 (/<3(/ ' ' x x n
= = = Pentru a cuprinde in cadrul inter$alelor atat $aloarea minima& cat si cea ma8ima& am ales ca dimensiune a inter$alului $aloarea de (''000 23 24 2= Co$!r"%0 !(1e+"+ #e (o)%ere 21 2< C(+)"+(re( 0e#%%+or % '(r%(%!%%+or /0 Interpretarea celor mai importante rezultate din outut. N : '( pe total ";in analiza de %ata au %ost luate in calcul '( de )udete& din care spre e8emplu 3 au o supra%ata culti$ata cu grau cuprinsa intre 31000 si ((4000 2ectareD Me($ : ('3=34 tone pe total "; productia medie obtinuta pe totalul )udetelor a %ost de ('3=34 tone& in $reme ce productia medie obtinuta in cadrul )udetelor cu o supra%ata culti$ata cuprinsa intre 31000 si ((4000 2ectare a %ost de 2''100 tone Me#%($ : =2000 tone pe total "; )umatate din )udetele considerate au a$ut o productie obtinuta sub =2000 tone& in $reme ce )umatate din )udetele cu supra%ata cuprinsa intre 31000 si ((4000 2ectare au a$ut o productie de sub 2(4000 tone S!#& De'%(!%o$ : (232(/ tone pe total "; apro8imati$ 41> din )udetele considerate au o productie cuprinsa intr"un inter$al egal cu media plus sau minus $aloarea abaterii medii patratice& respecti$ ('3=34BC"(232(/ tone& in timp ce apro8imati$ 41> din )udetele cu o supra%ata cuprinsa intre 31000 si ((4000 2ectare au o productie cuprinsa in inter$alul 2''100BC"4'/<1&1 tone /( C(+)"+"+ %$#%)(!or%+or '(r%(!%e% fo+o%$# ANOVA /2 // Interpretarea celor mai importante rezultate din output. Tabelul Descriptives o%era indicatorii tendintei centrale si ai dispersiei pentru o distributie bi$ariata *se obser$a ca sunt apro8imati$ aceleasi in%ormatii obtinute prin comanda Analyze- >Reports->Case Summaries prezentata anterior, Tabelul A!O7A o%era rezultatele analizei de $ariatie. Sum of Squares Between roups *suma patratelor abaterilor intre grupe, : 33''E(( "; plecand de la aceasta $aloare se poate calcula dispersia si abaterea medie patratica intre grupe 6ispersia intre grupe se calculeaza impartind Sum of Squares Between roups la numarul total al )udetelor considerate& iar abaterea medie patratica intre grupe scotand radical din dispersia intre grupe
33''00000000 (/32(<3(2(<3 ((421/< '( tone = = = Sum of Squares !it"in roups *suma patratelor abaterilor de grupa, : =2=1E(0 "; plecand de la aceasta $aloare se poate calcula dispersia si abaterea media patratica de grupa 6ispersia se calculeaza impartind Sum of Squares !it"in roups la numarul total al )udetelor considerate& iar abaterea medie patratica scotand radical din dispersie =2=10000000 (==3(2(<3(2 '2(/22 '( tone = = = Sum of Squares #otal *suma patratelor abaterilor colecti$itatii, : 42=(E(( "; plecand de la aceasta $aloare se poate calcula dispersia si abaterea media patratica pe total 6ispersia se calculeaza impartind Sum of Squares #otal la numarul total al )udetelor considerate& iar abaterea medie patratica scotand radical din dispersie 42=(00000000 (32<3(2(<3(2 (2/4=/' '( tone = = = Testul $ respecti$ $aloarea Si%:0&000 "; cu aceasta $aloare mai mica decat 0&03& testul - este semni%icati$& ceea ce inseamna ca e8ista o di%erenta semni%icati$a intre cele ' grupe de supra%ata in raport cu productia obtinuta A$(+%2(!% +e5(!"r( #%$!re )e+e #o"( '(r%(1%+e % !(1%+%!% )(re e!e )e+ 0(% -o!r%'%! 0o#e+ #e re5re%e& /' A$(+%2( re5re%e% Gonstruirea corelogramei sau a norului de puncte prin comanda (rap)->Le*acy Dialo*-> ,nteractive->Scatterplot /3 R SH in $aloare de 0<4 este mai mare decat 043& rezulta a$em de"a %acec cu o legatura puternica In continuare $om apro8ima %orma legaturii printr"un model de regresie utilizand optiunea Analyze->&e*reion->'urve /timation /4 /= /1 Gele mai bune / modele sunt in ordine. Huadratic& cubic& liniar /< '0 '( '2 Odata cu crearea rezultatelor in output& in Data /ditor& in %oaia Data View& gasim noile $ariabile create de SPSS ca urmare a optiunilor e8primate in %ereastra 'urve /timation0 Save& care reprezinta valorile etimate ale $ariabilei dependente '!,1(& valorile rezi)uale '/&&( si limitele in%erioare si superioare ale intervalului de incredere 'L'L si 2'L( pentru %iecare model de regresie ales '/ Am ales ca cel mai bun model de regresie pe cel liniar& pentru ca R SHuare este mare *0&<40, si gradul de semni%icatie al testelor - si t este 0&000 6eci ecuatia de regresie cea mai potri$ita este cea liniara si are urmatoarea %orma. <6 =>?@&A>BC>&A?@D ,nterpretare. la o crestere cu ( 2ectar a supra%etei& productia $a creste cu 243< tone A$(+%2( )ore+(!%e% '' Goe%icientul de corelatie Pearson este egal cu 0<10& ceea ce inseamna ca intre $ariabile e8ista o corelatie directa& puternica& $aloarea acestuia %iind %oarte apropiata de ( Testarea semni%icatiei coe%icientului de corelatie este realizata cu a)utorul tetului t. 7aloarea Sig *2"tailed, corespunzatoare& egala cu 0000 si este mai mica decat 000(& ceea ce inseamna ca sunt sanse mai mici de (> de a gresi daca a%irmam ca intre cele doua $ariabile e8ista o corelatie semni%icati$a '3