Sunteți pe pagina 1din 34

GIRU Lecia 8

Elemente de analiz statistic


Terminologii statistice i nelegerea unor elemente fundamentale de statistic
Caracteristicile statistice reprezint nsuirile fenomenelor studiate. Astfel putem deosebi caracteristici variabile ca form de manifestare sau ca nivel de dezvoltare.

Caracteristicile statistice care pot avea mai mult dect o singur valoare cu care variaz n funcie de o serie de factori se mai numesc i variabile statistice iar formele de manifestare ale acestor caracteristici se numesc variante. Variabilele pot fi: dependente dac sunt spuse influenei altor variabile; independente dac sunt variabile ce influeneaz alte variabile; continue dac au un numr infinit al nivelurilor de msurare; discrete dac au un numr finit al nivelurilor de msurare

Elemente de analiz statistic


Scalele de msurare se refer la modalitatea de msurare. Programul SPSS utilizeaz urmtoarele scale de msurare: Scal valorile numerice ale datelor se reprezint pe un interval sau printr- un raport. Exemplu: vrsta, venitul, temperatura, lungimea, timpul de rspuns. Variabilele reprezentate i msurate pe scal trebuie s aib valori numerice. Nominale se utilizeaz atunci cnd valorile datelor unei variabile reprezint valori de ordin neintrinsec n funcie de existena sau inexistena unei caracteristici. Exemplu: apartenena la o anumit categorie de funcii de ncadrare sau sexul: 1 masculin, 2 feminin. Ordinale (de ordin sau de rang) se folosesc atunci cnd valorile datelor reprezint categorii de ordin intrinsec care pot fi puse ntr-o anumit ordine de msurare. Exemplu nivelul de pregtire: sczut, mediu, nalt.

Elemente de analiz statistic Mrimile medii, indicatorii variaiei i asimetriei


Mrimile medii n analiza statistic se utilizeaz foarte frecvent mrimile medii, deoarece pe baza lor se poate exprima ntr-o anumit msur tendina unor fenomene. Acestea sunt: media aritmetic, media armonic, media ptratic i media geometric. Toate aceste medii se pot calcula ca medii simple sau ca medii ponderate.

Elemente de analiz statistic Valorile medii de poziie i de structur


Cele mai frecvent utilizate valori medii de poziie i de structur sunt: mediana, modulul, cuartilele i decilele. decilele Mediana Mediana (Me) reprezint valoarea central a unei serii statistice care mparte termenii unei seriei n dou pri egale. Jumtatea inferioar va conine termenii ale cror valori sunt mai mici dect valoarea medianei iar jumtatea superioar va conine termenii care au o valori mai mari dect valoarea medianei.
Modulul

Modulul (Mo) reprezint valoarea termenului dintr-o serie care are frecvena maxim.

Elemente de analiz statistic Valorile medii de poziie i de structur


Cuartile, decile

Pentru seriile cu asimetrie mare i care au o amplitudine mare a variaiei se calculeaz i ali indicatori de poziie cum sunt: quartilele, decilele, centilele i percentilele. Quartilele sunt acele valori ale termenilor care separ seria n patru pri egale. Deosebim astfel quartila inferioar (Q1) care delimiteaz sfertul inferior (25%) al termenilor, quartila a doua (medie) (Q2) care este egal cu mediana deoarece mparte termenii n dou pri egale (50%) i quartila superioar (Q3) care delimiteaz sfertul superior (75%). n mod similar decilele mpart seria n 10 pri egale iar centilele n 100 de pri egale. Rezult c vor exista 9 decile i 99 centile.

Programul SPSS. Analze i aplicaii


Descrcarea produsului: http//80.96.80.180/decizie
SAU

http//www.comunicare.ro/resurse/SPSS16.0EvalVersion-a.exe

Programul SPSS. Analze i aplicaii


ncrcarea, editarea i transformarea datelor. Componenta Data Editor n SPSS tabela bazei de date este mprit n linii i coloane. Liniile reprezint nregistrrile acesteia sau cazurile (cases) cum sunt denumite n SPSS. Coloanele (cmpurile) reprezint variabilele distribuiei. n celulele de intersecie se afl valorile corespunztoare variabilelor pentru fiecare caz (case).

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame
Analize statisice: O analiz univariant ce poate fi utilizat pentru analiza, practic a oricror date. Totui, o mare parte a cercetrii studiaz relaiile dintre dou sau mai multe variabile. O analiz statistic bivariant complet a datelor, necesit studierea tendinelor fundamentale ale datelor utiliznd tabele i diagrame. Metodele de prezentare a relaiilor bivariante, includ crearea tabelelor de asociere, histograme compuse (diagrame cu bare grupate) i diagrame scatter.

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame
Tipul tabelului sau diagramei, care este cel mai eficient pentru comunicarea relaiilor dintre date, depinde foarte mult de tipul datelor implicate. Dou variabile numerice, n general, vor fi cel mai eficient prezentate sub forma unei diagrame scatter. Dou variabile nominale sunt prezentate sub forma unui tabel de asociere.

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame
Exemplu:

Elaborarea unui tabel de asociere i a unei diagrame cu bare compus. Aceasta va prezenta numrul de barbai i femei care au fost spitalizai sau nu anterior.

Brbai Spitalizai Nespitalizai 20 30

Femei 25 14

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame
1.

Rezolvare: Introducerea datelor

- Definirea variabilelor in modul de lucru Variable View din Data View. - Etichetarea celor dou valori pentru stare_pacient si gen. - Trecerea n modul de lucru Data View din Data Editor. Editor
1.

Ponderarea datelor n funcie de frecven


- Se activeaz Data i se selecteaz Weight Cases... Cases - Se selecteaz frecvena i se bifeaz caseta Weight cases by.

1.

Crearea tabelelor asociate


- Se selecteaz Analyze-Tables- Basic Tables...

1.

Afiarea frecvenelor cu procentaj din numrul total


- Analyze-Tables- Basic Tables...- Statistics...- Tables% - Add Continue OK.

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame
5.

Rezolvare:

Afiarea frecvenelor cu procentaj din suma coloanei


- Analyze Tables - Basic Tables...- Statistics...- Col% - Add Continue OK. Dac se adun procentele de pe fiecare coloan, ele vor nsuma 100%.

6.

Diagrama procentual compus cu bare (suprapuse). - Se introduc cifrele de procentaj (col. numit ColPerCent) pentru ColPerCent
cele dou bare i se pondereaz. - Se selecteaz opiunea Graphs Bar... Stacked Define - Se selecteaz stare_pacient i se activeatz butonul de pe lang eticheta Category Axis i apoi Butonul OK.

Elemente de analiz statistic Relaiile dintre dou sau mai multe variabile Tabele i diagrame

Rezolvare:

7. Histogram compus (diagram cu bare grupate). - Se pondereaz cazurile dup frecvent


Se activeaz Data i se selecteaz Weight Cases... Cases Se selecteaz frecvena i se bifeaz caseta Weight cases by.

- Se selecteaz opiunea Graphs Bar... Clustered Define. Define - Se selecteaz Stare_pacient i se activeatz butonul de pe lang eticheta Category Axis. Axis - Se selecteaz Genul i apoi butonul de pe lng eticheta Define Stacks. Stacks - Se selecteaz % of cases i apoi OK. OK

Elemente de analiz statistic Coeficieni de corelaie Coeficienii de corelaie Pearson i Spearman


Exist

mai muli coeficieni de corelaie. Dar cel mai comun i cel mai folositor este pe departe coeficientul de corelaie Pearson. Pearson Un coeficient de corelaie este o msur numeric sau un indice al grdului de asociere ntre dou seturi de scoruri. Intervalul de valori este de la maximum +1,00, prin 0,00, pn la -1,00. Semnul + indic o corelaie pozitiv, adic scorurile unei variabile se mresc odat cu creterea scorurilor celeilalte variabile. Semnul indic o corelaie negativ, adic n timp ce scorurile unei variabile cresc, scorurile pentru cealalt descresc. Coeficientul de corelaie Pearson presupune o relaie n linie dreapt ntre dou variabile. variabile Diagrama scatter prezint, de regul, datele incluse ntr-un coeficient de corelaie.

Elemente de analiz statistic Coeficieni de corelaie Coeficienii de corelaie Pearson i Spearman


O

corelaie de 1,00 indic o asociere perfect ntre dou variabile. Cu alte cuvinte, o diagram scutter a celor dou variabile va arta c toate punctele sunt coninute de o singur dreapt. O valoare de 0,00, indic faptul c toate punctele din diagrama 0,00 scutter sunt dispersate aleatoriu n jurul oricrei drepte desenate pe aceast diagram a datelor sau sunt aranjate ntr-o manier curbilinie. O corelaie de -0,5 ar indica o relaie moderat negativ ntre cele dou variabile. Coeficientul Spearman este coeficientul de corelaie Pearson aplicat unor scoruri, dup ce acestea au fost ordonate cresctor pentru cele dou variabile n parte. Este folosit atunci cnd premisele coeficientului de corelaie Pearson nu sunt ndeplinite de ctre date. Aceast situaie se petrece, n special, n momentul n care scorurile pentru o variabil au o asimetrie pronunat.

Elemente de analiz statistic Coeficientul de corelaie Pearson


Coeficientul de corelaie Pearson se va utiliza atunci cnd se dorete msurarea valorilor a dou variabile din acelai eantion pentru a se afla dac ntre acestea exist o relaie i care este intensitatea relaiei. Dac relaia exist, vom deosebi dou feluri de corelaie: pozitiv i negativ. Corelaia este pozitiv atunci cnd creterea valorilor unei variabile determin creterea valorilor celeilalte variabile. Corelaia negativ apare atunci cnd creterea valorilor unei variabile determin scderea valorilor pentru a doua variabil. Felul corelaiei se exprim prin semnul coeficientului de corelaie Pearson (r), iar intensitatea legturii dintre cele dou variabile se exprim prin valoarea acestuia. Cu alte cuvinte atunci cnd avem o valoare pozitiv a lui r spunem c ntre variabile exist o corelaie pozitiv i invers. Cu ct valoarea lui r este mai mare cu att legtura dintre variabile este mai puternic. puternic

zx z y
i =1

Elemente de analiz statistic Coeficientul de corelaie Pearson


Expresia coeficientului de corelaie este: unde r este coeficientul de corelaie pentru variabilele x i y; N

z z
i =1 x

zx este scorul z al variabilei x; zy este scorul z al variabilei y;


N este volumul eantionului.

r=

Este de reinut faptul c valorile lui r pot varia doar n intervalul [-1, +1]. Numrul gradelor de libertate df = N 2. Atunci cnd se analizeaz corelaia se va 2 alege i un nivel de risc acceptat (n mod convenional 5%) sau un nivel minim de ncredere (n mod convenional 95%). O reprezentare grafic interesant a corelaiei poate fi obinut n SPSS prin intermediul unui grafic de tip Scatter Plot.

Elemente de analiz statistic Coeficienii de corelaie Pearson i Spearman


Exemplu:

Calculul corelaiei Pearson, o diagram scutter i coeficientul de corelaie Spearman pentru scorurile abilitilor muzicale i matematice a 10 copii.
Scoruri_muzicale
2 6 4 5 7 7 2 3 5 4

Scoruri_matematice
8 3 9 7 2 3 9 8 6 7

Elemente de analiz statistic Coeficientul de corelaie Pearson


1.

Rezolvare: Introducerea datelor

- Definirea variabilelor in modul de lucru Variable View din Data View. - Trecerea n modul de lucru Data View din Data Editor. Editor
1.

Corelaia Pearson
- Analyze Correlate Bivariate... - Se selecteaz mpreun sau separat Scoruri_muzicale i Scoruri_matematice i se introduc n lista de variabile, apoi clic pe butonul OK. OK

3.

Interpretarea output-ului
Corelaia dintre cele dou scoruri este de - 0,900. La un test de 0,900 semnificaie, 2-tailed la nivelul de probabilitate este de 0,001 sau mai mic, corelaia este statistic semnificativ. Numrul cazurilor pe care este bazat corelaia este 10. 10

Elemente de analiz statistic Coeficientul de corelaie Pearson

Elemente de analiz statistic Coeficientul de corelaie Pearson


4. Raportarea output-ului

Corelaia dintre abilittile muzicale i cele matematice este - 0,900. Se obijnuiete s se rorunjeasc cu dou zecimale, 0,900 deci va deveni - 0,90. Acesta este un rezultat mai mult dect 0,90 precis pentru majorarea msurtorilor psihologice. Nivelul de semnificaie exact, cu trei zecimale, este 0,000. 0,000 nseamn c nivelul de semnificaie este mai mic dect 0.001. 0.001 Nu folosii un ir de zerouri, deoarece deruteaz. ntotdeauna schimbai ultimul zero n 1. Aceasta nseamn c nivelul de semnificaie poate fi raportat ca fiind p < 0,001.

Elemente de analiz statistic Coeficientul de corelaie Pearson

Se obinuiete s fie prezentate gradele de libertate (df) n df locul numrului de cazuri, cnd se prezint corelaiile. Gradele de libertate sunt egale cu numrul de cazuri minus 2, 2 adic 8 pentru aceast corelaie. Nu este nimic greit n a raporta numrul de cazuri n schimb. ntr-un raport se scrie: Exist o relaie negativ semnificativ ntre abilitile muzicale i cele matematice. (r = - 0,90, df = 8, p < 0,001.). Copiii cu nivel ridicat la abiliti muzicale au nivel sczut la abiliti matematice.

Elemente de analiz statistic Coeficientul de corelaie Spearman


1.

Rezolvare: Introducerea datelor

- Definirea variabilelor in modul de lucru Variable View din Data View. - Trecerea n modul de lucru Data View din Data Editor. Editor
1.

Corelaia Spearman
- Analyze Correlate Bivariate... - Se selecteaz mpreun sau separat Scoruri_muzicale i Scoruri_matematice i se introduc n lista de variabile. - Se selecteaz opiunea Spearman i apoi clic pe OK. OK

3.

Interpretarea output-ului
Coeficientul de corelaie Spearman ntre Scoruri_muzicale i Scoruri_matematice este - 0,894. Nivelul de semnificaie, lund n calcul dou ipoteze este 0,001 sau mai mic, deci corelaia este statistic semnificativ. Numrul cazurilor este 10.

Elemente de analiz statistic Coeficientul de corelaie Spearman

Elemente de analiz statistic Coeficientul de corelaie Spearman


4. Raportarea output-ului

Corelaia raportat cu dou zecimale este - 0,89. 0,89 Probabilitatea de a obine aceast corelaie din ntmplare este mai mic de 0,001 (p < 0,001). 0,001 ntr-un raport se scrie: Exist o relaie negativ semnificativ ntre abilitile muzicale i cele matematice. (Coeficientul Spearman = - 0,90, DF = 8, p < 0,001). Copiii cu nivel ridicat la abiliti muzicale au nivel sczut la abiliti matematice i invers.

Elemente de analiz statistic Diagrama scatter

Rezolvare:

1. 2.

Se selecteaz Graphs Scatter Define. Define n fereastra Simple Scatterplot, pentru a avea variabila Scoruri _muzicale ca ax vertical, se selecteaz i se apas butonul de lng caseta YAxis. YAxis n fereastra Simple Scatterplot, pentru a avea variabila Scoruri_matematice ca ax orizontal, se selecteaz i se apas butonul de lng caseta X Axis. Axis Se apas butonul OK. OK

2.

4.

Elemente de analiz statistic Diagrama scatter

Elemente de analiz statistic Diagrama scatter


Interpretarea output-ului

n diagrama scatter, rspndirea punctelor este relativ ngust, ceea ce indic o corelaie mare. Forma mprtierii rezultatelor este relativ n linie dreapt indicnd mai degrab o relaie n linie dreapt dect o relaie curbilinie. Linia este de la colul stnga sus pn n dreapta jos, ceea ce indic o corelaie negativ. Dac relaia este curbilinie, atunci corelaiile Pearson i Spearman pot fi neltoare.

Elemente de analiz statistic Diagrama scatter


Raportarea output-ului

Nu ar trebui s raportai niciodat un coeficient de corelaie fr a examina diagrama scatter, din cauza unor probleme cum ar fi relaiile curbilinii sau valori atipice. Am putea scrie: A fost examinat o diagram scatter pentru relaia dintre abiliti_muzicale i abiliti_matematice. Nu exist nicio dovad privind o relaie curbilinie sau asupra influenei avute de rezultate atipice. atipice

Elemente de analiz statistic Coeficienii de corelaie Pearson i Spearman


Exemplu:

Se dorete s se afle dac rezultatele obinute de 9 studeni la un test aplicat pe parcurs, influeneaz notele lor finale la examen.

Numr de puncte obinute la test (variabila x) 230,00

Elemente de analiz statistic Coeficientul de corelaie Pearson


Raportarea output-ului Coeficientul de corelaie Pearson calculat pentru cele dou variabile este r = 0,976. Valoarea acestuia arat c ntre cele 0,976 dou variabile exist o legtur puternic i o corelaie pozitiv. Graficul Scatter red foarte sugestiv aceste informaii. n concluzie se poate afirma c studenii care au obinut un numr mare de puncte la test au obinut note mari la examenul final. final

Elemente de analiz statistic Coeficientul de corelaie Pearson

Elemente de analiz statistic Coeficientul de corelaie Pearson


350,00

300,00

250,00

x200,00

150,00

100,00

50,00 6,00 7,00 8,00 9,00 10,00