Sunteți pe pagina 1din 4

CORELATIA Corelatia este o metoda statistica utilizata pentru a determina relatiile dintre doua sau mai multe variabile.

Exista mai multe tipuri de corelatii att parametrice ct si neparametrice. Coeficientul de corelatie este o valoare cantitativa ce descrie relatia dintre doua sau mai multe variabile. El variaza ntre (-1 si +1), unde valorile extreme presupun o relatie perfecta ntre variabile n timp ce 0 nseamna o lipsa totala de relatie liniara. O interpretare mai adecvata a valorilor obtinute se face prin compararea rezultatului obtinut cu anumite valori prestabilite n tabele de corelatii n functie de numarul de subiecti, tipul de legatura si pragul de semnificatie dorit. Principalele doua conditii ce trebuie a fi ndeplinite pentru a utiliza probe parametrice sunt: 1. distributia normala a variabilei de interes din cadrul esantionului cercetarii; 2. omogenitatea dispersiei esntionului cercetarii referitor la variabila supusa studiului. Probele parametrice sunt preferate n cazul ndeplinirii acestor conditii deoarece sunt mai solide, ceea ce nseamna cresterea sansei de a respinge o ipoteza falsa. Aceste conditii pot fi verificate prin localizarea mediei n cadrul distributiei normale a datelor ct si prin calcularea indicatorilor de omogenitate a esantionului cercetat. Exista mai multe tipuri de corelatii parametrice. Pe parcursul acestui subcapitol ne vom opri la: - coeficientul de corelatie simpla (Bravais-Pearson); - coeficientul de corelatie partiala; - coeficientii de corelatie biserial si triserial. Coeficientul de corelatie simpl r n acest tip de corelatie sunt implicate doua variabile numerice care ndeplinesc conditiile parametrice. Pentru fiecare subiect avem doua rezultate. Calculul coeficientului de corelatie simpla (Bravais-Pearson) implica abaterile relative ale rezultatelor din cele doua distributii fata de mediile corespunzatoare. Exista mai multe formule de calcul n acest sens. Una din formulele de calcul a lui r este: Pragul de semnificaie este probabilitatea ca noi am considerat diferenele semnificative, dar ele sunt ntmpltoare. Atunci cnd susinem c diferenele sunt semnificative la nivelul de semnificaie 5%, sau p< 0,05; avem n vedere c probabilitatea ca ele s fie neadevrate este 0,05, sau altfel spus greim n 5 cazuri la sut.

Parametrii tendinelor central

Datele brute acumulate prin diferite metode de cercetare nu ne dau o informaie complet, general despre fenomenul studiat. Repartiia statistic la fel nu ne poate spune nimic despre fenomenul studiat. Prelucrarea statistic iniial permite exprimarea sintetic a ansamblului de date, servindu-se de anumite valori numerice. Primele valori care exprim centrul de concentrare a valorilor: media mediana i modul.

Media aritmetic (M) este o singur cifr care sintetizeaz toate valorile unei distribuii. Tendina central nu este necesar s se situeze neaprat n centrul axei pe care nsemnm limitele reale ale distribuiei de frecvene. Tendina central este situat acolo unde tind s se situeze toate valorile centrale. De la bun nceput media pare un indicator foarte intuitiv parc ar prea c nu ai ce spune despre ea, ns ea poate fi originea multor confuzii. Media este un indicator ce caracterizeaz o colectivitate din punct de vedere al unei caracteristici cu diferite niveluri individuale. Ea sintetizeaz ntr-o singur expresie cantitativ toate nivelele individuale concrete ale caracteristicii i exprim ceea ce este esenial i tipic n dezvoltarea caracteristicii pentru o anumit colectivitate. Mnd este urmtorul indicator al tendinei centrale. Mediana este acel parametru care prin poziia sa, se afl n mijlocul seriei de date. Ea reprezint punctul central al seriei, deoarece la stnga si la dreapta ei se situeaz cte 50% din totalitatea datelor. Mediana coincide cu media, n cazul unei distributii teoretice normale i se ndeparteaza mult de aceasta daca distributia este asimetrica. Pentru a calcula mediana n cazul distributiei simple a datelor exist doua situatii: cnd n este impar locul medianei se stabileste astfel: loc mediana = (n+1) / 2 cnd n este par sunt adunate valorile din centrul seriei si se mpart la doi. Sigur c sunt date cu elemente neomogene care prezint o diferen foarte mare ntre valorile lor extreme, aceste diferene sunt agravate de faptul c elementele lor au tendina de a se grupa mai mult la o extrem dect la cealalt. Aceste distribuii sunt asimetrice. n acest caz s inem cont de toate datele dar totodat s nu fie influenat de datele extreme.

Modul este parametrul care corespunde celei mai mari frecvente, adic este valoarea cea mai frecvent ntlnita. Astfel, pentru irurile de date simple modul se afla cutnd valoarea cel mai des ntlnita. Pentru irul dat drept exemplu: X = (4, 8, 6, 7, 9, 11, 9, 9, 12, 7). Dupa ordonarea datelor obinem X = (4, 6, 7, 7, 8, 9, 9, 9, 11, 12). Se observa ca valoarea cea mai ntlnit este 9 (apare de trei ori). Ca urmare modul pentru acest sir este: Mo = 9 Caracteristicile mediei: tine seama de toate cazurile si este afectata de valorile lor; poate fi calculata fra ordonarea prealabila a datelor. Caracteristicile medianei: tine seama de toate cazurile, dar nu este afectata de cazurile (valorile) extreme; necesita ordonarea irului de date. Caracteristicile modului: nu tine seama dect de masurile cele mai reprezentative; necesita ordonarea datelor corespunde unuia sau mai multor elemente ale seriei (n caz de frecvente egale).

Indicatori ai imprastierii datelor Amplitudinea Este un parametru care arat distana dintre valoarea minim si valoarea maxim din cadrul unui ir de date: A = (Xmax Xmin) Acest indicator este cel mai simplu de calculat dar i cel mai grosier, deoarece ine seama numai de termenii extremi. Abaterea standart sau abaterea medie ptratic se exprim n unitile de msur ale caracteristicii studiate. Ca urmare al acestui fapt acest indicator nu poate fi folosit pentru compararea gradului de variaie a unor caracteristici exprimate n uniti de msur diferite. Abaterea medie ptratic se calculeaz ca o medie ptratic din abaterile valorilor individuale de la media aritmetic.

Nu este foarte util n statistica descriptiv, fiind ns foarte important n statistica inferential. Dispersia este ptratul abaterii standard. Chiar i notaiile pentru dispersie sunt: s pentru dispersia populaiei, S pentru dispersia eantionului si s pentru dispersia eantionului utilizat pentru estimarea dispersiei populaiei. Formulele dispersiei pentru aceste situaii sunt aceleai cu cele pentru abaterea standard doar se elimin rdcina ptrat.

Media aritmetic (M) Mediana (Mdn) Modul sau valoarea modal (Mo) Amplitudinea (A) Dispersia (D ptrat) Abaterea standard (D) Coeficientul de variaie (V) Coeficientul de asimetrie sau oblicitate (K) Coeficientul de boltire