Sunteți pe pagina 1din 5

3.8.

Varianța variabilelor statistice

În teoria probabilității și statistică, varianța reprezintă media deviațiilor pătratice a unei


variabile aleatoare de la media sa. Informal spus, măsoară depărtarea valorilor individuale
(aleatoare) dintr-o mulțime, de la media lor. Varianța are un rol crucial în statistică, fiind folosită
în statistica descriptivă, statistica inferențială, testarea ipotezelor, calitatea modelării și metodele
Monte Carlo. Astfel de metode statistice se folosesc pretutindeni în știință. Varianța reprezintă
pătratul deviației standard, al doilea moment central al unei distribuții, și covarianța unei variabile
aleatoare cu sine însuși, fiind adesea reprezentată prin Var(x) sau s2.

Caracteristica statistică desemnează însuşirea, proprietatea, trăsătura comună unităţilor


unei colectivităţi statistice, reţinută în programul statistic pentru a fi înregistrată şi care capătă
accepţiuni sau valori diferite de la o unitate la alta sau de la un grup de unităţi la altul. Exemple
de caracteristici statistice pot fi: vârsta, greutatea, sexul, culoarea ochilor, statutul matrimonial,
naţionalitatea, ocupaţia, cifra de afaceri, nivelul extrasului de cont etc.

Valorile înregistrate de aceeaşi caracteristică la unităţile colectivităţii statistice se numesc


variante.

Caracteristicile statistice se mai numesc variabile statistice deoarece au proprietatea de a-


şi modifica valoarea în timp şi spaţiu de la o unitate la alta. Nivelul de dezvoltare (varianta) este
valoarea observată a unei variabile la o unitate (element) statistică.

Varianța unei variabile aleatoare X este speranța matematică a deviațiilor pătratice de la


media lui X=E[X]

Varianța variabilei aleatorii X este valoarea așteptată a pătratelor de diferență de X și


valoarea așteptată μ.Din definiția varianței putem obține:

σ 2 = Var ( X ) = E ( X 2 ) - μ 2

Această definiție cuprinde variabile aleatoare ce pot fi generate de procese


discrete,continue, mixte sau Cantoriene. Varianța poate fi, de asemenea, definită ca reprezentând
covarianța unei variabile aleatoare cu sine însăși:

Var(X)= Cov(X,X)

Varianta explicata reprezinta variatia variabilei rezultative (Y) datorata influentei


variabilelor factoriale (x1, x2, x3...xk) care arata împrasierea valorilor estimate în jurul mediei
valorilor reale ale variabilei rezultative si se determina dupa relatia:
                        Yx1x2…xk=

O sinteză a tipurilor de variabile studiate într-o populaţie statistică (eşantion), potrivit


scopului cercetării, se prezintă în figura următoare:

Proprietăți:
Când X și Y sunt variabile aleatoare independente:

Var ( X + Y ) = Var ( X ) + Var ( Y )

3.7.Valorile statisticii test KMO si ale statisticii x2

În vederea testării ipotezei de independență dintre variabilele statistice, programul


SPSS( programe informatice specializate) furnizează valorile calculate ale statisticilor test
corespunzatoare.

De exemplu, statistica test x2 este folosită pentru a testa dacă matricea corelațiilor este o
matrice unitate, deci dacă între variabilele respecive există o legătură statistică. Pentru aceasta se
formulează urmatoarele aspecte statistice:

H0 – ipoteza de independență( matricea corelațiilor este o matrice unitate)

H1 – ipoteza de dependență

Pentru testarea acestor ipoteze, programul SPSS furnizează atât valoarea calculată a
statisticii test (x 2 calculat = 1729,304), cât și valoarea probabilității asociate statisticii teste calculate
(Sig).

O valoare Sig < 0,05 asociată valorii cașculate a statisticii test x 2 arată că se respinge
ipoteza H0 și se acceptă H1. Se poate astfel garanta cu o probabilitate de 0,95 că există legături
statistice semnificative între variabilele statistice, că matricea corelațiilor nu este o matrice
unitate.

Valoarea calculată a statisticii test x2 este sensibilă la volumul eșantionului: atunci când n
crește, șansa de a respinge ipoteza nulă este foarte mare. Aceasta nu garantează însă că între
variabile există legături statistice seminificative.

Analiza simultană a rezultatelor obținute în urma testării ipotezei de independență,


folosind statistica test x2 și a valorii determinantului matricei corelațiilor permite identificarea
proprietăților acestei matrice care prezintă interes pentru ACP ( analiza componentelor
principale).

Identificarea existenței legăturilor dintre variabile este facilitată de calculi statisticii


Kaiser-Meyer-Olkin (KMO), măsură a adecvanței eșantionajului. Statistica KMO poate lua valori
in intervalul 0,1. O valoare mai mare decât 0,5 arată că între variabilele statistice există legături
statistice semnificative, deci, analiza componentelor principale poate fi aplicată.

Indicele Kaiser-Meyer-Olkin este folosit pentru a compara dimensiunile coeficientilor de


corelatie observati cu dimensiunile coeficientilor de corelatie partiala. Valori KMO mai mici de
0.50 indica date inadecvate pentru analiza factoriala.
Valoare indice KMO global obtinut prin rularea programului implementat:

KMO Total: 0.7153246887302334

Valori de referință în interpretarea acestui rezultat au fost evidențiate de Kaiser ( 1974) :

 O valoare a KMO mai mică decât 0,5 arată că soluția obținută prin ACP este inacceptabilă

 O valoare a KMO cuprinsă între 0,5 și 0,6 arată că soluția obținută prin ACP este
mediocră

 O valoare a KMO cuprinsă între 0,6 și 0,7 arată că solția obținută prin ACP este
acceptabilă

 O valoare a KMO cuprinsă între 0,7 si 0,8 arată că soluția obținută prin ACP este bună

 O valoare a KMO cuprinsă intre 0,8 și 0,9 arată că soluția obținută prin ACP este foarte
bună

 O valoare a KMO mai mare decât 0,9 arată că soluția obținută prin ACP este excelentă

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling .733
Adequacy.
Bartlett's Test of Approx. Chi-Square 1409.90
Sphericity 5
df 10
Sig. <.001

Valoarea calculată a statisticii test x2, pentru exemplul considerat, este x2=1409,905.
Nivelul de semnificație corespunzător acestei valori este Sig= 0,001; <0.05, deci se respinge
ipoteza H0 și se acceptă ipoteza H1. În această situație, analiza factorială poate fi aplicată asupra
datelor corespunzătoare.

În output-ul de mai sus este prezentată și valoarea calculată a statisticii KMO. Pentru
exemplul dat, s-a obținut o valoare egala cu 0,733 ceea ce arată că există legături statistice între
variabile.

S-ar putea să vă placă și