Sunteți pe pagina 1din 7

Traian Rotariu, Gabriel Bădescu, Irina Culic, Elemer Mezei, Cornelia Mureşan, Metode Statistice

aplicate în ştiinţele sociale, Editura Polirom 2000

Frecvenţe: dacă tre să determinăm numărul de ţări dintre toate statele lumii care sunt: dezvoltate,
mediu dezvoltate şi slab dezvoltate, înseamnă că trebuie să găsim câte ţări sunt din prima categorie,
câte din a adoua şi câte din a treia (căutarea frecvenţelor caracteristicii respective pentru populaţia
luată în obiectivul cercetării, sau a numărului de indivizi statistici care populează fiecare clasă a
caracteristicii)

Cap. 3 Indicatori ai caracteristicilor cantitative

Indicatori= valori ataşate variabilelor statistice cantitative, prin intermediul cărora se încearcă
exprimarea, de o manieră sintetică, a informaţiilor conţinute în distribuţia de frecvenţe respectivă.

1. Indicatori de poziţie (de nivel, ai tendinţei centrale) redă într-o singură valoare
numerică, nivelul general al valorilor seriei sau ordinul de mărime al acestor valori. Spre exemplu
media: valoare care se obţine împărţind suma valorilor tuturor indicatorilor din populaţie la numărul
acestora, valoare comună pe care ar trebui să o ia fiecare individ din populaţie, astfel încât să păstreze
neschimbată suma valorilor. Proprietăţi: 1. media este o valoare cuprinsă în intervalul ale cărui capete
le constituie valoarea minimă şi maximă ale seriei de valori, 2. val medie a unei populaţii descompuse
în s subpopulţii este media mediilor din subpopulaţii, ponderate cu mărimea fiecărei subpopulaţii, 3.
media e o unitate de măsură exprimată în aceeaşi unitate de măsură în care sunt exprimate şi valorile
variabilei respective, 4. suma abaterilor valorilor de la medie este nulă, 5. media aritmetică rămâne
neschimbată dacă frecvenţele se * sau se / cu acelaşi număr, 6. valoarea medie poate fi calculată chiar
dacă nu cunoaştem distribuţia caracteristicilor, ci numai suma valorilor. Media este relevantă dacă
populaţia este omogenă.
Mediana: valoarea mediană este cea care are în stânga sa tot atâtea valori cât şi în dreapta sa.
Se poate determina numai când şirul de valori e fără soţ, altfel considerăm cele două valori mediane,
din care facem media aritmetică
Modul este valoarea luată cu cea mai mare frecvenţă, valoarea ce caracterizează individul
tipic al populaţiei. Pt variabilele continue, tre să se construiască intervale de valori, apoi să se
găsească intervalul modal, adică a intervalului cu cea mai ridicată frevenţă. Există distribuţii
plurimodale (graficele au mai multe cocoaşe) şi unimodale.
Ordinea acestora este cea din dicţionar: MEDIA (1/3) < MEDIANA< (2/3)MODUL

2. Indicatori de dispersie(împrăştiere, variaţie)

Urmăresc să măsoare gradul de împrăştiere a indivizilor în cadrul seriei de valori pe care


aceştia le iau. Ei caracterizează o populaţie statistică din punctul de vedere al
omogenităţii/eterogenităţii în raport cu o variabilă dată.
Amplitudinea se calculează ca diferenţă dintre cea mai mare şi cea mai mică valoare.
Această valoare nu are o acurateţe prea mare pt că se iau în calcul douar două valori, care pot fi mult
diferite de seria celorlalte valori, deci care nu reflectă în mod real situaţia din populaţie.
Abaterea intercuartilă Cuartilele sunt valorile care corespund indivizilor statistici aflaţi pe
acele poziţii –în ierarhia formată pornind de la cel cu valoarea cea mai mică la cel cu valoarea cea mai
mare, care împart mulţimea indivizilor în patrru părţi egale- (Xmin, Q1), (Q1, Q2), (Q2, Q3), (Q3,
Xmax. A doua cuartilă, Q2 este chiar mediana)
Abaterea intercuartilă este I=Q3-Q1
Indicele de împrăştiere al lui Gini este media aritmetică a diferenţelor dintre toate perechile
de valori, diferenţe luate în valoare absolută
Abaterea medie
Ex: avem 5 note: 5,6,7,9,10.

1
Mediana este 7, abaterile de la ea vor fi 5-7=2, 6-7=1, 7-7=0, 7-9=2, 7-10=3, deci Am(Me)=
(2+1+0+2+3):5=8:5=1,6
Media este 7,4 abnaterea medie este (2.4+1.4+0.4+1.6+2.6):5=8.4:5=1,68 note, valoare mai
mare decât cea a abaterii de la mediană
Abaterea standard (deviaţie standard, dispersie) (este o măsură a gradului de
eterogenitate, diversitate, inegalitate, pentru indivizii ce formează populaţia respectivă) sau abaterea
medie pătratică se calculează prin ridicarea la pătrat a diferenţelor dintre valorile individuale şi o
mărime constantă, arbitrar aleasă, a, urmată de însumarea pătratelor respective şi de raportarea la
numărul cazurilor observate, adică n. Cea mai mică abatere standard este cea faţă de medie. Pătratul
indicatorului poartă denumirea de varianţă.
Proprietăţi:
- dacă valorile variabilei se înmulţesc cu o constantă, a, atunci şi abaterea standard se
multiplică cu aceeaşi valoare
- dacă la valorile variabilei se adună sau se scad o aceeaşi valoare, abaterea standard rămâne
nemodificată
Teorema de descompunere a varianţei S-a constatat că dacă populaţia statistică este
concepută ca fiind formată dintr-o mulţime de grupuri, atunci media generală a caracteristicii este
egală cu media mediilor la nivelul fiecărui grup. Astfel, varianţa totală se descompune în suma
varianţei intragrupale şi a celei intergrupale
Coeficientul de variaţie arată ce fracţiune din medie corespunde unei abateri standard. Cu
cât coef e mai aproape de 0, cu atât grupurile sunt mai omogene

3. Indicatori ai formei distribuţiei

Forma distribuţiei:
- în ce măsură distribuţia se abate de la cazul-limită al simetriei în jurul valorilor centrale
(distribuţia normală ideală). Pentru aceată problemă se introduc indicatori ai oblicităţiii
- În ce măsură distribuţia este mai plată sau mai boltită, se exprimă prin indicatori ai boltirii,
sau de exces
Indicatorii de oblicitate (skewness) oblicitatea distribuţiei, în sensul de deplasare spre
stânga sau spre dreapta a valorii modale, generează poziţii şi distanţe diferite între indicatorii tendinţei
centrale, adică între medie şimod. Indicatorul propus de Pearson. Valoarea este nulă pt distribuţii
simetrice, pozitivă pt curbe înspre dreapta, negativă pt curbe spre stânga
Indicatori ai boltirii (kurtosis) exprimă înălţimea cocoaşei curbei, comparativ cu cea
normală. Valorile pozitive indică distribuţii leptocurtice (cu cocoaşa înaltă) şi valorile negative, cele
platicurtice (cu cocoaşa aplatizată).

Cap. 4 Elemente de teoria probabilităţilor

Noţiuni elementare:
- experienţă (acţiune ce se poate repeta de multe ori, în condiţii identice: datul cu zarul)
- proba (fiecare dat cu zarul)
- cazul (rezultatul: ce cifre ies), mulţimea tuturor rezultatelor posibile e E
- evenimentele sunt afirmaţii legate de rezultatul unei probe a unui experiment
- ev imposibil e ev caracterizat de mulţimea vidă, ev sigur e notat cu E şi se prod pt toate
probele experienţei. A şi B sunt incompatibile dacă A intersectat cu B e mulţimea vidă. Ev
care apare când apare A şi nu apare B este A\B. A include B înseamnă că producerea lui A
atrage după sine producerea lui B.
- Frecvenţele relative se obţin prin împărţirea frecvenţelor de apariţie la numărul de probe
efectuate

2
Teoria probabilităţii pleacă de la convingerea că există o valoare-limită a frecvenţei
relative de apariţie a unui eveniment, pentru un număr mare de probe. Deci, pt fiecare
experienţă există o funcţie, numită probabilitate, definită de mulţimea tuturor evenimentelor cu
valori (0,1), interval dat de frecvenţa relativă de apariţie a evenimentului respectiv.
Distribuţia de probabilitate a unei variabile se referă la probabilităţile de apariţie a diferitelor
valori posibile ale apariţiei.
Schema hipergeometrică ? p. 69
Schema binominală? P.70

Distribuţia normală: reprezentarea grafică a cărei distribuţii este o curbă de forma unui
clopot , simetrică faţă de centrul dat de valoarea lui m (media distribuţiei) şi a cărei formă este
determinată de valoarea abaterii standard a distribuţiei. Importanţa acestei curbe este accea că
aproximează distribuţiile multor variabile întâlnite în aplicaţiile din ştiinţele sociale. Se mai utilizează
în multe metode de inferenţă statistică, premiţându-ne să estimăm valorile anumitor indicatori pentru
variabile, cu o eroare stabilită şi un risc de a greşi mic. Distribuţia normală de parametrii a cărei medie
este 0 şi a cărei abatere standard este 1, se numeşte distribuţie normală standard.

Probabilităţi condiţionate
Definim evenimentele A şi B ca fiind independente dacă P(Aintersectat cu B)=P(A)xP(B)
(realiy ev A nu infl ev B)
Dacă unul din ev ar infl celălalt ev, atunci acest ev ar tre să se realiz, ca secvenţă de timp,
înaintea celuilalt ev. … Probabilitatea evenimentului B, în ipoteza realizării lui A

Teorema lui Bayes


Având un câmp de probabilitate (E, P(E), P), finit sau infinit, discret sau continuu, un
eveniment oarecare posibil, A (P(A)>0), şi un ev oarecare B, numim probabilitatea lui B condiţionată
de A, valoarea notată cu P(B/A)=P(Aintersectat cu B)/P(A). Se observă că dacă evenimentele sunt
independente, atunci P(B)=P(B/A)

Teorema probabilităţii condiţionate Având (E, P(E), P) un câmp de probabilitate, Ai


(i=1,2,...n) uun sistem complet de evenimente (două câte două se exclud şi reuniunea cu Ai egal E) şi
B un ev oarecare, atunci:
P(B)= P(A1)xP(B/A1)+ P(A2)xP(B/A2)+ ................P(An)xP(B/An)

Cap. 5 Eşantioanarea

Eşantionarea sau selecţia reprezintă setul de operaţii cu ajutorul cărora, din ansamblul
populaţiei vizate de cercetare, se alege o parte, numită eşantion, parte ce va fi supusă în mod
nemijlocit investigaţiei. Alegerea tre făcută aî, prin intermediul acestui studiu redus, să se obţină
concluzii cu valabilitate generală, adică dând seama de întreaga populaţie. Eşantionarea este o
realitate impusă, nu numia datorită costurilor mai mici, dar şi pt că investigarea întregii populaţii este
absurdă.
Eşantionul tre să fie reprezentativ, capacitatea lui de a reproduce cât mai fidel structurile şi
caracteristicile populaţiei din care este extras.
Erori de eşantionare:
- în loc să culegem date de la toţi indivizii, le culegem numai de la o parte a acestora.
- Erori datorate persoanelor care culeg informaţia
d, eroarea maximă, ce exprimă diferenţa cea mai mare acceptată dintre o valoare v* găsită în
eşantion şi valoarea v găsită în populaţie (de exemplu ne spune cu cât se poate abate media de vârstă a
indivizilor din eşantion de media de vârstă a indivizilor din populaţie). Se mai poate calcula în funcţie
de abaterea standard, indicator de dispersie... Nu se poate vorbi de reprezentativitate în general, ci
numai în raport cu o caracteristică dată

3
P, nivel de probabilitate sau de încredere, care arată ce şanse sunt ca eroarea reală comisă, atunci
când valoarea v (fireşte, necunoscută) este aproximată prin v*, să nu depăşească limita d. Pentru
nivelul de probabilitate, nivelul minim acceptat este de 0,95, ceea ce înseamnă că şansele de a greşi
estimarea nu trebuie să fie mai mari de 5%.
Reprezentativitate unui eşantion este cuplul d, P. Cele două mărimi, d şi P nu sunt independente.
Cu toate acestea, în condiţii egale, scăderea erorii antrenează scăderea probabilităţii. Nu putem
ameliora simultan şi precizia estimării, şi siguranţa acesteia, restul condiţiilor fiind identice.
Reprezentativitatea este o noţiune relativă. Gradul de reprezentativitate al unui eşantion dep de :
- caracteristicile populaţiei (pt estimarea unor caracteristici ale unei pop omogene va fi nevoie
de un nr mai mic de indivizi. Pt a caracteriza niv de omogenitate al unei pop se fol indicatorul
de dispersie: abaterea standard) Eroarea de eşantionare e dp cu abaterea standard.
- mărimea eşantionului: cu cât mărimea e mai mare, cu atât reprezentativitatea e mai mare, dar
nu într-o rel dp. Reprezentativitatea atinge repede un niv ridicat, aî nu e necesară o creştere f
mare a eşantionului. Mărirea eşantionului se face de obicei pt a creşte reprezentativitatea în
cadrul subpopulaţiilor.
- tehnicile de eşantionare
eşantioane aleatoare, probabilistice: alegerea se face într-o manieră pur
întâmplătoare, se elimină intervenţia subiectivă. Fiecare individ are om şansă
calculabilă şi nenulă de a fi inclus în eşantion. Reprezentativitatea
eşantionului se poate calcula numai pt eşantioanele strict probabilistice.
Fiecare tehnică de eşantionare aleatoare pp formul specifice de estimare a
erorii.
eşantioane nealeatoare
1. eşantioanarea simplă aleatoare se procedează prin tragere la sorţi: tabele cu numere
întâmplătoare: se generează serii lungi de numere de 4,5,6, sau maimulte cifre, numerele sunt
dispuse întâmplător. Cercetătorul are o listă cu indivizii din populaţie, fiecare ind primeşte un
nr de la 1 la N
2. eşantionarea prin stratificare Se porneşte de la o divizare a populaţiei după un criteriu, o
caracteristică A, în s clase de efective: N1, N2, ..... Ns, cifre care prin însumare dau efectivul
total al populaţiei. Întrucât este greu să se stab un singur crit după care să se facă eşantionarea,
aceasta ia în calcul împărţirea pop după mai multe crit, cum ar fi cel de vârstă, sex, ocupaţie,
niv de şcolarizare. Acest tip de eşantion e mai reprezentativ decât cel aleator, pt că e ales pe
anumite criterii căutate
3. eşantionarea multistadială: într-un prim stadiu se alege un eşantion de grupuri de cel mai înalt
rang, apoi, din fiecare dintre acestea, un eşantion de rang 2, etc.În final se va alege un
eşantion de indivizi, care, de cele mai multe ori, cuprinde întreg efectivul ultimului eşantion
de grupuri. Scopul principal este reducerea costurilor şi timpului de cercetare. Este însă mai
puţin reprezentativ decât unul simplu aleator
Estimarea valorilor medii se face prin
- extragerea a mai multor subeşantioane şi calcularea mediilor acestora. Dacă media lor este
aceeaşi cu cea din populaţie, atunci eşantionul este corect alcătuit.
- Dacă eşantionarea e simplă aleatoare, abaterea standard a variabilei este de radical din n ori
mai mică decât abaterea standard a variabilei x. (mărind eşantionul se măreşte concentrarea
valorilor mediei din eşantioane de cea din populaţie)
- Distribuţia valorilor variabilei mediei din eşantion urmează o curbă normală (Gauss)
- Abaterea standard a variabilei x în populaţie este suficient de bine aproximată de abaterea
standard a aceleiaşi variabile într-un eşantion oarecare.
Ex: PP că avem un eşantion de 1600 de persoane, frecvenţa cu care se declară votul pt un p este
de 20%. Pt a calcula reprezentativitatea , mai întâi se estimează eroarea standard ( e 1%, după o
formulă?), apoi se alege un nivc de probabilitate P e 95%, căruia îi coresp o eroare max de 2e. Se
trage concluzia că există 95% şanse ca p respectiv să aibă, în întreaga populaţie, un procent de
susţinători cuprins între 18% şi 22%
- pt eşantionarea simplă aleatoare nerepetate (fără reintroducerea în urnă a individului extras)
p.100
- pt eşantionarea prin stratificare p.101

4
Teste de semnificaţie

Probl semnif diferenţei dintre 2 mărimi se pune atunci când se compară 2 valori, dintre care
cel puţin 1 este obţinută printr-o procedură de cercetare selectivă.
Teste de semnificaţie pentru eşantioane mari:
- Testul Z sau T se aplică în cazul eşantioanelor mari şi serveşte la testarea semnificaţiei
diferenţei dintre 2 mărimi sau la testarea unei mărimi (dacă ea este sau nu semnificativ
diferită de 0)
- Testarea semnificaţiei diferenţei dintre 2 medii sau proporţii
1. când 1 dintre mărimi este calculată la nivel de populaţie şi cealaltă la nivel de eşantion. Z nu este
altceva decât nr de erori standard. Dacă Z e mai mare de 2, mai exact de 1,96, atunci diferenţa este
semnificativă la nivelul de probabilitate de 0,95, adică 95%. Dacă Z depăşeşte valoarea de 2,6, atunci
diferenţa este semnificativă la nivelul de 0,99, iar când Z trece de 3,3 diferenţa este semnificativă la
nivelul de 0,999. Acestea sunt cele 3 praguri de probabilitate cel mai des utilizate
One sample statistics
N (nr de oam in Mean St. Deviation Std. Error Mean
esantion) (media) (abaterea (eroarea standard
standard) a var rezident)
REZIDENT 1298 .5470 .4980 1.4E-2
One –Sample test
Gradele de liberatate ale
eşantionului Test Value=0.543
95% Confidence Interval
of the Difference
Df Sig(2- Mean (intervalul de confidenţă
T (Z)
(N-1) tailed) difference pentru niv de încredere de
95%)
Lower Upper
REZIDENT .289 1297 .773 3.995E-03 -2.E-02 3.1E-02
(77.3%)

Sunt 77.3% şanse pentru a obţine valoarea 0,289pentru T, în ipoteza că cekle două valori sunt egale
Pentru intervalul de confidenţă: acesta se înmulţeşte cu 100 şi rezultă că este situat în intervalul –0,02
şi 0,31. Întrucât conţine valoarea 0, deci e posibil ca diferenţa dintre cele 2 medii să fie 0, deci nu
putem respinge ip ca cele 2 valori să fie egale
(simbolul E-02 înseamnă înmulţit cu 10 la –2. Ex: 4,1 E2 înseamnă 410)

2. Pentru compararea a două mărimi medii, respectiv proporţii. Dacă nivelul de probabilitate
depăşeşte valoarea de 0,95 se respinge ipoteza nulă, ipoteză care , în cazul de faţă, înseamnă că
mediile sau proporţiile celor 2 populaţii (din care s-au extras eşantioanele ale căror valori se compară)
sunt identice sau, altfel spus, că cele 2 eşantioane provin din aceeaşi populaţie.
Ex: pp că într-o anchetă s-a studiat câte un eşantion din 2 judeţe şi s-a stab că în cazul primului , pe
un eş de 700 de oam 25,8% votau cu X, iar pe al doilea, pe un eş de 1300 pt X votau 21,3%. Există o
diferenţă de atitudine? Ipoteza nulă este pp că populaţiile celor 2 judeţe sunt identice, din punctul de
vedere analizat, şi că diferenţa dintre procentele 25,8 şi 21,3 se datorează fluctuaţiilor normale de
eşantionare. După calcule ajungem la T=2,25, deci se depaseste val critică de 1,96%, pt pragul de
probabilitate de 0,95. P este 0.9756, deci vom respinge ipoteza nulă pt că există 97,56% şanse ca
realmente în prima populaţie partidul nostru să aibă mai mulţi aderenţi decât în a doua.

Testarea semnificaţiei coeficientului de corelaţie


Trebuie să se testeze valorile mici ale coeficientului de corelaţie, adică dacă se obţine pe
eşantion o anumită corelaţie, ea se regăseşte (cu acelaşi semn) la nivelul populaţiei.

5
Testul hi pătrat p.108

Teste de semnificaţie pentru eşantioane mici:

Testul t Este corespondentul testului Z, utilizabil în judecarea diferenţelor dintre 2 valori medii sau
proporţii, pt cazul când numărul indivizilor din eşantion este mic (nu mai mare de 60), t= (a-b)/e
A şi b sunt cele 2 valori care se compară, dintre care cel puţin una e obţinută pe eşantion, iar e este
eroarea standard, calculată la fel ca mai înainte, numai că la numitor se pune n-1 în loc de n

Semnificaţia coeficienţilor de corelaţie se pune cu mult mai multă acuitate în cazul eşantioanelor
mici...?
Testul Fisher
Procedură prin care se decide dacă dispersia unei caracteristici este diferită în 2 populaţii
reprezentate prin 2 eşantioane mici.

Cap. 6 Asocierea caracteristicilor calitative

Metodele statistice se împart în nonparamertice (calitative, având la baza caracteristici


construite pe scala nominală sau ordinală) şi cele parametrice, (cantitative, când se lucrează cu
caracteristici construite pe scale de intervale sau de rapoarte).
Asocierea este realizată atunci când distribuţia simultană a indivizilor statistici după 2 sau mai
multe caracteristici calitative, adică variabile nominale sau ordinale. (asocierea este sinonimă cu
contingenţa –grup de oameni având o compoziţie omogenă-). Asocierea evidenţiază comportamentul
simultan al indivizilor faţă de cele 2 variabile, induce oarecum ideea de abordare simetrică a factorilor
studiaţi.
Un tabel de contingenţă este cel în care ne permite analiza comportamentului indivizilor în
funcţie de o variabilă, în măs în care, după cealaltă var, sunt identici.
Etapele asocierii:
- analiza bivariată (asocierea a 2 caracteristici)
o 2 caracteristici (dihotomice)
O caracteristică dih e una care decupează din mulţimea indivizilor pe aceia care posedă o anumită
proprietate, distingându-i de cei care nu o posedă.
De ex. sexul, şi orice var calitativă. Având 2 var dih, indivizii ce formează populaţia statistică se
repartizează în 4 categorii. Pe prima diagonală asocierea este pozitivă, în timp ce pe a doua diagonală,
asocierea este negativă. Astfel, legătura dintre variabile poate avea intensităţi diferite. De aceea, după
descoperirea existenţei sau nu a unei asocieri , este calcularea unui coeficient care să măsoare această
intensitate.
Coeficienţii de asociere: (0-lipsa asocierii,1-asociere maximă), (+1 e pt asoc poz,-1 e pt asoc neg)
Asocierea perfectă nu se poate realiza decât în cazul în care distribuţiile de frecvenţe ale celor 2 var
luate separat coincid. În principiu, coeficienţii propuşi pt măsurarea asocierii pot fi simetrici (se
încearcă o măsurare globală a relaţiei statistice între cele 2 var) şi asimetrici (poziţiile variabilelor nu
sunt identice, una fiind considerată anterioară, independentă sau predictivă în raport cu cealaltă). Nici
o rel statistică ne este o garanţie pt existenţa unei relaţii reale de determinare sau de cauzalitate între
fenomenele sociale transpuse în formă statistică. Coeficienţi de asociere pentru caracteristicile
dihotomice:
- coeficientul fi concentrarea valorilor pe prima diagonală, înseamnă că coef vor
primi val pozitivă
- coeficientul Yule (ia val între –1 şi +1), se anulează în cazul în care variabilele sunt statistic
independente
- coeficientul Y
(Putem vorbi de un sens al asocierii numai pt că am presupus că o clasă desemnează prezenţa unui
atribut , iar cealaltă absenţa acestuia, semnul + se atribuie în caz de concordanţă , adică prezenţă sau
absenţă simultană a atributelor. Astfel am interpretat practic caracteristica dihotomică drept o
variabilă ordinală)

6
o variabile categoriale (religie, naţionalitate)
Două caracteristici a căror structură o constituie un sistem de clase, în număr superior lui 2, clase care
pot fi stări calitative propriu-zise (deci trepte ale unei scale nominale) sau stări calitative rezultate
dintr-o reducţie de scală, în sensul că se renunţă la ordonarea claselor sau a intervalelor de valori. Deci
nu introducem nici o ipoteză asupra sistemului de categorii, situându-ne în situaţia variabilelor
nominale. Nu mai putem vorbi de un sens al asocierii, toţi coeficienţiivor fi pozitivi, mişcându-se pe
intervalul (0,1). Existenţa asocierii se stabileşte, ca şi mai înainte prin apelul la situaţia de
independenţă.
Măsurarea asocierii se realizează prin mai mulţi indici:
- Coeficientul de contingenţă C (al lui Pearson). Acesta nu se poate apropia de valoarea 1 decât
dacă tabelul este din ce în ce mai mare
- Coeficientul V al lui Cramer
- Coeficientul Lambda: se defineşte ca proporţia cu care se reduc erorile , prin introducerea var
independente. Neajunsul acestui copeficient este că el se poate anula şi în cazul existenţei
unei asocieri.
- Coeficientul Tau
- Coeficientul de incertitudine U. Acest coef uzează de noţ de entropie: gradul de
nedeterminare sau de incertitudine faţă de plasarea indivizilor în categoriile respectivei
caracteristici
o variabile ordinale
Există o ordine a claselor caracteristicii, ceea ce implică, pe de o parte, necesitatea de a vorbi de un
sens al asocierii, observând dacă există o concordanţă sau discordanţă legată de ordonările respective.
Indicatori:
- coeficienţii lui Kendall
- Coeficientul gama (+1 dacă nu e nici o discordanţă, -1 dacă nr concordanţelor e nul şi 0 dacă
nr concordanţelor egal nr discordanţelor)

- analiza multivariată (asocierea simultană a mai multor caracteristici)


Este orice procedură statistică de evidenţiere şi evaluare a rel dintre 3 sau mai multe caracteristici,
indiferent de tipul scalei pe care s-au construit. Este vorba de caracteristici de tip calitativ,
variabile categoriale. Ideea analizei multivariate este că prin modele statistice adecvate se pot
reproduce condiţiile experimentului, adică o relaţie dintre 2 var (cauză-efect) se validează dacă se
regăseşte în situaţia când sunt controlate (menţinute constante) alte variabile.
Putem întâlni o situaţie în care de ex. factorul „pagubele produse de un incendiu” B este
corelat cu „amploarea mijloacelor materiale şi umane folosite de pompieri pt stingerea focului”, A. Cu
toate acestea, A şi B derivă din C „gravitatea incendiului”. Utilitatea descoperirii faptului că A şi B
sunt consecinţe ale lui C este că se va respinge ipoteza unei relaţii de determinare între A şi B.
Un alt subtip este cel în care variabila C este intermediară, el mijlocind influenţa lui A asupra
lui B. Caracterul ideal al acestui subtip este atunci când toată influenţa lui A asupra lui B se transmite
prin C.
A C B
Ex: mobilitatea socială: A este originea soc, C niv şcolar al indivizilor, iar B este statusul indivizilor
Un alt subtip: var cauzală A şi cea test C sunt independente statistic. Lipsa de asociere între A
şi C poate fi naturală sau artificială. De ex dacă ne interesează inf vârstei tineri-vârstnici (A) asupra
asupra atitudinii politice B: (st-dr), luând ca variabilă test mediul urban sau rural, şi ştiind că mediul
rural diferă mult de cel urban în privinţa reprezentării pe vârste. Cerinţa este ca lotul experimental să
coincidă cu cel de control, din pdv al caract C: „elaborare de relaţii parţiale”. Sunt evidenţiate 2
subtipuri:
- C anterior lui A
- C intermediar: A stimul, B răspuns, C condiţie