Sunteți pe pagina 1din 24

STATISTIC I

CURS 11

Prezentarea i caracterizarea
descriptiv a datelor statistice
bivariate

Prezentarea datelor bivariate

Seriile statistice de date bivariate sunt formate prin


considerarea concomitent a dou variabile numerice
sau nenumerice (X i Y).

Variabila X
x1
x2

xi
.
xn

Variabila Y
y1
y2

yi
.
yn
2

Prezentarea datelor bivariate


Cel mai frecvent aceste tipuri de date se sistematizeaz ntr-un tabel de
contingen (crosstab), sub forma unei serii de distribuie bidimensional:

Prezentarea datelor bivariate

Prezentarea datelor bivariate

Prezentarea datelor bivariate

Prezentarea datelor bivariate

Prezentarea datelor bivariate

n cadrul tabelelor bidimensionale se pot utiliza att frecvene


absolute ct i frecvene relative.
O firm de asigurri este interesat de cunoaterea distribuiei clienilor ce dein
asigurri auto de tip CASCO n funcie de gen i numrul accidentelor din ultimii
apte ani:

Prezentarea datelor bivariate

n cazul variabilelor alternative datele se pot prezenta


ntr-un tabel de asociere de forma:

Prezentarea datelor bivariate


Exemplu

Distribuia asigurailor unei companii de asigurri n funcie de


gen i i statutul marital, n anul 2008 a fost:

10

Reprezentarea grafic a datelor bivariate

Descrierea grafic a relaiei dintre dou variabile numerice se


realizeaz prin intermediul corelogramei.

Fiecare unitate statistic este reprezentat printr-un punct de


coordonate xi i yi.

Dac se analizeaz doar existena legturii dintre dou


variabile alegerea poziiei variabilelor pe axe este arbitrar.

Dac analiza legturii dintre variabile are drept scop


evidenierea unei relaii de tip cauz-efect atunci variabila
cosiderat factor cauzal (X) este reprezentat pe abscis, iar
variabila cosiderat factor efect (Y) este reprezentat pe
ordonat.
11

Reprezentarea grafic a datelor bivariate

12

Reprezentarea grafic a datelor bivariate

Forma de distribuire a punctelor pe grafic ofera informaii


privind:
a) existena legturii dintre variabile:

13

Reprezentarea grafic a datelor bivariate


b) sensul legturii dintre variabile:

14

Reprezentarea grafic a datelor bivariate


c) forma legturii dintre variabile:

dac punctele se concentreaz n jurul unei drepte oblice atunci legtura


este de tip liniar;

dac diagrama arat puncte adunate n jurul unei curbe legtura dintre
variabile nu este de tip liniar, fiind numit legtur neliniar.

15

Tipuri de legturi statistice

Exist trei scopuri principale, atunci cnd


analizm legturile dintre variabile statistice:
s descriem i s nelegem relaiile de
dependen;
s previzionm o nou valoare a variabilei
efect;
s ajustm i s controlm variabila efect,
prin intervenia asupra variabilei cauz.
16

Tipuri de legturi statistice

Dac dou variabile se modific similar se spune despre ele c sunt


corelate.

Nu ntodeauna ntre cele dou variabile corelate exist o relaie de tip


cauz-efect.

Este posibil ca o relaie de cauzalitate s existe, dar este posibil ca ambele


variabile s se modifice n pas cu o a treia variabil.

Exemplu
Vnzrile de ochelari de soare i numrul vizitatorilor unui ora turistic n
luna iulie cresc, amndou, foarte accentuat. Creterea vnzrilor de
ochelari de soare nu determin un numr mai mare de turiti i nici
viceversa (s ne gndim de pild la ce s-ar ntmpla n luna noiembrie, cnd
turitii i-ar cumpra umbrele de ploaie). n schimb, amndou variabilele
sunt corelate cu vremea nsorit din luna iulie.

17

Tipuri de legturi statistice

1.

Criterii de clasificare a legturilor statistice :


n funcie de tipul variabilelor luate n consideraie
i de scala pe care sunt msurate
- asocieri statistice (dou variabile calitative msurate
pe scala nominal sau ordinal)
- corelaii statistice (dou variabile cantitative msurate
pe scala de raport)

2. n funcie de sensul legturilor dintre variabile


Legturi directe: X => Y
Legturi inverse: X => Y

18

Tipuri de legturi statistice


3.

n funcie de modul de manifestare n timp a legturii


dintre variabile
- legturi sincrone (concomitente), cele n care modificarea
unei variabile are loc aproximativ o dat cu modificarea
alteia/altora)
- legturi asincrone (cu decalaj), cele n care efectul se
manifest dup un interval de timp de la producerea cauzei.

4.

Dup forma funciei care descrie relaia dintre variabile


- legturi liniare
- legturi neliniare
19

Metode de analiz a legturilor statistice


1.

2.

ANALIZA DE CORELAIE care arat ct de puternic sunt legate


cele dou variabile, ct de mult tind s se modifice mpreun

ANALIZA DE REGRESIE care studiaz schimbrile unei variabile


ca o funcie de schimbrile sau nivelurile altei variabile.

n analiza statistic a legturilor dintre variabilele social-economice cu


ajutorul metodelor corelaiei i regresiei, se noteaz cu:

X variabila cauzal, numit i independent sau exogen, explicativ;

Y variabila efect, numit i dependent sau endogen, explicat, care


poate fi cunoscut cnd se cunoate variabila explicativ.

20

ANALIZA DE CORELAIE

n analiza corelaiei, presupunem c


cele dou variabile, X i Y, se modific
mpreun, dar nu implic o relaie de tip
cauz-efect.

Dac cele dou variabile, X i Y, sunt


normal distribuite, putem vorbi despre o
distribuie normal bivariat.
21

COVARIANA

Cadranul
I
II
III
IV

xi x
+

yi y
+
+

(xi x )(yi y )
+

22

COVARIANA

legtur direct = modificarea n acelai sens a celor


dou variabile, punctele se vor situa predominant n
cadranele I i III (produse pozitive).

legtur invers= variabilele se modific n sensuri


contrare, punctele se vor situa predominant (dar nu
exclusiv) n cadranele II i IV (produse negative)

Covariana se determin ca medie a produselor


abaterilor

Covariana este un indicator absolut al legturii dintre


variabile i arat ct de mult se modific mpreun cele
dou variabile
23

COVARIANA
n

(x - x )(y - y ) n x y x y
i

cov(x,y) s xy

i 1

i i

i 1

i 1
2

i 1

Covariana este pozitiv dac legtura dintre variabile este


direct i negativ, dac legtura dintre variabile este invers.

Dac covariana este zero, acest lucru implic lipsa legturii ntre
variabile, sau, cel puin, lipsa legturii liniare.

Covariana poate lua valori orict de mari, fiind greu de


interpretat i comparat.

Covariana arat sensul legturii, nu i intensitatea ei.


24