Sunteți pe pagina 1din 20

Statistica Sociala Curs Blackboard sem. II, anul I Fac. de Sociologie-Psihologie LEClIA 1 .

GRUPAREA DATELOR Sa presupunem ca s-au nregistrat notele obNinute de studenNii anului II la examenul de statistica sociala. Rezultatele sunt prezentate aceste date grupat astfel: Nota 1 2 3 4 5 6 7 8 9 10 Nr. stud. 0 1 2 5 10 25 31 25 15 6 Din aceste date putem trage unele concluzii privind nivelul de pregatire si de prezentare la examen a studenNilor.Analiza statistica a unui fenomen, n raport cu o singura caracteristica conduce la prezentarea unei serii de perechi de valori, pe care o vom numi serie statistica. n cazul caracteristicilor calitative, prima valoare a perechii din se ria statistica nu mai este numerica. Exemplu: Sa consideram drept exemplu distribuNia dupa caracteristica sex a unei populaNii statistice: Sex Masculin Feminin Total Nr. unit. statistice 86 94 180 De asemenea, distribuNia dupa caracteristica grupei de vrsta a unei populaNii active n cmpul muncii, ar genera o serie statistica acarei prima valoare este cuprinsa ntre 18 si 62 ani. Vrsta 18 19 20 .............................................62 Nr. unit. statistice ................................................................ Din motive practice se pot face grupari pe intervale mai mari ale vrstei subiecNi lor, de exemplu din 5 n 5 ani sau din 10 n 10 ani, astfel: Grupe de vrsta 18 20 21 30 31 40

41 50 51 60 61 62 Nr. unit. statistice Istoria Psihologiei curs sem II-Blackboard 1

II. FRECVENlA ABSOLUTA. FRECVENlA RELATIVA. FRECVENlE CUMULATE Numim frecvenNa absoluta a unei valori a caracteristicii numarul de unitaNi ale populaNiei statistice corespunzatoare acelei valori. De exemplu, n tabela distribuNiei dupa caracteristica sex, valoarea 86 reprezinta numarul persoanelor masculine sau frecvenNa absoluta respectiva. Analog, 94 reprezinta frecvenNa absoluta sau numarul persoanelor de sex feminin. Suma frecvenNelor absolute ale tuturor valorilor caracteristicii este egala cu totalul populaNiei statistice. Numim frecvenNa relativa a unei valori m a caracteristicii raportul dintre frecvenNa absoluta a valorii respective m a caracteristicii si totalul populaNiei statistice. Vom scrie: m f= n unde: f -este frecvenNa valorii respective a caracteristicii; m este frecvenNa absoluta a acestei valori; n -este totalul populaNiei statistice. Revenind la exemplul anterior, frecvenNele relative vor fi: 86 f1= =0,48sau 48% 180 94 f2 = =0,52 sau 52% 180 Tabela respectiva devine: . Masculin Feminin. .. ..

.. 0 ,48 0,52 Seria statistica asociata unei caracteristici statistice se poate asocia cu distribuNia unei variabile aleatoare, care, reamintim, este un tabel de forma: . x1x2 xn . .. .. . p1p2 pn . n care x1, x2,... ....... .xn sunt valorile aleatoare corespunzatoare cu probabilitaNile p1, p2,... ... ...pn. Evident, avem ca p1 + p2 +... ......+ pn = 1 Istoria Psihologiei curs sem II-Blackboard 2

De multe ori, putem folosi termenul de variabila statistica n loc de caracteristica. Numim frecvenNa absoluta cumulata a unei valori x a variabilei statistice, suma frecvenNelor absolute ale tuturor valorilor variabilei care apar pna la valoarea x inclusiv. Istoria Psihologiei curs sem II-Blackboard 3

III. REPREZENTAREA GRAFICA A SERIILOR STATISTICE Sa consideram distributia investitiilor n cteva sectoare ale economiei nationale: Sectorul Investitii procentuale A............................................................................... ............ 5,5% B............................................................................... .......... ..14,5% C............................................................................... ................20% D............................................................................... ................25% E............................................................................... .................35% Total investitii 100% 25% 20% 14.50% 5.50% 35% Reprezentarea grafica corespunzatoare poarta denumirea de diagrama. Seriile cu caracteristica cantitativa se reprezinta grafic n raport cu un sistem de axe. Astfel, distributia de mai sus poate fi reprezentata grafic prin mai multe feluri: a) Reprezentarea prin batoane b) Reprezentarea prin histograme 010203040ABCDEF 010203040123456 Istoria Psihologiei curs sem II-Blackboard 4

n cazul reprezentarilor spatiale se utilizeaza cartodiagramele. Diagramele n cerc sau dreptunghiulare se mai numesc diagrame de structura. Histogramele se utilizeaza n cazul seriilor cu intervale egale. Ulterior se poate construi poligonul frecventelor. Daca unim punctele poligonului de frecventa printr-o curba oarecare, obtinem cur ba frecventelor sau curba de distributie. FORMA DISTRIBUTIILOR CU O CARACTERISTICA 1. Distributii simetrice. Se prezinta sub forma unui clopot. Cele mai raspndite dist ributii simetrice sunt distributiile normale care urmeaza legea normala de probabilitate studiata de La place si K. J. Gauss. 2. Distributii usor asimetrice. 3. Distributii pronuntat asimetrice. 4. Distributii n forma de J. 5. Distributii n forma de U. Istoria Psihologiei curs sem II-Blackboard 5

IV. ELEMENTE CARACTERISTICE ALE UNEI SERII STATISTICE Vom numi valoare centrala a unei clase de variaNie media aritmetica a extremitaNilor acestei clase. Modul sau dominanta unei serii statistice este valoarea caracteristicii corespunzatoare celei mai mari frecvenNe. Mediana unei serii este un numar x cu proprietatea ca exista attea unitaNi statistice corespunzatoare valorilor mai mici dect x, ct si cele corespunzatoare valorilor mai mari dect x. Media aritmetica. Daca x1, x2,... ..xn sunt n valori, atunci media aritmetica a lor este: x1 + x2 ++ xn n n cazul distribuNiei variabilei x: Valori x1 x2............................................. ..xn FrecvenNe y1 y2................................................yn Valoarea medie a variabilei respective este: x 1y1 + x2y2 ++ xnyn x = y1 + y2 ++ yn daca N=y1+ y2+.. +.ynestetotalulpopulaNiei, atunci: Istoria Psihologiei curs sem II-Blackboard 6

x = x 1f1 + x 2f 2 ++ x nf n yi undef i = , i = 1,2, , n. N DISPERSIA Fiind date n valori x1, x2,... ..xn cu media x , numim dispersia acestor valori, marimea: 21n 2 s= . (xi -x) , ni = 1 iar marimea s= s 2 se numeste abaterea medie patratica. Abaterea medie patratica indica gradul de mprastiere a valorilor n jurul mediei aritmetice. Din inegalitatea lui Cebisov rezulta ca n intervalul [x - 2s ,x + 2s ] se afla mai mult de 3/4 din numarul abaterilor. Istoria Psihologiei curs sem II-Blackboard 7

V. VARIABILE ALEATOARE O variabila aleatoare este un tabel de forma: . x 1 x 2 xn . X :.. .. . p 1 p 2 pn . unde xi sunt valorile pe care le poate lua variabila x cu probabilitaNile pi. n plus, este ndeplinita conotaNia: p1+p2+... ...pn= 1 Pot exista variabile aleatoare diferite cu aceeasi distribuNie. OperaNii cu variabile aleatoare Daca . x1x2 xm .. y1y2 yn . X: .. ,Y : .. siao .. qq q . . pp p . . 12 n . 12 m . constanta reala, atunci se definesc v.a. Urmatoare: . ax 1ax 2 ax n .. a + x 1a + x2 a + xn . aX : . ;a + X: .. ; .. .. . p1p2 pn ..

p1p2 pn . . Istoria Psihologiei curs sem II-Blackboard 8

. x1 + y1 x2 + y2 xm + yn . X + Y: .. .. . p 11 p12 pmn . unde pij este probabilitatea realizarii simultane a evenimentelor X = xi, Y = yj . XY : x 1 y 1 x 2 y 2 x m y n . . . . p11 p12 p mn . . unde pij este definit ca mai sus. Variabile aleatoare independente V.a. X si Y sunt independente daca evenimentele X = xi siY= yjsunt independente pentru toate cuplurile i si j. Putem scrie: pij =P(X=xi,Y=yj)=P((X=xi) (Y=yj))=P(X=xi)P(Y=yj)= piqj Valoarea medie a unei v.a. Valoarea medie a v.a. X este: M(X) = m = x = p1x1 + p2x2 + + pnxn Numim moment de ordin k al v.a. X, valoarea medie a v.a. Xk: Mk(X) = M(Xk) = p1x1k + + pnxnk Variabila X-M(X) se numeste abaterea de la medie a v.a. X Cel mai bun indicator al mprastierii unei v.a. este dat de expresia: M[(X-m)2] Care este un moment centrat de ordinul al doilea numit dispersia v.a. X Istoria Psihologiei curs sem II-Blackboard 9

s 2 = D2(X)= M[(X-m)2] , m = M(X) 2 22 s= s =D(X)= M(X -M(X) ) se numeste abatere medie patratica. Inegalitatea lui Cebsev: P(|X-m| < e) = 1-s 2 e 2 Unde m = M(X) iar s2 este dispersia v.a. X CovarianNa a 2 v.a. X si Y este coeficientul m XY = M[(X - X)(Y - Y)] = M(XY) - M(X) M(Y) Coeficientul de corelaNie a 2 v.a. X si Y este m XY M(XY) - M(X) M(Y) r XY == ss 22 22 X Y M(X) - M (X) M(Y ) - M (Y) ProprietaNi: 1) -1 =.XY = 1 2) Daca. = 1 ntre v.a. X si Y exista o dependenNa liniara. Astfel: s y -M(Y) = s Y ( X -M(X)) , (cazul . = 1) X s y-M(Y)=-Y s ( X -M(X)) , (cazul . = -1) X Istoria Psihologiei curs sem II-Blackboard 10

3) Daca v.a. X si Y sunt independente, atunci .XY = 0 Coeficientul de variaNie (sau de mprastiere) s X V= M ( X ) Istoria Psihologiei curs sem II-Blackboard

VI. CORELAlIA RANGURILOR Fie n unitaNi statistice A1, A2, , An fiecare fiind definita prin 2 caracteristici: (x1, y1) , (x2, y2) , , (xn, yn) Ne punem problema existenNei unei corelaNii ntre aceste caracteristici. Coeficientul de corelaNie a rangurilor al lui Spearman: 6 . d i2 r= 1 2 , (n>1) n(n - 1) ProprietaNi: -1 r 1 Coeficientul de corelaNie a rangurilor al lui Kendall 2(P -Q) r = n(n -1) unde P este un indicator al concordanNei pozitive, iar Q un indicator al concordanNei negative. CoeficienNi de corelaNie parNialasi multipla . xi .. yi .. zi . Daca X: .. ,Y: .. ,Z: .. sunt 3 v.a. si m11=M(x-m1)2 ; . p .. q .. r . . i .. i .. i . m12 = M(x-m1)(y-m2) , m22=M(x-m2)2, atunci

m 12 r 12 = m 11 m 22 este coeficientul de corelaNie parNiala ntre variabilele X si Y. n mod analog se defineste r23 si r31. Istoria Psihologiei curs sem II-Blackboard 12

CorelaNia dintre variabila X si grupul Y si Z se stabileste de catre coeficientul de corelaNie multiplu: M r 1 . 23 = 1m 11 M 11 unde . m11 m12 m13 . .. M = . m21 m22 m23 . .. . m31 m32 m33 . iar M este minorul elementului mij din |M|ij n mod analog, MM r 2 . 31 = 1- si r 3 . 12 = 1- m 22 M m 33 M 33 22 Coeficientul multiplu ntre variabilele Xi si grupul (X1, , Xn) este dat de formula: M r i; 1, 2 ,...,i -1, i + 1 ,..., n = 1m ii M ii ANALIZA DE REGRESIE Fie o distribuNie teoretica discreta de 2 variabile bidimensionale, X si Y de repartiNii . ai .. bj . X: .. ,Y: .. .. .. . , Xi-1, Xi+1,

pi .. qj . si P(X=ai , Y=bj) Istoria Psihologiei curs sem II-Blackboard 13

Se pune problema determinarii parametrilor a si b astfel nct: M(Y-aX-b)2= min sau nn S. p ij (b j -a ai -b )2 = minim i= 1j = 1 analiza de regresie rezolva aceasta problema a minimizarii sau a gasirii dreptelor de cea mai buna aproximare, obNinndu-se dreptele de regresie: s X y -M(Y) = r ( X -M(X)) si s Y s Y y -M(Y) = r ( X -M(X)) s X cu centrul de greutate: (M(X), M(Y)) Copied from Blackboard Academic Suite-Universitatea Spiru Haret///All rights reserved to Universitatea Spiru Haret///copied by dumy1dumy@yahoo.com Istoria Psihologiei curs sem II-Blackboard 14

S-ar putea să vă placă și