Sunteți pe pagina 1din 8

Anul I, CSIE 2011-2012 Statistica I Exercitii pregatitoare pentru testul de la seminar si pentru examen partea a II-a Problema 1 Pentru

u 6 salariai care au urmat un curs de perfecionare au fost nregistrate date privind calificativul obinut i productivitatea muncii (numar de dosare analizate intr-o ora): Nr. Calificativul Productivitatea crt. 1 Foarte bine 15 2 Bine 16 3 Foarte bine 14 4 Suficient 13 5 Insuficient 12 6 Bine 13 Se cere: a) sa se analizeze sensul si intensitatea legaturii dintre calificativul obinut si productivitatea muncii; b) pentru variabila productivitatea muncii, calculai scorurile z (standardizai variabila productivitate). Rezolvare: a) se calculeaza coeficientii de corelatie ai rangurilor Spearman si Kendall (a se vedea rezolvarea din ultimul curs); b) - notam cu Y variabila ce arata productivitatea muncii exprimata ca numar de dosare analizate intr-o ora de un salariat ce a urmat un curs de calificare; este o variabila numerica sau cantitativa, discreta, masurata pe scala de raport - pentru esantionul de volum n=6 salariati s-au inregistrat valorile variabilei Y, obtinandu-se urmatoarea serie simpla de date statistice numerice: { y1 = 15, y 2 = 16, y3 = 14, y 4 = 13, y5 = 12, y 6 = 13} . yi y Nr. Productivitatea y i Scorurile z: z i = ( yi y ) 2 sy crt.
1

y1 = 15 y 2 = 16 y 3 = 14 y 4 = 13 y 5 = 12 y 6 = 13

( y1 y ) 2 = 1.3689
4.7089

z1 = z2 = z3 = z4 = z5 = z6 =

y1 y = 0.80137 sy y2 y = 1.48630 sy y3 y = 0.11644 sy y4 y = -0.56849 sy y5 y = -1.25342 sy y6 y = -0.56849 sy

0.0289

0.6889

3.3489

6
6

( y 6 y ) 2 = 0.6889
i =1 2 ( yi y ) = 10,8334 2 ( yi y ) 6 6

i =1

yi = 83
= 13,83 dosare

y=

i =1

yi
6

s2 = y

i =1

6 1

= 2,16

sy =

s 2 = 1,46 dosare y

Problema 2. Rezultatele examinrii a unui eantion de studeni la probele teoretice i practice ale unei discipline de specialitate sunt urmtoarele: Student A B C D E F G H I J TEORIE 8 3 9 2 7 10 4 6 1 5 PRACTIC 9 5 10 1 8 7 3 4 2 6 Se cere: a) s se analizeze grafic legatura dintre cele doua variabile; b) in ipoteza distribuiei normale a celor doua variabile, sa se msoare intensitatea legturii folosind coeficientul de corelatie liniar Pearson c) sa se calculeze si interpreteze coeficientii de corelatie ai rangurilor Spearman si Kendall. Problema 3. Pe baza datelor referitoare la nivelul venitului i satisfacia profesional oferit de job pentru un eantion de 250 de persoane angajate n domeniul IT a fost construit tabelul de contingen. Output-ul obinut este:

Se cere: a) scrieti distributiile marginale ale celor doua variabile de interes; b) determinati si interpretati indicatorii statistici descriptivi ce se pot obtine pentru distributia salariatilor dupa satisfactia profesionala oferita de locul de munca; c) analizai asimetria si omogenitatea colectivitatii salariatilor nemultumiti dupa caracteristica categoria de venit; d) distributia venitului pentru cei foarte nemultumiti, medie, dispersie, omogenitate; e) compararea grupelor generate de satisfactia jobului in functie de omogenitate dupa variabila venit. Rezolvare: a) tabelul de contingenta Satisfactia foarte nemultumit Venit, nemultumit in Eur n11 = 17 n12 = 9 sub 500 Eur n21 = 21 n22 = 27 5001000 Eur 10001500 n31 = 6 n32 = 13 Eur n42 = 9 peste 1500 Eur n41 = 1 Total n1 = 45 n2 = 58

neutru 12 19 10 9 n3 = 5 0

multumit 6 17 11 18 n4 = 52

foarte Total multumit 6 8 5 26 n5 = 45 n1 = 50 n2 = 92 n3 = 45 n4 = 63 n = 250

Unitatea statistica este un salariat ce lucreaza in domeniul IT. Variabilele de interes sunt: X variabila ce arata venitul lunar, in Eur, al unui salariat; variabila numerica, continua; si 2

Y variabila ce arata satisfactia unui salariat, satisfactie oferita de locul de munca, variabila calitativa, masurata pe scala ordinala, ale carei variante de raspuns sunt: foarte nemultumit, nemultumit, neutru, multumit, foarte multumit. Distributiile marginale sunt: Distributia celor n=250 de angajati din domeniul IT dupa venitul lunar, in Eur (dupa variabila X): distributie de frecvente pe r=4 intervale de variatie de marime egala: Nr. Intervalele de variatie Frecventa absoluta nk crt. ale venitului, in Eur (numarul de angajati) 1 0 500 Eur n1 = 50 2 n2 = 92 5001000 Eur 3 n3 = 45 10001500 Eur 4 n4 = 63 15002000 Eur
k =1

nk = n = 250

Distributia celor n=250 de angajati din domeniul IT dupa satisfactia oferita de locul de munca (dupa variabila Y): distributie de frecvente pe r=5 variante distincte de raspuns: Nr. Satisfactia oferita de locul de munca Frecventa absoluta n j crt. (variantele de raspuns) (numarul de angajati) 1 2 3 4 5 foarte nemultumit nemultumit neutru multumit foarte multumit n1 = 45 n2 = 58 n3 = 50 n4 = 52 n5 = 45

n j = n = 250
j =1

b) indicatorii statistici descriptivi ce se pot calcula pentru distributia salariatilor dupa satisfactia profesionala oferita de locul de munca sunt Modul si Mediana, deoarece variabila Y este o variabila calitativa masurata pe scala ordinala. Frecventa absoluta maxima a unei variante de raspuns este n2 = 58 angajati, deci Modul este varianta nemultumit, care arata ca cel mai frecvent nivel de satisfactie al celor 250 de angajati din esantion este nemultumit. Pentru determinarea Medianei, se parcurg urmatorii pasi: n +1 = 125,5 ; o Se determina locul Medianei, adica 2 o Se calculeaza frecventele absolute cumulate crescator ale variantelor de raspuns ale variabilei de interes, variante ce au fost ierarhizate in distributie Fcj = n1 + ... + n j ; o Mediana este prima varianta de raspuns pentru care frecventa sa absoluta cumulata crescator depaseste locul Medianei: Fc1 = n1 = 45 < 125,5 Fc 2 = n1 + n2 = 103 < 125,5 Fc3 = n1 + n2 + n3 = 153 125,5 ,

prin urmare Mediana este a treia variante de raspuns, adica neutru, cu interpretarea ca jumatate dintre cei 250 de angajati din domeniul IT au un nivel de satisfactie oferit de locul de munca cel putin neutru.

c) Distributia salariatilor nemultumiti dupa caracteristica ce arata venitul lunar este: Nr. crt. 1 2 3 4 Intervalele de variatie Frecventa absoluta nk 2 ale venitului, in Eur (numarul de angajati nemultumiti) 0 500 Eur n12 = 9 n22 = 27 5001000 Eur n32 = 13 10001500 Eur n42 = 9 15002000 Eur
k =1

Centrul x k al intervalului de variatie x1 = 250 x 2 = 750 x3 = 1250 x 4 = 1750

nk 2 = n2 = 58 angajati nemultumiti

Histograma - distributia celor 58 de salariati nemultumiti dupa venitul lunar, in Eur


Frecventa absoluta (numarul de salariati nemultumiti) 30 25 20 15 10 5 0
r Eu r Eu r 50 0 00 00 15 00 2 0 0 Eu r Eu

27

13 9 9

10 0

50 0

Venitul lunar, in Eur

10 00

1 5

Poligonul frecventelor absolute - distributia celor 58 de salariati nemultumiti dupa venitul lunar, in Eur
30 Frecventa absoluta (numarul de salariati nemultumiti) 25 20 15 10 5 0 0 250 500 750 1000 1250 1500 1750 2000 Venitul lunar, in Eur (centrul intervalului de variatie)

Nr. crt.

Intervalele de variatie

Frecventa absoluta n k 2 (numarul de angajati nemultumiti)

Centrul x k al intervalului de variatie

xk nk 2
2250 20250 16250 15750
4

Fck Fc1 = 9 Fc 2 = 36 Fc3 = 49 Fc 4 = 58

1 2 3 4

0 500 Eur 5001000 Eur 10001500 Eur 15002000 Eur


4 k =1

n12 = 9 n22 = 27 n32 = 13 n42 = 9

x1 = 250 x 2 = 750 x3 = 1250 x 4 = 1750


k =1

nk 2 = n2 = 58

xk nk 2 = 54500
54500 = 58

x( 2 ) =

=939.6552

o Media pentru aceasta serie de distributie de frecvente pe r=4 intervale de variatie de marime 54500 = 939,6552 Eur, adica nivelul mediu al venitului unui n12 + ... + n42 58 salariat nemultumit este 939,65 Eur. egala este x = ( 2)
k =1

x k nk 2

o Intervalul modal este al doilea interval de variatie 500-1000 Eur, deoarece are frecventa n22 = 27 angajati, atunci valoarea modala este absoluta cea mai mare, ( 27 9) Mo = 500 + 500 = 781,25 Eur, adica cel mai intalnit venit al unui salariat ( 27 9) + ( 27 13) nemultumit este de 781, 25 Eur. o Locul medianei este 58 + 1 = 29,5 . Calculam frecventele absolute cumulate crescator ale 2 intervalelor de variatie Fck . Primul interval pentru care frecventa absoluta cumulata crescator este mai mare ca locul medianei este al doilea interval de variatie, deoarece Fc 2 = 36 , deci intervalul median este 500-100 Eur. Valoarea mediana este 29,5 9 Me = 500 + 500 = 879,62 Eur, cu interpretarea ca jumatate dintre angajatii 27 nemultumiti castiga lunar mai putin de 879,63 Eut.

o Cum Mo < Me < x( 2 ) , concluzionam ca distributia salariatilor nemultumiti dupa venitul lunar prezinta asimetrie pozitica, ce putea fi remarcata si din reprezentarile grafice ale distributiei (histograma si poligonul frecventelor); astfel intrei cei 58 de salariati nemultumiti predomina cei cu un venit salarial lunar mai mic. o Dispersia in esantion (de selectie) pentru aceasta serie de distributie de frecvente pe r=4 intervale de variatie de marime egala este s(22 ) =
k =1 2 ( x k x( 2 ) ) nk 2 4

( n12 + ... + n42 ) 1

12413793,10 = 217785,8439 , iar abaterea standard este 58 1

s( 2 ) = s (22 ) = 466,67 Eur, care arata cu cat se abat, in medie, valorile observate fata de nivelul mediu al venitului angajatilor nemultumiti din esantion. 6

o Coeficientul de variatie este v( 2 ) =

s( 2 ) x( 2 )

100 =

466,67 100 = 49,66% > 35% , ceea ce arata ca 939,65

media nu este reprezentativa pentru colectivitatea angajatilor nemultumiti, aceasta fiind o colectivitate eterogena. Problema 4. O firm de asigurri este interesat de cunoaterea distribuiei clienilor ce dein asigurri auto de tip CASCO n funcie de gen i numrul accidentelor din ultimii apte ani: Se cere: a) frecventele absolute cand se cunosc frecventele relative (%); b) determinarea distributiilor asiguratilor in functie de numarul de accidente si caracterizare a folosind indicatorii tendintei centrale; c) omogenitatea colectivitatii persoanelor de sex masculin in functie de caracteristica numar de accidente; d) reprezentarea grafica si analiza tendintei de normalitate a distributiei de sex feminin in functie de numarul de accidente.

S-ar putea să vă placă și