Sunteți pe pagina 1din 15

Seminar analiza descriptiva univariata a unei serii

I. Se inregistreaza numarul de zboruri in ultimul an pentru un esantion de 5 persoane: 6, 7, 10, 12,


15. Sa se calculeze si sa se interpreteze media aritmetica, modul si mediana.

II. Se considera distributia unui eşantion de angajaţi ai firmei X după numărul de mijloace de
transport în comun folosite zilnic până la locul de muncă. Datele sunt prezentate in tabelul de mai
jos.

Tabelul 1. Distribuţia unui eşantion de angajaţi ai firmei X după numărul de mijloace de transport în
comun schimbate zilnic până la locul de muncă

xi ni
1.00 5
2.00 75
3.00 27
4.00 3
Total 110

1. Sa se calculeze frecventele absolute si relative, simple si cumulate, media aritmetica, modul si


mediana.
2. Sa se calculeze si sa se interpreteze Q1, Q3 si D7.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Sa se reprezinte grafic distributia, folosind curba frecventelor
5. Stiind ca γ1 = 0.761 si γ2 = 1.056, sa se intrepreteze asimetria si boltirea distributiei.

Rezolvare

Punctele 1,2,si 3 au fost rezolvate in clasa.

4.

1
5.

2
3
Coeficientul de asimetrie γ1 este pozitiv, deci distributia este asimetrica la dreapta.
Coeficientul de boltire γ2 este pozitiv, deci distributia este leptocurtica.

III. Pentru o distributie s-au inregistrat valorile: D1=5, Q1=12, Q2=20, Q3=22, D9=25. Sa se
interpreteze asimetria distributiei folosind diagrama box-plot.

4
IV. Pentru doua serii de studenti s-au reprezentat grafic distributiile notelor obtinute la un test. Sa se
interpreteze quartilele si decilele. Sa se precizeze sensul asimetriei. Sa se specifice care serie a
obtinut note mai mari.

NOTA_1

NOTA_2

3 4 5 6 7 8 9 10 11

Distributia primei serii de studenti (reprezentata la Nota_1)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 5: 25% dintre studenti au obtinut cel mult 5, 75% dintre studenti au obtinut cel putin 5
Q2 = 6: 50% dintre studenti au obtinut cel mult 6, 50% cel putin 6
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia celei de-a doua serii de studenti (reprezentata la Nota_2)


D1 = 4: 10% dintre studenti au obtinut cel mult 4, 90% cel putin 4
Q1 = 6.5: 25% dintre studenti au obtinut cel mult 6.5, 75% dintre studenti au obtinut cel putin 6.5
Q2 = 8: 50% dintre studenti au obtinut cel mult 8, 50% cel putin 8
Q3 = 9: 75% dintre studenti au obtinut cel mult 9, 25% cel putin 9
D9=10: 90% dintre studenti au obtinut cel mult 10, 10% au obtinut cel putin 10

Distributia primei serii este asimetrica la dreapta, distributia celei de-a doua serii este asimetrica la
stanga.

Prin urmare, in urma analizarii tuturor acestor informatii, a doua serie a obtinut note ai mari decat
prima.

5
Variabila continua

I. Se considera distribuţia unui eşantion de reclame difuzate într-o zi la TV, observate după durata
reclamei în secunde. Datele sunt prezentate in tabelul urmator.

Tabelul 1. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi ni
8-12 20
12-16 55
16-20 15
20-24 10
Total 100

Se cere:
1. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
2. Sa se calculeze si sa se interpreteze media aritmetica
3. Sa se aprecieze reprezentativitatea mediei, stiind ca s=3.42.

Rezolvare

1.

Histogram

60

50

40
Frequency

30

20

10

Mean = 14.60
Std. Dev. = 3.42893
0 N = 100
5.00 10.00 15.00 20.00 25.00

Cases weighted by n

6
2.

Tabelul 2. Distribuţia unui eşantion de reclame difuzate într-o zi la TV după durata reclamei în
secunde – elemente de calcul
xi-1-xi xi  x ( x i  x )  ni ( xi  x ) 2 ( x i  x ) 2  ni
ni xi’ Ni xini
8-12
20 10 20.00 200 -4.60 -92.00 21.16 423.20
12-16
55 14 75.00 770 -0.60 -33.00 0.36 19.80
16-20
15 18 90.00 270 3.40 51.00 11.56 173.40
20-24
10 22 100.00 220 7.40 74.00 54.76 547.60

Total 100   1460   0.00   1164.00

Pentru a calcula indicatorii descriptive in cazul unei serii continue, pentru care valorile acesteia sunt grupate
pe intervale de variatie, se va proceda mai intai la “discretizarea” seriei, adica la folosirea mijloacelor
intervalelor de variatie a variabilei, ca valoare considerate reprezentativa pentru tot intervalul.
Mijloacele intervalelor sunt calculate in coloanal a treia din table (coloana xi’).
Din acest punct, toate calculele se vor face folosind coloanele 2 si 3, deci se va urma exact acelasi
procedeu de calcul ca in cazul variabilelor discrete.

In medie, durata unei reclama este de 14.6 secunde.

In software-urile de analiza statistica, rezultatele apar ca in tabelul prezentat mai jos, in care:

- N este volumul esantionului


- Mean este media artimetica
- Median este mediana
- Mode este modul
- Std. deviation este abaterea standard sau abaterea medie patratica
- Variance este varianţa
- Skewness este coeficientul de asimetrie Fisher
- Kurtosis este coeficientul de boltire Fisher
- Percentile 10 este D1
- Percentile 20 este D2
- Percentile 25 este Q1
- Percentile 50 este mediana sau Q2 sau D5
- Percentile 75 este Q3 etc.

7
Statistics

X
N Valid 100
Missing 0
Mean 14.6000
Median 14.2857a
Mode 14.00
Std. Deviation 3.42893
Variance 11.758
Skewness .686
Kurtosis .086
Percentiles 10 10.0000b
20 11.0667
25 11.6000
28 11.9200
30 12.1333
40 13.2000
50 14.2857
60 15.4286
70 16.5714
75 17.1429
80 17.7143
90 20.4000
95 22.0000
a. Calculated from grouped data.
b. Percentiles are calculated from grouped data.

3.Pentru reprezentativitatea mediei se calculeaza coeficientul de variatie.

Valoarea coeficientului de variatie este inferioara pragului de 50%, deci dispersia este mica, populatia este
omogena iar media este reprezentativa.

8
Variabile calitative

I. Se consideră distribuţia după regiunea de provenienţă a angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Nord-Est 40
Sud 22
Vest 12
Centru 4
Total 78

Să se interpreteze frecvenţele absolute şi relative, modul şi să se reprezinte grafic distribuţia.

Rezolvare

xi ni fi(%)
Nord-Est 40 51.28
Sud 22 28.21
Vest 12 15.38
Centru 4 5.13
Total 78 100

Interpretare frecvente relative


51.28% dintre angajati provin din regiunea de NE, 28.21% din regiunea de S etc.

Modul este valoarea variabilei (regiunea) cel mai frecvent observata. Frecventa maxima este
inregistrata de regiunea de NE, deci modul este regiunea NE. Prin urmare, puteam afirma ca cel mai
frecvent, angajatii provin din regiunea de NE.

9
Reprezentarea grafica a unei variabile nominale se realizeaza folosind diagrame prin bare. Coloane
su diagrame de structura, cum ar fi cercul de structura.

II. Se consideră distribuţia după nivelul de studiu al angajaţilor unei firme, prezentată în tabelul
următor.

xi ni
Medii 72
Universitare 30
Post-universitare 15
Total 117

Să se interpreteze frecvenţele absolute şi relative, simple şi cumulate, modul si mediana.

Rezolvare

xi ni fi Ni Ni Fi Fi


Medii 72 61.54 72 117 61.54 100
Universitare 30 25.64 102 45 87.18 38.46
Post-universitare 15 12.82 117 15 100 12.82
Total 117 100

10
Interpretare frecvente pentru nivelul de studii universitare (al doilea nivel de variatie a lui X):
30 de angajati au studii universitare
25.64% din angajati au studii universitare
102 angajati au cel mult studii universitare
45 angajati au cel putin studii universitare
87.18% din angajati au cel mult studii universitare
38.46% din angajati au cel putin studii universitare

Modul este studii medii, intrucat acesta este nivelul de studii cu cea mai mare frecventa de aparitie.
Prin urmare, cei mai multi angajati au studii medii.

Pentru mediana aplicam algoritmul de identificare a acesteia.


1. Aflam pozitia ocupata de mediana in sirul celor 117 valori

UMe = (117+1)/2 = 59

Prima valoare Ni care ajunge in mijloc, adica prima valoare Ni ≥ UMe este 72.

2. Identificam mediana ca fiind valoarea variabilei corespunzatoare valorii Ni aflata de la pasul
anterior, deci mediana este studii medii. Prin urmare, 50% din angajati au cel mult studii
medii, iar 50% au cel putin studii medii.

11
Tema – optional 😊

Concepte si notiuni fundamentale


- Populatie
- Esantion
- Unitate statistica
- Variabila statistica
- Scala de masurare

1. Intr-o comuna cu 2300 de gospodarii s-a studiat suprafata de pamant arabil (ha) si numarul de
animale (bucati) detinute de fiecare gospodarie.
- Identificaţi populaţia studiată, unitatea statistică, variabila observată, tipul variabilei şi al
scalei.
- Precizaţi tipul cercetării (totală sau parţială).

2. Un eşantion de angajaţi ai unei firme a răspuns la câteva întrebări cu caracter personal şi


profesional. Precizaţi natura următoarelor variabile şi tipul de scală specific:
- numărul de animale al familiei
- locul naşterii
- anul naşterii
- vârsta în ani împliniţi
- fumator (da, nu)
- nivelul ultimei diplome de studii obţinută (liceu, facultate, master, doctorat, post-
doctorat)
- tipul de maşină deţinut: autohton sau de import
- distanţa, în km, de acasă până la locul de muncă
- valoarea IQ-ului
- poziţia ierarhică ocupată în firmă (funcţionar, middle management, top management)
- calificativul obţinut la ultima evaluare la locul de muncă
- poziţia privind politica firmei de a reduce salariile în locul reducerii personalului existent
(acord total, acord, indiferent, dezacord, dezacord total)
- numărul de ore petrecute zilnic navigând pe internet

3. Pentru ţările din U.E. s-a înregistrat rata de creştere a PIB-ului în 2012. Se cere:
- Identificaţi populaţia studiată, unitatea statistică, variabila observată si tipul acesteia.

4. Precizaţi domeniul (setul de valori) pentru următoarele variabile:


- nr. de litri de combustibil din rezervorul unei maşini
- statusul marital al unei persoane
- nr. de cărţi de pe raftul unei biblioteci
- suma punctelor obţinute prin aruncarea simultana a două zaruri
- regiune din România

12
Analiza statistica univariata a unei serii numerice

Analiza numerica
1. Indicatori medii: media artimetica, modul, mediana, quartile, decile
2. Indicatori ai variatiei (dispersiei): varianţa, abaterea medie patratica, coeficientul de
variatie, amplitudinea intervalului interquartilic
3. Indicatori ai formei: asimetrie (coeficientul de asimetrie Fisher) şi boltire (coeficientul de
boltire Fisher)

Analiza grafica
- Histograma
- Poligonul frecventelor
- Curba frecventelor
- Diagrama box-plot

I. Se inregistreaza numarul de ore de pregatire la matematica efectuate de un grup elevi in vederea


pregatirii pentru BAC: 10, 2, 7, 46, 15. Sa se calculeze si sa se interpreteze media aritmetica, modul,
mediana si coeficientul de variatie.

II. Se considera distributia unui eşantion de studenti după numărul de ore de voluntariat efectuate in
ultima saptamana. Datele sunt prezentate in tabelul de mai jos.

Tabelul 1. Distribuţia unui eşantion de student dupa numarul de ore de voluntariat efectuate in ultima
saptamana

xi ni
1.00 10
3.00 19
4.00 80
7.00 25
Total 134

1. Sa se calculeze media aritmetica, modul si mediana.


2. Sa se calculeze si sa se interpreteze Q1, Q3 si D9.
3. Sa se calculeze si sa se interpreteze varianta, abaterea medie patratica si coeficientul de variatie.
4. Stiind ca valoarea coeficientului de asimetrie este 0.38 si valoarea coeficientului de boltire este
0.31, sa se interpreteze forma distributiei.

III. Pentru o distribuţie a studenţilor după nota obţinută la Statistică se cunoaşte: D1= 2,5, Q1 = 4,
Me=6,5, Q3 = 7, D9=8. Se cere:
a. Să se construiască diagrama box-plot.
b. Să se precizeze sensul asimetriei.
c. Să se calculeze şi interpreteze intervalul interquartilic.

13
IV. Se considera distribuţia unui eşantion firme din judetul Iasi, observate după valoarea profitului
acestora (milioane lei). Datele sunt prezentate in tabelul urmator.

Tabelul 2. Distribuţia unui eşantion de firme după valoarea profitului (milioane lei) – elemente de
calcul

Se cere:
4. Sa se reprezinte grafic distributia folosind histograma si curba frecventelor
5. Sa se calculeze si sa se interpreteze media artimetica
6. Sa se interpreteze indicatorii prezentati in tabelul de mai jos. Apreciati gradul de
reprezentativitate al mediei.

Statistics
profit

Valid 120
N
Missing 0
Mean 21.2500
Median 20.0000
Mode 15.00
Std. Deviation 11.52728
Variance 132.878
Skewness .442
Std. Error of Skewness .221
Kurtosis -.484
Std. Error of Kurtosis .438
Sum 2550.00
25 15.0000

Percentiles 50 20.0000

75 25.0000

14
V. Pentru o companie, s-a observat distributia salariului femeilor si a barbatilor. Sa se interpreteze
rezultatele obtinutwe in urma analizei.

15

S-ar putea să vă placă și