Documente Academic
Documente Profesional
Documente Cultură
Probleme Rezolvate Statistica
Probleme Rezolvate Statistica
Aplicatia 1
Numarul angajatilor in regim part-time, pentru 9 firme, selectate aleator, se prezinta astfel:
4 10 12 9 16 18 18 22 8
a. Identificati populatia statistica, esantionul, unitatea si variabila statistica. Aratati tipul variabilei
si scala de masurare.
b. Determinati numarul mediu, median si modal de angajati in regim “part-time” si interpretati
valorile obtinute.
c. Analizati omogenitatea seriei.
d. Determinati si interpretati cuartilele seriei.
e. Verificati prezenta valorilor extreme in serie (outiliers)
f. Analizati asimetria si boltirea/aplatizarea setului de date.
g. Calculati media si dispersia unei variabile alternative, a carei stare favorabila este data de firmele
care au angajat cel putin 16 persoane in regim part-time.
h. Completati urmatorul tabel “Descriptive Statistics”.
Mean …
Median …
Mode …
Standard Deviation …
Sample Variance …
Kurtosis -0,95
Skewness -0,65
Range …
Minimum …
Maximum …
Sum …
Count …
Rezolvare:
1
Scala de masurare: scala de raport.
b. Se noteaza:
X – variabila (nr. angajati in regim part-time)
n = 9 volumul esantionului
n<=30 esantion de volum mic
xi , sunt valorile variabilei
Se cere determinarea mediei, medianei si modului.
Mediana:
4 8 9 10 12 16 18 18 22
3. Se determina mediana, ca fiind al 5-lea termen din seria ordonata: Me=12 angajati
Interpretare:
50% dintre firmele din esantion au angajat mai putin de 12 persoane in regim part-time si 50% - mai mult.
Modul:
Valoarea care se repeta cel mai des (sau valoarea cu frecventa maxima de aparitie) este 18. Asadar,
Mo=18 angajati.
Pentru aceasta, intai determinam dispersia (s2), apoi abaterea standard (s):
2
S-a lucrat pe seria ordonata.
angajati
> 35%, rezultand ca seria nu este omogena, iar media nu este reprezentativa.
d. Cuartilele seriei sunt valori care impart seria ordonata in 4 parti egale. Exista 3 cuartile: Q1, Q2
(=Me) si Q3.
Se urmeaza aceiasi pasi ca si la determinarea medianei.
Dupa ce s-a ordonat seria, se determina locul primei cuartile:
Q1 este egala cu media aritmetica a celui de-al doilea si a celui de-al treilea termen al seriei
ordonate.
Interpretare: 25% dintre firme au angajat mai putin de 8,5 ~9 persoane in regim part-time, iar
75% dintre firme au angajat mai mult de 9 persoane in regim part-time.
Q2 = Me = 12 angajati.
Se determina locul cuartilei 3:
Q3 este egala cu media aritmetica a celui de-al saptelea si a celui de-al optulea termen al seriei
ordonate.
angajati
Interpretare: 75% dintre firme au angajat mai putin de 18 persoane in regim part-time, iar 25%
dintre firme au angajat mai mult de 18 persoane in regim part-time.
e. Sunt considerate valori extreme (outliers) valorile care indeplinesc una din conditiile:
xi Q1 1,5 IQR sau xi Q3 1,5 IQR
IQR = Q3 – Q1 = 18-8,5=9,5, unde IQR este abaterea intercuartilica.
Q1-1,5 x IQR = 8,5 – 1,5 x 9,5 = -5,75
Q3+1,5 x IQR = 18 + 1,5 x 9,5 = 32,25
Cum nu exista in serie nici o valoare mai mica decat -5,75 sau mai mare decat 32,25,
concluzionam ca nu exista valori extreme (de tip “outlier”) in serie.
3
Sau se poate folosi coeficientul de asimetrie Fisher, a carui valoare este afisata in tabelul
Descriptive Statistics: Skewness=-0,65<0 exista o asimetrie negativa, in serie predomina valorile
mari
Cum exista o asimetrie medie
Boltirea/aplatizarea se analizeaza cu ajutorul coeficientului de boltire/aplatizare, a carui valoare
este afisata in tabelul Descriptive Statistics: kurtosis = k = -0,95<0, ceea ce inseamna ca
distributia firmelor dupa numarul angajatilor in regim part-time este mai aplatizata decat
distributia normala, iar valorile sunt mai putin concentrate in jurul mediei decat in distributia
normala.
Se determina numarul firmelor din esantion care indeplinesc conditia de a avea cel putin 16 angajati in
regim part-time. Se noteaza cu m acest numar
m=4 (sunt patru valori cel putin egale cu 16: 16, 18, 18, 22)
4
Aplicatia 2
Pentru 150 de clienti ai unui magazine de produse cosmetice se cunosc sumele alocate lunar pentru
achizitionarea unui produs (unitati monetare u.m.):
a) Reprezentati grafic datele si analizati grafic forma distributiei clientilor dupa sumele alocate.
b) Determinati frecventele relative si frecventele relative cumulate crescator, interpretati a treia
valoare.
c) Determinati suma medie alocata lunar de un client pentru achzitionarea produsului si aratati daca
este reprezentativa.
d) Completati urmatoarele afirmatii:
- Jumatate dintre clientii din esantion au alocat mai putin de …….. u.m. pentru achizitionarea
produsului.
- Cei mai multi client au alocat ……. u.m. pentru achizitionarea produsului.
e) Analizati asimetria distributiei folosind un indicator adevat.
f) Determinat media si dispersia unei variabile altenative, pentru care starea favorabila este data de
clientii care au alocat cel mult 60 de u.m. pentru achizitionarea produsului.
Rezolvare:
a) Poligonul frecventelor
5
Distributie aproximativ normala, cu asimetrie negativa, predomina valorile mari
Interpretare: In medie, un client din esantion a alocat lunar 69 unitati monetare pentru achizitionarea
produsului.
Pentru aceasta, intai determinam dispersia (s2), apoi abaterea standard (s):
u.m.
< 35%, rezultand ca seria este omogena, iar media este reprezentativa.
6
Pentru determinarea medianei pe date grupate, se parcurg urmatorii pasi:
- se calculeaza frecventele absolute cumulate crescator: vezi coloana 9 a tabelului de mai sus
(Fci)
se determina locul medianei in serie:
Interpretare: 50% dintre clienti aloca mai putin de 70 u.m. pentru achizitionarea produsului, iar 50% - mai
putin. Se completeaza prima afirmatie cu “70” .
Este valoarea “xi” cu frecventa maxima. Cum frecventa maxima este 60 (vezi coloana cu ni), Mo=70
u.m.
Interpretare: Cei mai multi clienti au alocat 70 u.m. pentru achizitionarea produsului.
f)
- stare favorabila: clientii care au alocat cel mult 60 de u.m. pentru achizitionarea produsului
- stare nefavorabila: clientii care au alocat mai mult de 60 de u.m. pentru achizitionarea
produsului
Se determina numarul clientilor din esantion care indeplinesc conditia de a aloca cel mult 60 u.m. Se
noteaza cu m acest numar
7
Dispersia variabilei alternative este data de:
Aplicatia 3.
Pentru 45 de firme selectate aleator, s-a înregistrat numărul angajaţilor în anul anterior. În urma
prelucrării datelor, s-au obţinut rezultatele:
Numărul angajatilor a. Descrieţi seria de date sub aspectul tendinţei centrale, al
Mean …. variaţiei şi al formei distribuţiei firmelor după numărul de
Median 80 angajati, utilizând indicatori adecvaţi.
Mode 72 b. Ştiind că:
Standard Deviation ….. - 25% dintre firmele din eşantion au mai puţin de 78 de
Sample Variance 244.42 angajati, şi că
Kurtosis -0.33 - Abaterea intercuartilică este 8,
Skewness 0.28 arătaţi dacă valoarea minima şi maximă pot fi considerate
Range 65 outliers.
Minimum 50
Maximum ….
Sum 3735
Count …
Rezolvare:
I. Tendinta centrala:
Media:
Mediana:
Interpretare: 50% dintre firme au mai putin de 88 de angajati, iar 50% - mai mult.
Modul:
Mo=72 angajati
8
II. Variabilitatea:
Interpretare: Diferenta intre numarul maxim si cel minim de angajati este de 65.
Interpretare: numarul angajatilor intr-o firma difera in medie cu 15,63 ~ 16 angajati de numarul mediu de
angajati la nivelul esantionului.
- Coeficientul de variatie:
Interpretare: seria are o asimetrie pozitiva (coefficient pozitiv), slaba (valoarea coeficientului este intre 0
si 0,5), predomina valorile mici.
Interpretare: distributia este platicurtica (mai aplatizata decat distributia normala), deci valorile sunt mai
putin concentrate in jurul mediei decat in distributia normala.
b. Din afirmatia: “25% dintre firmele din eşantion au mai puţin de 78 de angajati” rezulta ca Q1 = 78.
Din afirmatia: “Abaterea intercuartilică este 8” rezulta ca IQR = 8
Cum IQR=Q3-Q1 rezulta ca Q3 = Q1 + IQR = 78+8=86.
Sunt considerate valori extreme (outliers) valorile care indeplinesc una din conditiile:
9
Aplicatia 4.
Pentru 10 supermarketuri amplasate în două zone ale unui oraş (Z1, Z2) a fost înregistrat profitul
obtinut in anul anterior (milioane lei). Datele – grupate după locaţia de amplasare a
supermarketurilor – sunt prezentate în următorul tabel:
Zona de amplasare Profit in anul anterior (milioane lei)
Z1 20; 23; 26; 23; 28
Z2 18; 15; 21; 16; 20
a) Determinati profitul mediu al unui supermarket din fiecare zona si aratati care grupă de
de supermarketuri este cea mai omogenă din punctul de vedere al profitului?
Argumentaţi.
b) Ce procent din variaţia totală a profitului este explicat de alţi factori decât zona de
amplasare a supermarketurilor?
Se calculeaza mediile, dispersiile, abaterile standard si coeficientii de variatie pentru fiecare grupa:
Grupa 1 (Zona 1)
mil. lei
mil. lei
Grupa 2 (Zona 2)
mil. lei
mil. lei
10
Cum v1 si v2 < 35% ambele grupe sunt omogene, ambele medii sunt representative.
Cum insa v1 < v2 prima grupa este mai omogena, si prima medie este mai reprezentativa decat a doua
medie.
SUMMARY
Standard
Count Average Variance
Groups Sum Deviation vi(%)
(ni) ( ) ( )
( )
Z1 5 120 24 9,5 3,08 12,83
Z2 5 90 18 6,5 2,55 14,16
58% din variatia totala a profitului este explicat (determinat) de zona de amplasare a supermarketului.
Coeficientul de nedeterminatie:
42% din variatia totala a profitului este explicat (determinat) de factorii aleatori sau reziduali (altii decat
zona de amplasare a supermarketului).
11
Aplicatia 5 (varianta a aplicatiei 4)
Pentru 10 supermarketuri amplasate în două zone ale unui oraş (Z1, Z2) a fost înregistrat profitul
obtinut in anul anterior (milioane lei). In urma prelucrarii datelor, s-a obtinut următorul tabel:
Count Variance
Groups Sum
(ni) ( )
Z1 5 120 9,5
Z2 5 90 6,5
a) Care grupă de de supermarketuri este cea mai omogenă din punctul de vedere al
profitului? Argumentaţi.
b) Determinati influenta procentuala a zonei de amplasare a supermarketurilor asupra
variatiei profitului acestora.
c) Studiati reprezentativitatea profitului mediu pe total esantion.
mil. lei
mil. lei
Cum v1 si v2 < 35% ambele grupe sunt omogene, ambele medii sunt representative.
Cum insa v1 < v2 prima grupa este mai omogena, si prima medie este mai reprezentativa decat a doua
medie.
12
Se determina Varianţa dintre grupe (Sum of Squares Between Groups):
58% din variatia totala a profitului este explicat (determinat) de zona de amplasare a supermarketului.
Coeficientul de nedeterminatie:
42% din variatia totala a profitului este explicat (determinat) de factorii aleatori sau reziduali (altii decat
zona de amplasare a supermarketului).
13