Documente Academic
Documente Profesional
Documente Cultură
Badia Mariana
MANAGEMENTUL DATELOR
Lucru individual
Specialitatea – Asistenţă Socială
Şef Departament
(semnătura)
Autorul:
(semnătura)
CHIŞINĂU-2022
SARCINI LA TEMA 1
1. În tabelul de mai jos indicați cu semnul X în coloanele respective care din următoarele grupuri de
indivizi formează o populație sau care – un eșantion (10 puncte):
Pentru populație – dați exemplu de eșantion, iar
Grup de indivizi Populație? Eșantion? pentru eșantion – numiți populația din care a
fost extras
1 Studenții X Un grup de studenți de la USM ar fi un
Universității de Stat eșantion.
din Moldova (USM);
2 Studenții Facultății X Un grup de studenți de la Facultatea de
de Drept de la USM; Drept de la USM sunt un eșantion dar toți
studenții Facultății sunt populație.
3 Un grup de persoane X Toate persoanele din orașul Chișinău
din or. Chișinău; formează populația dar un grup de persoane
luat întâmplător formează un eșantion.
4 Primarii localităților X Pentru a fi un eșantion trebuie să luăm doar
din r-nul Ialoveni; un grup sau câțiva din primarii r-nului
Ialoveni.
5 O lingură de fasole X Toate fasolele din cratița care fierbe sunt
luate din cratița în populația dar acea lingură de fasole
care ele se fierb; reprezintă un eșantion.
6 10 nuci dintr-un sac X Sacul de nuci formează populația , iar 10
cu nuci; nuci formează eșantionul din acest sac.
7 O alee de copaci din X Întreg parcul este o populație dar o alee
parc. este un eșantion.
2. Propuneți un exemplu de populație. Pentru această populație formulați câte 2 exemple de
(15 puncte):
Populația: Nr. de copii născuți în anul 2021 pe teritoriul Republicii Moldova.
Variabile nominale 1. grupa sangvină
2. culoarea ochilor
Variabile ordinale 1. 01.01.2021- 30.06.2021
2. 01.07.2021-31.12.2021
Variabile numerice 1. Vârsta mamei
2. Vârsta tatălui
Variabile dihotomice 1. masculine/feminin
2. viu/mort
Variabile discrete 1. al câtelea copil
2. scorul ApGar primit la nastere
2
Variabile continue 1. înălțimea
2. greutatea
3. Completați tabelul de mai jos cu frecvenţe absolute, relative, valide şi cumulate pentru datele
despre numărul de copii din familiile unui bloc de locuit din Chişinău (n/s − nu se ştie) (15
puncte):
0 2 1 0 2 2 0 1 1 0 3 2 0 n/s 1 2 0 4 1 0 2 2 0 1 1 2 2 3 n/s 1 2 1 0 0 1 0 1 2 4 2 1 1 1 0 2 0 2
2 4 1 0 1 n/s 0 1 0 0 1 2 4 2 n/s 1 2 0 1 1 2 2 1 0 n/s 2 2 3 0 1 0 2 1
4. Să se compare trei parcuri după distribuţia speciilor de copaci (U – ulm, P – pin, S – stejar,
B – brad, A – arţar) (15 puncte):
Parcul 1: P P S B B B P P A P P S S A A B B B P P
Parcul 2: U U U P S B A B S P P P P P U U S P P U
Parcul 3: U U P P P S B A P P P S U U P U U U P P
Rezolvare:
a) Tipul variabilei: nominală
b) Indicatori: Mo, IVC
c) Distribuția de frecvențe:
Specie Pin Stejar Brad Arțar Ulm
Parcul 1 8 3 6 3 0
Parcul 2 8 3 2 1 6
Parcul 3 9 2 1 1 7
d) Mo1=Pin Mo2=Pin Mo3=Pin
Concluzie: Categoria de copaci cu cea mai mare frecvență în toate cele 3 parcuri sunt speciile de
Pin.
3
IVC1=88.12%
IVC2=89.37% IVC3=82.5%
Concluzie: Distribuţiiile de frecvenţe sunt asimetrice
5. Să se compare următoarele sectoare ale mun. Chişinău după nivelul de poluare a aerului (F –
foarte înalt, I – înalt, M – mediu, J – jos, N – practic nu e poluat), conform opiniilor a 20 de
experţi
(15 puncte):
Ciocana: I I M M F F J I I I M M M I M M I I I F
Botanica: F I F I M J M M F F I I I M F F I I I F
Centru: F N M M M I I I I F F F I M M I F F I I
Rezolvare:
a) Tipul variabilei: ordinală
b) Indicatori: Mo, Me. IVC
c) Distribuția de frecvențe:
Sector Foarte înalt Înalt Mediu Jos Nepoluat
Ciocana 3 9 7 1 0
Botanica 7 8 4 1 0
Centru 6 8 5 0 1
d) Mo1=”Înalt” Mo2=”Înalt” Mo3=”Înalt”
Concluzie: Indicatorul nivelul de poluare a aerului “ Înalt” este cu ceam mai mare frecvență
Me1=”Înalt” Me2=”Înalt” Me3=”Înalt „
Concluzie: Aranjând în șir valorile pentru fiecare sector în parte am observat că la toate cele trei
sectoare mediana este valoarea „Înalt”.
IVC1=81.25% IVC2=84.37% IVC3= 85.62%
Concluzie: Distribuţiiile de frecvenţe sunt asimetrice, distribuţia nivelelor de poluare în toate
cele 3 sectoare, este neuniformă.
6. Să se compare următoarele trei grupe după notele obţinute la examen (15 puncte):
Grupa 1: 8 8 6 6 6 5 7 5 7 5 7 7 5 5 5 8 5 5 7 7
Grupa 2: 5 9 10 9 10 10 10 9 8 7 8 7 8 9 9 9 10 10 9 9
4
Grupa 3: 6 7 6 7 8 9 6 7 6 7 8 10 6 7 6 7 7 7 6 7
Rezolvare:
a) Tipul variabilei: numerică
b) Indicatori: Mo, Me , M, A, ϭ
c) Distribuția de frecvențe:
Grupa 5 6 7 8 9 10
Grupa 1 8 3 6 3 0 0
Grupa 2 1 0 2 3 8 6
Grupa 3 0 7 9 2 1 1
d) Mo1=5 Mo2=9 Mo3=7
Concluzie: În Grupa 1 cea mai întâlnită notă este 5, în Grupa 2 cea mai întâlnită este nota 9 iar în
Grupa 3 cea mai întâlnită notă este 7.
Me1=6 Me2=9 Me3=7
Concluzie: Aranjând în șiruri notele pentru fiecare grupă am determinat( calculat mediana pentru
fiecare grupă astfel am obținut rezultatele mediana pentru Grupa 1=6 , mediana pentru Grupa 2
este 9 iar pentru Grupa 3 este 7.
M1=6,20 M2=6,05 M3=7
Concluzie: Calculând media notelor obținute la examen pentru fiecare grupă,am obținut
rezultatele indicate mai sus.
A1=8-5=3 A2=10-5=5 A3=10-6=4
Concluzie: Calculând indicatorul de dispersie amplitudinea pentru fiecare grupa am obținut:
A1=3 A2=5 A3=4
− Abaterea standard, se calculează după formula:
√
n
ϭ= ∑
2
(x i−M )
i=1
n
5
7. Ca rezultat al cercetării unei păduri după soiurile de copaci ce cresc în ea, a fost determinat
indicatorul statistic moda, care s-a dovedit a fi pinul. Aceasta înseamnă că (vopsiți cu roșu
variantele corecte) (5 puncte):
a) În medie în pădure se întâlneşte soiul de pin.
b) În pădure cresc numai pini.
c) În pădure este necesar a mări numărul pinilor.
d) Cei mai înalţi copaci din pădure sunt pinii.
e) În pădure cel mai des se întâlneşte pinul.
f) În pădure diferite soiuri de copaci, inclusiv – pinul, sunt repartizate uniform.
?8. În urma cercetării unei păduri după soiurile de copaci ce cresc în ea, a fost determinat
indicatorul statistic Indicele variaţiei calitative (IVC), care s-a dovedit a fi egal cu 98,5%. Vopsiți
cu roșu variantele false din următoarele afirmaţii (5 puncte):
a) În pădure este acelaşi număr de copaci de fiecare soi.
b) Distribuţia soiurilor de copaci este aproape uniformă.
c) Distribuţia soiurilor de copaci este foarte neuniformă.
d) În pădure cresc mai multe soiuri de copaci, unul din care se întâlnește cel mai frecvent.
9. După susţinerea unui examen de către o grupă de studenţi (presupunem – 8), a fost determinată
nota medie a grupei M=8. Ţinând cont de faptul că studenţii au fost notaţi în sistemul zecimal
(note de la 1 la 10), determinaţi care și când următoarele afirmaţii pot fi adevărate ( în cazul
afirmațiilor corecte aduceți exemple formate din șiruri de 8 note) (5 puncte):
a) Studenţii au susţinut examenul pe note diferite.- F
Exemplu:
b) Toţi studenţii au primit note de 8. A
Exemplu: 8 8 8 8 8 8 8 8
c) Niciun student n-a primit nota 8.- F
Exemplu:
d) Nota 8 a fost cea mai frecventă în grupă.A
Exemplu:6 7 8 8 8 8 9 10
e) Atât nota maximală, cât şi cea minimală în grupă a fost nota 8. A
Exemplu:8 8 8 8 8 8 8 8
f) Un student a primit nota 10, unul – nota 6, iar restul studenţilor − note de 8.- A
6
Exemplu:6 8 8 8 8 8 8 10
SARCINI LA TEMA 2
1. Descrieți istoria dezvoltării programului SPSS (din Internet, până la o pagină!) (10 puncte).
SPSS (Statistical Package for the Social Sciences) este unul dintre cele mai puternice şi utilizate
programe statistice, , alături de STATISTICA, SAS, SYSTAT, S-PLUS, R-Project, etc. Acest
pachet integrat asigură acoperirea procedeelor specifice din Statistica descriptivă, Statistica
inferenţială şi Analiza datelor. Programul a devenit deosebit de atractiv pentru utilizatori deoarece
permite tratarea datelor statistice fără a impune cunoaşterea formulelor de calcul, îmbinând
posibilităţile de prelucrare statistică cu facilităţile oferite de programele de calcul tabelar (Excel,
Lotus, Quattro Pro) pentru condensarea datelor în tabele şi reprezentarea lor grafică.
Programul este un produs al firmei SPSS Inc., care s-a impus în domeniul realizării de software
pentru prelucrarea statistică a datelor, în principal prin SPSS şi SYSTAT. SPSS a fost creat la
Universitatea din Stanford, în anul 1968, pentru a asigura gestiunea şi analiza datelor statistice în
domeniul ştiinţelor sociale şi al psihologiei. Ulterior, utilizarea programului s-a extins spre
economie, marketing, educație, medicină etc. . În afară de analizele statistice posibile, programul
are componente puternice pentru managementul datelor (selectare, reconfigurare, creare de date
noi) şi pentru documentarea datelor (există un dicţionar metadata, care reţine caracteristici ale
datelor). Se mai poate adăuga flexibilitatea privind tipurile de date acceptate ca şi modulul de
construire a rapoartelor.
În acelaşi timp, evoluţiile din domeniul calculatoarelor au marcat şi dezvoltarea SPSS, prin
apariţia imediată a unor noi versiuni. Începând cu versiunea 7, realizată în 1995, SPSS a devenit un
produs pentru Windows, ajungându-se astăzi la versiunea 29(SPSS 29- septembrie 2022), aria de
aplicabilitate extinzânduse-se de la o versiune la alta, cu modul de operare si facilitățile oferite. La
ora actuală, SPSS este realizat sub formă modulară, fiecare utilizator putându-şi achiziţiona doar
acele componente care îi sunt necesare. Cele mai „comercializate" module sunt: Base module,
Professional Statistics, Advanced Statistics, Tables, Exact Tests, CHIAD şi Categories.
Statisticile SPSS plasează constrângeri asupra structurii interne a fișierelor, a tipurilor de date, a
procesării datelor și a fișierelor potrivite, care împreună simplifică considerabil programarea.
Seturile de date SPSS au o structură de tabel bidimensională, în care rândurile reprezintă de obicei
cazuri (cum ar fi indivizi sau gospodării), iar coloanele reprezintă măsurători (cum ar fi vârsta,
sexul sau venitul gospodăriei). Sunt definite doar două tipuri de date: numeric și text (sau "șir").
Toată prelucrarea datelor are loc secvențial de la caz la caz prin fișier (set de date). Fișierele pot fi
potrivite unu-la-unu și unu-la-mulți, dar nu mulți-la-mulți. În plus față de acea structură și procesare
cazuri cu variabile, există o sesiune de matrice separată în care se pot procesa date ca matrice
folosind operații de matrice și algebră liniară.
SPSS este un produs orientat spre utilizator şi permite: - analiza datelor sub multiple
aspecte; - extinderea datelor cercetărilor realizate pe un eşantion, la nivel naţional; - construirea
tabelelor de ieşire în diverse forme, inclusiv cu totaluri şi structuri pe orizontală şi verticală; -
construirea diagramelor sub diferite forme (linii, bare, sectoare etc.); - crearea prezentărilor şi a
rapoartelor; - utilizarea datelor în regim interactiv şi construirea seturilor de funcţii ale sistemului
pentru folosirea lor repetată (automatizarea analizei datelor); - exploatarea facilităţilor oferite de
Internet.
7
2. Descrieți posibilitățile de prelucrare a datelor cu programului SPSS (din Internet, până la o
pagină!) (10 puncte).
1. O bază de date conține următoarele caracteristici ale indivizilor: vârsta (în ani), mediul de
reședință (sat, oraș), opinia față de diferite canale TV (preferat, indiferent, nepreferat). Care din
următoarele informații pot fi determinate din această bază de date (colorați-le cu roșu) (5 puncte):
a) repartizarea respondenților după vârstă;
b) repartizarea respondenților după culoarea ochilor;
c) procentul pensionarilor din populația cercetată;
d) numărul de canale TV preferate de fiecare respondent;
e) care canal TV e cel mai preferat de respondenții de la sat;
f) atitudinea ucrainenilor față de canalele TV.
CHESTIONAR
9
5) eu nu citesc
6) nu pot răspunde
7) altceva (specificaţi) __________________________________________________
Plac_cit Dumneavoastre Vă 1- da
place să citiţi 2- nu
10
7- în alt loc (specificaţi) __________________
SARCINI LA TEMA 5
1. În Figura 5.1 sunt reprezentate frecvențele răspunsurilor unui grup de respondenți cu privire la
aprecierea sănătății lor, calculate în SPSS. În liniile a) - e) de sub tabel să se descrie rezultatele
marcate (10 puncte).
11
e) 83,0 % din respondenți au starea de sănătate bună
12
SARCINI LA TEMA 8
13
Barem note:
Puncte acumulate Nota
180 - 200 10
160 - 179 9
140 - 159 8
120 - 139 7
100 - 119 6
80 - 99 5
14