Sunteți pe pagina 1din 22

UNIVERSITATEA VALAHIA TÂRGOVIŞTE

Facultatea de Ingineria Mediului şi Stiinta Alimentelor


Str.Aleea Sinaia, nr. 13, B1, Târgovişte, 0200, jud. Dâmboviţa, ROMANIA
e-mail: fimbdec@valahia.ro

SPECIALIZAREA: SCECM

TEHNICI DE PRELUCRAREA DATELOR


EXPERIMENTALE
- Proiect -

Coordonator ştiinţific:
Conf. dr. ing. Alexandrescu Daniela

Masterand:

- TARGOVISTE -
2020

1
TEHNICI DE PRELUCRAREA DATELOR
EXPERIMENTALE
- Proiect -

Prelucrarea datelor este o etapă importantă de trecere de la datele primare


concrete la valori specifice, la sistemul de indicatori sintetici corespunzător
modului de manifestare a fenomenului studiat, cuprinzând tehnicile prin
intermediul cărora datele colectate sunt transformate în informaţii.

1.CERINŢE PROIECT
1
2 1. Identificaţi seturi de date reprezentând măsurători de calitate a
diferiților poluanți amosferici monitorizați (PM10, NOx, CO, SO, etc)
(www.calitate aer.ro)
3 2. Prezentaţi statistica descriptivă a variabilelor setului de date
utilizând programul SPSS.
4 3. Analizaţi tendinţa centrală şi varianţa pentru cele 3 variabile
(parametrul/poluantul ales). Prezentaţi atât rezultatele statistice, cât şi
concluziile acestora.
5 4. Analiza diferențială

2
Datele introduse în proiect pot fi de la 2, 3 poluanți monitorizați (PM10,
NOx, CO, SO, etc) înregistrați pe 3 zile (pentru a vă ușura munca)

2. INTRODUCEREA DATELOR DE MEDIU

Se selectează “Type in data” si click OK

Datele pot fi introduse manual pe fiecare coloană (reprezentând variabila de


interes = de exemplu şirul de măsurători reprezentând concentraţia SO2 în
aer sau concentraţia nitraţilor în apă), rând cu rând.

Sau

Copy/Paste dintr-o foaie de calcul Microsoft Excel

Exemplu:

3
Se deschide Fişierul

Seturile de date pentru analiză în cadrul acestui proiect reprezintă mediile


lunare ale măsurătorilor de dioxid de azot, respectiv dioxid de sulf
determinate în municipiul Târgovişte:

Şi

Tipuri de analize pretabile în prelucrarea datelor de mediu:


1. Analiza primara a datelor
 Masurarea tendintei centrale
 Analiza variantei
 Stabilirea normalitatii distributiei

4
ANALIZA NO2

Se selectează pe rand fiecare din cele 3 coloane reprezentând anii 2005-


2007, click mouse dreapta, Copy
Se deschide fereastra programului SPSS si se executa comanda paste

5
DEFINIREA NUMELUI
Dublu click pe capul coloanei (var00001) pentru definirea variabilei
NO2 – anul 2005 Se va scrie azot2005. Se repetă operaţia pentru fiecare
variabilă (azot2006 si azot2007) – atentie! Fără spaţiu

6
Se salvează fişierului SPSS NumeStudentmaster2013.sav (File/Save as)

Punctul 1 al proiectului:
Măsurarea tendinţei centrale

Dispersia observaţiilor
 Grupul modal (modulul) = Grupul care cuprinde cele mai multe
componente comparativ cu celelalte grupuri
 Mediana = Valoarea care imparte numarul de observatii in doua
grupuri egale - MEDIAN
 Media aritmetica - MEAN

Indicatori ai dispersiei

 Distributia frecventelor (relative) – graficul histogramelor


 Cuartile, decile, centile – QUARTILE RANGE
 Amplitudinea variatiei (Xmax – Xmin) - RANGE
 Abaterea medie patratica - STANDARD DEVIATION
 Varianţa - VARIANCE

 Coeficientul de variatie – un indicator important utilizat in cercetarea


stiintifica

7
Pentru obţinerea rezultatelor statistice descriptive

Meniul Statistics/Summarize/Descriptives

Selecţia variabilelor

Se selectează în stânga şi se apasă pe butonul cu săgeată din mijloc


După selectarea variabilelor se tastează Options

8
Se bifează căsuţele din imagine reprezentând indicatorii statistici ai
tendinţei

Prin apăsarea butonului Continue /OK se lansează fereastra OUTPUT


(Specifică programelor SPSS) cu rezultatul analizei statistice pentru cele 3
variabile selectate (reprezentând evoluţia anuală a concentraţiei de dioxid de
azot).

Indivizi, Amplitudine, Min, Max, Media, Abaterea erorii, Abaterea mediei, Varianţa

9
IMPORTANT! Fereastra OUTPUT cumulează toate analizele care se vor
efectua în continuare. A nu se închide deoarece se pierd rezultatele analizei,
ceea ce înseamnă repetarea operaţiunilor

Pentru obţinerea rezultatelor statistice privind distribuţia datelor

Meniul Statistics/Summarize/Frequencies

Selectăm variabilele

Debifăm Display frequency tables


Click Statistics

10
Selecţia indicatorilor statistici ai tendinţei centrale şi ai dispersiei/ Continue

Click butonul Charts/ Selectăm Histograms with normal curve/ Continue

OK

11
Fereastra OUTPUT prezintă rezultatul analizei statistice pentru tendinţa
centrală, dispersia şi distribuţia celor 3 variabile selectate (reprezentând
evoluţia anuală a concentraţiei de dioxid de azot).

şi sub formă grafică


AZOT2007
6

2
Frequency

1 Std. Dev = 7.18


Mean = 31.8
0 N = 12.00
25.0 30.0 35.0 40.0 45.0 50.0

AZOT2007

12
AZOT2005
3.5

3.0

2.5

2.0

1.5

1.0
Frequency

Std. Dev = 5.82


.5
Mean = 28.3
0.0 N = 12.00
20.0 22.5 25.0 27.5 30.0 32.5 35.0 37.5

AZOT2005


TEMĂ: Încercaţi să interpretaţi aceste rezultate (inteligibil pentru o
persoană nefamiliarizata cu jargonul statistic ~ cu cuvintele voastre)
Exemplu: Se constată că media, mediana şi varianţa cele mai mari s-au
înregistrat în anul 2007.

2. Analiza diferentiala
Identificarea existentei unor diferente statistice intre esantioane (grupuri)

Analiza bivariata a datelor

Presupune masurarea gradului de asociere a doua variabile sub aspectul:


 Directiei (naturii)
 Intensitatii
 Semnificatiei statistice

Punctul 2 al proiectului:
Compararea mediilor – testul Student (t)

Statistics/Compare Means/Paired-Samples T test

13
Se bifează pe rând variabilele pentru testarea semnificaţiei statistice la
95% grad de încredere în perechi 2005-2007, 2005-2006 şi 2006-2007

Click pe butonul din mijloc şi OK

Fereastra OUTPUT afişează următoarele rezultate

14
15
Raport valori date
Interval:2020/02/01 00:00:00 - 2020/02/04 00:00:00

 
9830B - CO 9841B - NO 9841B - NO2
Zi/Ora
Valori orare Valori orare Valori orare
Valoare
Valoare [µg/m³] Valoare [µg/m³]
[mg/m³]
2020-02-01 01 0,51 7,03 49,43
2020-02-01 02 0,54 4,53 45,93
2020-02-01 03 0,32 4,68 40,16
2020-02-01 04 0,21 5,71 34,49
2020-02-01 05 0,17 4,47 33,07
2020-02-01 06 0,14 4,32 30,39
2020-02-01 07 0,14 4,73 33,17
2020-02-01 08 0,19 8,26 37,93
2020-02-01 09 0,33 22,55 43,70
2020-02-01 10 0,24 13,42 30,08
2020-02-01 11 0,19 8,22 29,51
2020-02-01 12 0,14 5,49 20,05
2020-02-01 13 0,19 6,59 22,81
2020-02-01 14 0,17 3,31 15,68
2020-02-01 15 0,14 1,96 9,96
2020-02-01 16 0,14 2,20 11,20
2020-02-01 17 0,19 2,16 16,66
2020-02-01 18 0,22 2,10 25,70
2020-02-01 19 0,26 2,98 31,84
2020-02-01 20 0,44 10,44 67,77
2020-02-01 21 0,76 10,60 63,59
2020-02-01 22 0,67 5,48 51,22
2020-02-01 23 0,65 4,51 43,73
2020-02-01 24 0,38 3,56 31,87
2020-02-02 01 0,23 1,61 21,67
2020-02-02 02 0,16 1,83 18,99
2020-02-02 03 0,16 1,67 12,07
2020-02-02 04 0,16 2,36 23,37
2020-02-02 05 0,07 1,80 14,79
2020-02-02 06 0,07 7,23 21,80
2020-02-02 07 0,11 2,58 25,48
2020-02-02 08 0,12 7,92 32,19
2020-02-02 09 0,10 4,69 19,90
2020-02-02 10 0,08 2,92 12,61
2020-02-02 11 0,08 2,60 9,41
2020-02-02 12 0,07 2,25 7,29
2020-02-02 13 0,07 2,51 10,00
2020-02-02 14 0,07 2,23 7,24

16
2020-02-02 15 0,06 1,63 5,83
2020-02-02 16 0,06 1,53 5,35
2020-02-02 17 0,06 1,39 6,49
2020-02-02 18 0,05 1,76 7,53
2020-02-02 19 0,03 1,37 6,98
2020-02-02 20 0,02 1,55 6,97
2020-02-02 21 0,02 1,57 7,33
2020-02-02 22 0,02 1,71 15,32
2020-02-02 23 0,03 1,88 17,88
2020-02-02 24 0,03 1,43 11,97
2020-02-03 01 0,06 1,55 15,21
2020-02-03 02 0,07 1,62 12,92
2020-02-03 03 0,07 1,29 14,02
2020-02-03 04 0,08 6,20 37,52
2020-02-03 05 0,08 1,84 22,80
2020-02-03 06 0,08 1,98 24,41
2020-02-03 07 0,09 1,67 20,66
2020-02-03 08 0,10 1,65 23,91
2020-02-03 09 0,13 5,37 29,70
2020-02-03 10 0,13 3,33 28,93
2020-02-03 11 0,10 3,05 14,01
2020-02-03 12 0,08 2,87 9,41
2020-02-03 13 0,08 2,30 8,08
2020-02-03 14 0,08 2,41 8,14
2020-02-03 15 0,08 2,77 10,21
2020-02-03 16 0,07 2,18 13,22
2020-02-03 17 0,07 1,92 13,13
2020-02-03 18 0,06 1,87 11,99
2020-02-03 19 0,06 1,98 11,80
2020-02-03 20 0,05 1,62 9,89
2020-02-03 21 0,05 1,49 11,20
2020-02-03 22 0,06 1,61 12,27
2020-02-03 23 0,08 2,13 17,86
2020-02-03 24 0,06 1,56 10,25

17
Descriptive Statistics

N Range Minimum Maximum Mean

Statistic Statistic Statistic Statistic Statistic Std. Error

NO 72 21,26 1,29 22,55 3,6886 ,39765


NO2 72 62,42 5,35 67,77 21,3881 1,63934
SO2 72 6,84 ,63 7,47 3,2733 ,17487
Valid N (listwise) 72

Descriptive Statistics

Std. Deviation Variance Skewness Kurtosis

Statistic Statistic Statistic Std. Error Statistic Std. Error

NO 3,37416 11,385 3,168 ,283 13,668 ,559


NO2 13,91027 193,496 1,259 ,283 1,438 ,559
SO2 1,48385 2,202 ,813 ,283 ,955 ,559
Valid N (listwise)

Frequencies

18
Statistics

NO NO2 SO2

Valid 72 72 72
N
Missing 0 0 0
Mean 3,6886 21,3881 3,2733
Std. Error of Mean ,39765 1,63934 ,17487
Median 2,2750 17,2600 3,0750
a a
Mode 1,55 9,41 2,65a
Std. Deviation 3,37416 13,91027 1,48385
Variance 11,385 193,496 2,202
Range 21,26 62,42 6,84
Minimum 1,29 5,35 ,63
Maximum 22,55 67,77 7,47
Sum 265,58 1539,94 235,68
25 1,6800 10,4875 2,2150

Percentiles 50 2,2750 17,2600 3,0750

75 4,6425 29,9850 4,0000

a. Multiple modes exist. The smallest value is shown

Histogram

19
20
21
22

S-ar putea să vă placă și