Documente Academic
Documente Profesional
Documente Cultură
2 Pre-tratarea datelor
Este esențială pentru a evita o greșeală.Primul pas în EDA cuprinde date univariate de
analiză utilizând statistici de bază și descriptive (de exemplu, calcul din medie, abaterea
standard, varianță, șiretură, kurtoză, corelație matrice, t-test, F-test, ANOVA, cutii de
carton și whisker și verificarea normalității). Apoi, prezența unor valori excepționale,
adică observații care par a sparge modelul sau gruparea ,indicată de marea majoritate a
probelor, ar trebui evaluate deoarece cele mai multe metode convenționale multivariate
sunt sensibile pentru ei. Astfel, trebuie identificate valori extreme și apoi decizia trebuie
luată în legătură cu acceptarea sau respingerea valorii exagerate în procesul de
modelare. În acest scop,analiza manuală convențională și eliminarea valorii extreme
,dar, recent, s-au dezvoltat metode robuste de analiza datelor multivariate, în vederea
reducerii sau eliminării acestora efect al punctelor de date periferice și să permită restul
să fie predominant pentru a determina rezultatele. Metodele robuste se bazează pe
metodele exploratorii și diagnosticarea convențională externă .
Metodele multivariate pot fi subdivizate în funcție de diferite aspecte. În primul rând, ele
sunt diferențiate în funcție de structura care trebuie descoperită sau verificată împreună
cu ele. Metodele de determinare a structurii includ:
Analiza regresiei: investighează influența a două tipuri de variabile una asupra celeilalte.
Se vorbește despre variabilele dependente și independente. Primele sunt așa-numitele
variabile explicative, în timp ce acestea din urmă sunt variabile explicative. Primul
descrie starea actuală pe baza datelor, a doua explică aceste date prin intermediul
relațiilor de dependență dintre cele două variabileAnaliza de variație: determină
influența mai multor variabile individuale asupra grupurilor prin calcularea mediilor
statistice. Aici puteți compara variabilele dintr-un grup, precum și grupuri diferite, în
funcție de unde vor fi asumate abaterile. De exemplu: Care sunt grupurile care fac cel
mai des clic pe butonul "Cumpărați acum" din coșul de cumpărături?
https://en.ryte.com/wiki/Multivariate_Analysis_Methods
hidratare
• 4 maxime: (970 + 1190) 1450 +1940 nm ,diferite O-Hstretching și îndoirea O-H ,bandă
și combinații
http://www.eurofoodwater.eu/pdf/2002/Buening-Pfaue_eurofoodwater2002.pdf
Principala tehnică EDA este PCA, care este adesea primul pas al analizei datelor pentru a
detecta modelele măsurate.PCA este o tehnică care, prin reducerea dimensionala a
datelor, permite sa vizualizezi cat mai mult din datele prezente in datele initiale.
Astfel, PCA transformă variabilele măsurate originale în variabile noi necorelate, numite
componente principale. Fiecare director component este o combinație liniară a
originalului de variabile masurate. Această tehnică permite un grup de axe ortogonale
care reprezintăcele mai mari variați de date . Prima, Componenta principală (PC1)
contabilizează maximul ,varianta totală, a doua (PC2) nu este corelată cu prima și
contabilizează maximul varianței reziduale și așa mai departe până când variația totală
este contabilizată. Din motive practice, este suficient să păstrăm doar acele componente
care țin cont de realizarea unui procent mare din variația totală. Coeficienții liniari din
relația inversă a combinațiilor liniare sunt numite încărcări de componente, adică
coeficienții de corelație între variabilele originale și componentele principale. Valorile
care reprezintă eșantioanele în spațiul definit de principalele componente sunt scorurile
componentelor. Pot fi folosite scorurile ca intrare la alte tehnici multivariate, în loc de
originalele variabile măsurate.
EDA (de exemplu, algoritmul din APC, definiția măsurilor de distanță și algoritmi de
grupare) este o tehnica ce pote fi găsita în chimia standard, articole sau manuale.