Sunteți pe pagina 1din 19

Adnotat SPSS de ieire discriminante Analiza

Aceast pagin prezint un exemplu de analiza discriminant n SPSS cu notele de subsol care explic de ieire. Datele utilizate n acest exemplu sunt dintr-un fiier de date, discrim.sav , cu 244 observaii cu privire la patru variabile. Variabilele include trei variabile continue, numerice ( n aer liber ,sociale i conservator ) i o variabil categoric ( de locuri de munc ), cu trei niveluri: 1) client service, 2) mecanic i 3) dispecer. Suntem interesati de relatia dintre cele trei variabile continue i variabile nostru categoric. Concret, am dori s tiu ct de multe dimensiuni ne-ar trebui s-i exprime aceast relaie. Folosind aceast relaie, putem prezice o clasificare bazat pe variabile continue sau s evalueze ct de bine variabilele continue separa categoriile n clasificarea. Vom discuta gradul n care variabilele continue pot fi folosite pentru a discrimina ntre grupuri. Unele opiuni pentru vizualizarea ceea ce se ntmpl n analiza discriminant poate fi gsit n discriminante Exemplu Analiza Analiza datelor . Pentru a ncepe, putem examina mijloacele generale ale variabilelor continue.

get file = "C: \ Data \ discrim.sav". descriptives variabile = n aer liber sociale conservatoare / = Statisticile spun stddev min max.

Suntem interesati de locuri de munc se refer la modul n care n aer liber, social i conservatoare. S ne uitm la statistici rezumat al acestor trei variabile continue pentru fiecare categorie de locuri de munc.

mijloace tabele = conservatoare n aer liber sociale de locuri de munc / Celule nseamn numrul de stddev.

Din aceast producie, putem vedea c unele dintre mijloacele de aer liber, sociale i conservatoare difer semnificativ de la grup la grup n loc de munc . Aceste diferene vor permite, sperm noi s folosim aceste predictori pentru a distinge observaiile ntr-un singur loc de munc grup din observaiile ntr-un alt loc de munc grup. n continuare, ne putem uita la corelaii ntre aceste trei predictori. Aceste corelaii ne va da cteva indicaii despre ct de mult informaie unic pentru fiecare predictor va contribui la analiza. n cazul n care dou variabile predictor puternic sunt foarte corelate, atunci ei vor fi contribui informaiile partajate pentru a analiza. Variabile necorelate sunt susceptibile de preferat, n acest sens. Ne vom uita, de asemenea, la frecvena de fiecare grup de locuri de munc.

corela ii variabile = n aer liber sociale conservatoare.

frecven e variabile = locuri de munc.

Discriminantului comand n SPSS efectueaz analiza discriminantului liniar canonice, care este forma clasic de analiz discriminant. n acest exemplu, vom specifica n grupuri subcomanda c suntem interesai n variabila de locuri de munc, iar noi list n paranteze valorile minime i maxime observate la locuri de munc . Am lista urmtoare variabilele discriminatorii, sau predictori, n variabilele subcomanda. n acest exemplu, am selectat trei predictori: n aer liber , social i conservatoare . Vom fi interesai n compararea gruprile reale n locuri de munc pentru categoriile anticipate generate de analiz discriminant. Pentru aceasta, vom folosi statisticile subcomanda. Acest lucru ne va furniza statistici de clasificare din producia noastr.

discriminantului / Grupuri de locuri de munc = (1 3) / Variabile = conservatoare n aer liber social / Statistici = masa.

Rezumatul datelor

. o analiz sumar a cauzelor - acest tabel rezum setul de date n ceea ce privete analiza de cazuri valide i excluse. Motivele pentru care s-ar putea exclude SPSS o observaie de la analiza sunt listate aici, i numrul ("N"), precum i la suta din cazuri care se ncadreaz n fiecare categorie (valabil sau una dintre excluderi) sunt prezentate. n acest exemplu, toate observaiile din setul de date sunt valide. . b. Grupul Statistic - Acest tabel prezint distribuia de observaii n cele trei grupuri din cadrul de locuri de munc . Putem vedea numrul de observaii care intr n fiecare dintre cele trei grupuri. n acest exemplu, vom folosi greutatea implicit 1 pentru fiecare observaie n setul de date, astfel nct numrul ponderat de observaii n fiecare grup este egal cu numrul de observaii neponderat n fiecare grup.

Valori proprii i testele cu variabile multiple

c.. Func ia - Aceasta indic funcia de prima sau a doua canonice discriminante liniare. Numrul de funcii este egal cu numrul de variabile discriminatorii, n cazul n care exist grupuri de mai mult de variabile, sau 1 mai puin dect numrul de niveluri din variabila grup. n acest exemplu, de locuri de munc are trei nivele i trei variabile discriminante au fost folosite, deci dou funcii sunt calculate. Fiecare funcie acioneaz ca proiecii ale datelor pe o dimensiune care separ cel mai bun sau o discriminare ntre grupuri.

d.. Eigenvalue - Acestea sunt valorile proprii ale matricei produs a inversului n cadrul grupului-sume-deptrate i eco-produs matrice i ntre grupuri de sume-de-ptrate i eco-produs matrice. Aceste valori proprii sunt legate de corelaii canonice i s descrie ct de mult capacitatea de discriminare posed o funcie. Amploarea ale valorilor proprii sunt informative abilitilor funciile "discriminatorii. Vezi exponent e pentru calculele care stau la baza. e. % din varian - Acesta este procentul de capacitatea discriminatoriu dintre cele trei variabile continue gsite ntr-o funcie dat. Aceast proporie se calculeaz ca procent din eigenvalue funcia de la suma tuturor valorilor proprii. n aceast analiz, primele conturi funcionale pentru 77% din capacitatea discriminatoriu dintre variabilele discriminatorii i a conturilor dou funcii de 23%. Noi putem verifica acest lucru prin faptul c suma valorilor proprii este de 1.081 + 0.321 = 1.402. Atunci (1.081/1.402) = 0,771 i (0.321/1.402) = 0,229. f.. % cumulativ - Aceasta este proporia cumulat a capacitii de discriminare. Pentru orice analiz, proporiile de capacitatea de discriminare se vor nsuma la unul. Astfel, ultima intrare n coloana cumulat va fi de asemenea unul. g.. Corela ia Canonical - Acestea sunt corelaiile canonice ale variabilelor predictor noastre ( n aer liber, sociale i conservator ) i gruprile dinlocuri de munc . Dac lum n considerare variabilele discriminante a fi un set de variabile i un set de manechine generate de variabila grupului nostru de a fi un alt set de variabile, putem efectua o analiza de corelaie canonic cu privire la aceste dou seturi. Din aceast analiz, vom ajunge la aceste corelaii canonice. h.. Test de Func ia (e) - Acestea sunt funciile incluse ntr-un test de dat cu ipoteza nul c corelaii canonice asociate cu funcii sunt toate egale cu zero. n acest exemplu, avem dou funcii. Astfel, primul test prezentat n acest tabel testeaza ambele corelaii canonice ("1 prin 2"), precum i al doilea test a prezentat testeaz corelaia canonic dou singur. i.. 'Lambda Wilks - Wilks 'Lambda este una dintre statistica multivariat calculat de SPSS. Acesta este produsul valorilor (1-canonice corelaie 2 ). n acest exemplu, corelaiile noastre canonice sunt 0.721 i 0.493, astfel nct Wilks 'Lambda testarea ambele corelaii canonice este (1-0.721 2 ) * (1-0.4932 ) = 0.364, iar Wilks "Lambda testarea corelaia canonic doilea este ( 1-0.493 2 ) = 0.757. j. Chi-ptrat - Aceasta este testarea statistica Chi-ptrat care corelaie canonic a funciei dat este egal cu zero. Cu alte cuvinte, ipoteza nul este c funcia, i toate funciile care urmeaz, nu au capacitatea de discriminare. Aceast ipotez este testat folosind acest statistica Chi-ptrat. . K DF - Acesta este efectul de grade de libertate pentru funcia dat. Ea se bazeaz pe numrul de grupuri prezente n variabila categoric i numrul de variabile continue discriminant. Statistica Chi-ptrat este comparat cu o distribuie Chi-ptrat cu grade de libertate declarate aici. l.. Sig. - Aceasta este valoarea p asociat cu statistica Chi-ptrat al unui anumit test. Ipoteza nul c coresponden o functie dat lui canonic i toate corelaiile mici canonice sunt egale cu zero este evaluat cu privire la aceast p-valoare. Pentru un nivel de alfa dat, cum ar fi 0,05, n cazul n care valoarea p este mai mic dect alfa, ipoteza nul este respins. Dac nu, atunci nu reuim s resping ipoteza nul.

Discriminantului Func ia de ieire

M. Coeficien ii standardizate Canonici func ia discriminant - Aceti coeficieni pot fi folosite pentru a calcula scorul discriminant pentru un anumit caz. Punctajul este calculat n acelai mod ca o valoare a prezis la o regresie liniar, utiliznd coeficienii standardizate i variabilele standardizate. De exemplu, s zoutdoor, zsocial i zconservative fi variabilele create prin standardizarea variabilele discriminatorii. Apoi, pentru fiecare caz n parte, scorurile funcionale vor fi calculate cu ajutorul urmtoarelor ecuaii: Score1 = 0.379 * zoutdoor - 0.831 * zsocial + 0.517 * zconservative Score2 = 0.926 * zoutdoor + 0.213 * zsocial - 0.291 * zconservative Distribuia scorurilor la fiecare funcie este standardizat de a avea o medie de deviaie standard de zero i de unul. Amploarea acestor coeficieni indic ct de puternic variabilele discriminatorii afecta scorul. De exemplu, putem vedea c coeficientul standardizat pentru zsocial n prima funcie este mai mare dect n mrime coeficienii pentru celelalte dou variabile. Astfel, sociale va avea cel mai mare impact al trei pe scorul discriminant primul. nr. Matrix Structura - Aceasta este structura canonic, de asemenea, cunoscut sub numele de ncrcare sau de ncrcare canonice discriminante, a funciilor discriminant. Ea reprezint corelaiile dintre variabilele observate (cele trei variabile continue discriminatorii), precum i dimensiunile create cu funciile discriminant neobservabile (dimensiuni).

o. Func ii la centroizi Group - Acestea sunt mijloacele de a scorurilor funciei discriminant pe grupe pentru fiecare funcie calculate. Dac am calculat scorurile prima funcie, pentru fiecare caz n setul de date nostru, si apoi sa uitat la mijloc a punctajelor pe grupe, vom gsi c serviciul pentru clien igrupul are o medie de -1.219, mecanicul grup are o medie de 0.107, iar expedierea grupul are o medie de 1.420. tim c scorurile func ionale au o medie de zero, i putem verifica acest lucru uitandu-se la suma de grup nseamn nmulit cu numrul de cazuri n fiecare grup: (85 * -1.219) + (93 * 0.107) + (66 * 1.420) = 0.

Clasificri anticipate

. p. Clasificare Sumar Prelucrarea - Aceasta este similar cu Rezumatul de procesare analiz de la caz (a se vedea exponent a ), dar n acest tabel, "prelucrate" de cazuri sunt cele care au fost cu succes clasificate pe baza analizei. Motivele pentru care o observaie nu pot fi prelucrate sunt indicate aici.Putem vedea c, n acest exemplu, toate observaiile din setul de date au fost clasificate cu succes. q. Probabilit ile prealabile pentru grupuri - Aceasta este distribuia de observaii n locuri de munc grupuri folosite ca un punct de plecare n analiza. Livrare implicit prealabil este o alocare egal n grupuri, aa cum se vede n acest exemplu. SPSS permite utilizatorilor s specifice antecedente diferite, cu antecedente subcomanda.

. R previzibil grup de membri - Acestea sunt frecvenele estimate ale grupurilor de analiza. Numerele merge n jos pe fiecare coloan indic ct de multe au fost n mod corect i incorect clasificate. De exemplu, din cele 89 de cazuri care au fost prezise a fi n customer service grup, 70 au fost prezis corect, iar 19 au fost incorect prezise (16 de cazuri au fost in mecanicul grup i trei cazuri au fost n expedi ie grup). s.. Original - Acestea sunt frecvenele de grupuri gsite n datele. Noi putem vedea din totalul de rnd care 85 de cazuri se ncadreaz n customer service de grup, 93 se ncadreaz n mecanic de grup, i 66 intr n expedi ie grup. Acestea se potrivesc cu rezultatele le-am vzut mai devreme n producia de frecven e comanda. Pe fiecare rnd, vom vedea ct de multe dintre cazuri n grup sunt clasificate pe analiza noastr n fiecare dintre diferitele grupuri. De exemplu, din cele 85 de cazuri care sunt n customer service de grup, 70 au fost prezis corect i 15 au fost prezis incorect (11 au fost prezis a fi n mecanic grup i patru au fost prezis a fi n expediere grup). T. Count - Aceast parte a tabelului prezint numrul de observaii care se ncadreaz n intersecia dat de original i a prezis apartenena la un grup. De exemplu, putem vedea n aceast parte a tabelului care numrul de observaii iniial n client service grup, dar a prezis s cad n mecanicul de grup este de 11. Totalurile rnd de aceste capete de acuzare sunt prezentate, dar totaluri de coloan nu sunt. . u % - Aceast parte a tabelului prezint la sut din observaii iniial ntr-un anumit grup (enumerate n rndurile), prezis de a fi ntr-un anumit grup (enumerate n coloanele). De exemplu, putem vedea c la suta din observaiile mecanicul grup care au fost prezise a fi n expedi ie grup este 16,1%.Acest lucru NU este acelai ca la sut din observaii prezis a fi n expedi ie grup care au fost in mecanic de grup. Acesta din urm nu este prezentat n acest tabel.

Analiza datelor SPSS Exemple funcia discriminant Analiza


Informatiile Versiune: Cod pentru aceast pagin a fost testat n IBM SPSS 20. Analiza liniar funcia discriminant (de exemplu, analiza discriminant) efectueaz un test cu variabile multiple a diferenelor dintre grupuri. n plus, analiza discriminant este utilizat pentru a determina numrul minim de dimensiuni necesare pentru a descrie aceste diferene. O Uneori se face distincie ntre analiza discriminant descriptiv i analiza discriminant predictiv. Vom fi ilustreze analiza discriminant de predicie pe aceasta pagina. V rugm s re ine i: Scopul acestei pagini este de a arta modul de utilizare a diferitelor date comenzi de analiz. Aceasta nu acoper toate aspectele legate de procesul de cercetare care cercettorii se ateapt s fac. n special, aceasta nu se refer la date de curare i verificare, de verificare a ipotezelor, diagnosticare model sau poteniale follow-up analize.

Exemple de analiz funcia discriminant


Exemplul 1. Un operator de transport aerian internaional de mare a colectat date privind angajaii n trei clasificri de locuri de munc diferite: 1) Personalul de servicii pentru clienti, 2) mecanici i 3)

dispecerii. Directorul de Resurse Umane vrea s tie dac aceste trei clasificri de locuri de munc apela la diferite tipuri de personalitate. Fiecare angajat este administrat o baterie de test psihologic, care includ msuri de interes n aer liber de activitate, sociabilitate i conservator. Exemplul 2. Exist Fisher (1936) exemplu clasic de analiza discriminant care implic trei soiuri de iris i patru variabile predictor (latime petal, petal lungime, latime SEPAL, i lungimea SEPAL). Fisher nu doar a vrut pentru a determina daca soiurile au diferit semnificativ pe cele patru variabile continue, dar el a fost, de asemenea, interesat in punerea predictiilor sau clasificarea varietate de plante necunoscute individuale.

Descriere a datelor
S urmreasc exemplul 1 de mai sus. Am inclus fiierul de date, care poate fi obinut prin clic pe discrim.sav . Setul de date are 244 observaii cu privire la patru variabile. Variabilele psihologice sunt interese n aer liber , sociale i conservatoare . Variabila categoric este de tip de locuri de munc cu trei nivele; 1) Serviciul Clieni, 2) mecanic, i 3) dispecer. S ne uitm la datele. Este ntotdeauna o idee bun pentru a ncepe cu statisticile descriptive.

get file = 'd: \ date \ discrim.sav ". variabile descriptives = conservatoare n aer liber social.

nseamn mese n aer liber = conservatoare sociale de locuri de munc.

variabile corela iile = conservatoare n aer liber social.

variabile de frecven e = locuri de munc.

Metodele de analiz s-ar putea lua n considerare


Mai jos este o list a unor metode de analiz pe care le-au ntmpinat. Unele dintre metodele enumerate sunt destul de rezonabile, n timp ce alii fie au czut din favoarea sau au limitri.

Analiza funcia discriminant - Aceast procedur este multivariat i ofer, de asemenea, informaii cu privire la dimensiunile individuale. MANOVA - Testele de semnificaie sunt aceleai ca i pentru analiza discriminant funcie, dar MANOVA d nici informaii cu privire la dimensiunile individuale. Regresie logistic multinomial sau probit multinomial - Acestea sunt, de asemenea, opiuni viabile. Separate, one-way ANOVAs - Ai putea analiza aceste date folosind separate, one-way ANOVAs pentru fiecare variabil psihologic. Cele ANOVAs separate nu va produce rezultate variabile multiple i nu preiau informaii cu privire la dimensionalitate. Din nou, desemnarea variabilelor independente i dependente este inversat ca i n MANOVA.

Funcia de analiz discriminant


Vom rula analiza discriminant prin discriminantului n SPSS procedura. Exist o mulime de ieire astfel nct vom comenta n diferite locuri de-a lungul drum.

discriminantului / Grupuri de locuri de munc = (1 3) / Variabile = conservatoare n aer liber social / Analiza tuturor

/ / / /

Antecedente de anse Statistici = boxm tabelul Lot = combinat hart Clasifica = global.

De ieire de mai sus indic faptul c toate cazurile 244 au fost folosite n analiza. Vedem, de asemenea, numrul de cazuri pentru fiecare variabil rezultat, la fiecare nivel al variabilei grupare.

Testul caseta de egalitate de matrice de covarian poate fi afectat de abateri de la normalitate multivariat.

Reinei c standardizat Canonical discriminante funcia de tabel Coeficienii i

Matrix tabelul Structura sunt enumerate n ordine diferite.

Numrul de dimensiuni discriminant este numrul de grupuri minus 1. Cu toate acestea, unele dimensiuni discriminant poate s nu fie semnificativ statistic. n acest exemplu, exist dou dimensiuni discriminant, ambele din care sunt semnificative statistic.
Corelaiile canonice pentru cel dimensiuni i dou sunt 0.72 i 0,49, respectiv. Coeficienii standardizate discriminant funcioneze ntr-un mod analog cu coeficienii

de regresie standardizai de regresie OLS in. De exemplu, o cretere de o abatere standard peliber variabila va duce la o scdere 0.32 deviaia standard a valorilor prezise asupra functiei discriminant 1.

Structur canonic, de asemenea, cunoscut sub numele de ncrcare sau ncrcrile canonic discriminant, reprezint corelaii ntre variabilele observate i funciile neobservabile discriminant (dimensiuni). Funciile discriminant sunt un fel de variabile latente i corelaiile sunt incarcarile similare sarcinile factor. Centroizi de grup sunt de clas (de exemplu, de grup) nseamn de variabile canonice.

Implicit este probabiliti egale anterioare.

n continuare, vom trasa un grafic al persoanelor cu privire la dimensiunile discriminant. Datorit numrului mare de subiecte, vom scurta de etichete pentru grupuri de locuri de munc pentru a face mai lizibil Graficul. Atta timp ct nu ne salva setul de date aceste etichete noi nu va trebui s devin permanente.

Funciile discrimant sunt: discriminant_score_1 = 0.517 * 0.379 * + conservatoare n aer liber - 0.831 * social. discriminant_score_2 = 0.926 * 0.213 * + aer liber social - 0.291 * conservatoare. Dup cum putei vedea, angajaii de servicii pentru clienti tind s fie mai puin social (negativ) sfritul dimensiunea 1; dispecerii au tendina de a fi la captul opus, cu mecanica din mijloc. Pe dimensiunea 2, rezultatele nu sunt la fel de clare, cu toate acestea, mecanicii au tendina de a fi mai mare pe dimensiunea n aer liber i servicii pentru clieni i angajai dispecerii mai mici. SPSS produce, de asemenea, un teren ASCII hart teritorial care prezinta locaia relativ a granielor diferite categorii. Harta teritorial este prezentat mai jos.

Harta Canonical discriminant Function 2 -6,0 -4,0 -2,0 .0 2,0 4,0 6,0 .................................. ................ ...........

Teritorial

6.0. 122. . 112 2. . 12 223. . 122 233. . 112 223. . 122 233. 4.0. 112. . . . 223. . 12 233. . 122 223. . 112 2233. . 12 233. . 122 223. 2.0. . 112. . 233. . . 122 223. . 112 233. . 12 223. . 122 * 233. . 112 223. 0.0. . . 122. 233. . . . * 112 223. . 1233 *. . 13. . 13. . 13. -2.0. . . 13. . . . 13. . 13. . 13. . 13. . 13. -4.0. . . 13. . . . 13. . 13. . 13. . 13. . 13. -6.0. 13.

.................................. ................ ........... -6,0 -4,0 -2,0 .0 2,0 4,0 6,0 Funcia discriminant Canonical 1 Simboluri folosite n hart teritorial Simbolul Label Group ------------------------------1 2 3 * 1 service clieni 2 mecanic 3 expedierii Indic un grup de centrul de greutate

Interese s ia n considerare
Multivariate ipoteze normale de distribuie deine pentru variabile de rspuns. Acest lucru nseamn c fiecare dintre variabilele dependente este normal distribuit n cadrul grupurilor, c orice combinatie liniara a variabilelor dependente este normal distribuit, i c toate subgrupurile ale variabilelor trebuie s fie normal multivariat. Fiecare grup trebuie s aib un numr suficient de mare de cazuri. Metode diferite de clasificare pot fi utilizate n funcie de faptul dac matricele varian-covarian sunt egale (sau foarte asemntoare) ntre grupuri. -lea Non-parametric funcia de analiz discriminant, numit k cel mai apropiat vecin, pot fi, de asemenea, efectuate.

http://www.ats.ucla.edu/stat/spss/dae/discrim.htm http://www.ats.ucla.edu/stat/spss/output/SPSS_discrim.htm