Sunteți pe pagina 1din 18

Cibernetic, Statistic i Informatic Economic

Introducere
JMP avantajul explorrii grafice a datelor n analiz statistic

JMP este un software pentru grafic statistic interactiv i folosete o interfa grafic
extraordinar pentru a afia i analiza datele. Software-ul ofer o varietate de metode statistice i grafice,
organizate ntr-un numr mic de platforme interactive.
Cele mai importante aspecte care defines programul statistic JMP sunt: facilitatile de gestiune a
datelor statistice, functiile de analiza statistica disponibile, facilitati de reprezentare grafica, interfata cu
utilizatorul.
Facilitile de reprezentare grafic se refer n special la flexibilitatea n generarea graficelor
bazate pe date i pe rezultate, dar i la facilitile de configurare i adaptare a reprezentrilor (prin culori,
simboluri).
Interfaa cu utilizatorul asigur un echilibru ntre accesul rapid la cele mai utilizate funcii i
flexibilitatea de adaptare a prelucrarilor conform cerintelor utilizatorilor.

Prezentarea rezultatelor se face n ferestre sau zone specializate, n diferite formate


(tabular, text, grafic).
Cele mai importante aspecte care defines programul statistic JMP sunt: facilitatile de
gestiune a datelor statistice, functiile de analiza statistica disponibile, facilitati de reprezentare
grafica, interfata cu utilizatorul.
JMP ofer facilitati pentru analiza statistic i explorare, care permit utilizatorului:
* S descopere : grafica interactiv pentru a observa modelele i relaiile dintre date;
* S interactioneze : atunci cnd un produs este uor de utilizat, utilizatorul se concentreaz mai
degrab asupra problemei, dect asupra programului folosit a vedea problema.
* S inteleag mai multe : datorit graficii, utilizatorul observ modul n care datele i modelul
lucreaz mpreun pentru a oferi rezultatul statistic.
Accesul la tabelele de date:
Toate exemplele din cadrul documentatiei JMP utilizeaza esantioane de date predefinite.
Pentru a realiza accesul acestora selectezi Help > Sample Data. De aici poti realiza urmatoarele:
Sa deschizi un director;
1

Sa deschizi o lista ordonata alfabetic a tuturor tabelelor continand esantioanele de date;


Sa gasesti o tabela intr-o categorie anume;

Despre tipurile de date necesare modelarii proceselor statistice:


Tipurile utilizate in procese transmit JMP-ului, cum sa se reactioneze in timpul analizei.
Schimbarea tipului iti permit sa privesti o variabila din mai multe puncte de vedere in timpul
analizei.
Descrierea tipurilor:
Continu Coloanele pot contine doar tipuri de date numerice. Valorile continue sunt tratate
u
ca valori de masura continue. JMP utilizeaza valori numerice direct in calcule.
Ordinal Coloanele pot contine fie tipuri numeric, fie tipuri caracter. Analizele JMP trateaza
valorile ordinale ca niste categorii discrete care au o ordine. Daca valorile sunt
numere, ordinea este cea normala. Daca valorile sunt caractere, ordinea este
alfabetica.
Nominal Coloanele pot contine fie tipuri numerice, fie tipuri caracter. Toate valorile sunt
tratate in analizele JMP daca sunt discrete fara o ordine implicita.

Alegerea tipului de analiza si lansarea programului


Tabelul urmator asigura cateva exemple pentru a alege o analiza si de a lansa platforma
corespunzatoare.
Scopul
Analiza distributiei valorilor
Analiza relatiei dintre doua variabile
Graficul variabilelor continue X si Y
Puncte mobile pe un grafic de imprastiere a
datelor (scatterplot)

Analiza
Analyze > Distribution
Analyze > Fit Y by X
Graph > Overlay Plot
Graph > Bubble Plot

Completarea unei ferestre


Dupa ce lansezi o platforma, va aparea o fereastra. Utilizeaza fereastra lansata pentru a-ti
seta analiza prin mutarea coloanelor in roluri.
Fereastra unui raport

Odata ce ai completat fereastra de lansare (care ruleaza analiza) vei vedea o fereastra de
raport. De exemplu, figura de mai jos. Poti folosii acest output pentru a realiza o interpretare a
datelor.
Platforma de distributie descrie
distributia variabilelor utilizand
histograme, grafice aditionale si
rapoarte. Poti examina distributia mai
multor variable o singura data.
Continutul-raport al fiecarei variabile
variaza, depinzand fie daca variabila
este de categorie (nominala sau
ordinala), fie continua.
Fereastra de raport a distributiei este
interactiva. Dand click pe orice bara
evidentiata din distributie, este
evidentiata aceeasi data in tabelul de
date.
Din histograma observam urmatoarele:

Numele

Varstele nu sunt uniform


distribuite.
Pentru inaltime sunt 2 puncte
cu valori extreme.
Varstele corespunzatoare sunt
evidentiate in histograma
varstelor. Varsta potentiala este
de 12 ani.
Randurile corespunzatoare sunt
evidentiate in tabelul de date.

potentiale sunt Lillie si Robert.

Histogramele afiseaza vizual datele tale. Pentru cele de categorie (nominale sau ordinale),
histograma afiseaza cate o bara pentru fiecare nivel al variabilelei nominale sau cardinale.
Pentru variabilele continue, histograma afiseaza cate o bara pentru fiecare grupa de valori
ale variabilei continue.

Mozaicul de imprastiere

Optiunea Mosaic Plot afiseaza o diagrama mozaic pentru fiecare variablila de raspuns fie
nominala, fie cardinala. Aceasta este o diagrama fixa unde fiecare segment este proportional cu
grupul sau de frecventa.

Testarea probabilitatilor

Utilizam testarea posibilitatilor pentru a introduce probabilitati ipotetice. Raportul de


testarea probabilitatilor contine diferite optiuni, depinzand daca variabilele au mai mult decat
doua niveluri, sau exact doua niveluri.
Testul pentru probabilitati scaleaza valorile ipotetice pe care tu le introduci, astfel incat
probabilitatile se insumeaza intr-una. Cea mai usoara cale sa iti testezi daca toate probabilitatile
sunt egale este sa introduci cate una in fiecare camp. Daca doresti sa testezi un subset de
probabilitati, atunci nu introduce o valoare pentru orice nivel care nu sunt implicate. JMP
substituie probabilitatile estimate.

Normal Quantile plot


Utilizam optiunea Normal Quantile plot sa vizualizam masura in care o variabila este normal
distribuita. Daca o variabila este normal distribuita, quantila normala aproximeaza o linie
diagonala dreapta. Acest tip de plot este de asemenea numit un plot quantila-quantila sau un plot
Q-Q.

Testul mediei
Pentru a realiza media unei singure variabile se poate
folosii optiunea Test Mean. Daca introducem o valoarea reala
pentru abaterea standard programul realizeaza un test z. Altfel,
esantionul pentru abaterea standard este folosit pentru a rula
testul t. De asemenea, se poate face apel la un test fara parametric Wilcoxon.

Distributia variabilelor
Pentru a face mai usoara identificarea disttributiei unei variabile JMP traseaza o curba
peste histrograma alaturi de un raport al estimarii parametrilor. JMP dispune de numeroase tipuri
de distributii pentru:

Variabilele continue: Normala, Logaritmarea Normalei, Weibull, Weibull cu prag


si valori extreme, Exponentiala, Gamma, Beta, Johnson Su, Johnson Sb, Johnson
SI si altele.
Variabilele discrete: Poisson, Binomiala, Gamma Poisson, Beta Binomiala

Distributia Normala este des utilizata pentru a masura daca modelul prezinta simetrie
asupra valorilor din mijlocul curbei. Selectarea optiunii potrivirii normale pentru orice set de date
arata cat de bine se incadreaza distributia normala asupra inregistrarilor.
Distributia Gamma este realizata de JMP prin estimarea parametrilor specifici acestei
distributii , si anume > 0 si >0. Parametrul , denumit alpha in raport, descrie forma sau
curbura. Parametrul , denumit sigma, este parametrul de scala al distributiei. Un al treilea
parametru, , denumit generic prag, este parametrul ce descrie cea mai mica valoare a
distributiei. Acesta este setat cu valoarea 0, doar daca nu exista si valori negative ale datelor.

Diagnostic Plot
Figura din dreapta prezinta optiunea de a aranja intr-un grafic quantila sau probabilitatea
in mijlocul valorii variabilelor dupa cazul distributiei folosite.
Distributia variabilei dependente Y de variabila independent X
Exista 4 tipuri de analiza:

Analiza bivariata;
Analiza singulara;
Regresia logistica;
Tabela anlizei contigentei;

Analiza bivariata realizeaza graficul relatiei dintre dou variabile continue. Cea singulara
analizeaza distributia variabilei continue Y in legatura cu o variabila nominala sau ordinal X .
Regresia logistica foloseste variabila nominala sau ordinal Y in raport cu una continua X pentru a
descrie probabilitatile de raspuns la categoriile lui Y. Ultimul tip de analiza, cel pe baza unei
tabele de contingent foloseste atat Y cat si X ca variabile nominale sau ordinale.

Densitati
Optiunea Densitati ofera cateva
posibilitati de a compara distributia si compozitia
raspunsului la diferite niveluri ale lui X:

Composition of Densities: arata


suma densitatilor diferentiate de
inaltimea data de numarul de
inregistrari ale fiecarui grup. La
fiecare valoare a lui X, graficul
compozitiei densitatilor arata cu cat
contribuie fiercare grup la total.
Proportion of Densities: arata
contributia grupului ca o proportie
a totalului pe fiecare nivel al lui X.

Potrivirea coloanelor
9

Optiunea Matching Column ofera 2


actiuni primare:

Alcatuieste un model aditiv (


utilizand un algoritm iterativ
de potrivire proportional ) ce
include atat variabila de
grupare X, cat si variabila de
potrivire selectata.
Algoritmul este superior
datorita faptului ca poate
lucre pe sute de subiecti, fata
de algoritmul modelului
liniar care este foarte lent si
necesita resurse mari de
memorie.
Traseaza linii intre punctele
ce leaga grupul. Daca exista
multiple observatii cu acelasi
ID, linile sunt desenate de la
media grupului de observatii.

Norul de puncte 3D
Acesta are la baza Analiza corespondentei pe o tabela de contingent.
Figura prezinta urmatoarele aspecte:

Pe axa c1, raspunsurile de la 1 la 5 apar la dreapta lui 0 ( sunt pozitive).


Raspunsurile de la 6 la 9 apar in stanga lui 0 ( sunt negative).
Pe axa c2, A si C apare la stanga lui 0 ( negative). B si D apar la dreapta lui 0
(pozitive).

Pe baza acestor obsevatii putem spune ca c1 corespunde satisfactiei generale ( de la


cel mai putin preferate la cele mai mult) si c2 corespunde unei calitati ce diferentiaza
pe B si D de A si C.

10

Vizualizarea interactiva a datelor


Harta
Harta reprezinta una din optiunile disponibile programului de a reda cat mai fidel si de a
reprezenta vizual datele geografice. Aceasta optiune poate fi folosita utilizand instrumentul
Graph Builder si folosind Shape. Pentru a creea o harta este nevoie de a asigna coloana ce
reprezinta teritoriile geografice(tara,stat,provincie,judete,comitate, etc.)
In figura de mai jos avem reprezentarea unor date statistice la nivelul Statelor Unite ale
Americii unde fiecare stat este colorat corespunzator valorii variabilei de grupare. Daca variabila
este continua culoarea va fi de tip gradient. Axele Y si X reprezinta latitudinea, respectiv
longitudinea.

Stacked bars
Reprezinta modul de vizualizare a datelor sub forma unor linii ingrosate pe orizontala
grupate dupa o variabila dependenta in functie de una sau mai multe variabile independente.

11

12

Diagrame
Diagramele se pot utiliza folosind platforma Chart din cadrul meniului Graph. In cadrul
acesteia avem diagrame pentru tipul variabilelor continue si pentru variabilele de categorie.
Diagramele suporta cateva tipuri de reprezentare si aliniere. Cateva dintre acestea sunt :

Coloane si coloane in stiva ( bar and stacked bar)


Placinta (pie)
Ac (needle)

13

Liniara (line)
Punct (point)
In sir (range)

Norul de puncte 3D
Fata de norul de puncte 3D definit mai sus pe baza analizei de corespondenta, acesta se
realizeaza din meniul grafic al JMP cu numeroase avantaje printre care rotirea modelului statistic
in functie de cele trei variabile ( de cele trei axe de coordinate). Se pot definii in mai multe feluri
putand fi construite doar pe baza a 2 variabile sub forma elipsoidala, dar intr-un mediu de lucru
tridimensional.

14

Cea mai utilizata este cea de mai jos in care se poate opta pentru a modifica culorile
utilizate, transparent sau dimensiunea modelului 3D.

Bubble Plot (Diagrama de bule)


Bubble Plot-ul este un nor de puncte ce reprezinta punctele sub forma unor cercuri sau
bule. Acesta poate fi dinamic ( animat pe o perioada de timp) sau static ( bule fixate ce nu se
deplaseaza). Aceasta diagrama are la baza urmatoarele:

Animatia dinamica a bulelor folosind o variabila de timp, pentru a vedea sablonul


si deplasarea acestuia in timp;
15

Se foloseste dimensiuni si culori diferite pentru a distinge mai usor intre variabile;
Datele sunt agregate intr-o singura bula pentru simplificare diagramei.

Concluzii
Programul JMP detinut de firma SAS Institute Inc. ofera un set complet si comprehensive
asupra fenomenelor statistice precum si posibilitatea modelarii unor experimente si a controlului
calitatii datelor statistice intr-un singur pachet. Lucrul cu diferite platforme de sisteme de operare
si numeroase tipuri de fisier precum fisiere text, fisiere Excel, fisere baze de date SAS, fisiere
16

baze de date de tip ODBC( Open Database Connectivity) , ii asigura un avantaj pe piata
produselor software de tip modelarea statistica.
Totodata JMP acorda utilizatorilor si un limbaj de script pentru a dezvolta diverse
aplicatii denumit JSL (JMP Scripting Language). JSL este un limbaj interpretative ce se executa
la compilare, oferind o manipulare coerenta si coordonata a obiectelor platformei de aplicatii
JMP. Impreuna cu mediul de lucru, limbajul asigura o utilitate imensa in setarea aplicatiilor
statistice.
Prin urmare putem spune ca pachetul software JMP reprezinta una dintre cele mai bune
solutii pentru dezvoltarea de modele statistice aplicabile in orice domeniu de interes, dar si a
unor aplicatii interactive menite sa ofere utilizatorului o experienta totala.

Bibliografie

JMP Basic Analysis and Graphing 9.0.2 , SAS Campus Drive, Cary,
NC 27513
JMP Using JMP 10 , SAS Campus Drive, Cary, NC 27513
http://en.wikipedia.org

17

S-ar putea să vă placă și