Sunteți pe pagina 1din 24

Pagina 1

12

MODELE C OGNITIVE

PREZENTARE GENERALĂ

Modelele cognitive reprezintă utilizatorii sistemelor interactive.


■ Modelele ierarhice reprezintă sarcina și scopul utilizatorului
structura.
■ Modelele lingvistice reprezintă gramatica sistemului utilizatorului.
■ Modelele fizice și ale dispozitivelor reprezintă motorul uman
aptitudini.
■ Arhitecturile cognitive stau la baza acestor cognitive
modele.

Pagina 2
420 Capitolul 12 ■ Modele cognitive

12.1 INTRODUCERE
Tehnicile și modelele din acest capitol pretind că au o anumită reprezentare
utilizatorii care interacționează cu o interfață; adică modelează un aspect al utilizatorului
înțelegere, cunoaștere, intenții sau procesare. Nivelul de reprezentare diferă
trase de la tehnică la tehnică - de la modele de obiective la nivel înalt și de la rezultate
activitățile de rezolvare a problemelor, descrierile activității la nivel de motor, cum ar fi apăsările de la tastatură
și clicuri de mouse. Formalismul a fost în mare măsură dezvoltat de psihologi sau
oamenii de știință de calculator, al căror interes este de a înțelege comportamentul utilizatorilor.
O modalitate de a clasifica modelele este în ceea ce privește cât de bine descriu caracteristicile acestora
competența și performanța utilizatorului. Citând de la Simon [323]:
Modelele de competență tind să fie cele care pot prezice secvențele de comportament legal, dar
în general faceți acest lucru fără a se referi la faptul dacă acestea ar putea fi efectiv executate de utilizatori.
În contrast, modelele de performanță nu numai că descriu comportamentul necesar
secvențele nu descriu decât atât ceea ce trebuie să știe utilizatorul, cât și cum este acesta
angajați în executarea efectivă a sarcinilor.
Modelele de competență, prin urmare, reprezintă tipurile de comportament așteptate de la un utilizator,
dar ele oferă puțin ajutor în analizarea acelui comportament pentru a-și determina cerințele
pe utilizator. Modelele de performanță furnizează o putere analitică, în principal prin focalizare
comportament de rutină în aplicații foarte limitate.
O altă distincție utilă între aceste modele este dacă acestea abordează
sau formularea unui plan de activitate sau executarea planului respectiv. referire
înapoi la cadrul de interacțiune prezentat în Capitolul 3, această clasificare ar fi
înseamnă că unele modele sunt preocupate de înțelegerea utilizatorului și a
în timp ce alții se preocupă de traducerea articulării
între limba respectivă și limba de introducere . Prezentarea cognitivului
modelele din acest capitol urmează acest sistem de clasificare, împărțit în următoarele
categorii:

■ reprezentarea ierarhică a sarcinii utilizatorului și structura țintă


■ modele lingvistice și gramatice
■ modele fizice și la nivel de dispozitiv.
Prima categorie se ocupă direct de problema formulării obiectivelor și sarcinilor.
Al doilea se referă la gramatica traducerii articulației și la modul în care este
înțeles de către utilizator. Cea de-a treia categorie se ocupă din nou de articulare, dar la
nivelul motorului uman în loc să fie la un nivel mai înalt de înțelegere umană.
Argumentele arhitecturale despre utilizator sunt necesare în oricare dintre modelele cognitive
discutate aici. Au fost acoperite unele dintre cele mai importante ipoteze arhitecturale
Capitolul 1, cum ar fi distincția dintre memoria pe termen lung și pe termen scurt. După ce a
în cele trei categorii de mai sus, vom descrie două aspecte cognitive suplimentare
arhitecturile și modul în care sunt relevante pentru analiza designului interactiv al sistemului.
Multe dintre aceste modele nominale cognitive au o aromă destul de computațională.
Aceasta reflectă modul în care analogiile computaționale sunt adesea folosite în cogniție

Pagina 3
12.2 Ierarhii de obiective și sarcini 421

psihologie. Similitudinea dintre limbajul care descrie utilizatorul și acela


descrierea computerului are unele avantaje și unele pericole. Pe pozitiv
pe care îl face comunicarea și analiza sistemelor combinate de
tem mai usor. De exemplu, teoria complexității cognitive (descrisă mai jos) produce
modele de ambele obiective ale utilizatorilor și de gramatică a sistemului și pot raționa în legătură cu inter-
acțiune. Pe de altă parte, există pericolul ca acest lucru să încurajeze un mecanism
vizualizarea utilizatorului.

12.2 IERARHIE DE GARANȚIE ȘI SARCINĂ

Multe modele utilizează un model de procesare mentală în care utilizatorul reușește


obiective prin rezolvarea subgoalelor într-o manieră divizată și cucerită. Vom lua în considerare două
modele, GOMS și CCT , unde aceasta este o caracteristică centrală. Cu toate acestea, vom vedea sim-
ilar în alte modele, cum ar fi TAG (Secțiunea 12.3.2) și atunci când luăm în considerare
tehnici de analiză a sarcinilor (Capitolul 15).
Imaginați-vă
Pentru că dorim
a atinge acest să realizăm
obiectiv, un raport
îl împărțim privind
în mai multevânzările
subgole, de manuale
spunând introductive
că acumulăm pentru HCI.
datele
împreună, producând tabelele și histogramele și scriind materialul descriptiv.
Concentrându-se pe culegerea datelor, hotărâm să împărțim acest lucru în alte subgale:
găsiți numele tuturor manualelor HCI introductive și apoi căutați vânzările cărților
baza de date pentru aceste cărți. În mod similar, fiecare dintre celelalte subgoale este divizat
mai multe subgale, până când se găsește un anumit nivel de detaliu la care ne oprim. Noi
astfel se încheie cu o ierarhie de obiective și subgoale. Exemplul poate fi stabilit
pentru a expune această structură:

produce un raport
adunați date
. găsiți numele cărților
. . căutare cuvinte cheie de nume de date
<< mai multe subgoale >>
. . trece prin nume și rezumate de mână
<< mai multe subgoale >>
. căutați baza de date de vânzări
<< mai multe subgoale >>
tabele de layout și histograme
<< mai multe subgoale >>
scrie descriere
<< mai multe subgoale >>
Diferite aspecte apar ca o încercare de astfel de analize de utilizare a calculatorului.
Unde ne oprim? Putem merge la descompunerea sarcinilor până când ajungem la
mișcări individuale ale mâinilor și ale ochilor utilizatorului sau putem să ne oprim la un abstract
nivel. De unde începem? În mod similar, putem începe analizele noastre la diferite

Pagina 4
422 Capitolul 12 ■ Modele cognitive

puncte în ierarhia obiectivelor. În cele din urmă am putea extinde analiza noastră la mai mari
și obiective mai mari: "plita de lumină" este o subgolă de "mazăre de fiert" și așa mai departe spre obiective precum "
cina mea "," hrană "și" rămâi în viață ".
Aceste două întrebări sunt probleme de granularitate și ambele metode descrise
de mai jos lăsa acest lucru într-o oarecare măsură în mâinile designerului. Diferite probleme de proiectare
solicită niveluri diferite de analiză. Cu toate acestea, ambele metode funcționează relativ
nivel scăzut; nici nu ar încerca să înceapă cu un astfel de scop abstract ca "a produce
raport "care va implica o creativitate reală și o rezolvare dificilă a problemelor. În schimb, ei
se limitează la mai multe comportamente învățate de rutină. Această sarcină abstractă
este denumită sarcina unitară . Sarcina unității nu necesită rezolvarea de probleme
abilități din partea utilizatorului, deși cere frecvent destul de sofisticat
rezolvarea problemelor din partea designerului pentru a le determina.
Ce facem atunci când există mai multe modalități de a rezolva o problemă sau dacă soluția
tions la două subgoale interacționează? Utilizatorii vor avea de multe ori mai multe modalități de realizare
un obiectiv și trebuie să existe o modalitate de a reprezenta modul în care
hrănire.
O altă problemă importantă are legătură cu tratarea erorilor. Utilizatorii nu sunt
perfect. O ierarhie a obiectivelor poate arăta modul în care utilizatorul perfect ar atinge un obiectiv, dar
ce pot spune despre dificultățile pe care utilizatorul le-ar putea avea de-a lungul drumului? În general,
dicționarul comportamentului de eroare este slab între aceste tehnici de modelare ierarhică,
deși unele (teoria complexității cognitive (CCT), de exemplu) pot reprezenta eroare
comportament.

12.2.1 GOMS
Modelul GOMS al lui Card, Moran și Newell este un acronim pentru obiectivele, operatorii,
Metode și selecție [56]. O descriere GOMS constă din aceste patru elemente:
Obiective Acestea sunt obiectivele utilizatorului, care descriu ce vrea să realizeze utilizatorul.
Mai mult, în GOMS obiectivele sunt luate pentru a reprezenta un "punct de memorie" pentru utilizator,
din care poate evalua ce trebuie făcut și la care se poate întoarce
ar trebui să apară erori.
Operatori Acestea sunt cele mai mici niveluri de analiză. Acestea sunt acțiunile de bază
utilizatorul trebuie să efectueze pentru a folosi sistemul. Acestea pot afecta sistemul
(de exemplu, apăsați tasta "X") sau doar starea psihică a utilizatorului (de exemplu, citiți
caseta de dialog). Există încă un grad de flexibilitate în ceea ce privește granularitatea
operatori; putem lua nivelul de comandă "emite comanda SELECT" sau să fie
mai primitiv: 'muta mouse-ul în bara de meniu, apăsați butonul mouse-ului de centru. . . ".
Metode După cum am menționat deja, există de obicei mai multe moduri în care un obiectiv
pot fi împărțite în subgole. De exemplu, într-un anumit manager de ferestre, în prezent
fereastra selectată poate fi închisă pentru o pictogramă fie prin selectarea opțiunii "ÎNCHIS"
dintr-un meniu pop-up sau prin apăsarea tastei funcționale "L7". În GOMS aceste două obiective
descompunerile sunt denumite metode, deci avem metoda CLOSE și
metoda L7 :

Pagina 5
12.2 Ierarhiile obiectivelor și sarcinilor 423

OBIECTIV: ICONIZE-WINDOW
. [selectați GOAL: USE-CLOSE-METHOD
. . Move-MOUSE-TO-GEAM-HEADER
. . POP-UP-MENIU
. . CLICK-Over-CLOSE-OPTION
GOAL: UTILIZARE-L7-METODĂ
. . PRESS-L7-KEY]
Punctele sunt folosite pentru a indica nivelul ierarhic al golurilor.
Selecție Din fragmentul de mai sus vedem utilizarea cuvântului selectați unde
alegerea metodelor apare. GOMS nu lasă acest lucru ca o alegere aleatorie, dar
încearcă să prezică care metode vor fi utilizate. Acest lucru depinde în mod obișnuit atât de
utilizatorul particular și despre starea sistemului și detalii despre obiective.
De exemplu, un utilizator, Sam, nu folosește metoda L7 , cu excepția unui singur joc,
" blocuri ", în cazul în care mouse-ul trebuie să fie utilizate în joc până în momentul de moment
este apăsată tasta. GOMS captează acest lucru într-o regulă de selecție pentru Sam:
User Sam:
Norma 1: Utilizați metoda CLOSE dacă nu se aplică o altă regulă.
Regula 2: Dacă aplicația este " blocată ", utilizați metoda L7 .
Ierarhiile țintă descrise într-o analiză GOMS sunt aproape complet sub nivelul
a sarcinii unității definite anterior. O analiză tipică GOMS ar consta, așadar, din
un singur obiectiv la nivel înalt, care este apoi descompus într-o secvență de sarcini unitare, toate
din care poate fi descompusă în continuare până la nivelul operatorilor de bază:
GOAL: EDIT-MANUSCRIPT
. GOAL: EDIT-UNIT-SLEEP repeta până când nu mai are sarcini unitare
Descompunerea obiectivului dintre sarcina generală și sarcinile unității ar implica
înțelegerea detaliată a strategiilor de rezolvare a problemelor și a
domeniu. Acestea sunt pas cu pas în întregime prin metoda propusă inițial.
Ar fi posibil să folosim notația generală pentru a descrie acest subgoal
(de exemplu, în exemplul raportului de mai sus). Această formă de nivel înalt
descrierea obiectivului este adoptată în timpul analizei sarcinilor care va fi discutată în capitolul
ter 15. În special, obiectivul analizei sarcinilor ierarhice este de a produce decom-
poziții, care ar fi similare (dar într-o altă notație) cu cea din carte
exemplu de raportare.
Analiza structurii obiectivelor GOMS poate produce măsuri de performanță.
adâncimea de stivuire a unei structuri de țintă poate fi utilizată pentru estimarea memoriei pe termen scurt
cerințe. Modelul proceselor mentale ale utilizatorilor implicați în acest lucru este, bineînțeles,
foarte idealizat. De asemenea, regulile de selecție pot fi testate pentru acuratețe în raport cu utilizările,
și sa schimbat ca răspuns la discrepanțe. În experimentele timpurii ale tehnicii,
inventatorii au reușit să obțină, în medie, o rată de predicție corectă de 90%
mands. Mai mult, o metodă foarte simplă de predicție a timpului (presupunând că
fiecare operator are un timp constant) a fost capabil să prezică timpii reali cu o eroare
de 33%.

Pagina 6
424 Capitolul 12 ■ Modele cognitive

Modelul inițial GOMS a servit drept bază pentru o mare parte a modelului cognitiv-
de cercetare în HCI. A fost bine pentru a descrie modul în care experții îndeplinesc sarcini de rutină.
Cuplat cu modelele dispozitivelor fizice discutate mai târziu, acestea pot fi folosite pentru a prezice
performanța acestor utilizatori în ceea ce privește timpul de execuție. Nu a fost niciodată intenționată să pro-
vedeți tipul de informații despre cunoștințele utilizatorului care ar putea fi comparate
în diferite sarcini pentru a anticipa lucruri precum orele de antrenament sau de transfer.

D ESIGN F OCUS

GOMS economisește bani

Acum câțiva ani, compania americană de telefonie NYNEX intenționa să instaleze un nou sistem informatic
pentru a sprijini operatorii lor. Înainte de instalare, a fost efectuată o analiză detaliată GOMS
controlează procesele cognitive și fizice implicate în rezolvarea unui apel. Tehnica particulară
a fost destul de diferită de notația inițială GOMS așa cum este descrisă aici. Deoarece un operator efectuează
au fost construite mai multe activități în paralel cu o descriere GOMS în stil PERT [192, 154]. PERT ana-
liza a fost utilizată pentru a determina calea critică și, prin urmare, timpul pentru a îndeplini o sarcină tipică. A fost
a descoperit că, mai degrabă decât accelerarea operațiunilor, noul sistem ar dura mai mult pentru a procesa fiecare
apel. Noul sistem a fost abandonat înainte de instalare, ducând la o economie de milioane de dolari.

Exercițiu lucrat Creați o descriere GOMS a sarcinii de fotocopiere a unui articol dintr-un jurnal. Discutați despre
problema închiderii (vezi capitolul 1) în ceea ce privește descrierea dvs. GOMS.
Răspuns O descriere posibilă a GOMS a ierarhiei țintă pentru această sarcină este prezentată mai jos.
Răspunsurile vor varia în funcție de ipotezele referitoare la fotocopierul folosit ca model
pentru exercițiu. În acest exemplu, vom presupune că articolul trebuie să fie copiat unul
pagina la un moment dat și că trebuie să fie instalat un capac deasupra suprafeței imagistice a copiatorului
înainte ca copia reală să poată fi făcută.
OBIECTIV: FOTOCOPIE-HÂRTIE
. GOAL: LOCATE-ARTICOL
. GOAL: FOTOCOPY-PAGE se repetă până când nu mai există pagini
. . OBIECTIV: PAGINA ORIENTĂ
. . . OPEN-COVER
. . . SELECT-PAGE
. . . POZIȚIA-PAGE
. . . CLOSE-COVER
. . OBIECTIV: BUTONUL PRESS-COPY
. . OBIECTIV: Verificați-copiați
. . . LOCALIZAREA-OUT-tray
. . . EXAMINA-COPY
. OBIECTIV: COLECTARE-COPIE
. . LOCALIZAREA-OUT-tray

Pagina 7
12.2 Ierarhiile obiectivelor și sarcinilor 425

. . REMOVE-COPY (obiectivul exterior este îndeplinit!)


. GOAL: RETRIEVE-JOURNAL
. . OPEN-COVER
. . ELIMINAȚI-JURNAL
. . CLOSE-COVER
Problema de închidere care apare în acest exemplu apare atunci când se face copia articolului
este îndepărtată din tava de copiere a fotocopierului, satisfăcând obiectivul general al sarcinii. În
descrierea de mai sus, totuși, articolul din jurnalul original este încă pe suprafața imagistică a
copiatorul și capacul este închis. Utilizatorul ar putea uita cu ușurință să elimine
jurnal. Cum ar putea fi revizuită procedura de fotocopiere pentru a elimina această problemă?
Lem? Unul dintre răspunsuri este de a forța obiectivul RETRIEVE-JOURNAL să fie îndeplinit înainte
COLLECT-COPY.
12.2.2 Teoria complexității cognitive
Teoria complexității cognitive, introdusă de Kieras și Polson [199], începe cu
premisele de bază ale descompunerii obiectivelor de la GOMS și îmbogățește modelul
oferă mai multă putere de predicție. CCT are două descrieri paralele: unul dintre utilizatori
obiectivele și celălalt al sistemului informatic (numit dispozitivul în CCT). Descrierea
atingerea scopurilor utilizatorului se bazează pe o ierarhie de țintă asemănătoare GOMS, dar este exprimată
utilizând în principal reguli de producție . Am introdus reguli de producție în capitolele 1 și 2
vom descrie în continuare utilizarea acestora în CCT de mai jos. Pentru sistemul de gramatică, CCT folosește
rețele de tranziție generalizate , o formă de rețea de tranziție de stat . Asta nu va fi
descrise aici, dar rețelele de tranziție de stat vor fi discutate în detaliu în capitolul 16.
Regulile de producție sunt o serie de reguli:
dacă condiția și apoi acțiunea
unde condiția este o declarație despre conținutul memoriei de lucru. Dacă condiŃiile
este adevărat atunci se spune că regula de producție se declanșează. O acțiune poate consta dintr-una sau una
mai multe acțiuni elementare, care pot fi fie schimbări ale memoriei de lucru,
sau acțiuni externe, cum ar fi apăsările de la tastatură. Programul de producție "program" este scris în a
LISP-like language.
De exemplu, considerăm o sarcină de editare utilizând editorul de text UNIX vi. Sarcina
este de a introduce un spațiu în care unul a fost ratat în text, de exemplu dacă noi
a observat că în paragraful de mai sus am scris "teoria complexității cognitive".
Aceasta este o eroare destul de frecventă de tiparire, deci presupunem că am evoluat
proceduri bune pentru a îndeplini sarcina. Considerăm un fragment al CCT asociat
regulile de producție.
(SELECT-INSERT-SPACE
DACĂ (ȘI (TEST-GOAL efectuați sarcina unității)
(Sarcina TEST-TEXT este spațiul de inserare)
(NU (spațiul de inserare TEST-GOAL))
(NOT (TEST-NOT executând spațiul de inserare)))

Pagina 8
426 Capitolul 12 ■ Modele cognitive

Apoi ((ADD-GOAL introduceți spațiu)


(ADD-NOT executând spațiul de inserare)
(Sarcina LOOK-TEXT este la% LINE% COL)))
(INSERT-SPACE-TERMINAT
DACĂ (ȘI (TEST-GOAL efectuați sarcina unității)
(TEST-NOTE executând spațiul de inserare)
(NU (spațiul de inserare TEST-GOAL)))
THEN ((DELETE-NOT executând spațiul de inserare)
(DELETE-GOAL efectua sarcina unității)
(UNBIND% LINE% COL)))
(INSERT-SPACE-1
DACĂ (ȘI spațiul de inserare TEST-GOAL)
(NOT (TEST-GOAL mutați cursorul))
(NU (TEST-CURSOR% LINE% COL)))
Apoi ((ADD-GOAL mutați cursorul la% LINE% COL)))
(INSERT-SPACE-2
DACĂ (ȘI spațiul de inserare TEST-GOAL)
(TEST-CURSOR% LINE% COL))
THEN ((DO-KEYSTROKE "I")
(DO-KEYSTROKE SPACE)
(DO-KEYSTROKE ESC)
(DELETE-GOAL introduceți spațiu)))
Pentru a vedea cum funcționează aceste reguli, imaginați-vă că utilizatorul tocmai a văzut tastarea greșit-
ia și astfel conținutul memoriei de lucru (wm)

(GOAL efectua sarcina unității)


(Sarcina TEXT este inserarea spațiului)
(Sarcina TEXT este la 5 23)
(CURSOR 8 7)
TEXT se referă la textul manuscrisului care se editează și se referă la CURSOR
cursorul de introducere pe ecran. Desigur, aceste elemente nu sunt de fapt situate în
memoria de lucru - ele sunt externe utilizatorului - dar presupunem că cunoștințele
din observarea acestora este stocată în memoria de lucru a utilizatorului.
Locația (5,23) este linia și coloana greselii de tipare în cazul în care spațiul
este necesară. Cu toate acestea, poziția curentă a cursorului este la linia 8 și coloana 7. Aceasta este
desigur, dobândită în memoria de lucru a utilizatorului, privindu-se pe ecran. Uite-
la cele patru reguli de mai sus ( SELECT-INSERT-SPACE , INSERT-SPACE-DONE ,
INSERT-SPACE-1 și INSERT-SPACE-2 ), numai prima poate declanșa. Conditia
pentru SELECT-INSERT-SPACE este:

(AND (TEST-GOAL efectua sarcina unității)


adevărat deoarece (GOAL îndeplini sarcina unitară) este în wm
(Sarcina TEST-TEXT este spațiul de inserare)
adevărat deoarece (sarcina TEXT este spațiul de inserare) este în wm

Pagina 9
12.2 Ierarhii de obiective și sarcini 427

(NU (spațiul de inserare TEST-GOAL))


adevărat deoarece (spațiul de introducere GOAL) nu este în wm
(NOT (TEST-NOT executând spațiul de inserare)))
adevărat deoarece (NOTĂ execută spațiul de inserare)
nu este în wm
Deci, regulile de incendiu și acțiunea sa sunt executate. Această acțiune nu are nici un efect extern în
termeni de introducere a tastaturii, dar adaugă informații suplimentare memoriei de lucru. ( LOOK-
TEXT task este la% LINE% COL ) caută o intrare corespunzătoare și leagă LINE
și COL la 5 și, respectiv, 23 . Acestea sunt variabile, oarecum la fel de normale
limbaj de programare, la care se face referire din nou în alte reguli.
Conținutul memoriei de lucru după arderea regulii SELECT-INSERT-SPACE
sunt după cum urmează (rețineți că ordinea elementelor memoriei de lucru este arbitrară):

(GOAL efectua sarcina unității)


(Sarcina TEXT este inserarea spațiului)
(Sarcina TEXT este la 5 23)
(NOTĂ care execută spațiul de inserare)
(Spațiul de inserare GOAL)
(LINE 5)
(COL 23)
(CURSOR 8 7)
În acest moment, niciuna dintre regulile SELECT-INSERT-SPACE sau INSERT-SPACE-DONE
va declansa ca intrare ( spatiul de inserare GOAL ) va face ca conditiile lor false. La fel de
LINE este obligat să 5 și COL este obligat la 23 , condiția ( TEST-CURSOR% LINE
% COL ) va fi de asemenea falsă și, prin urmare, poate conduce numai INSERT-SPACE-1 poate declanșa.
După ce au fost efectuate acțiunile acestei reguli, memoria de lucru va include
intrarea ( GOAL muta cursorul la 5 23 ). Regulile pentru mutarea cursorului sunt
nu sunt incluse aici, dar ar fi destul de extinse, se deplasează în sus / în jos și în dreapta / stânga
în funcție de pozițiile relative ale cursorului și ale locației țintă. În cele din urmă,
presupunând că mișcarea cursorului este de succes, cursorul ar fi la (5,23) de unde
regula INSERT-SPACE-2 ar fi capabil să tragă. Aceasta ar efectua apăsările tastaturii:
I , SPACE și ESC , care în vi pune editorul în modul inserare, împachetează spațiul
și apoi lasă modul de inserare. De asemenea, acțiunea elimină obiectivul spațiului de inserare de la
memorie de lucru ca acest obiectiv a fost atins.
Acum, obiectivul a fost eliminat, a doua regulă INSERT-SPACE-DONE este liberă
incendiu, care "tidează" memoria de lucru. În special, aceasta "desface" variabilele LINE
și COL , adică elimină legăturile din memoria de lucru.
Observați că regulile nu s-au declanșat în ordinea în care au fost scrise. Deși ei
arata oarecum cum ar fi comenzile if-then-else pe care le-ar primi intr-un standard de pro-
gramming limba, se comportă foarte diferit. Regulile sunt toate active și la fiecare
moment în care orice regulă care are condițiile ei adevărate poate declanșa.
Este
de exemplu,
posibil ca
dacă
unele
cursorul
regulisesăaflă
nu seîn tragă
poziția
niciodată;
corectă, regula a treia nu ar declanșa focalizarea.
În plus, aceeași regulă se poate declanșa în mod repetat; de exemplu, dacă am fi scris
regulile de producție pentru mutarea cursorului, o regulă ar putea fi bine
Pagina 10
428 Capitolul 12 ■ Modele cognitive

(MOVE-UP
DACĂ (ȘI (TEST-GOAL mov-up)
(TEST-CURSOR-SUB LINE%))
ATUNCI ( ( DO-KEYSTROKE "K")))
Această regulă este de tip " K " (comanda vi pentru a muta cursorul în sus o linie) în timp ce
cursorul este sub linia dorită. Va fi, bineînțeles, în mod constant refăcut până la
cursorul este la linia corectă.
Observați că apăsările de taste pentru inserarea efectivă a spațiului, odată ce vă aflați la
poziție corectă, au fost proceduralizate . Adică utilizatorul nu trece prin
subgalezurile "introduceți modul de inserare", "spațiul de tip", "modul de inserare la ieșire". Pentru un complex
este foarte probabil ca utilizatorul să realizeze exact aceste obiective. In orice caz,
actul de inserare a unui singur spațiu este presupus a fi atât de bine repetat încât este
stocate ca o singură bucată. Adică, regulile de mai sus reprezintă cunoștințele experților
editorul vi.
Desigur, începătorii pot face exact aceleași intrări de la tastatură ca și experții, dar
modul în care stochează cunoștințele vor fi diferite. Pentru a face față acestei situații, CCT are un set
de reguli de "stil" pentru novici. Acestea limitează forma condițiilor și a acțiunilor în
regulile de producție. Practic, începătorii trebuie să testeze în mod constant toate regulile din
memoria lor de lucru și pentru a verifica feedback-ul din sistem după fiecare
apăsare de tastă. Astfel, un set de reguli "novice" nu ar include forma proceduralizată
introduceți spațiu. Bovair, Kieras și Polson oferă o listă cu multe reguli de stil care pot
să fie folosit pentru a întruchipa anumite ipoteze psihologice despre utilizator (începător / expert
distincția este doar una) într-o descriere CCT [39].
Regulile din TCC nu trebuie să reprezinte o performanță fără erori. Acestea pot fi folosite
pentru a explica fenomenele de eroare, deși nu le pot prezice. De exemplu,
regulile de mai sus pentru introducerea unui spațiu sunt "buggy" - nu verifică modul editorului.
Imaginați-vă că tocmai ați tastat "cognitivul" în "teoria complexității cognitive"
(cu spațiul lipsit), credeți că pentru câteva minute și apoi uita-te din nou la
ecran și observați că spațiul lipsește. Cursorul este în poziția corectă pentru
spațiul, deci regula INSERT-SPACE-1 nu este niciodată concediată și mergem direct
secvența: SELECT-INSERT-SPACE , INSERT-SPACE-2, apoi INSERT-
DESPRE SPACE . Introduceți "i", un spațiu și apoi scapați. Cu toate acestea, "i" presupune asta
vă aflați în modul de comandă vi și este comanda pentru a muta editorul în insert
Mod. Dacă totuși, după ce ați tastat "cognitiv" nu ați tastat scape, pentru a vă aduce înapoi
în modul de comandă, întreaga secvență se va realiza în modul de inserare. Textul
ar citi: "teoria complexității cognitive".
Regulile CCT sunt strâns legate de ierarhiile de țintă asemănătoare GOMS; regulile pot fi
generate de o astfel de ierarhie sau, alternativ, putem analiza producția
regulile de obținere a arborelui țintă:
GOAL: introduceți spațiu
. GOAL: mutați cursorul - dacă nu în poziția corectă
. PRESS-KEY-I
. APASĂ SPAȚIU
. PRESS-ESCAPE

Pagina 11
12.2 Ierarhii de obiective și sarcini 429

Adâncimea de stivuire a acestei ierarhii de țintă (așa cum este descrisă pentru GOMS) este direct legată
la numărul de termeni ( GOAL ... ) din memoria de lucru.
De fapt, regulile CCT pot reprezenta planuri mai complexe decât cele simple
ierarhiilor IGC. Continuă activitatea tuturor regulilor de producție
posibil să reprezinte planuri concurente. De exemplu, s-ar putea avea un set de pro-
reguli de conduită reprezentând scopul de a scrie o carte și un alt set reprezentând
scopul de a bea ceai. Aceste reguli ar putea fi simultan active, permițând astfel -
un autor de a bea ceai în timp ce tastați. În pofida acestei flexibilități evidente, CCT nu este
utilizate în mod normal în acest mod. Nu este clar de ce este acest lucru, cu excepția faptului că CCT, precum GOMS,
este destinat obiectivelor low-level, proceduralizate - adică sarcina unitară . Este rezonabil
ca sarcinile unitare succesive să fie alese din diferite activități: autorul poate șterge
un cuvânt, beți o băutură, faceți o căutare de cuvinte, dar de fiecare dată când ar fi o sarcină unitară completă
efectuat - autorul nu ia o băutură de ceai în mijlocul ștergerii unui cuvânt.
Am văzut cum regulile CCT pot fi analizate informal pentru a discuta aspecte legate de
proceduralizare și comportament de eroare și modul în care putem să le corelem cu cele de tipul GOMS
scopurile ierarhiilor. Cu toate acestea, scopul principal al TCC este (după cum sugerează și numele) să fie capabil
pentru a măsura complexitatea unei interfețe.
Practic, cu cât mai multe reguli de producție din descrierea CCT este mai dificilă
interfata este de a invata. Această afirmație se bazează pe presupunerea că normele de producție
reprezintă în mod rezonabil modul în care cunoașterea este stocată și, prin urmare, că
timpul necesar pentru a învăța o interfață este aproximativ proporțional cu numărul de reguli pe care dvs.
trebuie să învețe.
Am discutat doar partea utilizatorului CCT aici. Dacă descrierea cognitivă a utilizatorului,
este completat de o descriere a sistemului, se susține că se poate pre-
dictează dificultatea asocierii dintre obiectivele utilizatorului și modelul de sistem.
Rețelele generalizate de tranziție care descriu ele însele gramatica sistemului
au o structură ierarhică. Astfel, atât descrierea utilizatorului cât și a utilizatorului
sistemul poate fi reprezentat ca ierarhii. Acestea pot fi apoi comparate pentru a găsi
neconforme și să producă o măsură de disonanță.
Există diverse probleme cu TCC. Ca și în cazul multor metode de descriere "bogate"
dimensiunea descrierii pentru o parte a unei interfețe poate fi enormă. În plus,
pot exista mai multe moduri de a reprezenta același comportament și interfață cu utilizatorul
comportament, producând diferite măsuri de disonanță. Într-o anumită măsură, acest lucru este asigurat
de regulile de stil nou, dar nu există un set de reguli pentru descrierea sistemului.
O altă problemă este alegerea particulară a notațiilor. Regulile de producție sunt deseori
sugerată ca un bun model al modului în care oamenii își amintesc cunoștințele procedurale, dar
există clase evidente în descrierea CCT dată mai sus. În special,
intrarea memoriei de lucru ( NOTĂ care execută spațiul de inserare ) există doar pentru a permite
regula DONE INSERT-SPACE-la foc , la momentul oportun. Nu este deloc clar
că are o semnificație cognitivă reală. De asemenea, se poate pune întrebarea dacă
Notarea lar a aleasă pentru sistem este critică pentru metodă. S-ar putea să alegem
reprezintă sistemul utilizând oricare dintre notele de descriere a dialogului din capitolul 16.
Diferitele notații ar genera, probabil, măsuri ușor diferite de disonanță.
Cu toate acestea, ar trebui să se țină seama de TCC ca un instrument de inginerie care să ofere o măsură gravă
de învățare și dificultate, combinate cu o descriere detaliată a comportamentului utilizatorilor.

Pagina 12
430 Capitolul 12 ■ Modele cognitive

Acest lucru poate fi apoi utilizat de către analiști care își folosesc expertiza profesională. Fără îndoială,
puterea ideii centrale a CCT se află dincolo de notele speciale folosite.

12.2.3 Probleme și extensii ale ierarhiilor de țintă


Formarea unei ierarhii de țintă este, în mare măsură, o tehnică post-hoc și rulează foarte real
riscul de a fi definit de dialogul computerului mai degrabă decât de utilizator. O modalitate de a rectifica
aceasta este de a produce o structură de țintă bazată pe proceduri manuale preexistente și astfel
obțineți o ierarhie naturală [201]. Pentru a fi corect, GOMS definește domeniul său ca fiind
utilizarea expertului și, prin urmare, structurile de țintă care sunt importante sunt cele pe care utilizatorii le utilizează
să se dezvolte din folosirea sistemului. Cu toate acestea, o astfel de ierarhie naturală poate fi par-
util ca parte a unei analize CCT, reprezentând o stare de cunoaștere foarte timpurie.
Pe partea pozitivă, cadrul conceptual al ierarhiilor de țintă și al scopului utilizatorilor
stivele pot fi folosite pentru a exprima probleme de interfață, care nu sunt direct abordate de notații
de mai sus. De exemplu, putem folosi acest lucru pentru a examina în detaliu problema închiderii cu
aparatele bancare automate (ATM-uri) anterioare menționate în caseta Design Focus din Chap-
ter 1, secțiunea 1.3.2. Aceste ATM-uri timpurii au dat clientilor banii inainte de a se intoarce
cărțile lor. Din păcate, acest lucru a dus la faptul că mulți clienți și-au lăsat cardurile în urmă. Acest
a fost în ciuda mesajelor de pe ecran, spunându-le să aștepte. Aceasta este menționată ca o problemă
de închidere . Obiectivul principal al utilizatorului este de a obține bani; atunci când acest obiectiv este îndeplinit,
utilizatorul nu completează sau închide diferitele sub-sarcini care rămân încă deschise:
OBIECTIV: GET-BANI
. OBIECTIV: USE-ATM
. . INSERT-CARD
. . ENTER-PIN
.. .. ENTER-SUMA
STRANG BANI
<< țintă exterioară acum stack gol gol mulțumit >>
. . COLECTARE-CARD - operatorii subgoiali au ratat
Băncile (cel puțin unele dintre ele) au schimbat curând ordinea de dialog, astfel încât să fie cartela
întotdeauna recuperate înainte de eliberarea banilor. O regulă generală care poate fi aplicată
la orice ierarhizare a obiectivelor este că nu trebuie îndeplinit niciun obiectiv la nivel superior
toate subgoalele au fost satisfăcute. Cu toate acestea, nu este întotdeauna ușor să se prevadă când
utilizatorul va considera că un obiectiv a fost satisfăcut. De exemplu, unul dintre autori a făcut-o
a fost cunoscut pentru a colecta cardul lui și uita banii!

12.3 LINGUISTIC MODELS

Interacțiunea utilizatorului cu un computer este adesea privită în termeni de limbă, așa că


nu este surprinzător faptul că mai multe formalizări de modelare s-au dezvoltat în centrul atenției
acest concept. Mai multe dintre notele de dialog descrise în capitolul 16 se bazează, de asemenea

Pagina 13
12.3 Modele lingvistice 431

pe ideile lingvistice. Într-adevăr, gramatica BNF este frecvent utilizată pentru a specifica dialogurile.
Modelele de aici, deși similare în formă cu notațiile de dialog de dialog, au fost
propusă cu intenția de a înțelege comportamentul utilizatorului și de a analiza comportamentul utilizatorului
dificultate cognitivă a interfeței.

12.3.1 BNF

Reprezentantul abordării lingvistice este utilizarea de către Reisner a formulei Backus-Naur ( BNF )
reguli pentru a descrie gramatica de dialog [301]. Aceasta privește dialogul într-un mod pur sintactic
nivel, ignorând semantica limbii. BNF a fost utilizat pe scară largă pentru a specifica
sintaxa limbajelor de programare pe calculator și multe dialoguri de sistem pot fi
descrise cu usurinta folosind regulile BNF. De exemplu, imaginați-vă un sistem grafic care are a
funcția de desen linie. Pentru a selecta funcția, utilizatorul trebuie să selecteze opțiunea de meniu 'linie'.
Funcția de desen linie permite utilizatorului să deseneze o polilinie, adică o secvență de
arcurile liniare dintre puncte. Utilizatorul selectează punctele făcând clic pe butonul mouse-ului
zona de desen. Utilizatorul face dublu clic pentru a indica ultimul punct al poliliniei.
trage-line :: = select-line + select-points
+ ultimul punct
selectați-line :: = pozitia mouse-ului + CLICK-MOUSE
alege-puncte :: = alege-una
| selectați-o + alegeți-puncte
Alege una :: = pozitia mouse-ului + CLICK-MOUSE
ultimul punct :: = pozitia-mouse + DOUBLE-CLICK-MOUSE
pozitia-mouse :: = goala | MOVE-MOUSE + mouse-ul de poziție
Numele din descriere sunt de două tipuri: non-terminale , prezentate în litere mici,
și terminale , prezentate în majuscule. Terminalele reprezintă nivelul cel mai scăzut al utilizatorului
comportament, cum ar fi apăsarea unei taste, apăsarea unui buton al mouse-ului sau deplasarea mouse-ului.
Non-terminalele sunt abstracții de nivel superior. Terminalele non-terminale sunt definite în termeni
de alte terminale și terminale, prin definirea formularului
nume :: = expresie
Simbolul ' :: = ' se citește ca fiind 'definit ca'. Numai non-terminale pot apărea pe
din stânga unei definiții. Partea din dreapta este construită folosind doi operatori " + " (secvență)
și " | (alegere).De exemplu, prima regulă spune că linia de remorcare non-terminală
este definită a fi linia de selecție urmată de opțiunile de selectare urmate de ultimul -
punct . Toate acestea sunt non-terminale, adică nu ne spun ce este utilizatorul de bază
acțiunile sunt. A doua regulă spune că linia de selecție este definită ca fiind poziția-
mouse (destinat să fie peste intrarea din meniul "linie"), urmată de CLICK-MOUSE . Acest
este primul nostru terminal și reprezintă clicul real al mouse-ului.
Pentru a vedea ce poziție este șoarecele , ne uităm la ultima regulă. Asta ne spune că există
sunt două posibilități pentru poziția-șoarece (separate prin simbolul " | "). unu
opțiunea este că poziția-mouse-ul este gol - un simbol special reprezentând nr
acțiune. Aceasta este, o opțiune nu este de a muta mouse-ul la toate. Cealaltă opțiune este de a face

Pagina 14
432 Capitolul 12 ■ Modele cognitive

o acțiune MOVE-MOUSE urmată de poziționarea mouse-ului . Această regulă este recursivă și


această a doua poziție mouse-ul poate fi ea însăși goală sau să fie un MOVE-MOUSE
acțiune urmată de poziția-șoarece , și așa mai departe. Asta este, poziția mouse-ul poate
fie orice număr de acțiuni MOVE-MOUSE .
În mod similar, punctele de alegere sunt definite recursiv, dar de data aceasta nu au
opțiunea de a fi gol. Acesta poate fi una sau mai multe dintre non-terminale alege-one
care este definită ca fiind (ca și linia de selectare ) poziția-șoarece urmată de
CLICK-MOUSE .
Descrierea BNF a unei interfețe poate fi analizată în mai multe moduri. Un mea-
este sigur să numeri numărul de reguli. Cele mai multe reguli necesită o interfață pentru ao folosi,
cu atât este mai complicat. Această măsură este destul de sensibilă la modul exact în care inter-
este descrisă fața. De exemplu, am fi putut înlocui regulile pentru alege-
puncte și alegeți-o cu definiția unică
alege-puncte :: = pozitia-mouse + CLICK-MOUSE
| poziția mouse-ului + CLICK-MOUSE + alege-puncte
O măsură mai robustă ia în calcul și numărul de " + " și " | " "operatori. Acest
ar penaliza, într-adevăr, regula unică mai complexă. O altă problemă apare cu
regula pentru selectarea liniei . Aceasta este identică cu regula de alegere . In orice caz,
acțiunile de selectare a opțiunii de meniu și alegerea unui punct pe o suprafață de desen
sunt în mod evident atât de diferite încât trebuie să fie desigur separate. Deciziile de genul asta
despre structura unei descrieri a BNF sunt mai puțin o problemă în practică decât
probleme similare pe care le-am avut cu CCT.
În plus față de aceste măsuri de complexitate pentru limba în ansamblu, putem folosi
definiția BNF pentru a determina câte acțiuni de bază sunt necesare pentru o anumită persoană
sarcină și, astfel, să obțină o estimare tare a dificultății acestei sarcini.
Descrierea BNF de mai sus reprezenta doar acțiunile utilizatorului, nu cele ale utilizatorului
percepția răspunsurilor sistemului. Această tendință de intrare este surprinzător de comună
printre modelele cognitive, așa cum vom discuta în Secțiunea 12.4. Reisner sa dezvoltat
extensii la descrierile de bază ale BNF, care încearcă să se ocupe de aceasta prin adăugarea
"acțiuni de căutare a informațiilor" la gramatică.

12.3.2 Gramatica de sarcină-acțiune

Măsurile bazate pe BNF au fost criticate ca nefiind suficient de "cognitive". ei


să ignore avantajele coerenței atât în structura limbii, cât și în cadrul acesteia
utilizarea numelor și literelor de comandă. Task-action grammar ( TAG ) [284] tentative
pentru a rezolva unele dintre aceste probleme prin includerea unor elemente cum ar fi parametrizate
regulile gramaticale pentru a accentua coerența și codarea cunoștințelor lumii utilizatorului
(de exemplu, sus este opusul de jos).
Pentru a ilustra consecvența, luăm în considerare cele trei comenzi UNIX: cp (pentru copiere
fișiere), mv (pentru fișierele în mișcare) și ln (pentru conectarea fișierelor). Fiecare dintre acestea are două posibile
formulare. Ei au fie două argumente, un nume de fișier sursă și destinație, sau au
orice număr de nume de fișiere sursă urmat de un director de destinație:

Pagina 15
12.3 Modele lingvistice 433

copie :: = 'cp' + nume fișier + nume fișier


| "cp" + nume de fișiere + director
muta :: = 'mv' + nume fișier + nume fișier
| directorul "mv" + nume de fișiere +
link :: = 'ln' + nume fișier + nume fișier
| Adresele "ln" + nume de fișiere +
Măsurile bazate pe BNF nu au putut distinge între aceste
mâinile și o alternativă inconsecventă - spuneți dacă ln a luat argumentul directorului
primul. Task-action gramatica a fost conceput pentru a dezvălui doar acest tip de coerență. Este
descrierea comenzilor UNIX ar fi
fișier-op [Op]: = comandă [Op] + nume fișier + nume fișier
| comandă [Op] + nume de fișiere + director
comanda [Op = copie]: = 'cp'
comanda [Op = mutare]: = 'mv'
comandă [Op = link]: = 'ln'
Aceasta captează coerența comenzilor și seamănă foarte mult cu originalul
descriere textuală. Ne-am putea imagina ca o masura a complexitatii
limba bazată pe descrierea TAG ar fi mai bine să prezicăți învățarea reală
și performanță decât una simplă a BNF.
Pe lângă faptul că se ocupă bine cu consistența, TAG are caracteristici pentru a vorbi despre "lumea"
cunoştinţe'. De exemplu, imaginați-vă că avem două interfețe de linie de comandă pentru deplasare
o broască țestoasă mecanică în jurul podelei.
Interfața de comandă 1
mișcare [Direcție]
: = comanda [Direction] + distanta + RETURN
comandă [Direction = inainte] : = 'merge 395'
comanda [Direction = inapoi]: = 'merge 013'
comandă [Direcție = stânga] : = 'merge 712'
comandă [Direcție = dreapta] : = 'merge 956'
Interfața de comandă 2
mișcare [Direcție]
: = comanda [Direction] + distanta + RETURN
comandă [Direction = inainte] : = 'FORWARD'
comandă [Direcție = înapoi]: = 'BACKWARD'
comandă [Direcție = stânga] : = 'LEFT'
comandă [Direcție = dreapta] : = 'DREAPTA'
Prima interfață nu poate fi la fel de proastă cum pare; comanda "du-te 395" ar putea
se referă la adresa unei rutine de cod de mașină, care efectuează funcția corespunzătoare
circulaţie. Cu toate acestea, este absolut clar că a doua interfață este preferabilă față de
primul. TAG include o formă specială cunoscută , care este utilizată pentru a desemna informații
care utilizatorul va cunoaște deja și, prin urmare, nu trebuie să învețe pentru a folosi
sistem. Folosind acest formular, regulile TAG pentru a doua interfață sunt rescrise

Pagina 16
434 Capitolul 12 ■ Modele cognitive

Interfața de comandă 2
mișcare [Direcție]
: = comanda [Direction] + distanta + RETURN
comandă [Direcție]: = element cunoscut [Tip = cuvânt, Direcție]
* comanda [Direction = forward]: = 'FORWARD'
* comanda [Direction = inapoi]: = 'BACKWARD'
* comanda [Direction = left] : = 'LEFT'
* comanda [Direction = right] : = 'DREAPTA'
Regulile marcate cu stea pot fi generate din a doua regulă, folosind lumea utilizatorilor
cunoştinţe. Acestea sunt incluse în orice descriere TAG pentru completitudine, dar nu sunt
numărate în orice măsură de complexitate.
Uneori este posibil să nu fie clar ce este comanda potrivită, dar odată ce noi
știți unul, restul devine evident. De exemplu, considerați o bază de date simplă
jucând o listă de înregistrări. Ne asteptam la doua comenzi, una pentru a merge la lista
înregistrarea anterioară și alta pentru a trece în jos lista la următoarea înregistrare. Sunt
mai multe opțiuni pentru comenzi, de exemplu UP / DOWN, PREVIOUS / NEXT,
eventual în litere mici sau mici, eventual, de asemenea, doar prima literă a literei relevante
cuvânt. În plus, s-ar putea să aveți seturi de comandă mixte, cum ar fi UP / NEXT sau
N / anterior. Faptul că oricare din vechile seturi de comenzi este mai ușor de învățat decât
comenzile mixte se numește congruență . TAG are o notație pentru a descrie
congruența unei interfețe. Notația F ("următoarea") este utilizată pentru a denumi caracteristica
set legat de cuvântul "următor". Aceasta este următoarea / anterioară. Cu această notație congruentă
gramatica necesită doar o singură regulă "reală", cum ar fi
răsfoiți [Direcție]: = F ('următor') + retur
* răsfoiți [Direction = up] : = 'precedent' + retur
* Răsfoiți [Direction = jos]: = 'următor' + retur
Am văzut că notația permite să se spună că comenzile DREAPTA și
LEFT sunt consecvente pentru acțiuni opuse. De unde știm că utilizatorul privește
opus de DREAPTA de a fi LEI mai degrabă decât ÎNAPOI? Evident, includerea
cunoașterea lumii depinde de utilizatorul sistemului - cele de mai sus presupun cu siguranță
că limba utilizatorului este engleza. Designerul este responsabil pentru introducerea acestui lucru
cunoașterea mondială în descrierea TAG și validitatea acesteia va depinde de
raționamentul profesional al designerului. Cu toate acestea, TAG va face aceste ipoteze clare
și astfel, subliniind-le, să le țineți pentru inspecție.

12.4 PROVOCAREA SISTEMELOR BAZATE DE DISPOZITIE

Ambele tehnici bazate pe ierarhie și gramatică au fost inițial dezvoltate când


cele mai multe sisteme interactive au fost linia de comandă sau, cel mult, tastatura și cursorul.
Există, așadar, îngrijorări semnificative cu privire la cât de bine aceste abordări pot genera
alize pentru a face față interfețelor mai moderne cu ferestre și mouse-driven.

Pagina 17
12.4 Provocarea sistemelor bazate pe afișare 435

Ambele familii de tehnici ignoră în mare măsură rezultatele sistemului - ceea ce vede utilizatorul.
Presupunerea implicită este că utilizatorii știu exact ce vor să facă și
executați secvențele de comandă corespunzătoare orbește. Există excepții de la acest lucru.
Am menționat deja modul în care BNF al Reisner a fost extins pentru a include afirmațiile
despre producție. În plus, TAG a fost extins pentru a include informații
despre modul în care afișajul poate afecta regulile de gramatică [180].
O altă problemă pentru gramatici este structura lexicală de nivel inferior. Apăsând a
cheia cursorului este o lexemă rezonabilă , dar mișcarea unui pixel este mai puțin sensibilă.
În plus, dialogurile bazate pe pointer sunt mai orientate spre afișare. Faceți clic pe un cursor la
un anumit punct pe ecran are o semnificație dependentă de ecranul curent
corturi. Această problemă poate fi rezolvată parțial prin examinarea unor operațiuni precum "selectați"
regiune de text "sau" faceți clic pe butonul de ieșire "ca terminale ale gramaticii. Dacă asta e
abordarea este luată, mișcările detaliate ale mouse-ului și parsarea evenimentelor mouse-ului în
contextul informațiilor de afișare (meniuri etc.) este îndepărtat.
Metodele de ierarhie a obiectivelor au diferite probleme, deoarece sunt mai orientate spre afișare
sistemele încurajează metode mai puțin structurate pentru realizarea obiectivelor. În loc de hav-
planuri bine definite, utilizatorul este considerat ca îndeplinind o sarcină mai exploratorie,
recunoscând direcțiile fructuoase și sprijinindu-i pe ceilalți. De obicei, chiar și atunci când acest lucru
stilul experimental este folosit la un singur nivel, putem vedea în el și în jurul acestuia mai mult
metode orientate spre obiective. De exemplu, am putea lua în considerare obiectivul la nivel înalt
structura
SCRIE SCRISOARE
. FIND_SIMILAR_LETTER
. COPY_IT
. EDIT_COPY
Cu toate acestea, sarcina de a găsi o scrisoare similară ar fi exploratorie, căutând prin
folderele etc. Această căutare bazată pe recunoaștere este extrem de dificil de reprezentat
ca o structură a obiectivelor. În mod similar, editarea efectivă ar depinde foarte mult
activități neplanificate: "ah da, vreau să reutilizez acel pic, dar va trebui să schimb asta".
Dacă scădem din nou la un nivel inferior, ierarhiile de țintă devin aplicabile.
De exemplu, în timpul etapei de editare am putea avea subdialogul "șterge un cuvânt":
DELETE_WORD
. SELECT_WORD
. . MOVE_MOUSE_TO_WORD_START
. . DEPRESS_MOUSE_BUTTON
. . MOVE_MOUSE_TO_WORD_END
. . RELEASE_MOUSE_BUTTON
. CLICK_ON_DELETE
. . MOVE_MOUSE_TO_DELETE_ICON
. . CLICK_MOUSE_BUTTON
Astfel, ierarhiile de țintă pot face față parțial sistemelor orientate spre afișare de către un
alegerea adecvată a nivelului, dar problemele nu pun accentul pe prescripție
natura modelelor cognitive care le stau la baza.

Pagina 18
436 Capitolul 12 ■ Modele cognitive

Aceste probleme au fost unul dintre factorii din spatele popularității în creștere
acțiune situat [334] și cogniție distribuite [208, 185] în HCl ( a se vedea , de asemenea , lele
ter 14). Ambele abordări subliniază modul în care acțiunile sunt contingente
evenimente și determinate de context, în loc să fie pre-planificate. La o extremitate,
protagoniștii acestor abordări par să nege acțiunile planificate sau pe termen lung
goluri. Pe de altă parte, modelele tradiționale cognitive se bazează pe modelare pe bază de afișare
cogniție folosind reguli de producție și metode similare, care includ date senzoriale
în cadrul modelelor.
La un nivel scăzut, comportamentul expertului chunked este modelat eficient utilizând ierarhia
sau modele lingvistice, și este locul unde modelul de tip keystroke-level (discutat în secțiunea
12.5.1 de mai jos) sa dovedit a fi eficientă. În schimb, este clar că nici o cantitate de cognitivă
modelarea poate capta activitatea în timpul scrierii unei poezii. Între aceste două,
modelele cognitive vor avea diferite nivele de succes și utilitate. Desigur, modele, la toate
dar cele mai scăzute niveluri trebuie să țină seama de reacțiile utilizatorilor la feedback-ul de la
sistem, altfel nu pot aborda deloc problema fundamentală a interactivității .

12.5 MODELE FIZICE ȘI DISPOZITIVE

12.5.1 Modelul la nivelul tastaturii


Comparativ cu înțelegerea cognitivă profundă necesară pentru a descrie problema-
activitățile de rezolvare a problemelor, sistemul motor al omului este bine înțeles. KLM ( Nivel de tastare
Modelul [55] utilizează această înțelegere ca bază pentru predicții detaliate despre utilizator
performanţă. Se adresează sarcinilor unitare în cadrul interacțiunii - executarea unor simple
secvențe de comandă, de obicei nu mai mult de 20 de secunde. Exemple de acest lucru
ar folosi o funcție de căutare și înlocuire sau o schimbare a fontului unui cuvânt. Da
nu se extind la acțiuni complexe, cum ar fi producerea unei diagrame. Presupunerea este că
aceste sarcini mai complexe ar fi împărțite în subtascuri (ca în GOMS) înaintea utilizatorului
încearcă să le mute în acțiuni fizice. Sarcina este împărțită în două etape:
achiziția sarcinii, atunci când utilizatorul construiește o reprezentare mentală a sarcinii;
executarea sarcinii utilizând facilitățile sistemului.
KLM oferă doar predicții pentru ultima etapă de activitate. În timpul achiziției
, utilizatorul va decide cum să realizeze sarcina folosind primitivele
sistem și, astfel, în timpul fazei de execuție, nu există
- utilizatorul este în mod efectiv expert. KLM este legat de modelul GOMS și poate fi
gândit ca un model GOMS la un nivel foarte scăzut unde metoda este dată.
Modelul descompune faza de execuție în cinci motoare fizice diferite
operatori, un operator mental și un operator de răspuns la sistem:
K Keystroking, chei efectiv izbitoare, inclusiv schimburi și alte taste modificatoare.
B Apăsarea unui buton al mouse-ului.
P Pointing, mutarea mouse-ului (sau a unui dispozitiv similar) la o țintă.

Pagina 19
12.5 Modele fizice și de dispozitive 437

H Homing, schimbând mâna între mouse și tastatură.


D Desenarea liniilor cu ajutorul mouse-ului.
M Mental pregătirea pentru o acțiune fizică.
R Răspuns la sistem care poate fi ignorat dacă nu trebuie să așteptați utilizatorul, cum ar fi
în copierea textului.
Executarea unei sarcini va implica întâlniri intermediare ale diferitelor operațiuni.
ators. De exemplu, imaginați-vă că folosim un editor bazat pe mouse. Dacă observăm un singur
caracter de eroare vom indica la eroare, ștergeți caracterul și reintroduceți-l, apoi
reveniți la punctul nostru de introducere anterior. Aceasta se descompune după cum urmează:
1. Mutați mâna pe șoarece H [mouse]
2. Poziționați mouse-ul după caracterul PB
rău [stânga]
3. Întoarceți-vă la tastatură H [tastatură]
4. Ștergeți caracterul MK [DELETE]
5. Corectarea tipului K [char]
6. Repoziționați punctul de inserare H [mouse] MPB [stânga]
Observați că anumiți operatori au adăugate descrieri, reprezentând care
dispozitivul casei de mână (de exemplu, mouse-ul) și ce taste sunt lovite (de exemplu,
LEFT - butonul stâng al mouse-ului).
Modelul prezice timpul total necesar în timpul fazei de execuție prin adăugarea lui
timpii componente pentru fiecare dintre activitățile de mai sus. De exemplu, dacă timpul necesar pentru
o tastă este t K , atunci timpul total care face apăsările de la tastatură este
TK=2tK
Calcule similare pentru ceilalți operatori dau un timp total de
T execuție = T K + T B + T P + T H + T D + T M + T R
=2tK+2tB+tP+3tH+0+2tM+0

În acest exemplu, timpul de răspuns al sistemului a fost zero. Cu toate acestea, dacă utilizatorul a trebuit
așteptați pentru sistem, atunci se va adăuga timpul corespunzător. În multe sarcini de tiparire,
utilizatorul poate introduce oricum în viitor și, prin urmare, nu este nevoie să se adauge timpii de răspuns.
Atunci când este necesar, timpul de răspuns poate fi măsurat prin observarea sistemului.
Vremurile pentru ceilalți operatori sunt obținute din date empirice. Keying-ul
timpul depinde în mod evident de calitatea de scriere a utilizatorului, și astfel sunt diferite momente
utilizate pentru diferiți utilizatori. Apăsarea unui buton al mouse-ului este de obicei mai rapidă decât introducerea textului
(în special pentru dactilografii cu două degete) și se poate face o predicție mai precisă a timpului
prin separare a apăsat butonul B din restul tastatura K . Punctul-
timpul de calcul poate fi calculat folosind legea lui Fitts (a se vedea capitolul 1) și, prin urmare, depinde de
dimensiunea și poziția țintă. 1 Alternativ, un timp fix bazat pe media în cadrul

1 Forma legii lui Fitts utilizată cu KLM inițial este K log ( D / S + 0,5), unde D este distanța față de
2

țintă și S este dimensiunea țintă. Vom folosi acest formular pentru calcule în această subsecțiune, dar vom reveni la
Formați un log a + b ( D / S + 1) în următoarea subsecțiune atunci când luăm în considerare modelul cu trei state al lui
2

aBuxton,
fost folosit pentru
deoarece aceste
acest experimente.
formular

Pagina 20
438 Capitolul 12 ■ Modele cognitive

Tabelul 12.1 Timpii pentru diferiți operatori în modelul de nivel cu tastatură (adaptat de la
Card, Moran și Newell [56], publicate și retipărite cu permisiunea lui Lawrence Erlbaum
Associates, Inc.)

Operator Comentarii Timp (e)

K apasa tasta
bun dactilograf (90 wpm) 0,12
(40 wpm) 0,28
non-dactilograf 1.20
B Apăsați butonul mouse-ului
în jos sau în sus 0.10
clic 0,20
P Punct cu mouse-ul
Fitts 'lege 0,1 log ( D / S + 0,5)
2

mișcare medie 1.10


H Mâinile acasă de la și de la tastatură 0,40
D Desen - domeniu dependent -
M Mental pregăti 1,35
R Răspuns de la măsurarea sistemului -
wpm = cuvinte pe minut

poate fi folosită afișarea ecranului. Timpul de desenare depinde de numărul și lungimea lui
liniile desenate, și este destul de domeniu specifice, dar se poate folosi cu ușurință date empirice pentru
sarcini generale de desen. În cele din urmă, timpul de găzduire și timpul pregătirii mintale sunt
presupusă constantă. Timpii tipici sunt rezumați în Tabelul 12.1.
Operatorul mental este probabil cea mai complexă parte a KLM. Sa nu uiti asta
se presupune că utilizatorul a decis ce să facă și cum să procedeze. Pre-
parație este, astfel, doar ușoarele pauze făcute în timp ce utilizatorul își amintește ce trebuie să facă în continuare.
Există euristici complicate pentru a decide unde să pună operatorii M , dar toți
se toarnă până la nivelul chunking (vezi capitolul 1 pentru o discuție despre chunking).
Dacă utilizatorul introduce un cuvânt sau un nume de comandă bine-cunoscut, acesta va fi o bucată,
și, prin urmare, necesită doar un operator mental. Cu toate acestea, dacă un nume de comandă a fost unul
acronimul pe care utilizatorul îl reamintește scrisoarea prin scrisoare, atunci am plasa un M
operator pe scrisoare.
Timpul operatorului fizic depinde de abilitățile utilizatorului. De asemenea, mentalul
operatorul depinde de nivelul de chunking și, prin urmare, de expertiza utilizatorului. Tu
trebuie deci să decideți înainte de a utiliza predicțiile KLM exact ce fel de utilizator sunteți
gindind despre. Nici măcar nu poți să faci operatorii și apoi să completezi orele
ulterior, deoarece diferiții utilizatori pot alege diferite metode și au diferite poziții
M din cauza chunking. Acest lucru pare destul de oneros, dar predicțiile făcute
de KLM sunt doar menite să fie o aproximare, și astfel, presupuneri rezonabile despre
nivelurile de expertiză sunt suficiente.
Previziunile individuale pot fi interesante, dar puterea KLM constă în
ISON. Având în vedere mai multe sisteme, putem elabora metodele de îndeplinire a sarcinilor cheie și
apoi folosiți KLM pentru a ne spune care este cel mai rapid sistem. Acest lucru este considerabil mai ieftin decât

Pagina 21
12.5 Modele fizice și de dispozitiv 439

efectuând experimente lungi (nivelele de variație individuală ar cere o vastă


numărul de încercări - a se vedea capitolul 9). În plus, sistemele nu trebuie nici măcar să existe.
Din descrierea unui sistem propus, putem prezice timpul necesar sarcinilor.
Pe lângă compararea sistemelor, putem compara metodele dintr-un sistem. Acesta poate fi
util în pregătirea materialelor de instruire, deoarece putem alege să predăm metodele mai rapide.

Utilizând modelul la nivel de tastă

De exemplu, comparați cele două metode de iconire a unei ferestre din secțiunea
12.2.1. Unul a folosit tasta funcțională "L7", iar cealaltă opțiunea "CLOSE" din fereastra
meniu pop-up. Acesta din urmă este obținut prin mutarea la bara de titlu a ferestrei, prin apăsarea mouse-ului din stânga
, glisând mouse-ul în meniul pop-up în opțiunea "ÎNCHIDE" și apoi eliberând
butonul mouse-ului. Presupunem că mâna utilizatorului este pe mouse-ul pentru a începe cu și, prin urmare, numai
L7-METODA va necesita un operator de găzduire. Operatorii pentru cele două metode sunt:
L7-METODA H [la tastatură] MK [tasta funcțională L7]
P [până la bara de meniu] B [LEFT down] MP [la opțiunea] B [LEFT up]
CLOSE-METODA
Timpul total este astfel
L7-METODA = 0,4 + 1,35 + 0,28
= 2,03 secunde
= 1,1 + 0,1 + 1,35 + 1,1 + 0,1
CLOSE-METODA
= 3,75 secunde
Primul calcul este destul de simplu, dar cel de-al doilea are nevoie de o despachetare. Butonul
presele sunt separate în jos și apoi în sus acțiuni și, astfel, fiecare este temporizat la doar 0,1 dintr-o secundă,
mai degrabă decât 0,2 pentru un clic, sau 0,28 pentru tastare. De asemenea, am utilizat media simplificată de 1,1 sec-
onds pentru sarcina de orientare. Din aceste predicții, putem vedea că metoda L7 este mult mai rapidă.
În secțiunea 12.2.1, regula de selecție a lui Sam a fost aceea de a folosi metoda L7 atunci când se joacă blocuri. Pentru a face acest lucru,
el poate continua să joace jocul cu ajutorul mouse-ului în mâna dreaptă în timp ce își mișcă mâna stângă
cheia. Astfel, timpul real pentru Sam, de când își ia atenția de la joc la momentul când
comanda este dată, este mai mică: 2,03 secunde minus timpul de găzduire, adică 1,63 secunde. Avand in vedere
metoda este atât de rapidă, de ce nu o folosește Sam tot timpul?
Probabil că estimările medii pentru timpii de indicare ne-au influențat estimarea. Putem fi ceva mai mult
cu precizie cu privire la calendarul CLOSE-METHOD dacă folosim legea Fitts în loc de media de 1,1 secunde.
Mouse-ul va fi în mod obișnuit în mijlocul unei ferestre cu o înălțime de 25 de linii. Bara de titlu este de 1,25 linii înălțime.
Astfel, raportul distanță la țintă pentru prima sarcină de direcționare este de 10: 1. Opțiunea "ÎNCHIS" este de patru elemente
în jos în meniul pop-up; de aceea raportul pentru a doua activitate de indicare este 4: 1. Astfel putem calcula
târziu ori orientativ:
P [la bara de meniu] = 0.1 log (10.5) = 0.339
2

P [la opțiune] = 0,1 log (4,5) = 0,217


2

Cu aceste sincronizări revizuite, KLM prezice că CLOSE-METHOD va dura 2,1 secunde. Deci, Sam
regula de selecție nu este la fel de rea cum părea inițial!

Pagina 22
440 Capitolul 12 ■ Modele cognitive

Exercițiu de lucru Faceți o analiză la nivel de tastă pentru a deschide o aplicație într-o interfață grafică desktop folosind
un mouse ca dispozitiv de indicare, comparând cel puțin două metode diferite pentru efectuarea
sarcină. Repetați exercițiul utilizând un trackball. Luați în considerare modul în care analiza ar diferi pentru diferite
pozițiile trackball-ului față de tastatură și pentru alte dispozitive de indicare.
Răspuns Furnizăm o analiză la nivel de tastă pentru trei metode diferite de lansare a unui
aplicație pe un desktop vizual. Aceste metode sunt analizate pentru o metodă convențională,
mouse-ul mouse-ului, un trackball montat departe de tastatură și unul montat aproape
tastatura. Principala distinctie intre cele doua trackballs este cea de-a doua
nu necesită o repoziționare explicită a mâinilor, adică nu este nevoie de timp
pentru plasarea mâinilor între dispozitivul de indicare și tastatură.
Metoda 1 Dublu clic pe pictograma aplicației
paşi Operator Șoarece Trackball 1 Trackball 2

1. Mutați mâna pe șoarece H [mouse] 0.400 0.400 0.000


2. Mouse pentru a icoana P [la pictogramă]
0,664 1.113 1.113
3. Faceți dublu clic 2B [click] 0.400 0.400 0.400
4. Întoarceți-vă la tastaturăH [kbd] 0.400 0.400 0.000
Ora totală 1.864 2.313 1.513

Metoda 2 Utilizarea unei taste de accelerare


paşi Operator Șoarece Trackball 1 Trackball 2

1. Mutați mâna pe șoarece H [mouse] 0.400 0.400 0.000


2. Mouse pentru a icoana P [la pictogramă]
0,664 1.113 1.113
3. Faceți clic pentru a selecta
B [click] 0.200 0.200 0.200
4. Întrerupeți M 1.350 1.350 1.350
5. Întoarceți-vă la tastaturăH [kbd] 0.400 0.400 0.000
6. Apăsați accelerația K 0.200 0.200 0.200
Ora totală 3.214 3.663 2.763

Metoda 3 Utilizarea unui meniu


paşi Operator Șoarece Trackball 1 Trackball 2

1. Mutați mâna pe șoarece H [mouse] 0.400 0.400 0.000


2. Mouse pentru a icoana P [la pictogramă]
0,664 1.113 1.113
3. Faceți clic pentru a selecta
B [click] 0.200 0.200 0.200
4. Întrerupeți M 1.350 1.350 1.350
5. Meniul pentru redarea fișierelor
P 0,664 1.113 1.113
6. Meniu pop-up B [jos] 0.100 0.100 0.100
7. Trageți pentru a deschideP [drag] 0.713 1.248 1.248
8. Eliberați mouse-ul B [sus] 0.100 0.100 0.100
9. Întoarceți-vă la tastaturăH [kbd] 0.400 0.400 0.000
Ora totală 4.591 6.024 5.224

Pagina 23
12.5 Modele fizice și de dispozitive 441

Card, Moran și Newell au validat empiric KLM împotriva unei game de sisteme,
atât tastatura, cât și mouse-ul, și o selecție largă de sarcini. Predicțiile au fost
a fost remarcabil de precis (o eroare de aproximativ 20%). KLM este astfel unul dintre puțini
modele capabile să ofere predicții cantitative exacte despre performanță.
Cu toate acestea, gama de aplicații este, în consecință, mică. Ne spune foarte multe despre
micro-interacțiune, dar nu despre dialogul la scară mai largă.
Am văzut că trebuie să fii foarte atent, ca aproximările pe care le faci
poate schimba radical rezultatele - KLM este un ghid, nu un oracol. Ar trebui, de asemenea, să adăugăm
un cuvânt de prudență în legătură cu presupunerea că cel mai rapid este cel mai bun. Există cu siguranță situații
în cazul în care acest lucru este posibil, de exemplu, sarcini foarte repetitive, cum ar fi telefonia sau datele
intrare. Cu toate acestea, chiar și utilizatorii experți nu vor folosi adesea metoda cea mai rapidă. Pentru examen-
expertul poate avea mai degrabă un set de metode generale, non-opționale, decât
câteva metode specifice sarcinilor.

12.5.2 Modelul cu trei state


În capitolul 2, am văzut că există o serie de dispozitive de indicare în plus față de mouse.
Adesea, aceste dispozitive sunt considerate echivalente logic, dacă aceleași intrări sunt disponibile
capabil de aplicare . Asta este, atâta timp cât poți selecta un punct de pe ecran, ei
sunt la fel. Cu toate acestea, aceste dispozitive diferite - mouse-ul, trackball-ul, stiloul - simt
foarte diferit. Deși dispozitivele sunt similare din punctul de vedere al aplicației,
au caracteristici senzor-motor foarte diferite.
Buxton a dezvoltat un model simplu de dispozitive de intrare [53], modelul cu trei stări ,
care surprinde unele dintre aceste distincții cruciale. El începe să privească un șoarece.
Dacă mutați-l fără butoane împinse, în mod normal se mișcă cursorul mouse-ului.
Acest comportament de urmărire este denumit stare 1. Prin apăsarea unui buton peste o pictogramă și apoi
mișcarea mouse-ului va avea ca rezultat adesea tragerea unui obiect. Asta sună
starea 2 (a se vedea figura 12.1).
Dacă în schimb considerăm un stilou cu buton, acesta se comportă exact ca un mouse când
atinge ecranul. Când butonul nu este apăsat, este în starea 1 și când
butonul său este în jos, de stat 2. Cu toate acestea, stiloul de lumină are oa treia stare, atunci când lumina
stiloul nu atinge ecranul. În această stare sistemul nu poate urmări penele de lumină
poziţie. Aceasta se numește stare 0 (vezi Figura 12.2).
Un touchscreen este ca un stilou de lumină fără buton. În timp ce utilizatorul nu atinge
ecranul, sistemul nu poate urmări degetul - adică, starea 0 din nou. Când utilizatorul
atinge ecranul, sistemul poate începe să urmărească - starea 1. Deci, un ecran tactil este o stare
Dispozitivul 0-1, în timp ce un mouse este un dispozitiv de stare 1-2. Deoarece nu există nici o diferență între a
starea 0-2 și un dispozitiv de stare 0-1, există doar cele trei posibilități pe care le-am văzut.

Figura 12.1 Tranziții ale mouse-ului: stările 1 și 2

Pagina 24
442 Capitolul 12 ■ Modele cognitive

Figura 12.2 Tranziții stiloului de lumină: trei stări

Singura complexitate suplimentară este dacă dispozitivul are mai multe butoane, caz în care noi
ar avea o stare pentru fiecare buton: 2 stânga , 2 mijloc , 2 dreapta .
O singură utilizare a acestei clasificări este de a examina diferite sarcini de indicare, cum ar fi pictograma
selectarea sau desenul de linie și să vedem ce comportament de stare 0-1-2 cere. Noi putem
apoi verificați dacă un anumit dispozitiv poate suporta sarcina necesară. Dacă trebuie să folosim
un dispozitiv necorespunzător, este posibilă utilizarea tastelor de tastatură pentru a adăuga stările dispozitivului. Pentru
cu un touchscreen, putem nominaliza cheia de evacuare pentru a fi "virtuală"
butonul mouse-ului în timp ce degetul utilizatorului este pe ecran. Deși amestecul de chei-
bord și chei de mouse-ul este în mod obișnuit un obicei prost, este evident necesar în anumite ocazii.
La început, modelul pare să caracterizeze stările dispozitivului de către intrările
disponibile pentru sistem. Deci, din această perspectivă, starea 0 este clar diferită
din statele 1 și 2. Cu toate acestea, dacă ne uităm la tranzacția de stat 1-2, vedem asta
este simetric cu privire la cele două stări. În principiu, nu există niciun motiv pentru a
programul nu ar trebui să decidă să efectueze urmărirea simplă a mouse-ului în timp ce este în starea 2 și trageți
lucruri despre starea 1. Asta înseamnă că nu există niciun motiv până când nu vrei să tipi ceva!
Modul în care putem spune starea 1 din starea 2 este prin activitatea utilizatorului . Statul 2 necesită
un buton care trebuie apăsat, în timp ce starea 1 este una de relaxare relativă (în timp ce încă
coordonarea mâinilor-ochi pentru mișcarea mouse-ului). Există o diferență similară în
tensiune între starea 0 și starea 1.
Este bine cunoscut faptul că legea Fitts are constante diferite de timp pentru diferite dispozitive.
Amintiți-vă că legea Fitts spune că timpul necesar pentru a trece la o țintă de mărimea S la distanță
D este:
a + b log 2 ( D / S + 1)
Constantele a și b depind de dispozitivul special de indicare utilizat și de priceperea lui
utilizatorului cu dispozitivul respectiv. Cu toate acestea, înțelegerea dată de modelul cu trei state este aceea
aceste constante depind, de asemenea, de starea dispozitivului. În plus față de momentul, finala
acuratețea poate fi afectată.
Aceste observații sunt destul de evidente pentru dispozitivele de stat 0-1. Cu ecran tactil sau
stilou, un cursor va apărea adesea sub degetul sau stiloul
tact cu ecranul. Acuratețea cu care puteți deplasa cursorul în jurul va
să fie mult mai mare decât precizia cu care puteți să indicați în primul rând. De asemenea, este
rezonabil să se aștepte ca constanta legii lui Fitts să fie diferită, deși nu este așa
evident, care va fi mai rapidă.
Există o diferență similară între stările 1 și 2. Deoarece utilizatorul deține a
butonul în jos, mâna se află într-o stare de tensiune și, astfel, indică precizia și viteza
pot fi diferite. Experimentele pentru a calcula constantele legii Fitts în statele 1 și 2 au

Pagina 25
12.6 Arhitecturi cognitive 443

Tabelul 12.2 Coeficienții legii Fitts (după MacKenzie, Sellen și Buxton [221], © 1991
ACM, Inc. Reprinted by permission)
Dispozitiv a (ms) b (ms / bit)

Indicația (starea 1)
Șoarece -107 223
trackball 75 300
Tragere (starea 2)
Șoarece 135 249
trackball -349 688

a arătat că aceste diferențe există [221]. Tabelul 12.2 prezintă rezultatele obținute pentru
un mouse și un trackball.
Putem recalcula predicția KLM pentru metoda CLOSE folosind aceste date.
Amintiți-vă că metoda a avut doi operatori indicatori, unul pentru a indica titlul ferestrei
(cu o rată a distanței față de țintă de 10: 1), a doua pentru a trage selecția în jos
la "CLOSE" în meniul pop-up (4: 1). Astfel, primul operator de indicare este statul 1 și
a doua este starea 2. Vremurile sunt astfel
Șoarece
P [în bara de meniu] = -107 + 223 log 2 (11) = 664 ms
P [la opțiune] = 135 + 249 log 2 (5) = 713 ms
trackball
P [la bara de meniu] = 75 + 300 log 2=(11)
1113 ms
P [la opțiune] = -349 + 688 log 2 (5) = 1248 ms

oferind un timp suplimentar revizuit pentru CLOSE-METHOD de 2,93 secunde folosind un mouse
și 3,91 secunde folosind un trackball.
12.6 ARHITECTURILE COGNITIVE

Formalizările pe care le-am văzut până acum au un model implicit sau explicit al modului în care
utilizatorul efectuează procesarea cognitivă implicată în realizarea unei sarcini. De exemplu,
conceptul de a lua o problemă și de ao rezolva prin împărțirea și cucerirea folosind subgoale
este central pentru GOMS. CCT presupune distincția între termen lung și scurt
memorie, regulile de producție fiind stocate în memorie pe termen lung și "potrivite"
împotriva conținutului memoriei pe termen scurt (sau de lucru) pentru a determina ce "foc".
Valorile pentru diferiții operatori motrici și psihici din KLM au fost bazate pe model
Procesor uman (MHP) al lui Card, Moran și Newell [56]. O alta
presupunerea comună, pe care nu am discutat-o în acest capitol, este distincția
între nivelele lingvistice - semantice, sintactice și lexicale - ca model arhitectural
din înțelegerea utilizatorului.

Pagina 26
444 Capitolul 12 ■ Modele cognitive

În Capitolul 1, am discutat despre unele dintre aceste descrieri arhitecturale ale utilizatorului ca
o mașină de prelucrare a informațiilor. Accentul nostru în această secțiune va fi acela de a descrie
un cuplu mai multe modele arhitecturale care sunt destul de distincte de cele descrise în
Capitolul 1 și asumate în părțile anterioare ale acestui capitol. Aici vom vedea că
ipotezele arhitecturale sunt esențiale pentru descrierea modelării cognitive
pe care le oferă aceste abordări.
Există diferențe interesante de accentuare între aceste modele arhitecturale
și modelele anterioare. Notațiile ierarhice și lingvistice tind să-și asume
dialogul perfect din partea utilizatorului. Ele pot măsura complexitatea acelui perfect
dialog, dar nu tinde să ia în considerare devierea de la secvențele de comandă optime.
Cu toate acestea, pentru modelele arhitecturale din această secțiune, predicția și sub-
starea erorii este esențială pentru analizele lor.

12.6.1 Modelul spațial problemă

Rational comportamentul este caracterizat ca un comportament care este destinat să atingă un anumit
poartă. Acest element de raționalitate este adesea folosit pentru a face distincția între inteligent și
comportament asemănător mașinii. În domeniul inteligenței artificiale (AI), un sistem care prezintă
comportamentul rațional este denumit sistem de cunoștințe . Un sistem la nivel de cunoaștere
conține un agent care se comportă într-un mediu. Agentul are cunoștințe despre
ea însăși și mediul său, inclusiv obiectivele proprii. Poate efectua anumite acțiuni
și să perceapă informații despre mediul său în schimbare. Așa cum agentul se comportă în ei
mediu, schimbă mediul și propriile cunoștințe. Putem vizualiza
comportamentul general al sistemului la nivel de cunoaștere ca secvență de mediu și
agenții spun că progresează în timp. Scopul agentului este caracterizat ca a
preferință față de toate secvențele posibile ale stărilor agent / mediu.
Contrastează acest comportament rațional cu alt model de calcul general
o mașină, care nu este rațională. În domeniul informaticii, este comun să se descrie a
problemă ca căutarea printr-un set de stări posibile, de la o anumită stare inițială la
o stare dorită. Căutarea se realizează trecând de la o stare la alta posibilă
stat prin operațiuni sau acțiuni, scopul ultim al căruia este de a ajunge la unul
a stărilor dorite. Acest model foarte general de calcul este utilizat în mod obișnuit
sarcina programatorului. Odată ce a identificat o problemă și un mijloc de sosire
la rezolvarea problemei (algoritmul), atunci programatorul reprezintă
problema și algoritmul într-un limbaj de programare, care poate fi executat pe un a
pentru a ajunge la starea dorită. Arhitectura mașinii permite numai
definirea spațiului de căutare sau a problemei și acțiunile care pot apărea pentru a traversa
acel spațiu. De asemenea, se presupune că se termină și când se atinge starea dorită.
Observați că mașina nu are capacitatea de a formula spațiul cu probleme
și soluția sa, în principal pentru că nu are nicio idee despre obiectiv. Este treaba pro-
grammer să înțeleagă scopul și astfel să definească mașina pentru ao atinge.
Putem adapta modelul computational de stat al unei masini,
arhitectura unui sistem la nivel de cunoaștere. Noul model computational este
Pagina 27
12.6 Arhitecturi cognitive 445

modelul spațiu problemă , bazată pe activitatea de rezolvare a problemelor de Newell și Simon


la Universitatea Carnegie-Mellon (vezi capitolul 1). Un spațiu problemă constă dintr-un set de
stări și un set de operații care pot fi efectuate pe stări. Comportamentul în a
spațiul de probleme este un proces în două etape. În primul rând, operatorul actual este ales pe baza
starea actuală și apoi este aplicată la starea actuală pentru a atinge noul stat.
Spațiul cu probleme trebuie să reprezinte un comportament rațional și trebuie să caracterizeze
obiectivul agentului. Un spațiu problemă reprezintă un obiectiv prin definirea stărilor dorite
ca un subset al tuturor stărilor posibile. Odată ce starea inițială este stabilită, sarcina din prob-
spațiul lem este de a găsi o secvență de operații care formează o cale în interiorul spațiului de stare
de la starea inițială la una dintre stările dorite, după care se termină cu succes
are loc.
Din descrierea de mai sus, putem evidenția patru activități diferite care apar
într-un spațiu cu probleme: formularea țintă, selectarea operațiunii, aplicarea aplicației
și finalizarea obiectivului. Relația dintre aceste procese de spațiu și probleme
cunoașterea la nivel de activitate este esențială. Percepția care apare la nivelul cunoașterii este
realizată de procesul de formulare a țelurilor, care creează starea inițială bazată pe
observații ale mediului extern. Acțiunile la nivel de cunoaștere sunt opera-
în spațiul de probleme care sunt selectate și aplicate. Cunoașterea reală
despre agent și despre mediul și obiectivele sale derivă din stat / operator
informații în spațiul problemei. Din cauza procesului de formulare a obiectivului, setul
din stările dorite indică obiectivul nivelului de cunoaștere în spațiul problemei.
procesul de selectare a operațiunilor selectează operația corespunzătoare la un moment dat
deoarece este considerat cel mai probabil să transforme statul în spațiul problemei
una dintre stările dorite; prin urmare, comportamentul rațional este implicit.
Ciclul de activitate în spațiul problemei este după cum urmează. Unele schimbări în
mediul extern, care este relevant pentru scopul agentului, este perceput de către
procesul de formulare a obiectivului, care la rândul său definește setul de stări dorite pentru agent
și starea sa inițială pentru următoarea sarcină. Procesul de selectare a operațiunilor sugerează
o operație care poate acționa asupra acelei stări și transformă-o "mai aproape" într-o stare dorită.
procesul de aplicare a procesului execută operația, modificând starea curentă și
mediul inconjurator. Dacă noua stare este o stare dorită, atunci obiectivul a fost
realizat și procesul de completare a obiectivului readuce agentul la inactiv.
Puterea reală a arhitecturii spațiului problemă este în recurs. Activitatea companiei
oricare dintre procese are loc numai atunci când cunoștințele de care are nevoie pentru a-și finaliza sarcina
este imediat disponibil. De exemplu, pentru a decide care dintre operațiuni este cel mai probabil să
conduce la o stare dorită, spațiul problemei va trebui să știe lucruri despre curentul său
stat și a mediului. Dacă aceste informații nu sunt disponibile imediat,
atunci activitatea nu poate continua. În acest caz, este invocat un alt spațiu de problemă
scopul de a afla informațiile necesare pentru spațiul problemei părintelui.
În acest fel, putem vedea evoluția problemelor de spații ca o structură de tip stivă, nouă
spațiile fiind invocate și plasate pe stiva spațială cu probleme numai pentru a fi extrase
stiva după ce și-au atins scopul.
Deși modelul spațial problemă descris pe scurt mai sus nu este implementat direct
mentibil, este baza pentru cel puțin o arhitectură cognitivă executabilă, numită Soar.

Pagina 28
446 Capitolul 12 ■ Modele cognitive

Nu vom discuta detaliile implementării lui Soar aici; în schimb ne referim


la Laird, Newell și Rosenbloom [205]. O aplicație interesantă a
Soar implementarea spațiilor problematice a fost făcută de către Young și colegii săi
modele de utilizatori programabile (sau PUM ) [386]. Având în vedere o descriere a unui designer
procedură sau sarcină care urmează a fi realizate cu un sistem interactiv,
o analiză a acelei proceduri produce cunoștințele care ar fi necesare și
disponibile pentru orice utilizator care încearcă sarcina. Această cunoaștere este codificată în prob-
lem arhitectura spațială a Soar, producând un model de utilizator "programat" (PUM)
pentru a realiza obiectivul de a îndeplini sarcina. Prin executarea PUM, stivuirea
și poate fi analizată desființarea spațiilor problematice necesare realizării obiectivului
pentru a măsura sarcina cognitivă a procedurii intenționate. Mai important, dacă
PUM nu poate atinge obiectivul deoarece nu poate găsi cunoștințe necesare
pentru a finaliza sarcina, aceasta indică proiectantului că există o problemă cu
proiectul dorit. În acest fel, comportamentul eronat poate fi anticipat înainte
punerea în aplicare.

12.6.2 Interacțiunea subsistemelor cognitive

Barnard a propus o arhitectură cognitivă foarte diferită, denumită interacțiune cog-


subsisteme [ ICS ] [24, 25, 27]. ICS oferă un model de percepție, cunoaștere
și acțiune, dar spre deosebire de alte arhitecturi cognitive, nu este destinat să producă
o descriere a utilizatorului în ceea ce privește secvențele de acțiuni pe care le efectuează. ICS
oferă o imagine mai cuprinzătoare a utilizatorului ca mașină de procesare a informațiilor.
accentul se pune pe stabilirea modului în care procedurile speciale ale secvențelor de acțiune sunt ușor de realizat
devenind mai automate în cadrul utilizatorului.
ICS încearcă să încorporeze două tradiții psihologice separate într-una
arhitectura cognitivă. Pe de o parte, este arhitectural și general-scop
abordarea de procesare a informațiilor a cercetării pe termen scurt a memoriei. Pe de altă parte
este abordarea computațională și reprezentativă caracteristică psiho-
cercetarea lingvistică și literatura de rezolvare a problemelor AI.
Arhitectura ICS este construită prin activitatea coordonată a celor nouă mai mici
subsisteme: cinci subsisteme periferice sunt în contact cu lumea fizică și
patru sunt centrale, care se ocupă de procese mentale. Fiecare subsistem are același gen-
eric. Un subsistem este descris în termeni de intrări și ieșiri tipizate
împreună cu un magazin de memorie pentru păstrarea informațiilor tipizate. Are transformare
funcții pentru procesarea intrării și producția de ieșire și stocate permanent
informație. Fiecare dintre cele nouă subsisteme este specializată pentru a gestiona un aspect al
procesare externă sau internă. De exemplu, un subsistem periferic este vizual
sistem de descriere a ceea ce este văzut în lume. Un exemplu de subsistem central
este una pentru procesarea informațiilor propoziționale, care captează atributele și
identitățile entităților și relațiile dintre ele (un exemplu special
acea informație propozițională înseamnă "a ști" că un anumit cuvânt are patru
silabe, începe cu "P" și se referă la o zonă din centrul Londrei "[27]).

Pagina 29
12.7 Rezumat 447

ICS este un alt exemplu de arhitectură generală cognitivă care poate fi aplicată
la design interactiv. Una dintre caracteristicile ICS este capacitatea sa de a explica modul în care un utilizator
proceduralizează acțiunea. Amintiți-vă în discuția despre TCC ne-am distins
între începători și experți în utilizarea unui sistem interactiv. Experții pot efectua com-
secvențe de acțiuni ca și cum ar fi fără un gând, în timp ce un utilizator novice trebuie
contemplați fiecare mișcare (dacă nu credeți că această distincție este exactă,
observați utilizatorii la un ATM și vedeți dacă puteți spune expertului de la începător).
expertul recunoaște situația de activitate și reamintește o procedură de acțiuni "conservată"
care, din experiență, duc la realizarea obiectivului dorit. Ei nu au
să gândim dincolo de recunoașterea sarcinii și invocarea consecventă a celor corecte
procedură. Un astfel de comportament procedural este mult mai puțin predispus la eroare. Un bun
proiectantul va ajuta utilizatorul să proceduralizeze interacțiunea cu sistemul și cu voința
încercați să proiectați o interfață care sugerează utilizatorului o sarcină pentru care el deja
are un răspuns proceduralizat. Din acest motiv, ICS a fost sugerată ca fiind
un instrument de proiectare care poate acționa ca un sistem expert pentru a sfătui un designer în curs de dezvoltare
o interfață.

12.7 REZUMAT

În acest capitol am discutat despre o gamă largă de modele cognitive ale


utilizatorii de sisteme interactive. Modelele cognitive încearcă să reprezinte utilizatorii ca fiind
ei interacționează cu un sistem, modelarea unor aspecte ale înțelegerii, cunoașterii,
intenții sau procesare. Am împărțit modelele cognitive în trei categorii.
a descris GOMS
Modelul mai întâiși structura ierarhică
CCT au fost a sarcinilor
exemple de modeleutilizatorului și aaceastă
cognitive din structurilor de țintă.
categorie.
Cea de-a doua categorie se referea la modelele lingvistice și gramaticale, care
a subliniat înțelegerea de către utilizator a dialogului de sistem utilizator. BNF și TAG au fost
descrise ca exemple în această categorie. Cele mai multe dintre aceste modele cognitive s-au concentrat
asupra activității de execuție a utilizatorului, neglijând capacitatea sa perceptivă și cum
care ar putea afecta strategiile de interacțiune mai puțin intenționate și naturale. A treia categorie
a modelelor cognitive sa bazat pe înțelegerea mai solidă a motorului uman
sistem, aplicabil în situațiile în care utilizatorul nu planifică comportamentul și
execută automat acțiuni. KLM a fost folosit pentru a furniza măsuri dure de utilizator
performanță în ceea ce privește timpii de execuție pentru secvențele de acțiuni de bază. lui Buxton
Modelul cu trei stări pentru dispozitivele de indicare permite o mai bună distincție între execuția
timp decât în cazul KLM. Am încheiat acest capitol cu o discuție despre cognitivă
arhitecturi, ipotezele cărora constituie fundamentul oricărui cognitiv
modele. În plus față de distincția arhitecturală de bază între termenele lungi și cele scurte,
pe termen lung, am discutat despre alte două arhitecturi cognitive - spațiul problemelor
model și ICS - care aplică ipoteze diferite la analiza interactivă
sisteme.

Pagina 30
448 Capitolul 12 ■ Modele cognitive

E XERCIZE

12.1 Amintiți-vă descrierea CCT a regulii INSERT-SPACE-2 discutată în secțiunea 12.2.2:


(INSERT-SPACE-2
DACĂ (ȘI spațiul de inserare TEST-GOAL)
(TEST-CURSOR% LINE% COL))
ATUNCI ( (DO-KEYSTROKE "I")
(DO-KEYSTROKE SPACE)
(DO-KEYSTROKE ESC)
(DELETE-GOAL introduceți spațiu)))
După cum am discutat, acest lucru este deja proceduralizat; adică regula este o regulă de expert. Scrie
noile reguli de "novice" unde cele trei apăsări de taste nu sunt proceduralizate. Asta ar trebui să aveți
reguli separate pentru fiecare apăsare de tastă și obiective potrivite (cum ar fi GET-INTO-INSERT-MODE )
lor.
12.2 Una dintre ipotezele care stau la baza abordării modelului de utilizator programabil este că este posibil
să furnizeze un algoritm care să descrie comportamentul utilizatorului în interacțiunea cu un sistem. luare
această poziție la extrem, alegeți o sarcină comună cu un sistem interactiv familiar (pentru
exemplu, crearea unei coloane de numere într-o foaie de calcul și calcularea sumei lor sau a oricărei alte
sarcină pe care o puteți gândi) și descrie algoritmul necesar utilizatorului pentru a îndeplini această sarcină.
Scrieți descrierea în pseudocod. Acest exercițiu sugerează îmbunătățiri în
sistem?

RECOMANDAT CITIREA

SK Card, TP Moran și A. Newell, Psihologia calculatorului uman


Interacțiune , Lawrence Erlbaum, 1983.
Un text clasic în acest domeniu al modelelor cognitive, în care arhitectura de bază
ipotezele arhitecturii modelului procesor uman sunt explicate ca și
modelul GOMS și KLM.
S. Bovair, DE Kieras și PG Polson, Achiziționarea și performanța
Abilitatea de editare a textului: o analiză a complexității cognitive, Interacțiunea om-calculator ,
Voi. 5, Nr. 1, pp. 1-48, 1990.
Acest articol oferă o descriere definitivă a TCC printr-o procedură extinsă
exemplu. Autorii oferă, de asemenea, definiția diferitelor reguli de stil pentru scriere
Descrieri CCT pentru a distinge, de exemplu, între utilizatorii novici și experți.
F. Schiele și T. Green, formalizări HCI și psihologie cognitivă: cazul
sarcini-acțiune gramatici. În MD Harrison și HW Thimbleby, editori, Formal
Metode în interacțiunea om-calculator , capitolul 2, Universitatea Cambridge
Press, 1990.

Pagina 31
Lectură recomandată 449

O descriere bună a TAG cu câteva exemple extinse bazate pe


Interfața Macintosh. Autorii oferă o bună analiză comparativă a TAG
versus alte tehnici de modelare cognitivă.
A. Newell, G. Yost, JE Laird, PS Rosenbloom și E. Altmann, Formulând
model-model computațional spațial-problemă. În RF Rashid, editor, CMU Computer
Știință: A 25-a aniversare comemorativă , Capitolul 11, ACM Press, 1991.
Descrierea arhitecturii cognitive a spațiului problemă a fost informată prin aceasta
articol, care conține, de asemenea, referințe la lucrările esențiale pe platforma Soar.
J. Carroll, editor, modele HCI, teorii și cadre: către un interdisciplinar
Știință , Morgan Kaufmann, 2003.
Vezi capitolele lui Scott MacKenzie despre modelele de comportament motorizat (legea lui Fitts și
dincolo de), Bonnie John privind prelucrarea informațiilor și comportamentul calificat (GOMS
și modele similare) și Stephen Payne pe modele cognitive și mentale.

S-ar putea să vă placă și