Interpretarea standard a Testului Turing Testul Turing este un experiment din domeniul Inteligenei Artificiale care i propune s dea rspuns la ntrebarea dificil Pot (sau vor putea) mainile s gndeasc?. A fost conceput de matematicianul i informaticianul britanic Alan Turing n 1950. Practic e vorba doar de maini de calcul care pot fi programate astfel nct s se comporte mai mult sau mai puin asemntor oamenilor, prin aceea c accept ntrebri formulate ntr-un limbaj natural (nu de programare) i dau rspunsuri mai mult sau mai puin rezonabile. Una din variantele de a afla dac o main e n stare s "gndeasc" este s o supunem testului. Conform acestui test cineva (n schia din dreapta: C) trebuie s discearn ntre o alt persoan (B) i o main (A), fr s-i vad, doar pe baza rspunsurilor acestora la ntrebri. Rspunsurile se dau i ele numai n scris, de ex. pe o imprimant. Dac rspunsurile mainii sunt att de bune nct cel care pune ntrebrile nu reuete s-i dea seama exact cine este o persoan i cine o main, atunci maina a trecut testul i se poate spune c ea gndete. Turing presupunea c n jurul anului 2000 computerul va ajunge la performana de a l putea induce n eroare pe cel ce pune ntrebrile - n cel puin 30 % din cazuri. La aceast variant de testare s-au ridicat n principal dou tipuri de ntrebri: ntrebri tehnice, de genul: se poate construi o main (A) att de "inteligent" nct permite s i se ghiceasc identitatea n cel mult 70 % din cazuri? ntrebri epistemice: oare un Test Turing ofer un temei valid pentru a acorda acelei maini statutul de "entitate gnditoare"? Cuprins 1 Istorie o 1.1 ELIZA i PARRY o 1.2 The Chinese room (Camera Chinez) o 1.3 Colocviul Turing o 1.4 Loebner Prize 2 Versiuni ale Testului Turing o 2.1 Jocul Imitrii o 2.2 Interpretarea standard o 2.3 Neclariti 3 Puncte forte ale testului 4 Puncte slabe ale testului o 4.1 Inteligen uman comparat cu inteligena n general o 4.2 Inteligen real comparat cu inteligena simulat o 4.3 Impracticabilitate i irelevana: Testul Turing i cercetarea IA 5 Predicii 6 Note 7 Vezi i 8 Legturi externe Istorie ELIZA i PARRY "Chatbot-ul ELIZA" funcioneaz pe baza unor cuvinte cheie predefinite. Dac un cuvnt cheie este gsit, atunci se aplic o regul care transform comentariile utilizatorului i returneaz rezultatul acestei operaiuni. Dac nu este gsit nici un cuvnt cheie, ELIZA va rspunde fie cu un rspuns generic, fie prin repetarea unuia dintre comentariile anterioare. Weizenbaum a dezvoltat ELIZA astfel nct s reproduc comportamentul unui psihoterapeut rogersian, permindu-i programului s fie "liber de a-i asuma rolul de a nu cunoate aproape nimic din lumea real". Cu aceste tehnici, programul lui Weizenbaum a fost n msur s fac pe unii oameni s cread c au purtat o conversaie cu o persoan real. Astfel, unii susin c ELIZA ar fi unul din programele (probabil primul) capabil s trec Testul Turing, dei acest punct de vedere este discutabil. "Chatbot-ul PARRY" al lui Colby a fost descris ca fiind "ELIZA cu atitudine": acesta ncearc s imite comportamentul unui schizofrenic, folosind o abordare similar (dac nu cumva mai avansat) cu cea folosit de Weizenbaum. PARRY a fost testat la nceputul anilor 1970 folosind o variaie a Testului Turing. Un grup de psihiatri cu experien au analizat o combinaie de pacieni reali i computere care rulau PARRY prin intermediul unei maini telex. Unui alt grup de 33 de psihiatri le-au fost artate transcrieri ale convorbirilor. Celor dou grupuri le-a fost cerut s identifice care dintre pacieni sunt fiine umane i care sunt programe. Psihiatrii au reuit doar n 48% din cazuri s identifice corect pacienii. The Chinese room (Camera Chinez) John Searle a propus n lucrarea sa "Minds, Brains, and Programs" ("Mini, Creieri i Programe"), 1980, un argument mpotriva Testului Turing, cunoscut sub numele de experimentul "Camera Chinez". Searle a susinut c softwareul (cum ar fi ELIZA) ar putea trece Testul Turing pur i simplu prin manipularea de simboluri pe care nu le nelege. Dar fr a le nelege, acesta nu ar fi permis s fie descris ca fiind capabil s gndeasc (cum o fac oamenii). Searle ajunge la concluzia c Testul Turing nu poate dovedi c o main poate s gndeasc. n anii 1980 i 1990 argumente precum cel adus de Searle au declanat dezbateri intense cu privire la natura inteligenei, la posibilitatea de existen a unor maini inteligente i la valoarea Testului Turing. Colocviul Turing n 1990 a avut loc a patruzecea aniversare a primei publicri a lucrrii lui Turing "Computing Machinery and Intelligence" ("Maini de calcul i inteligen"), astfel interesul pentru Testul Turing fiind rennoit. n acel an au avut loc dou evenimente importante: primul a fost Colocviul Turing, care a avut loc n aprilie la Universitatea din Sussex, Regatul Unit, i a reunit cadre universitare i cercettori de la o mare varietate de discipline pentru a discuta Testul Turing; al doilea a fost formarea concursului anual "Loebner Prize". Loebner Prize Loebner Prize este un concurs anual ce ofer posibilitatea punerii n practic a Testului Turing. Prima ediie a concursului a avut loc n noiembrie 1991. Hugh Loebner a menionat c acest concurs a fost creat pentru a da impulsuri noi cercetrilor din domeniul inteligenei artificiale. Un alt motiv ar fi acela c nimeni nu a ncercat s implementeze Testul Turing, n ciuda faptului c timp de 40 de ani s-au purtat discuii pe aceast tem [1] . Medaliile de argint (pentru text) i aur (audio i vizual) ale concursului nu au fost niciodat ctigate. Cu toate acestea, medalia de bronz a fost acordat n fiecare an softului care, n opiniile juriului, prezint comportamentul cel mai asemntor cu cel omenesc n timpul conversaiei. Astfel, prima ediie a concursului a fost ctigat de un program lipsit de raiune. Victoria acestui program se datoreaz n mare parte faptului c era capabil s imite greeli umane de scriere. Programul Artificial Linguistic Internet Computer Entity (A.L.I.C.E.) a reuit s ctige premiul de bronz de trei ori n 2000, 2001 i 2004. Jabberwacky a ctigat n 2005 i 2006. Cstigtorul ediiei din 2008 este Elbot, care dei nu dispune de un comportament uman a reuit s duc n eroare trei arbitri. n primele ediii ale concursului Loebner Prize conversaiile erau restricionate astfel: conversaiile se purtau pe un subiect unic. n 1995, aceast regul de resticionare a fost nlturat. Durata interaciunii dintre arbitru i entitate (main sau om) a variat de la o ediie a concursului la alta: n 2003 fiecrui arbitru uman i s-au permis cinci minute pentru a interaciona cu o entitate; ntre 2004 i 2007, timpul de interaciune permis a fost de aproximativ douzeci de minute; n 2008, durata de interogare permis a sczut la cinci minute; n 2009, arbitrii au avut la dispoziie 10 de minute pentru fiecare rund: 5 minute pentru a conversa cu persoana uman i 5 minute pentru a conversa cu programul. Versiuni ale Testului Turing
Jocul imitrii aa cum a fost descris de Alan Turing n lucrarea "Tehnica de calcul i inteligena" Exist cel puin trei versiuni primare a Testului Turing, dintre care dou sunt descrise n lucrarea "Tehnica de calcul i inteligena", iar una n lucrarea lui Saul Traiger "Interpretare standard" ("Standard Interpretation"). Aceste trei versiuni nu sunt considerate ca fiind echivalente, punctele lor forte i punctele slabe sunt distincte. Jocul Imitrii Turing a propus un joc simplu care implic trei jucatori: primul juctor (A) - un brbat, al doilea jucator (B) - o femeie i un juctor (C) cu rol de arbitru. Jocul presupune urmtoarele ipoteze: arbitrul comunic cu ceilali doi juctori prin intermediul notelor scrise, nefiindu-i permis s-i vad prin intermediul ntrebrilor, arbitrul trebuie s determine care dintre cei doi juctori este brbat i care femeie rolul primului juctor este acela de a pcli arbitrul astfel nct acesta s ia o decizie eronat rolul celuilalt jucator este acela de a-l ajuta pe arbitru s ia decizia corect
Jocul imitrii n care juctorul A este nlocuit de calculator. Turing a propus ca rolul primului jucatorul (A) s-i revin calculatorului. Interpretarea standard S-a ajuns la concluzia c scopul Testului Turing nu este neaprat acela de a determina dac un calculator este sau nu capabil de a-l induce pe arbitru n eroarea de a-l crede femeie, ci mai degrab dac este sau nu capabil s imite un om. n aceast versiune, primul jucator este un computer, pe cnd al doilea este o persoan (femeie sau brbat). Rolul arbitrului este acela de a determina care este om i care calculator. Neclariti "Ar trebui arbitrul s tie despre existena calculatorului?" - Turing nu specific clar dac arbitrul ar trebui, sau nu, s tie faptul c unul dintre participani este un computer. Cnd Colby, F.D. Hilf, S. Weber i A.D. Kramer au testat chatbot-ul PARRY, ei au fcut acest lucru presupunnd c arbitrii nu au nevoie s tie c unul sau mai muli dintre cei intervievai sunt de fapt computere. Aa cum au evideniat Ayse Saygin i alii, acest lucru este de mare importan n ceea ce privete punerea n aplicare i rezultatul testului. Huma Shah i Kevin Warwick, care au participat la organizarea Testelor Turing, nu sunt de acord cu acest punct de vedere, susinnd c verdictul unor arbitri ar putea fi diferit n cazurile c ei tiu, sau nu, de existena computerelor. Dei n ediia a 18-a a concursului Loebner Prize judectorilor nu li s-a spus n mod explicit, unii dintre acetia au presupus c fiecare pereche (format din cei doi juctori ascuni - A i B) ar fi format dintr-un computer i o persoan. Erorile de ortografie i-au trdat pe oameni, pe cnd mainile au fost identificate dup viteza uimitoare de a rspunde. Aceste fapte ngreuiaz mult interpretarea rezultatelor. Puncte forte ale testului Puterea Testului Turing deriv din faptul c se poate conversa pe orice tem. John Haugeland spune c "nelegerea cuvintelor nu este suficient, trebuie s fie neles la fel de bine i subiectul". Pentru a putea trece un Test Turing bine conceput, maina trebuie s foloseasc limbajul natural, raiunea, s dispun de cunotine i s fie capabil i s nvee. Testul Feigenbaum este conceput pentru a profita de gama larg de subiecte disponibile la un Test Turing. Se compar abilitile computerului cu cele ale experilor ntr-un anumit domeniu, cum ar fi literatura de specialitate sau chimia. Puncte slabe ale testului Testul Turing se bazeaz pe presupunerea c fiinele umane pot aprecia inteligena unei maini prin compararea comportamentului mainii cu comportamentul uman. Fiecare element din aceast ipotez a fost pus n discuie, unii cercettori din domeniul inteligenei artificiale punnd la ndoial utilitatea testului. Inteligen uman comparat cu inteligena n general
Nu testeaz n mod direct dac computerul are un comportament inteligent, ci doar dac se comport ca i o fiin uman. Deoarece comportamentul uman i comportamentul inteligent nu sunt chiar exact acelai lucru, testul poate eua n a msura cu precizie inteligena n dou moduri: Unele comportamente umane nu sunt inteligente Testul Turing cere ca maina s fie capabil s imite toate comportamentele umane, indiferent dac acestea sunt sau nu inteligente. Astfel se testeaz i comportamente pe care nu le-am putea considera inteligente (spre exemplu: predispoziie spre insulte, tentaia de a mini, sau pur i simplu o frecven mare de greeli de scriere). Dac o main nu poate imita comportamentul uman n detaliu, atunci ea va pierde testul. Aceast constatare a fost comentat revista de tiri sptmnal The Economist ntr-un articol intitulat Prostia artificial (Artificial Stupidity), publicat la scurt timp dup prima competiie Loebner Prize n 1992. Articolul menioneaz c victoria ctigtorului primei competiii Loebner a fost datorat, cel puin n parte, capacitii sale de a "imita erori de scriere umane". Turing nsui a sugerat c programele adaug intenionat erori n rspunsurile lor, ca s devin juctori mai buni ai jocului. Unele comportamente inteligente nu sunt umane Testul Turing nu se ocup de comportamentele extrem de inteligente, cum ar fi capacitatea de a rezolva probleme dificile. De fapt, cere n mod expres nelciune din partea mainii: dac maina este mai inteligent dect o fiin uman medie, atunci trebuie s evite n mod intenionat s par prea inteligent. Dac ar reui s rezolve o problem de calcul imposibil de rezolvat pentru oameni, atunci arbitrul ar ti imediat c are de-a face cu un program, iar maina nu ar trece testul. Inteligen real comparat cu inteligena simulat Este testat doar modul n care se comport obiectul (comportamentul exterior al mainii). n aceast privin se asum definiia inteligenei din punct de vedere comportamental sau funcional. Spre exemplu, ELIZA a artat c o main care trece testul poate fi capabil de a simula comportamentul uman conversaional atunci cnd urmeaz doar o list simpl (dar bogat) de reguli mecanice, fr a fi nevoit s gndeasc sau a avea vreo minte. John Searle susine c comportamentul extern nu poate fi utilizat pentru a determina dac o main gndete sau pur i simplu simuleaz gndirea. Argumentul su The Chinese Room este destinat s arate faptul c, dei Testul Turing reprezint o definiie operational bun a inteligenei, acesta nu poate indica dac maina are vreo minte, contiin sau intenionalitate. Impracticabilitate i irelevana: Testul Turing i cercetarea IA Cercettorii principali ai IA susin c ncercarea de a treace Testul Turing reprezint doar o distragere a ateniei de la cercetri mult mai fructuoase. Stuart Russell i Peter Norvig au scris: Cercettorii IA au acordat o atenie sczut trecerii Testului Turing". Exist mai multe motive: n primul rnd, exist modaliti mai uore de a-i testa programele. Cele mai multe curente de cercetare n domeniile legate de IA vizeaz obiective specifice i modeste, cum ar fi programarea automat (automated scheduling), recunoaterea obiectelor sau i probleme de logistic. n al doilea rnd, crearea de simulri de via ca cea a fiinelor umane deja este n sine o problem dificil, care nu-i nevoie a fi rezolvat pentru realizarea obiectivelor de baz ale cercetrii IA. Caractere umane credibile pot fi interesante ntr-o oper de art, un joc sau o interfa sofisticat cu utilizatorul, dar ele nu fac parte din tiina de a crea maini inteligente, maini care s rezolve probleme folosindu-se de inteligen. Russell i Norvig sugereaz o analogie cu istoria zborului: avioanele sunt testate dac zbor bine, dar nu n comparaie cu psrile. n al treilea rnd, dac nivelul de inteligen al Testului Turing este vreodat atins, atunci testul nu va mai fi de niciun folos la construirea sau evaluarea sistemlore inteligente care s depeasc inteligena uman. Din acest motiv au fost propuse mai multe alternative de testare, care ar fi n msur s evalueze sistemele super-inteligente. Turing, la rndul su, nu a intenionat niciodat ca testul su s fie utilizat ca o msur practic, de zi cu zi, a inteligenei programelor IA; el a vrut s ofere un exemplu clar i uor de neles pentru a ajuta la dezbaterile filosofice despre inteligena artificial. Predicii Turing a prezis c mainile ar fi capabile, ntr-un final, s treac testul; de fapt, el a estimat c pn n anul 2000, mainile cu 10^9 bii (aproximativ 120 MB) de memorie ar putea s pcleasc treizeci la sut dintre arbitrii umani ntr-un test de cinci minute. El a mai prezis c machine learning ar deveni o parte important a construciei de maini puternice, o afirmaie considerat plauzibil de ctre cercettorii contemporani. The Long Bet Project este un pariu de 20.000 de dolari ntre Mitch Kapor (pesimist) i Kurzweil (optimist). Ei au pariat pe faptul dac un computer va trece testul Turing, pn n anul 2029.