Sunteți pe pagina 1din 2

IA - Tema 3: Explorarea arborelui Competiie

Autor: Andrei Mogo


Se consider un labirint n form de arbore (fiecare nod are ntre 2 i k fii (k >=2)) cu h niveluri
(h >= 5). n labirint se afl doi ageni care exploreaz labirintul. Exist un ceas al sistemului. La
fiecare tic, fiecare agent poate s parcurg un arc (dintre dou noduri) sau poate s stea pe loc.
Valoarea curent a unui nod poate fi pozitiv, negativ sau 0. Valorile nodurilor sunt numere
ntregi. Iniial fiecare agent are punctajul 0. Cand un agent ajunge ntr-un nod, punctajul agentului
se modific astfel:
punctaj_nou = punctaj_curent + valoare_curent_nod
Valoarea unui nod se modific o dat la t tic-uri (t >= 2), fiind selectat aleator dintr-o mulime cu 3
valori posibile asociate nivelului pe care se afl nodul respectiv n arbore. Detalii referitoare la
aceste 3 valori se gsesc n paragraful urmtor. Pentru fiecare tic n care un agent st pe loc,
punctajul agentului scade cu valoarea p (valoarea p este discutat n paragraful urmtor).
Valoarea unui nod este cu att mai mic (n modul) cu ct nivelul pe care se afl nodul respectiv
este mai apropiat de rdcin. Un nod poate avea doar + sau - valoarea asociat nivelului din arbore
sau 0. Se utilizeaz o progresie geometric de raie q > 1 (q numr natural). Se consider c un nod
de pe nivelul 1 (nivelul rdcinii) are valoarea +q, -q sau 0; un nod de pe nivelul 2 are valoarea
+q2, -q2 sau 0; un nod de pe nivelul 3 are valoarea +q3, -q3 sau 0, . Se consider c p este
jumtate (mprire ntreag; p numr natural) din valoarea nivelului luat n modul (q, q2, q3...).
Fiecare agent poate s vad valoarea curent a nodurilor adiacente cu nodul n care se afl la
momentul curent (adic nodurile unite prin arce de nodul n care se afl la momentul curent).
Totui, deoarece la fiecare tic agentul poate parcurge un arc, iar orice nod i poate schimba
valoarea, este posibil ca agentul s fi vazut de exemplu c un nod are o valoare pozitiv i cnd
ajunge acolo (traversand un singur arc) s gseasc o valoare negativ (valoarea acelui nod s-a
schimbat n timp ce agentul parcurgea arcul dintre cele dou noduri).
Cei doi ageni pleac din rdcina arborelui. Competiia se termin n momentul n care un al treilea
agent, numit arbitru, anun acest lucru. Arbitrul anun terminarea competiiei dup un numr tt de
tic-uri de ceas selectat aleator (tmin <= tt <= tmax). Ctig competiia agentul care are punctajul
cel mai mare n momentul terminrii competiiei. n caz de egalitate, amandoi agenii ctig.
Cerin (10 puncte)
S se implementeze:
- un sistem care s simuleze mediul (n continu schimbare) n care se mic agenii (arborele)
- cate o strategie pentru fiecare agent n cadrul competiiei (este vorba de agenii care concureaz).
Cele dou strategii trebuie s fie semnificativ diferite.
- competiia
- agentul arbitru
- n final, programul trebuie s anune ctigtorul (sau ctigtorii)

Observaii:
- se dau: arborele (prin urmare se cunosc i k i h), t, tmin, tmax, q. Intrrile k, h, t, tmin, tmax i q
sunt numere naturale. Se vor propune (de ctre studeni) 5 seturi de date de test, dintre care pentru
cel puin dou seturi de date k >= 3 i h >= 7.
- fiecare agent (care concureaz) tie: t, tmin, tmax, q, faptul c se afl ntr-un arbore, modul n care
sunt asociate valorile pe niveluri (q, q2, q3...), p; un agent i d seama cnd urc (spre rdcin) i
cnd coboar (spre frunze) n arbore. Agentul arbitru tie doar tmin i tmax.
- pentru fiecare set de date, la fiecare tic al ceasului, programul trebuie s afieze:
- arborele de la momentul curent reprezentat n mod text i pe arbore trebuie reprezentate i
poziiile curente ale celor doi ageni
- arborele de la tic-ul de ceas precedent (reprezentat n mod text i coninnd acelai tip de
informaii ca arborele de la momentul curent)
- punctajul fiecrui agent (care concureaz) la momentul curent
Bonus (2 puncte)
- Se consider 5 arbori cu k >=3 i h >=7 (pot fi considerai aici i cei doi arbori de acest fel cerui
n partea obligatorie a temei).
- Se aleg 10 tupluri (t, tmin, tmax, q). Alegerea nu este la ntamplare. Studentul trebuie s poat
motiva de ce a ales aceste tupluri (ce cazuri a vrut s pun n eviden).
- Pentru fiecare arbore se ruleaz programul pentru fiecare dintre cele 10 tupluri (t, tmin, tmax, q) i
apoi se creeaz un tabel cu urmtorul antet (Agent1 i Agent2 sunt cei doi ageni care concureaz):
(t, tmin, tmax, q)

| Punctaj Agent1

| Punctaj Agent2

Pentru fiecare tabel se interpreteaz rezultatele obinute (un paragraf pentru fiecare tabel) cu accent
pe compararea celor dou strategii de joc (strategiile folosite de cei doi ageni aflai n concurs).
n cazul n care se face i partea de bonus, codul surs va fi nsoit de un fisier .pdf care va conine:
- cele 5 tabele
- interpretarea rezultatelor din tabele

S-ar putea să vă placă și