Sunteți pe pagina 1din 18

Planification Partiellement Ordonne

Pavlos Moratis

Planification Partiellement Ordonne (1)


La recherche dans lespace des tats par chanage avant et arrire sont des formes de recherche de plans totalement ordonns Elles exploitent seulement des squences strictement linaires dactions, directement connectes au dbut ou lobjectif Cela signifie quelles ne peuvent pas tirer profit de la dcomposition du problme. Au lieu de travailler sur chaque problme sparment, elles doivent toujours prendre des dcisions sur comment crer une squence dactions par tous les sous-problmes Il est prfrable davoir une approche qui travaille sur diffrents sous-problmes indpendamment, qui les rsout avec des sousplans diffrents et qui ensuite les combine Une telle approche a aussi lavantage de souplesse dans lordre dans lequel elle construit le plan

Planification Partiellement Ordonne (2)


La stratgie gnrale pour retarder un choix durant la recherche est appel stratgie du plus petit engagement (least commitment) Le plus petit engagement est un concept utile pour analyser quand des dcisions devraient tre prises chaque problme de recherche Considrons le simple problme de mise dune paire de chaussures. Nous pouvons dcrire ce problme comme un problme formel de planification comme suit: Objectif(ChaussureDroiteMiseChaussureGaucheMise)
Init() Action(ChaussureDroite, PRECOND:ChaussetteDroiteMise, EFFET:ChaussureDroiteMise) Action(ChaussetteDroite, EFFET:ChaussetteDroiteMise) Action(ChaussureGauche, PRECOND:ChaussetteGaucheMise, EFFET:ChaussureGaucheMise) Action(ChaussetteGauche, EFFET:ChaussetteGaucheMise)

Planification Partiellement Ordonne (3)


Un planificateur peut raliser lobjectif en excutant la squence de deux actions ChaussetteDroite suivie de ChaussureDroite pour accomplir le premier conjoint de lobjectif et la squence ChaussetteGauche suivie de ChaussureGauche pour le second conjoint Les deux squences peuvent tre combines pour produire le plan final Le planificateur manipulera les deux sous-squences indpendamment, sans sengager sur le fait quune action dans une squence sera avant ou aprs une action dans lautre Tout algorithme de planification, qui peut placer deux actions dans un plan sans spcifier quelle action vient en premier, sappelle planificateur dordre partiel (partial-order planner) Une solution de plans partiellement-ordonns peut correspondre plusieurs plans totalement-ordonns. Chacun deux sappelle linarisation de plans partiellement-ordonns

Planification Partiellement Ordonne (4)

Planification Partiellement Ordonne (5)


La planification partiellement-ordonne peut tre implmente comme une recherche dans lespace de plans partiellementordonns Nous commenons avec un plan vide et aprs nous cherchons comment raffiner le plan jusqu ce quon arrive un plan complet qui rsout le problme Les actions dans cette recherche ne sont pas des actions dans le monde mais des actions sur des plans, savoir ajouter un pas dans un plan, imposer un ordre qui met une action avant une autre, etc. Diffrentes mthodes heuristiques de recherche peuvent tre appliques quand le problme de recherche est formul Les tats du problme de recherche seront des plans non finis. Pour viter la confusion avec les tats du monde nous parlerons par la suite de plans et non dtats

Planification Partiellement Ordonne (6)


Chaque plan a les quatre composants suivants, o les deux premiers dfinissent les pas de plan et les deux derniers servent une fonction de comptabilit pour dterminer comment les plans peuvent tre tendus Un ensemble dactions qui forment les pas du plan. Elles sont rcupres par lensemble des actions dans le problme de planification
Le plan vide contient juste les actions Dbut et Fin Dbut na pas de prconditions et a comme effets tous les littraux de ltat initial du problme de planification Fin na pas deffets et a comme prconditions les littraux de lobjectif du problme de planification

Un ensemble de contraintes dordre. Chaque contrainte dordre est de la forme AB ce qui est lu "A avant B" et signifie que laction A doit tre excute avant B mais pas ncessairement juste avant A
Les contraintes dordre doivent dcrire un ordre partiel propre Chaque cycle comme AB et BA reprsentent une contradiction. Donc une contrainte dordre ne peut tre rajoute dans le plan si elle cre un cycle

Planification Partiellement Ordonne (7)


Un ensemble de liens causaux. Un lien causal entre deux actions A et p B dans un plan, est crit AB et lu A accomplie p pour B
Le lien causal ChaussetteDroite ChaussureDroite montre que ChaussetteDroiteMise est un effet de laction ChaussetteDroite et une prcondition de ChaussureDroite Il montre aussi que ChaussetteDroiteMise doit rester vrai du temps de laction ChaussetteDroite jusquau temps de laction ChaussetteDroite Le plan ne doit pas tre tendu en ajoutant une nouvelle action C en conflit avec le lien causal p Une action C est en conflit avec AB si C a un effet p et si C (selon les contraintes dordre) peut arriver aprs A et avant B Les liens causaux sont appels parfois intervalles de protection, parcep que le lien AB protge p dtre ni dans lintervalle A B
ChaussetteDroiteMise

Planification Partiellement Ordonne (8)


Un ensemble des prconditions ouvertes. Une prcondition est ouverte si elle nest pas satisfaite par une action dans le plan
Les planificateurs essayeront de rduire lensemble de prconditions ouvertes lensemble vide sans introduire une contradiction

Actions:{ChaussetteDroite,ChaussureDroite,ChaussetteGauche, ChaussureGauche,Dbut,Fin} Ordres:{ChaussetteDroiteChaussureDroite, ChaussetteGauche ChaussureGauche}


ChaussetteDroiteMise

Liens:{ChaussetteDroiteChaussureDroite, ChaussetteGauche ChaussureDroiteMise ChaussureGaucheMise ChaussureGauche, ChaussureDroiteFin, ChaussureGaucheFin} Prconditions ouvertes:{ }

ChaussetteGaucheMise

Planification Partiellement Ordonne (9)


Un plan cohrent est un plan dans lequel il nexiste pas de cycles dans les contraintes dordre et de conflits avec des liens causaux Un plan sans prconditions ouvertes est une solution Le problme de recherche que la PPO rsout peut tre formul comme suit. Nous allons considrer une formulation approprie pour des problmes de planification propositionnels
Le plan initial contient Dbut et Fin, les contraintes dordre DbutFin, pas de liens causaux et a toutes les prconditions dans Fin comme des prconditions ouvertes La fonction du successeur arbitrairement pique une prcondition ouverte p sur une action B et gnre un plan successeur pour chaque moyen cohrent de slection dune action A qui accomplie p. La cohrence est renforce comme suit
1.

p Le lien causal AB et la contrainte dordre AB sont ajouts dans le plan. Laction A peut tre une action existante dans le plan ou une nouvelle. Si elle est nouvelle, ajoute elle dans le plan avec aussi DbutA et AFin

Planification Partiellement Ordonne (10)


2. Nous rsolvons les conflits entre le nouveau lien causal et toutes les actions existantes et entre laction A (si elle nouvelle) et tous les liens p causaux existants. Un conflit entre AB et C est rsolu en faisant C intervenir un temps en dehors de lintervalle de protection, by ajoutant BC ou CA. Nous ajoutons des tats successeurs pour lun de deux ou pour les deux si ils ont comme rsultat des plans cohrents

Le test dobjectif contrle quand un plan est une solution pour le problme original de planification. Puisqu ils ne sont gnrs que de plans cohrents, le test dobjectif a juste besoin de contrler quil nexiste pas de prconditions ouvertes Rappel: les actions considres par lalgorithme de recherche sous cette formulation, sont des pas de raffinement du plan plutt que des actions relles du domaine lui-mme Le cot du chemin est sans importance puisque la seule chose qui intresse est le cot total des actions relles dans le plan, auquel le chemin emmne.

Exemple: Changement de Pneu


Init(Sur(PneuAPlat, Essieu) Dans(PneuDeRechange, Huche)) Objectif(Sur(PneuDeRechange,Essieu)) ction(Rtirer(PneuDeRechange,Huche), PRECOND: Dans(PneuDeRechange,Huche) EFFET: Dans(PneuDeRechange, Huche)Au(PneuDeRechange,Sol)) Action(Rtirer(PneuPlat, Essieu), PRECOND: Sur(PneuAPlat, Essieu) EFFET: Sur(PneuAPlat, Essieu) Au(PneuAPlat,Sol)) Action(PoserSur(PneuDeRechange, Essieu), PRECOND: Au(PneuDeRechange,Sol)Sur(PneuAPlat, Essieu) EFFET: Au(PneuDeRechange,Sol)Sur(PneuDeRechange,Essieu)) Action(PartirPendantLaNuit, PRECOND: EFFET: Au(PneuDeRechange,Sol)Sur(PneuDeRechange,Essieu) Dans(PneuDeRechange, Huche)Au(PneuAPlat,Sol) Sur(PneuAPlat, Essieu)

Solution (1)
La recherche dune solution avec PPO commence avec le plan initial, contenant une action Dbut avec effet Sur(PneuAPlat,Essieu) Dans(PneuDeRechange, Huche) et une action Fin avec la seule prcondition Sur(PneuDeRechange,Essieu) Nous gnrons des successeurs en prenant une prcondition ouverte pour travailler avec et en choisissant une parmi les actions possibles pour la satisfaire. La squence des vnements est comme suit:
1. 2. Prendre la seule prcondition ouverte, Sur(PneuDeRechange,Essieu) de Fin. Choisir la seule action applicable, PoserSur(PneuDeRechange, Essieu) Prendre la prcondition Au(PneuDeRechange,Sol) de PoserSur(PneuDeRechange, Essieu). Choisir la seule action applicable Rtirer(PneuDeRechange,Huche) pour la satisfaire

Dans(PneuDeRechange,Huche) Rtirer(PneuDeRechange,Huche) Sur(PneuDeRechange,Essieu)

Au(PneuDeRechange,Sol)

Sur(PneuAPlat, Essieu) PoserSur(PneuDeRechange, Essieu).

Fin

Dbut

Dans(PneuDeRechange, Huche) Sur(PneuAPlat,Essieu)

Solution (2)
3. Prendre la prcondition Sur(PneuAPlat, Essieu) de PoserSur(PneuDeRechange, Essieu). Juste pour pour aller contre sens, choisissons laction PartirPendantLaNuit au lieu de laction Rtirer(PneuPlat, Essieu). Notons que PartirPendantLaNuit a aussi comme effet Au(PneuDeRechange,Sol) qui est en conflit avec avec le lien causal
Au(PneuDeRechange,Sol)

Rtirer(PneuDeRechange,Huche) PoserSur(PneuDeRechange, Essieu) Pour rsoudre ce conflit nous ajoutons une contrainte dordre en mettant PartirPendantLaNuit avant Rtirer(PneuDeRechange,Huche).
Dans(PneuDeRechange,Huche) Rtirer(PneuDeRechange,Huche) Sur(PneuDeRechange,Essieu) Au(PneuDeRechange,Sol)

Dbut
Dans(PneuDeRechange,Huche) Sur(PneuAPlat,Essieu)

Sur(PneuAPlat, Essieu)

Poser(PneuDeRechange, Essieu).

Fin

Au(PneuDeRechange,Sol) Sur(PneuDeRechange,Essieu) Dans(PneuDeRechange,Huche) PartirPendantLaNuit Au(PneuAPlat,Sol) Sur(PneuAPlat,Essieu)

4.

La seule prcondition ouverte ce point est Dans(PneuDeRechange,Huche) de laction Rtirer(PneuDeRechange,Huche)


La seule action qui peut la satisfaire est laction Dbut, mais le lien causal du Dbut Rtirer(PneuDeRechange,Huche) est en conflit avec leffet Dans(PneuDeRechange, Huche) de laction PartirPendantLaNuit Cette fois ci il ny a pas de manire de rsoudre le conflit avec PartirPendantLaNuit Nous ne pouvons pas la placer avant Dbut (puisque rien ne peut tre avant Dbut) et nous ne pouvons pas la placer aprs Rtirer(PneuDeRechange,Huche) (puisque il y a dj une contrainte dordre avant Rtirer(PneuDeRechange,Huche)) Nous sommes forcs de revenir en arrire et retirer laction PartirPendantLaNuit et les deux derniers liens causaux et retourner ltat prcdent. Le planificateur a dmontr que laction PartirPendantLaNuit ne peut pas tre utilise comme moyen pour changer un pneu

Solution (3)

5.

Considrer nouveau la prcondition Sur(PneuAPlat, Essieu) de laction PoserSur(PneuDeRechange, Essieu). Cette fois ci nous choisissons laction Rtirer(PneuPlat, Essieu) Prendre la prcondition Dans(PneuDeRechange,Huche) de laction Rtirer(PneuDeRechange,Huche) et choisir Dbut pour la satisfaire. Cette fois ci il ny a pas de conflits Prendre la prcondition Sur(PneuAPlat, Essieu) de Rtirer(PneuPlat, Essieu) et choisir Dbut pour la satisfaire

6.

7.

Solution Finale
Dans(PneuDeRechange,Huche) Rtirer(PneuDeRechange,Huche)

Dbut

Dans(PneuDeRechange,Huche) Sur(PneuAPlat,Essieu) Au(PneuDeRechange,Sol) Sur(PneuDeRechange,Essieu)

Sur(PneuAPlat, Essieu) PoserSur(PneuDeRechange, Essieu).

Fin

Sur(PneuAPlat,Essieu) Rtirer(PneuAPlat,Essieu)

Conclusions sur PPO


Les liens causaux conduisent un lagage dune partie de lespace de recherche, qui cause de conflits non rsolvables, ne contient pas de solutions La solution prsente prcdemment est un plan partiellement ordonn. Dans cet exemple lavantage parat petit puisque il existe seulement deux linarisations

Rfrences
Artificial Intelligence: A Modern Approach, S. Russell, P. Norvig

S-ar putea să vă placă și