Sunteți pe pagina 1din 29

Intellectica, 1999/1, 28, pp.

11-35
J.-P. D'ALES, J. FROMENT
*
et J.-M. MOREL
**

Reconstruction visuelle et gnricit
L'objet de cet article est de faire le point sur ce que l'on peut appeler
le gestaltisme gomtrique. Cette doctrine, ne dans les annes 20, s'est
propose de formaliser la perception visuelle et a dvelopp pendant
cinquante ans une mthode exprimentale originale. Nous
expliquerons d'abord comment les gestaltistes dfinissent et expliquent
la formation des objets visuels. Leur approche est pratiquement
axiomatique et l'hypothse se dgage de l'existence, comme en
physique, d'un petit nombre de principes organisateurs. Nous
dcrirons les principes gestaltistes les plus importants et nous
montrerons qu'ils suffisent faire de vritables commentaires de
figures, qui sont presque formels. Nous montrerons comment la
plupart des principes gestaltistes se dduisent d'un principe, plus
abstrait et plus mathmatisable, de gnricit.

Mots-cls : gestaltisme gomtrique, formalisation, objets visuels,
gnricit.

Visual Reconstruction and Genericity. The aim of this article is to
review the concept known as geometrical gestaltism. This doctrine,
which was born in the 1920's, proposed a formalisation of visual
perception and, over a period of fifty years, developped an original
experimental method. We shall first explain how the gestaltists define
and explain the formation of visual objects. Their approach is
practically axiomatic and the hypothesis emerges, as in physics, that
there exist a small number of organisational principles. We shall
describe the main gestaltist principles and show that they suffice to
provide near-formal commentaries on figurative shapes. We show
further that the majority of the gestaltist principles derive from an
abstract mathematisable principle, namely genericity.


*
PRISME, UFR Mathmatiques et Informatique, Universit Ren Descartes, 45 rue des
Saints-Pres, 75270 PARIS Cedex 06.
E-mail : froment@math-info.univ-paris5.fr
**
CMLA, Ecole Normale Suprieure de Cachan, 61 av. du Prsident Wilson, 94235
CACHAN Cedex.
E-mail : morel@cmla.ens-cachan.fr
12 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Key words: geometrical gestaltism, formalisation, visual objects,
genericity.
Reconstruction visuelle et gnricit 13

1 - INTRODUCTION
La reconstruction visuelle, telle qu'elle est dfinie par Kanisza
(Kanisza 1979 et 1980), consiste, partir d'une image, dtecter les
objets prsents dans le champ visuel, dterminer leur degr de
rigidit, distinguer comment ils s'articulent ou se dcomposent en
parties, ou au contraire comment ils sont regroups pour former des
ensembles perceptifs homognes, et enfin comment ils sont
positionns dans l'espace. En s'appuyant sur les travaux de l'cole de
psychologie de la Gestalt (voir par exemple Wertheimer 1923 et Ellis
1939), Kanizsa affirme que la reconstruction visuelle chez l'homme
est effectue en suivant certaines rgles ou principes bien dfinis.
Ces lois permettent d'organiser les donnes sensorielles fournies par
les yeux (c--d. la quantit de lumire reue chaque instant par les
cellules de la rtine), et de construire une interprtation cohrente
de ces donnes. Les gestaltistes ont montr que l'application de ces
principes organisateurs obit une certaine logique, qu'ils ont
appele grammaire ou syntaxe de la vision. En particulier, il peut
arriver dans certains cas que lapplication des principes gestaltistes
conduise plusieurs interprtations conflictuelles. Deux principes
peuvent amener deux regroupements ou deux rigidifications
contradictoires. Il faut alors savoir grer ces situations
conflictuelles ; l'une de ces interprtations possibles domine-t-elle
les autres, et si oui laquelle ? Ou bien y a-t-il apparition d'un
compromis entre les interprtations ? Nous verrons que l'application
de la grammaire de Kanizsa permet justement de rpondre ces
questions.
Il est important de noter que pour Kanizsa aussi bien que pour
l'cole gestaltiste, cette reconstruction visuelle est effectue
indpendamment de toute connaissance a priori sur le contenu
smantique de l'image. Elle est base uniquement sur les structures
gomtriques du champ d'intensit lumineuse (et ventuellement de
couleur) qui compose l'image. Une consquence immdiate de cette
remarque est que d'un point de vue thorique, la mise en uvre
informatique de la reconstruction visuelle partir d'images
numriques ne devrait pas poser de problme majeur. La pratique,
cependant, a fait surgir des difficults nouvelles qui n'taient pas
prvues par la thorie.
En effet la grammaire de Kanisza, ainsi que la thorie de la
Gestalt, portent sur des objets lmentaires que sont les points, les
14 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

droites, les courbes, les ensembles connexes homognes du point de
vue chromatique, etc Ce sont d'ailleurs ces mmes objets qui
apparatront dans notre discussion tout au long de larticle. Le
programme gestaltiste suppose donc que ces objets sont dj
constitus. Or il s'est avr que toutes les tentatives d'implantation
sur ordinateur des principes gestaltistes ont but sur l'extraction de
ces objets lmentaires sur des images relles. La dtection de ces
lments apparemment trs simples est une tche beaucoup plus
ardue qu'il n'y paraissait au premier abord. En effet, ce sont des
abstractions, et leur ralit physique est parfois difficile mettre en
vidence ; par exemple la dtection de la frontire entre deux zones
homognes textures est un problme dlicat en traitement des
images.
Nous pouvons dcomposer le problme de la comprhension
mathmatique de la perception visuelle en deux parties :
a) Computer vision : cette discipline s'attache dfinir
correctement les bords ou les contours, et les rgions
chromatiquement homognes
1
.
b) La "logique de la vision" telle qu'elle a t dfinie par Max
Wertheimer et commente par Gaetano Kanisza. Il s'agit de dtecter,
partir des contours prsents dans l'image, les objets solides, de
comprendre comment ils s'articulent, et quelle est leur position
relative dans l'espace.
Nous nous intressons ici plus particulirement au point b). Nous
nous proposons de reprendre la discussion amorce par Kanizsa sur
les principes gestaltistes. Dans un premier temps, nous
reformulerons ces principes, en leur donnant une tournure un peu
plus mathmatique. Puis nous montrerons que l'application d'une
partie de ces lois est elle-mme rgie par un mta-principe
rgulateur, que nous appellerons principe de gnricit. Ce principe
permet en particulier de grer certaines situations conflictuelles
dans lapplication des principes organisateurs. Il est en fait
multiforme, et il existe plusieurs manires de le dfinir. Par exemple,
il est possible d'interprter certains principes gestaltistes comme des
instanciations du principe de gnricit dans des situations bien
particulires nous reviendrons plus en dtail sur cette dfinition
dans le paragraphe consacr ce principe. On peut aussi l'assimiler

1
Elle correspond la recherche d'une premire esquisse brute, ce que David Marr
appelle le raw primal sketch.
Reconstruction visuelle et gnricit 15

au postulat suivant : dans la reconstruction visuelle, il est toujours
suppos que les objets prsents dans le champ visuel ne sont pas
perus dans une situation ou sous un angle de vue "particulier",
mais, au contraire, gnrique. On entend par gnrique une vue dont
la structure ne change pas quand on modifie lgrement l'angle
d'observation.
Afin d'illustrer notre propos, nous allons prendre l'exemple du
cube de Necker et de lillusion de Kopfermann :


A B


Figure 1
La figure 1.A prsente une vue en perspective dun cube
transparent. (Necker remarque que ses faces peuvent tre
interprtes de deux manires diffrentes en fonction de la
position de lobservateur, situ ou bien en dessus du cube, ou
bien en dessous, mais ce n'est pas ce qui nous intresse ici). Une
position particulire de lobservateur par rapport un cube
peut l'amener voir la figure 1B, auquel cas le cube n'est plus
reconnu comme tel (illusion de Kopfermann) : le principe de
gnricit en donne la raison.

Nous pouvons interprter les images 1.A et 1.B comme des prises
de vues diffrentes d'un mme cube transparent (dans l'image 1.A
nous ne nous intressons pas au problme classique, qui avait t
pos par Necker, de savoir quel sommet est le plus proche de
l'observateur). Il y a cependant une diffrence qualitative essentielle
entre ces deux vues : l'une, 1.A, est gnrique, alors que l'autre, 1.B,
est singulire. En effet dans 1.B, deux sommets du cube sont aligns
avec l'axe focal de l'observateur. Cette configuration est singulire
en ce sens que, si l'observateur modifie trs lgrement son point de
vue, l'aspect du cube subit un changement qualitatif important. En 1A
16 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

au contraire, un petit dplacement de l'observateur ou du cube ne
provoque pas de changement qualitatif notable.
Ceci a pour consquence que si on prsente la figure 1 en
masquant la partie 1.A un observateur, celui-ci ne l'interprte pas
spontanment comme la projection d'un cube sur une surface plane,
mais plutt comme un hexagone divis par trois droites ou six
triangles possdant un sommet commun, ou bien encore, si on veut
conserver une interprtation perspective, dune pyramide base
hexagonale vue de haut. L'interprtation ou la reconstruction
visuelle en 1.B est donc fondamentalement diffrente de celle en 1.A,
alors que nous sommes partis de deux prises de vues d'un mme
objet. Cet exemple pourtant trs simple montre donc bien
l'importance de l'hypothse de non-dgnrescence dans la
reconstruction visuelle.
Nous pouvons ds prsent donner une premire version du
principe de gnricit : dans la reconstruction visuelle, on suppose
toujours que les objets sont vus dans une position gnrique, et que
la configuration globale de la scne est elle aussi gnrique.
Avant d'tudier plus en dtail le principe de gnricit, nous
allons dfinir de faon plus approfondie les buts de la reconstruction
visuelle (section 2), puis nous passerons en revue dans la section 3
les principes organisateurs de la Gestalt, qui indiquent comment on
peut atteindre ces buts. Nous serons alors en mesure de rpondre
dans la section 4 aux questions suivantes : comment se fait-il que
dans les images 1A et 1B, nous ne percevions qu'un seul objet, et
qu'en 1A, cet objet soit interprt comme la reprsentation d'un objet
tridimensionnel (un cube), alors qu'en 1B une telle interprtation n'a
pas lieu spontanment ? Enfin nous montrerons comment le principe
de gnricit permet dexpliquer un certain nombre de principes
organisateurs, de grer les situations de conflit, et de valider ou
d'invalider une interprtation construite partir des principes
organisateurs.
2 - LES BUTS DE LA RECONSTRUCTI ON VI SUELLE
Nous avons dj donn dans l'introduction une premire
dfinition de la reconstruction visuelle, au sens que Kanizsa donne
ce terme, et voqu les buts qu'elle est sense atteindre. L'objet de ce
paragraphe est de dtailler ces buts.
Reconstruction visuelle et gnricit 17

Il faut prciser que la reconstruction visuelle conduit la
constitution d'objets visuels et non la reconnaissance. L'hypothse
gestaltiste est que le processus primaire de constitution et celui
secondaire de reconnaissance sont indpendants.
Nous avons dcompos le travail d'organisation effectu lors de la
reconstruction visuelle en cinq tches principales bien dfinies. Nous
appellerons ces tches buts de la reconstruction visuelle. Cette
division contient une certaine part d'arbitraire. Elle obit nanmoins
une certaine logique interne, en ce sens que la plupart des
principes indiquent comment atteindre l'un de ces cinq buts, et pas
les autres. Nous numrons ces buts dans un ordre qui nous parat le
plus naturel. Toutefois si nous nous replaons dans le cadre de la
vision humaine, cet ordre logique n'est pas un ordre chronologique.
C'est--dire que du point de vue oprationnel, ces tches ne sont
sans doute pas accomplies successivement par le sujet, mais, dans
une certaine mesure, de manire simultane.
Le regroupement perceptif ou unification : il arrive que certaines
rgions dans l'image soient perues comme un tout homogne. Par
exemple dans la figure 2, nous percevons une rgion noire sur fond
blanc.



Figure 2
Le regroupement perceptif : les points du papier noircis l'encre
sont regroups et unifis en un objet visuel. Le principe
organisateur qui provoque cette unification est l'identit
chromatique.

De mme, dans la figure 3, nous percevons deux amas de formes
ellipsodales noires.



18 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Figure 3
Le regroupement perceptif : les petites formes ellipsodales
noires sont regroupes en deux objets visuels.

Nous appellerons de tels processus d'unification regroupements
perceptifs. Remarquons que dans la figure 3, trois regroupements
sont effectus de faon rcursive : une premire unification
intervient pour la formation des petites ellipses noires (comme dans
la figure 2), puis ces ellipses sont regroupes en des ensembles plus
grands. Enfin, les deux ensembles sont eux-mmes regroups, car ils
ont mme forme et mme texture. Le regroupement perceptif peut
donc s'appliquer aux rsultats de regroupements antrieurs.
La "rigidification". Il s'agit d'une forme particulire de
regroupement perceptif, dans laquelle on attribue une qualit
supplmentaire l'objet visuel : la rigidit. La rgion unifie est
assimile la trace sur l'image d'un objet tridimensionnel solide
prsent dans le champ visuel, ou des parties de cet objet. Afin
d'allger la rdaction, nous nous permettrons un abus de langage en
attribuant la qualit de rigidit l'objet visuel qui correspond
une rgion de l'image assimil la trace d'un objet solide sur
l'image. Notons que cette phase de rigidification peut s'effectuer
indpendamment de toute connaissance a priori sur les objets.


Figure 4
Chaque segment prsent dans cette image est rigidifi.
L'observateur peut imaginer une rotation d'un segment par
rapport l'autre, mais la sparation des deux segments semble
improbable.

L'articulation tout-parties. Ici, le but est de comprendre comment les
diffrentes parties des objets visuels, ventuellement rigidifis,
s'articulent entre elles, et quel est leur rapport avec l'objet visuel qui
les englobe. Les figures 2 et 3 donnent cet gard deux exemples
diffrents d'articulation tout-parties. Dans la figure 2, le tout a
compltement occult les parties. C'est--dire que nous ne percevons
pas les points noirs qui composent la tache noire. Dans la figure 3 en
revanche, des parties (les formes ellipsodales noires) sont toujours
perceptibles. La figure 4 illustre une autre possibilit de relation
tout-parties : l'articulation mcanique non rigide. Chaque segment
Reconstruction visuelle et gnricit 19

devient un objet rigide, et les deux segments peuvent bouger
indpendamment autour de leur extrmit commune.
Nous constatons donc que les proprits des parties sont
modifies lorsqu'elles sont incluses dans un ensemble perceptif qui
les englobe. Autrement dit, nous ne percevons pas les petites formes
ellipsodales noires de la figure 3 de la mme faon lorsqu'elles sont
isoles et lorsqu'elles sont insres dans des amas comme ceux de la
figure 3. Il s'agit l de l'un des leitmotivs de la thorie de la Gestalt.
Le tout influence les parties, et de ce fait les proprits du tout ne se
rduisent pas la simple addition des proprits des parties.
L'ordre dans l'espace (ou articulation fond-forme). Il s'agit
d'ordonner des objets prsents dans le champ visuel par rapport
l'observateur. Schmatiquement, cela revient appliquer une
relation d'ordre du type "est derrire" ou "est devant" sur l'ensemble
des objets dtects. Un cas particulier important est celui de la
distinction fond-forme dans l'image. Un autre cas de figure
important est celui o un objet masque partiellement un autre dans
le champ visuel. Dans ce cas, le sujet humain a toujours tendance
reconstruire les parties manquantes de l'objet partiellement occult.
Les psychologues appellent ce processus compltion amodale. Il fait
aussi partie des buts de la reconstruction visuelle. Nous verrons que
cette compltion peut tre effectue partir des principes
organisateurs, indpendamment de toute connaissance pralable de
l'objet partiellement occult.
La reconstruction perspective. La position relative des objets
prsents dans le champ visuel est dtermine indpendamment de
celle de l'observateur. Les distances entre les objets prsents dans le
champ visuel sont values, ainsi que la distance entre ces objets et
le sujet.
Il faut remarquer que l'application des seuls principes gestaltistes
permet d'atteindre tous ces buts ( l'exception peut-tre de la
reconstruction perspective complte), et donc d'effectuer une
reconstruction visuelle totale, sans faire appel l'exprience du
sujet, ni ses connaissances ventuelles sur le contenu smantique
du champ visuel.
Nous appellerons interprtation de l'image le rsultat de la
reconstruction visuelle. Il s'agit en fait d'un commentaire de figure,
o sont spcifis les objets visuels qui ont t constitus, la faon
dont ils s'articulent entre eux, et leur position relative dans l'espace.
20 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Une interprtation d'une image peut bien sr possder une
cohrence interne mais ne pas correspondre la configuration
relle de la scne qui est l'origine de l'image interprte. Cette
remarque est illustre par l'image 1B, o la scne reprsente
contient un cube, mais l'interprtation ne le dtecte pas.
3 - LES PRI NCI PES ORGANI SATEURS
3.1 Principe d'identit chromatique
Selon le principe d'identit chromatique, sont unifies toutes les
rgions connexes o les niveaux de gris (ou de couleur) sont
constants, ou varient lentement (dgrads). Cette unification est
souvent accompagne d'une rigidification, en particulier lorsque les
frontires de la rgion sont rgulires (voir plus loin le paragraphe
sur le principe de continuit de direction). La rgion est alors
interprte comme la trace sur limage dun objet (ou dune partie
dun objet) prsent dans le champ visuel. La figure 2 donne un
exemple simple d'unification par identit chromatique.
Le principe didentit chromatique peut tre considr comme un
principe fondateur de la Gestalt, en ce sens que la vision repose sur
la capacit distinguer les diffrences de niveau de luminosit ou de
couleur entre des points distincts de l'image.
Dans le regroupement perceptif effectu suivant le principe
d'identit chromatique, le tout masque les parties. Nous ne percevons
pas consciemment les points qui composent la rgion forme par
application du principe, et nous ne dcomposons pas non plus
spontanment cette rgion en sous-rgions (sauf videmment si
l'application d'autres principes organisateurs induit une telle
segmentation).
3.2 Principe de proximit
Le principe de proximit s'applique lorsque la distance entre des
objets est faible. Son action consiste alors unifier les lments
voisins. La taille du voisinage d'un objet visuel est tout fait
relative, et dpend non seulement de la taille de l'objet, mais aussi
des distances tous les autres objets visuels construits sur l'image.
Etant donn trois objets visuels A, B et C, A et B sont dits proches ou
voisins (sous-entendu par rapport C) si la distance de A B est
petite compare aux distances de A C et de B C. La figure 3 est un
exemple de regroupement perceptif suivant le principe de proximit.
Reconstruction visuelle et gnricit 21

Remarquons que contrairement ce qui se passe avec le principe
d'identit chromatique, le regroupement perceptif suivant le principe
de proximit ne masque pas les parties constituantes.
3.3 Principe de similitude
Le principe de similitude stipule que les objets visuels semblables
sont regroups perceptuellement.



Figure 5
Le principe de similitude permet d'interprter cette image comme
compose de deux rgions homognes : celle centrale des
cercles et celle priphrique des rectangles.

Il peut se produire que le nombre des lments semblables soit
trs important : il y a alors formation de ce qu'on appelle une micro-
texture. La relation tout-parties est alors modifie, et comme pour le
principe d'identit chromatique, les parties ne sont plus perues
spontanment. La rgion texture acquiert les mmes proprits que
les rgions de couleur uniforme (Cf. figure 6).

22 J.-P. D'ALES, J. FROMENT et J.-M. MOREL



Figure 6
Le principe de similitude permet de distinguer sur cette image
deux formes circulaires. Le nombre important d'lments
semblables (les petits carrs) cre un effet de texture. Notons que
la forme des lments constituants n'est perceptible qu'au prix
d'un effort.

3.4 Principe de continuit de direction
Le principe de continuit a pour effet la rigidification des courbes
rgulires dtectes dans l'image. Plus prcisment, ce sont en fait
les objets visuels qui ont donn naissance ces courbes rgulires
qui sont rigidifis. Par exemple, si une courbe reprsente une
frontire entre deux rgions homognes (figure 2, figure 6), alors au
moins une de ces rgions est rigidifie (en 2, c'est la rgion noire, en
6, ce sont le disque et l'anneau texturs). Les courbes rgulires sont
cres en gnral par des contours occlusifs, des contours d'arte
(comme dans la figure 1), ou des contours subjectifs (comme les
frontires entre les zones textures de la figure 6).
Les principes de fermeture, de compltion amodale, et de
transparence ou ombrage, que nous allons maintenant tudier,
peuvent tre considrs comme des cas particuliers du principe de
continuit de direction.
3.5 Principe de fermeture
Le principe de fermeture permet la rigidification d'lments
visuels. Il s'agit aussi d'un principe important pour l'articulation
fond-forme. Lorsqu'une courbe ferme est dtecte, la rgion
Reconstruction visuelle et gnricit 23

entoure par cette courbe est perue comme un tout indissociable.
Les points appartenant cette rgion sont automatiquement
regroups et rigidifis (Cf. figure 7). La rgion intrieure est
assimile la trace d'un objet plac devant un fond (la rgion
extrieure) qu'il occulte partiellement.


Figure 7
Exemple d'application du principe de fermeture : l'intrieur de la
courbe en noir est rigidifi et assimil la trace d'un objet.
L'extrieur de la courbe est assimil au fond.

3.6 Principe de compltion amodale
Ce principe s'applique lorsqu'une courbe rgulire s'arrte sur
une autre. Ce cas de figure est appel jonction en "T". Ce principe de
continuation sous occlusion stipule que la barre du "T" est toujours
rigidifie, et qu'une telle jonction est le rsultat de l'occlusion d'un
objet par un autre. En gnral, une jonction en "T" isole ne permet
pas de dterminer l'ordre dans l'espace des trois rgions dlimites
par la jonction en "T". Cet ordre est en gnral choisi de faon
obtenir une interprtation globale cohrente de la figure.



Figure 8
Un exemple de jonction en "T" : les courbes formant le T sont ici
des frontires entre rgions chromatiquement homognes.

24 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Si dans l'interprtation globale, la rgion "au-dessus" de la barre
du T (la rgion noire dans la figure 8) est la plus proche, alors cette
rgion occulte partiellement les deux autres rgions, et on prolonge
alors mentalement ces deux rgions, ainsi que le contour qui les
spare (le "pied" du T) sous la rgion noire. Selon le principe de
compltion amodale, ce prolongement doit prserver la rgularit du
contour visible, c'est--dire la continuit de la direction et de la
courbure le long du contour (voir figure 9).



Figure 9
Dans l'image A, l'ordre spatial en profondeur dans
l'interprtation dominante est rgion noire / rgion grise / fond
blanc. Il y a alors "compltion amodale" de la rgion grise de
faon prserver la continuit de la direction et de la courbure
du contour de cette rgion (image B).

3.7 Principe de transparence
Si deux contours rguliers prsents dans l'image se croisent, les
quatre rgions chromatiquement diffrentes se regroupent par
paires de manire former deux objets se recouvrant partiellement,
l'un tant vu "par transparence" travers l'autre. Dans la figure 10,
les branches a et d sont interprtes comme le bord de l'un des deux
objets, par exemple l'objet transparent. les branches b et c sont
interprtes comme le bord de l'autre objet.

Reconstruction visuelle et gnricit 25



Figure 10
Un cas d'application du principe de transparence et d'ombrage :
deux courbes rgulires qui se croisent. a est regroup avec d, c
avec b.
3.8 Principe de constance de largeur
La constance de largeur s'observe lorsque deux courbes sont
parallles, c'est--dire lorsque l'on peut faire glisser entre elles une
boule tangente aux deux courbes (Cf. figure 11). L'application de ce
principe rigidifie les deux courbes ainsi que la rgion intrieure
dlimite par elles.


Figure 11
Le principe de constance de largeur s'applique sur ces deux
courbes car elles sont parallles. Notons que chacune de ces
courbes se constitue elle-mme par application du mme principe
26 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

de constance de largeur. En effet, toute courbe visible a une
paisseur non nulle et peu prs constante.

Le principe de constance de largeur intervient notamment dans la
rigidification des traits noirs que nous avons utiliss abondamment
dans nos figures. Un trait est une rgion noire dlimite par deux
contours parallles. La rigidification des traits est donc le fruit de la
collaboration entre principes d'identit chromatique et de constance
de largeur.
Remarquons aussi que le principe de constance de largeur
s'applique uniquement si les deux courbes ne sont pas trop loignes
l'une de l'autre. La distance entre les deux courbes ne doit pas tre
trop grande compare la longueur des courbes.
3.9 Principe de symtrie
Lorsqu'un ensemble dobjets visuels est invariant par une
symtrie axiale, ces objets sont regroups et forment un ensemble
rigide.
Malgr le regroupement et la rigidification des dix points dans la
figure 12, on peroit les deux sous-ensembles de cinq points qui sont
symtriques l'un par rapport l'autre. Ces deux sous-ensembles sont
unifis sparment grce aux principes de similitude et de proximit,
mais ces deux regroupements distincts sont renforcs par le principe
de symtrie. Nous avons ici un exemple d'articulation tout-parties, o
le tout ne masque pas les parties.





Figure 12
Exemple de regroupement perceptif suivant le principe de
symtrie.

Reconstruction visuelle et gnricit 27

Ainsi dfini, le principe de symtrie pourrait sappliquer dans
pratiquement toutes les images, puisque tout couple de points admet
un axe de symtrie. Il est nanmoins relativement facile de masquer
cette symtrie en introduisant d'autres points :





Figure 13
Masquage de la symtrie par ajout de quelques objets.

3.10 Principe de convexit
Le principe de convexit, ou de courbure minimale, favorise
linterprtation dune image en objets convexes. Tout comme le
principe de fermeture, le principe de convexit intervient donc dans
la rigidification ainsi que dans l'articulation fond-forme.




Figure 14
Bien que les principes d'identit chromatique et de fermeture puissent
orienter l'interprtation de cette image vers la vision de formes toiles
noires, l'observateur a plutt l'illusion de formes convexes (ovales)
blanches sur fond noir.
28 J.-P. D'ALES, J. FROMENT et J.-M. MOREL


3.11 Principe de perspective
Le principe de perspective s'nonce de la manire suivante : trois
segments de droites concourants indiquent soit un point de fuite, soit
la jonction de trois contours d'arte d'un objet. On suppose que les
trois segments de droites sont dans une position gnrique, c'est--
dire qu'ils sont contenus dans trois droites distinctes (dans le cas
contraire, ces segments forment une jonction en T, qui sort du champ
d'application du principe de perspective, et rentre dans le domaine
du principe de continuation). Nous appellerons jonction en Y une
telle configuration.
D'une manire gnrale, nous parlerons d'interprtation
perspective lorsqu'une figure, ou une image, sera effectivement
perue ou considre comme la reprsentation plane d'une scne
tridimensionnelle.
a
b
c
d


Figure 15
Un exemple d'application du principe de perspective : les quatre
jonctions en Y a, b, c, et d permettent une interprtation
perspective cohrente.
Sur l'exemple de la figure 15, dans l'interprtation dominante, on
voit une poutre de section carre et de trs grande longueur, vue de
l'une de ses extrmits. Le principe de perspective s'applique aux
quatre jonctions en Y a, b, c, et d. Les jonctions a, b, et c sont
interprtes sommes des points de jonctions d'artes, et la jonction d
comme un point de fuite.
A chaque fois qu'une ligne de fuite est repre dans l'image, il est
possible de percevoir l'loignement des objets le long de cette ligne,
et de les ordonner en profondeur.
Remarquons que l'utilisation du principe de perspective suppose
que l'image soit une reprsentation en perspective centrale (c'est--
dire une projection centrale sur un plan en termes mathmatiques).
Reconstruction visuelle et gnricit 29

Dans ce type de perspective, l'image d'un groupe de droites
parallles est un groupe de droites concourantes en un mme point
(le point de fuite).
4 - GENERI CI TE
Le principe de gnricit intervient, lors de la reconstruction
visuelle, dans les processus de regroupement perceptif et de
rigidification. Il s'agit d'un principe multi-forme, et nous prsentons
maintenant les diffrentes manires de l'apprhender.
4.1 - Graphe d'aspect

A
B

Figure 16
Exemples de configuration dgnre ou singulire : en A, l'il
est align avec une arte du paralllpipde rectangle, et n'en
voit donc qu'une face. En B, l'un des plans simultanment
tangents aux surfaces des deux cylindres contient l'il, lequel
voit ainsi deux objets colls.

Dans une premire approche, on peut considrer le principe de
gnricit comme un postulat : dans la reconstruction visuelle, on
suppose que la configuration des objets prsents dans la scne observe
est gnrique par rapport la position de l'observateur ou du capteur.
Cela veut dire par exemple, que si un objet possde un bord d'arte
rectiligne, alors celui-ci n'est pas align avec le point d'observation,
ou bien, plus gnralement, que si une droite est tangente en deux
points distincts un mme objet, ou bien deux objets diffrents,
alors cette droite ne contient pas le point d'observation. Ces deux cas
de figure sont illustrs sur la figure 16.
Il est possible d'inscrire et de reformuler le principe de gnricit
dans le cadre de la thorie des graphes d'aspects (voir par exemple
30 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Van Effelterre 1995). Rappelons que l'aspect d'un objet volumique
dlimit par des surfaces rgulires est la projection sur un plan de
ses contours de silhouette, ainsi que de ses contours occlusifs
internes ventuels. L'aspect d'un objet donn est donc dfini par un
ensemble de courbes planes. Construire le graphe d'aspect de cet
objet consiste recenser tous ses aspects (correspondants tous les
points de vue possibles), et les regrouper en classes d'quivalence.
Deux aspects sont dans la mme classe si leurs proprits
topologiques et diffrentielles sont identiques. On obtient ainsi une
partition de l'espace trois dimensions en rgions o l'aspect est
qualitativement le mme. Le passage d'une rgion une autre est
appel vnement visuel. On dira aussi qu'il y a changement
qualitatif de l'aspect. Lorsque l'il est situ sur la frontire entre
deux telles rgions, nous dirons qu'il est dans une position non
gnrique.
Il est facile de gnraliser cette notion un groupe de plusieurs
objets (en spcifiant s'ils sont ou non transparents), et au cas d'objets
prsentant des artes. On peut alors donner un nouvel nonc du
principe de gnricit : pour effectuer la reconstruction visuelle, il est
suppos que le point d'observation est l'intrieur (au sens topologique
du terme) de l'une des rgions homognes du graphe d'aspect. En
d'autres termes, une reconstruction gestaltiste doit tre telle
qu'aucune petite perturbation de la position des objets reconstruits
ou du point d'observation ne cre d'vnement visuel. Il faut
remarquer que pour la vision humaine, cette hypothse est tout fait
lgitime, car il est facile de valider la reconstruction en effectuant de
petits mouvements de la tte.
Notons que les graphes d'aspects n'puisent pas tous les types de
gnricit. En particulier, nous verrons que pour la reconstruction
visuelle, des proprits affines telles que le paralllisme ou la
symtrie viennent s'ajouter la topologie et la diffrentiabilit.
4.2 - Le principe de gnricit est un principe vrificateur
Lorsque les positions du point d'observation ou des objets
observs sont lgrement perturbes, de manire que l'aspect de la
scne ne soit pas qualitativement modifi, les contours occlusifs, de
silhouette, ou d'arte des objets subissent des dformations.
Inversement, nous pouvons utiliser cette remarque pour vrifier
qu'une interprtation visuelle correspond bien une situation
gnrique. Etant donn une interprtation d'une figure, construite
Reconstruction visuelle et gnricit 31

partir des principes organisateurs, on applique des petites
dformations indpendantes chaque contour d'objet solide dtect
lors de la reconstruction. Si les proprits topologiques et
diffrentielles de l'aspect sont modifies (i.e. si on a un vnement
visuel), alors l'interprtation est dite non gnrique (on ne peut pas
parler d'interprtation fausse ou mauvaise, car si le point
d'observation est effectivement dans une position singulire, alors
cette interprtation est la bonne). Par contre, si ces proprits ne
sont pas altres, alors la reconstruction ou l'interprtation est dite
gnrique.
Le principe de gnricit n'est donc pas constructeur, comme le
sont les principes organisateurs, mais il peut servir vrifier la
pertinence des principes organisateurs utiliss pour fournir
l'interprtation. Il peut aussi servir d'arbitre, lorsque plusieurs
interprtations ont pu tre construites partir des principes
organisateurs, en liminant celles qui ne sont pas gnriques.
Remarquons que dans certains cas, il peut y avoir plusieurs
interprtations gnriques pour une mme figure (on en a un
exemple dans la figure 1A avec le cube de Necker). Il peut aussi
arriver qu'il n'existe pas d'interprtation gnrique (voir l'exemple
de la fourchette de Penrose, figure 17).
4.3 - Quelques exemples d'application du principe de gnricit
Les exemples d'interprtation qui suivent illustrent le fait que
l'application des principes gestaltistes fournit une reconstruction
visuelle complte partir de la seule donne des variations de
l'intensit lumineuse dans l'image.
4.3.1 Le cube de Necker
Dans la figure 1A, les principes d'identit chromatique et de
constance de largeur induisent une rigidification de chaque segment
de droite noir ainsi que leur inclusion dans un ensemble rigide
articul en huit points (les sommets du cubes). Mais le paralllisme
entre les segments de droite induit une rigidification de ces points
articuls. En outre, ces points sont des jonctions en Y, qui permettent
donc une interprtation perspective. Il y a alors deux interprtations
gnriques, suivant l'ordre des deux carrs dans l'espace.
32 J.-P. D'ALES, J. FROMENT et J.-M. MOREL


4.3.2 La fourchette de Penrose



Figure 17
La Fourchette de Penrose : un exemple de figure pour laquelle il
n'existe pas d'interprtation gnrique. Bien que l'objet physique
donnant cette image puisse tre construit, en fil de fer par
exemple, l'observateur considre cet objet comme "impossible".

Sur la figure 17, les principes d'identit chromatique, de
constance de largeur et de continuit de direction induisent une
interprtation comprenant un seul objet. Si l'attention est focalise
sur la partie droite de la figure (ou bien si on masque compltement
la partie gauche), les lignes horizontales sont assimiles aux
contours de silhouette de trois objets cylindriques. Cette
interprtation est dicte par les principes de fermeture et de
perspective, qui cooprent avec les principes dj cits. En revanche,
si l'attention est porte sur la partie gauche de la figure, les lignes
horizontales sont assimiles des contours d'arte d'un objet
paralllpipdique en forme de U. Cette fois, ce sont les principes de
compltion amodale et de perspective qui cooprent avec les trois
principes mentionns prcdemment.
Ces deux interprtations partielles, bases sur des considrations
locales, sont incompatibles, ce qui explique l'impossibilit de
construire une interprtation globale gnrique. On parle alors
d'"objet impossible".
4.4 - Le principe de gnricit comme principe premier
On peut aussi voir le principe de gnricit comme un principe
gnral de rigidification, dont un certain nombre de principes
organisateurs ne seraient que des instanciations.
4.4.1 Principe d'identit chromatique
Si une rgion o les niveaux de gris sont constants n'est pas
rigidifie, par exemple si elle est divise en deux parties solides, et si
Reconstruction visuelle et gnricit 33

on carte lgrement ces deux rgions, alors la topologie de la
figure est modifie. La seule interprtation gnrique possible
consiste rigidifier la rgion dans sa totalit. Le principe d'identit
chromatique est donc une application du principe de gnricit.

+

Figure 18
Le principe d'identit chromatique comme application du
principe de gnricit au cas des rgions niveau de gris
constant.

4.4.2 Principe de continuit de direction
On voit une courbe rgulire comme "une" (image 19-A). Pourtant,
elle pourrait rsulter de la superposition spatiale de deux segments
de courbe spars, ou de la juxtaposition de deux bouts de segments
de courbe se touchant aux extrmits et parallles (image 19-B). Ces
deux interprtations correspondent des positions spciales ou
singulires de l'observateur par rapport aux objets. Elle sont donc
rejeter. Le principe de gnricit implique donc le principe de
continuit de direction.

= +
A B


Figure 19
34 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

Le principe de gnricit implique que l'image A ne peut pas tre
interprte comme la juxtaposition particulire de deux portions
de courbes, comme en B.

Cas particulier : les segments articuls (continuation non rgulire).
Deux segments dont les bouts se touchent (image 20-A) sont
interprts comme un solide articul : on "permet" mentalement
qu'ils bougent l'un par rapport l'autre (image 20-B), mais en les
gardant attachs par leur extrmit commune (l'image 20-C nest pas
permise).

= +
=
A
B
C


Figure 20
Le point angulaire de la courbe sur l'image A permet de
linterprter comme tant constitue de deux segments. Langle
entre ces deux segments ntant pas particulier (ni droit, ni plat)
il peut varier librement (image B). Le caractre connexe de la
courbe doit par contre tre conserv (image C).

Du point de vue de la gnricit, on autorise que les deux
branches subissent des mouvements indpendants condition que le
point d'articulation soit conserv. Sans cette dernire restriction,
nous voyons en 20-C que l'interprtation n'est plus gnrique. Une
autre possibilit est d'appliquer les principes de compltion amodale
et de fermeture. On considre alors l'ensemble des deux segments
comme le bord d'un objet plat (une feuille par exemple) partiellement
occult. Le mouvement articul des deux segments reste autoris, car
c'est une dformation possible de l'aspect de cet objet quand la
perspective change. Les deux interprtations gestaltistes ainsi
proposes n'entrent pas en conflit et sont toutes deux gnriques.
4.4.3 Principe de transparence
Reconstruction visuelle et gnricit 35

Le principe de transparence, lorsqu'il est appliqu une jonction
en "X" est aussi un cas particulier du principe de gnricit. Dans la
figure 10, si ad et bc ne sont pas rigidifies sparment, alors
l'interprtation n'est pas gnrique. Du point de vue de la gnricit,
un regroupement du type ac + bd correspondrait une situation
dgnre de l'observateur par rapport aux objets. Le principe de
transparence est donc aussi une consquence de la gnricit.
4.4.4 Principe de compltion amodale
La figure en "T" n'est gnrique que si la barre verticale du T se
prolonge amodalement au-del de la barre horizontale (figure 21).
La compltion amodale nous autorise donc un mouvement relatif des
deux barres de la jonction sans changement de topologie.



=
=


Figure 21
La compltion amodale d'une jonction en T la rend gnrique :
les petits mouvements relatifs des deux barres prservent la
jonction.



36 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

= +
A B C
+
+


Figure 22
Compltion amodale des courbes formant les pieds du T : un
exemple est donn en B, o l'interprtation qui place le rectangle
devant la courbe est gnrique.

4.4.5 Principe de fermeture
Une courbe ferme unifie les points situs lintrieur de cette
courbe et cre ainsi une rgion. Pourtant, une telle rgion peut ne
pas avoir de ralit physique comme lillustre la figure 23 : elle peut
se former cause d'une position particulire de lobservateur par
rapport aux objets. Ici encore, nous pouvons appliquer le
raisonnement utilis pour l'identit chromatique propos de la
gnricit.

A
= +
B
C


Figure 23
Le principe de fermeture amne interprter limage A comme
un unique objet rigide et non pas, par exemple, comme deux
querres qui paratraient sajuster leurs extrmits (image B).
Cela pourrait cependant tre la bonne interprtation, comme
Reconstruction visuelle et gnricit 37

lillustre la figure C, mais cette interprtation n'est pas gnrique
car elle suppose une position particulire de lobservateur.

4.4.6 Constance de largeur, ou paralllisme
Si deux segments sont parallles sur une figure, on ne les
interprte pas comme des reprsentants de segments en position non
parallle dans l'espace. Cela impliquerait une position spciale de
l'observateur et du plan de l'image (Cf. figure 24).


A
B


Figure 24
Le principe de constance de largeur est un cas particulier du
principe de gnricit. Dans A, les deux segments parallles sont
interprts comme les artes dune mme face dun mme objet.
Toute autre interprtation (comme celle donne en B) serait non
gnrique car elle supposerait une position particulire de
lobservateur et de l'angle de vue.

Du point de vue de la gnricit, les proprits de la figure ou de
l'aspect qui doivent tre conserves aprs dformation spare des
parties rigides ne sont plus seulement les proprits topologiques ou
de rgularit des courbes, mais incluent aussi le paralllisme entre
ces courbes (cette dernire proprit n'est pas prise en compte dans
les graphes d'aspect).
Remarquons que dans le cadre de la perspective centrale (que
nous avons utilise pour dfinir le principe de perspective) le
principe de constance de largeur ne peut s'appliquer puisque deux
artes ou deux contours parallles dans l'espace ne sont
gnralement pas reprsents par des courbes parallles sur
l'image. Toutefois, si la distance relative des objets considrs n'est
38 J.-P. D'ALES, J. FROMENT et J.-M. MOREL

pas trop grande, le principe de constance de largeur est
approximativement valable.
4.4.7 Principe de symtrie
La prsence d'un axe de symtrie dans une image constitue une
structure gomtrique importante. Selon le principe de gnricit,
cette symtrie est une proprit des objets observs, et non le
rsultat fortuit du choix de la position du point d'observation par
rapport la scne observe. Il est donc lgitime, du point de vue du
principe de gnricit, de rigidifier une figure symtrique.
5 - CONCLUSION
Les gestaltistes ont prouv l'existence d'un petit nombre de
principes expliquant la formation des objets visuels. Nous avons vu
que l'axiomatique gestaltiste est assez complte pour permettre une
vritable explication par principes d'une figure simple. Mais nous
avons galement vu que les principes gestaltistes relvent pour
l'essentiel d'un principe mathmatique de gnricit. Cette analyse
nous conduit esprer le dveloppement d'outils mathmatiques
(puis informatiques) d'analyse des images. Un dveloppement
mathmatique que, plusieurs fois, les gestaltistes ont appel de leurs
vux.
REMERCI EMENTS
De nombreux lments prsents dans cet article sont issus des
rflexions d'un groupe de travail qui s'est runi l'Universit Paris
IX-Dauphine, et qui tait compos de, outre les auteurs, Mariko
Arisawa, Frdric Benqu, Isabeau Birindelli, Antonin Chambolle,
Laurent Cohen, Julio Esclarin, Herv Hamy, Martin Lefbure,
Marcella Mairota, Nicolas Mathieu, Lionel Moisan, Denis
Pasquignon, Patrice Prez.
Nous remercions galement la Fondation des Treilles pour son
accueil.
Reconstruction visuelle et gnricit 39

Bibliographie
Arnheim, R. (1954) Art and visual perception : a psychology of the creative
eye.
Ellis, W.D. (1939) A source book of Gestalt theory, New-York, Harcourt
Brace.
Fuchs, W. (1923) "Experimentelle Untersuchungen ber das simultane
Hintereinandersehen auf der selben Sehrichtung", Zeitschrift fr
Psychologie, 91, 154-253.
Kanizsa, G. (1979) Organization in Vision, N.Y. Praeger.
Kanizsa, G. (1980) Grammatica del Vedere, Il Mulino, Bologna. Traduction
franaise par Antonin Chambolle, La Grammaire du Voir, ditions
Diderot, 1997.
Kanizsa, G. (1991) Vedere e pensare, Il Mulino, Bologna.
Marr, D. (1982) Vision, New-York, W.H. Freeman and Co.
Metzger, W. (1975) Gesetze des Sehens, Waldemar Kramer, Frankfurt am
Main.
Nitzberg, M., and Mumford, D. (1990) "The 2.1 Sketch", in Proceedings of
the Third International Conference on Computer Vision, Osaka.
Van Effelterre, T. (1995) Calcul Exact du Graphe d'Aspect de Solides de
Rvolution, Thse de Doctorat, Universit de Rennes I.
Wertheimer, M. (1923) "Untersuchungen zur Lehre der Gestalt, II",
Psychologische Forschung, vol. 4, pp.301-350.

S-ar putea să vă placă și