Documente Academic
Documente Profesional
Documente Cultură
CH-1015 Lausanne
http://serval.unil.ch
Year : 2011
Quentin Rossy
Droits dauteur
L'Universit de Lausanne attire expressment l'attention des utilisateurs sur le fait que tous les
documents publis dans l'Archive SERVAL sont protgs par le droit d'auteur, conformment la
loi fdrale sur le droit d'auteur et les droits voisins (LDA). A ce titre, il est indispensable d'obtenir
le consentement pralable de l'auteur et/ou de lditeur avant toute utilisation d'une oeuvre ou
d'une partie d'une oeuvre ne relevant pas d'une utilisation des fins personnelles au sens de la
LDA (art. 19, al. 1 lettre a). A dfaut, tout contrevenant s'expose aux sanctions prvues par cette
loi. Nous dclinons toute responsabilit en la matire.
Copyright
The University of Lausanne expressly draws the attention of users to the fact that all documents
published in the SERVAL Archive are protected by copyright in accordance with federal law on
copyright and similar rights (LDA). Accordingly it is indispensable to obtain prior consent from the
author and/or publisher before any use of a work or part of a work for purposes other than
personal use within the meaning of LDA (art. 19, para. 1 letter a). Failure to do so will expose
offenders to the sanctions laid down by this law. We accept no liability in this respect.
Facult
de
Droit
et
des
Sciences
Criminelles
Ecole
des
Sciences
Criminelles
Mthodes
de
visualisation
en
analyse
criminelle:
approche
gnrale
de
conception
des
schmas
relationnels
et
dveloppement
dun
catalogue
de
patterns
THSE
DE
DOCTORAT
prsente
la
Facult
de
Droit
et
des
Sciences
Criminelles
de
lUniversit
de
Lausanne
pour
lobtention
du
grade
de
Docteur
s
Sciences
en
science
forensique
par
Quentin
Rossy
Directeur
de
thse
Prof.
Olivier
Ribaux
LAUSANNE
2011
R E M E R C I E M E N T S
Leffort dintrospection effectu lors de la rdaction de la thse, ma fait raliser quelle point
le titre de cette recherche contient un mot cl : relationnel . Au del du caractre centrale
de lanalyse dite relationnelle en analyse criminelle, si je ne devais retenir qu'une seule chose,
cest que l'intrt principal de ce travail rside bien dans les relations quil ma permi et me
permet de crer. Jespre vivement quil moffrira lopportunit den raliser de nombreuses
autres.
Je remercie les personnes qui mont soutenu, conseill et aid tout au long de la thse, ainsi
que lcole et les organes de police qui mont offert des cadres de travail ouverts aux
initiatives de recherche et dveloppement. Un grand merci notamment Pierre Margot,
directeur de lEcole des Sciences Criminelles et Olivier Guniat, chef de la police judiciaire
lors de mon activit la police neuchteloise. Je tiens exprimer ma vive gratitude Olivier
Ribaux, directeur de thse, pour la confiance quil ma tmoign tout au long de mes activits
de recherche et denseignement, pour ces trs prcieux conseils et pistes de rflexion et sa
passion communicative.
ii
Une pense particulire pour tous les collgues avec qui jai partag de nombreuses
discussions et qui mont transmis un peu de leur savoir. Jaurais aim les citer tous, jai une
pense pour chacun deux:
- Les collgues de la police neuchteloise et tout particulirement Jean-Claude Voirol
qui ma fait dcouvrir lanalyse de la dlinquance srielle.
- Les collgues des polices de suisse romande, du CICOP et les analystes criminels, plus
particulirement Julien Cartier et Sbastien Capt.
- Les collgues de lESC et en particulier tous les membres du groupe analyse criminelle,
dont Stphane Birrer, pour son soutien ds mes dbuts en tant quassistant et pour
tout les grands moments pass lors du dveloppement de PICAR. Sylvain Ioset et
Thibault Genessay, pour leur soutien permanent et les trs nombreuses discussions sur
diffrents aspects de cette recherche.
A ma famille,
A mes parents,
A ma femme,
Mille merci.
iii
S U M M A R Y
Police work and criminal investigation require taking many decisions: i.e.choosing which traces
should be analysed and placing under surveillance or detention a suspect are decisions that
are made daily by the actors of the legal system. These decisions need to weigh competing
interests based on the analysis of available information. It is the role of crime analysis to put
into perspective collected information to make it intelligible to decision makers. The use of
visualisations is particularly recommended to support the analysis and communication of such
information by highlighting the essential features.
Link charts are used in criminal investigations in order to facilitate the processing of large-
scale investigation data. The relevant elements of the inquiry are represented in the form of
diagrams describing the relationships between events and entities featuring in the
investigation (such as people, objects and traces). For instance, traditional uses of those graph-
like techniques are: the representation of criminal networks, smuggling of goods, chronologies
of events, as well as the visualisation of telephone records and financial data. In this context,
visualisations are used for many objectives, such as analysing the traces and the information
gathered, evaluating a cold case, helping along the categorization of a particular offence,
facilitating the transmission and receipt of a case or supporting an argument at the Courts
trial.
Common practice includes simple software tools that produce powerful and often elegant
visualisations. However their use raises important difficulties. This research suggests that there
are astonishing disparities in the use of these techniques. Reasoning and perception biases
can be introduced, sometimes leading to wrong decisions with serious consequences. This
observation reveals the need to consolidate available methods.
iv
To highlight these difficulties, evaluations were conducted with practitioners and students. An
empirical picture of the manifold ways in designing and interpretating visualisations has been
established. The impact of this variety on decision-making is also discussed. The nature and
variety of concepts to be represented, the absence of an emerging consensus on how to
represent data, the diversity of visual solutions, the constraints imposed by tools and the
absence of a clear formalization of the visual language, are all supposed causes of the
observed difficulties.
Over the past two decades, several lines of development have been proposed to deal with
these problems, such as improving automated graph building tools, exploitation of social
network analysis, automation of the identification and extraction of entities in unstructured
text and the definition of formal languages. This research suggests a parallel approach based
on an appropriate use of graph structures and visual properties to optimize readability based
on analysis objectives and nature of the information to be represented.
Solutions were sought in several areas. General recommendations from various research
communities related to visualisation were gathered to provide a general approach for the
design of link charts. In addition, the development of a best practices catalogue formalized as
patterns was initiated. Each pattern describes a particular solution to a recurring analysis
question, such as the analysis series of burglaries. Finally, the impact on tools of the proposed
methodology is discussed in light of the limitations they impose. A multi-dimensional
visualisation software prototype was developed.
On the whole, this research highlights the difficulties encountered in designing link charts that
support inquiries and proposes methodological and technical innovations useful for practice
and teaching.
R E S U M E
Des techniques de visualisation relationnelle sont notamment exploites dans les enqutes
judiciaires afin de faciliter le traitement daffaires denvergure. Les lments pertinents de
lenqute sont reprsents sous la forme de schmas dcrivant les relations entre les
vnements et les entits dintrts (tel que des personnes, des objets et des traces). Les
exploitations classiques de ces techniques qui sapparentent des graphes, sont par exemple :
la reprsentation de rseaux criminels, de trafics de marchandises, de chronologies
dvnements, ainsi que la visualisation de relations tlphoniques et financires. Dans ce
contexte, la visualisation soutient un nombre importants dobjectifs, tels quanalyser les traces
et les informations collectes, valuer a posteriori une investigation, aider qualifier les
infractions, faciliter lapprhension dun dossier, voire soutenir une argumentation lors du
procs.
La pratique intgre des outils logiciels simples qui produisent des graphiques lgants et
souvent percutants. Leur utilisation semble nanmoins soulever des difficults. Cette recherche
tend montrer quil existe des disparits tonnantes lors de lexploitation de ces techniques.
Des biais de raisonnement et de perception peuvent tre induits, allant jusqu provoquer des
vi
dcisions aux consquences parfois dsastreuses. Ce constat rvle la ncessit de consolider
les mthodes pratiques.
Pour mettre en vidence ces difficults, des valuations ont t effectues avec des praticiens
et des tudiants. Elles ont permis dtablir une image empirique de ltendue des variations de
conception et dinterprtation des reprsentations, ainsi que de leurs impacts sur la prise de
dcision. La nature et la diversit des concepts reprsenter, labsence dun consensus
mergeant sur la manire de reprsenter les donnes, la diversit des solutions visuelles
envisageables, les contraintes imposes par les outils exploits et labsence dune
formalisation claire du langage, sont autant de causes supposes des difficults.
Au cours des vingt dernires annes, plusieurs axes de dveloppement ont t proposs pour
traiter les difficults observes, tels que lamlioration des automatismes facilitant la
conception dune reprsentation, lexploitation des techniques de rseaux sociaux,
lautomatisation de lidentification et de lextraction des entits dans du texte non-structur et
la dfinition de langages formels. Cette recherche propose une approche parallle fonde sur
une exploitation adapte de structures de graphe et de proprits visuelles pour optimiser la
reprsentation en fonction des objectifs dfinis et de la nature des informations reprsenter.
Des solutions ont t recherches selon plusieurs axes. Des recommandations gnrales,
issues de diverses communauts de recherche lies la visualisation, ont t recherches afin
de proposer une dmarche gnrale de conception des schmas relationnels. Par ailleurs, le
dveloppement dun catalogue de bonnes pratiques formalises sous la forme de patterns de
visualisation a t amorc. Chaque pattern dcrit une solution particulire pour un problme
danalyse rcurrent, tel que lanalyse dune srie de cambriolages. Finalement, limpact sur les
outils de la mthodologie propose est discut en regard des limites quils imposent. Un
prototype de visualisation multidimensionnel a t labor.
vii
INTRODUCTION 1
Contexte
1
Problmatique
2
Structure
de
la
thse
2
viii
SYNTHESE
83
Constat
83
Consolidation
des
mthodes
87
Dlimitation
du
cadre
87
Objectifs
88
Mthodologie
88
ix
CONCLUSION 215
BIBLIOGRAPHIE 217
ANNEXES 232
I N T R O D U C T I O N
C o n t e x t e
Les services de police (au niveau local, national et international) ont de plus en plus recours
des modles de prises de dcisions oprationnelles et stratgiques fondes sur lexploitation
de produits de lanalyse de donnes. Parmi les problmatiques majeures actuelles, la mise en
place de structures danalyse charges de traiter la masse dinformations recueillies et la
dfinition de mthodologies de travail efficientes sont des questions permanentes. De
nombreuses formes de reprsentations graphiques sont exploites dans ce cadre pour
produire et communiquer les renseignements utiles la prise de dcision.
De nombreuses polices travers le monde et tout particulirement aux Etats-Unis ont investi
des moyens importants pour produire des systmes de visualisation cartographique de la
criminalit. Ces systmes permettent dobtenir rapidement une image claire et facile daccs
de problmes criminels souvent complexes. Par ailleurs, des logiciels de visualisation ont
galement t intgrs dans les enqutes judiciaires afin de faciliter le traitement daffaires
denvergure. Les lments pertinents de lenqute sont reprsents sous la forme de schmas
dcrivant les relations entre les vnements et les entits dintrts (tel que des personnes, des
socits, des vhicules et des traces). Les exploitations classiques de ces techniques sont, par
exemple : la reprsentation de rseaux criminels, de trafics de marchandises, de modes
opratoires complexes, de chronologies, ainsi que la visualisation de relations tlphoniques
et financires.
2
Introduction
Les nouvelles technologies apportent des solutions techniques de plus en plus varies. Mais
cette apparente simplicit dlaboration de produits graphiques lgants et souvent
percutants semble toutefois cacher un nombre important de problmes mthodologiques et
pratiques.
P r o b l m a t i q u e
Le travail policier et lenqute judiciaire ncessitent de prendre de nombreuses dcisions : une
visite domiciliaire, une mise sous surveillance ou une mise en dtention dun suspect, sont
autant de dcisions qui sont prises quotidiennement par les acteurs du systme judiciaire. Ces
dcisions font lobjet de peses dintrts qui se fondent sur lanalyse de linformation
accessible. Cest le rle de lanalyse criminelle de mettre en perspective cette information pour
la rendre intelligible aux dcideurs comptents. Lusage de reprsentations graphiques est
notamment recommand pour soutenir lanalyse et la communication des informations. Bien
que lanalyse criminelle propose une mthode gnrale et harmonise, la mise en uvre
pratique de la mthode semble poser de nombreuses difficults lors de la production de telles
reprsentations. Cette recherche tend montrer quil existe de relles difficults, puis proposer
des solutions mthodologiques et techniques. Les questions abordes sont : quel est le
contexte dexploitation de la visualisation en analyse criminelle, quels sont ses rles, quelles
sont les formes de reprsentation exploites et quels sont les problmes rencontrs lors de
leurs utilisations?
S t r u c t u r e d e l a t h s e
P r e m i r e p a r t i e
Structure
de
la
thse
3
Le deuxime chapitre dcrit le contexte de lenqute judiciaire dont sont issus les exemples
analyss dans cette thse. Les objectifs attendus en matire de visualisation sont dcrits ainsi
que les besoins des acteurs du processus en regard de la visualisation ; quils en soient les
crateurs ou les destinataires. Bien que la problmatique traite dans cette thse se base sur
ltude de cas issus de linvestigation criminelle, les problmes identifis et lapproche
envisage pour les traiter semblent toutefois avoir une utilit plus globale.
Il est souponn que les pratiques de conception des schmas relationnels sont disparates et
que les visualisations produites sont plus ou moins efficaces. Le troisime chapitre dfinit la
notion defficacit, les indicateurs permettant de la mesurer et les mthodologies existantes
pour lvaluer.
Les difficults dlaboration de reprsentations sont prsentes dans le quatrime chapitre qui
rsume des valuations prliminaires effectues et des exemples de cas. En premier lieu, la
4
Introduction
disparit des solutions graphiques labores pour une mme situation par diffrentes
personnes est observe. Deux illustrations portant sur des cas simples sont prsentes
(reprsentation dune seule phrase). La troisime illustration expose les schmas relationnels
produits partir dune mme affaire, par un ensemble denquteurs, dtudiants et danalystes
criminels. Il est alors constat quil ne semble pas exister de consensus mergeant en matire
de reprsentation relationnelle des informations. Ces disparits ont-elles un impact important
sur lanalyse et la communication des informations ? Des exemples dexploitation au cours du
processus denqute et du jugement sont prsents afin dillustrer limpact des choix effectus
pour analyser, synthtiser et communiquer les informations daffaires complexes.
S e c o n d e p a r t i e
Les contributions prsentes dans la deuxime partie de cette thse sont divises en trois
chapitres. Le premier chapitre est consacr la prsentation dlments gnraux de mthode
formaliss dune part sur les travaux de recherches issus de la littrature en matire de
visualisation et dautre part sur des observations effectues lors du traitement de situations
rcurrentes. Une formalisation du processus de conception dun graphe est propose afin
dexpliciter, pour chaque tape, les causes supposes des difficults observes lors des
valuations prliminaires. La dmarche propose repose sur une dfinition plus prcise du
langage visuel exploitable pour concevoir un schma. Une typologie de relations est propose
afin de guider les choix de conception. Celles-ci ont t compares empiriquement afin
dtudier limpact du changement de structure sur lefficacit des graphes. La dernire section
du premier chapitre vise prsenter les recommandations gnrales identifies. Elles sont
intgres dans une bauche de dmarche gnrale guidant la conception des schmas.
Les recommandations et les lments de mthode formaliss dans le premier chapitre ont
notamment t dfinis en regard de situations rcurrentes identifies au cours denqutes. Le
second chapitre prsente les bonnes pratiques proposes pour reprsenter ces situations : tel
que le traitement de sries de cambriolages ou lanalyse de donnes tlphoniques par
exemple. La dmarche est ainsi explicite par des exemples concrets. Lobjectif est damorcer
le dveloppement dun catalogue de bonnes pratiques. Il ne saurait tre dmontr que les
solutions proposes sont les meilleures possible. Elles ont toutefois montr une certaine
efficacit qui est discute pour chaque cas.
Structure
de
la
thse
5
possibilits sont videmment cantonnes aux fonctionnalits offertes. Ils offrent gnralement
des solutions gnriques, alors que les problmes rsoudre sont souvent spcifiques. Ils ne
favorisent pas toujours les bons choix de reprsentation en regard des questions danalyse.
Afin dexpliciter les difficults lies lexploitation des logiciels, le processus de visualisation
est dcrit dun point de vue technique. Une sparation ncessaire est identifie entre le
modle des donnes rcoltes et le modle ncessaire pour produire une vue. Le
dveloppement de mcanismes permettant dune part de faire communiquer ces modles et
dautre part de modifier dynamiquement la structure des graphes est propos comme une
solution ncessaire pour que les techniques soutiennent plus efficacement les raisonnements
effectus en cours danalyse. Finalement, le dveloppement de techniques de reprsentation
intgrant lensemble des dimensions danalyse est certainement lun des dfis majeurs de ces
dix dernires annes dans le domaine. En effet, cette problmatique est identifie depuis le
dbut des annes deux-mille et de nombreux outils sont dvelopps dans cette perspective
intgratrice facilitant lanalyse globale des donnes. Un prototype de visualisation
multidimensionnelle a t amorc dans le cadre de cette thse. Il est prsent en fin de
chapitre.
The power of the unaided mind is highly overrated. Without external aids, memory,
thought, and reasoning are all constrained. But human intelligence is highly flexible and
adaptive, superb at inventing procedures and objects that overcome its own limits. The real
powers come from devising external aids that enhance cognitive abilities. How have we
increased memory, thought, and reasoning? By the invention of external aids: It is things
that make us smart. (Norman, 1993, p.43)
P A R T I E
I
:
C O N T E X T E
E T
P R O B L E M A T I Q U E
Diverses formes de reprsentation sont exploites dans de nombreux domaines pour faciliter
lapprhension de grandes quantits de donnes, afin de dtecter des tendances ou des
anomalies qui sont alors rendues visuellement explicites (Ware, 2004). De nombreuses
recherches ont t entreprises sur le sujet depuis les annes soixante qui tendent formaliser
les principes et les mthodes de la visualisation de linformation. Dans une recherche sur la
visualisation, lanalyse criminelle ne saurait tre considre autrement quen tant
quapplication spcifique de certaines formes de reprsentation. Lanalyste criminel, quant
lui, ne peut quapprhender la visualisation comme une technique particulire, certainement
utile, voire ncessaire, lui facilitant laccomplissement de certaines tches. Il reconnait que le
fruit de son travail est souvent transmis grce une reprsentation visuelle. Lanalyse
criminelle semble en effet avoir russi son intgration dans le domaine de la scurit grce
notamment un usage particulirement efficace de reprsentations graphiques. Bien quelle
couvre un processus bien plus large et complexe, Il faut admettre que les produits de
renseignement transmis sous la forme de reprsentations graphiques faonnent limage de la
discipline. Lanalyse criminelle nest de fait pas la seule discipline sur laquelle la visualisation a
un impact important. Certains auteurs prtendent que lessor des techniques de
reprsentation de linformation est lun des facteurs responsables du dveloppement de
toutes les sciences modernes (Crosby, 1997) (Friendly, 2008). Cette recherche aborde
lexploitation des reprsentations graphiques dans la perspective de lanalyse criminelle, tout
en intgrant des principes et des recommandations formalises dans des travaux lies la
visualisation afin de mieux comprendre les difficults rencontres et consolider les mthodes
pratiques.
A n a l y s e
c r i m i n e l l e
e t
v i s u a l i s a t i o n
Les termes danalyse ou de renseignement criminel(le) sont parfois utiliss comme synonyme
ou du moins de faon interchangeable. Dans le cadre de cette thse, ces termes seront utiliss
pour distinguer une mthode (analyse criminelle) du produit de lanalyse et de la fonction
(renseignement criminel).
Lanalyse criminelle est considre en tant que mthode systmatique exploitant notamment
des techniques de la gestion de linformation afin de dtecter, mmoriser et reprsenter des
relations1. Lanalyse criminelle dcrit un processus gnral qui par une exploitation structure
des informations aide grer les informations accessibles afin den matriser les flux et de
garder la vue densemble, cherche structurer les raisonnements et en particulier en
minimiser les biais et finalement met en perspective les informations pour les prsenter aux
dcideurs. La visualisation fait partie des moyens exploits au cours du processus pour
analyser les informations collectes et communiquer les renseignements produits.
1
Lanalyse criminelle consiste en la recherche et la mise en vidence mthodiques de relations - dune part entre
les donnes de la criminalit elles-mmes et, dautre part entre des donnes de la criminalit et dautres donnes
significatives possibles - des fins de pratiques judiciaires et policires. (Interpol, 1997)
Lanalyse stratgique est lensemble des mthodes et des techniques d'analyse qui essayent de manire
scientifique, de dcrire, d'valuer et d'expliquer la problmatique de scurit policire, en mettant en vidence des
relations entre d'une part les diffrents aspects de ces problmes et d'autre part des donnes contextuelles.
(dfinition de lanalyse stratgique par la police fdrale belge, http://www.polfed-
fedpol.be/org/djb_environnement/djb_envir11_fr.php, dernier accs le 12.11.2010).
8
Analyse
criminelle
et
visualisation
data, information, knowledge et intelligence. Bien que les dfinitions de ces termes soient
sujettes discussion et quil nexiste pas de consensus gnral, les distinguer permet de
caractriser des tats dans le processus de lanalyse criminelle. En effet, les informations sont
en permanence en mouvement et elles se modifient. La forme et le support de communication
des donnes peuvent varier. Une donne est considre comme le matriau brut, initialement
rcolt, dont la signification na pas t tablie (Brodeur, 2005a). Elle devient une information
lorsque sa pertinence a t value en fonction des objectifs de lanalyse. Une information est
gnralement structure et reprsente pour tre analyse puis communique. Une
connaissance est le fruit de linterprtation de linformation en fonction de la question
danalyse. Un renseignement intgre une notion dutilit pour laction de scurit implique
(Brodeur, 2005a). Il sert de base la prise de dcision et la rsolution de la problmatique. Il
doit intgrer une recommandation, une ide qui permet dagir. Le renseignement se dfinit
alors comme une information signifiante, raisonne et interprte dans un contexte particulier,
utile la prise de dcision.
Bien que dans une certaine mesure, tous les acteurs de la scurit peuvent produire du
renseignement. Le service de renseignement se distingue des autres fonctions de scurit,
puisquil na, en principe, pas dautres missions que danalyser et de communiquer. Lagent de
renseignement apporte une vision globale et synthtique dun problme de scurit en
suivant une dmarche analytique (dmarche de lanalyse criminelle ou processus du
renseignement). Le renseignement est une fonction de suivi permanent et mthodique qui
contribue au passage dune stratgie daction policire ractive vers un modle plus proactif
guid par le renseignement. Les analyses produites peuvent servir de base la prise de
dcision et guider des choix stratgiques ( long terme) ou oprationnels ( court terme). Le
renseignement peut se dcomposer soit selon des types dobjectifs, comme lanalyse de
phnomnes criminels, soit en fonction de la nature des informations analyses, comme le
renseignement financier par exemple.
Processus
de
lanalyse
criminelle
9
P r o c e s s u s
d e
l a n a l y s e
c r i m i n e l l e
Le processus de lanalyse criminelle est prsent ici afin dexpliciter les rles de la visualisation
dans la dmarche. Lanalyse criminelle est gnralement dcrite en tant que dmarche
systmatique et analytique (Atkin, 2000) (Boba, 2009) (Bruce, 2009) (Paulsen et al., 2010). Le
terme danalyse signifie la dcomposition dun ensemble en ses constituants afin de permettre
ltude et linterprtation des informations (Atkin, 2000). Dimportance gale, la synthse
quant elle vise regrouper un ensemble dlments afin daboutir une nouvelle
information (Peterson, 1998). Lanalyse criminelle est parfois dfinie comme la mise en
vidence mthodique de relations (Interpol, 1997), telles que des similitudes, des rgularits
ou des correspondances. La dtection dune relation sous-entend la fois une capacit
dcomposer les informations en entits (tels que des vnements et des personnes) entre
lesquels des relations sont recherches et la ncessit de reconstruire une connaissance
globale sur laquelle se base des dcisions. Lanalyse criminelle couvre donc un ensemble de
mthodes et de techniques exploites dans un processus commun afin daccomplir un
ensemble danalyses et de synthses. Le caractre systmatique de lanalyse criminelle rside
dans sa dmarche, fonde sur un ensemble organis de mthodes et de principes qui tiennent
en partie du domaine de la gestion de linformation.
10
Analyse
criminelle
et
visualisation
Gestion de linformation
Rechercher
et
Slectionner
Problme
Dcomposer
et
Structurer
Donnes
Agrger
acquises
Filtrer
Calculer
Visualiser
Analyse
criminelle
Informations
intgres
Informations
reprsentes
Raisonner
et
Interprter
Rvaluer Connaissance
Recommander
Communiquer
Problme
Renseignement
Agir
Figure 1 Processus de lanalyse criminelle
Processus
de
lanalyse
criminelle
11
Quatre tats reprsentent les donnes acquises, les informations intgres, les informations
reprsentes et la connaissance.
Cinq cycles sont reprsents pour dcrire des tapes du processus : le cycle dacquisition,
dintgration, de reprsentation, de raisonnement et de rvaluation.
Cinq tapes agrges qui dcrivent le processus linaire simplifi dlaboration du
renseignement.
Le processus est itratif. Il englobe un ensemble de sous-processus reprsents par des cycles
sur le schma. Des techniques spcifiques sont exploites pour accomplir les tches de
chacune de ces tapes. Le processus est dcompos en sous-systmes devant sintgrer dans
une architecture globale soutenant le processus de lanalyse criminelle. Toutefois, le processus
nen reste pas moins continu. Lune des difficults majeures de la transposition technologique
de ce processus est la formalisation des mcanismes de communication entre les sous-
systmes dvelopps. Les brves descriptions des tapes, prsentes ci-dessous, soulignent
certaines problmatiques fondamentales du processus.
Lacquisition est une tape cruciale du processus. Elle se base sur des choix et la dfinition de
priorits souvent imposes par le contexte (tels que les moyens disposition ou lurgence de
la situation). La variabilit des supports sur lesquels linformation est transmise
(principalement textuels, visuels et auditifs) et la diversit des formats posent de nombreux
problmes dacquisition. Le format des donnes de transactions bancaires ou de
communications tlphoniques rcoltes lors dune enqute par exemple, varie en fonction
des prestataires de service et sont parfois transmises sous la forme papier. Une mauvaise
valuation2 des besoins, de la pertinence et de la fiabilit des donnes rcoltes peut
engendrer des complications et une propagation des erreurs dans tout le continuum de
lanalyse. Laccessibilit des donnes doit galement tre rgle lors de cette tape du
processus. Loptimisation du processus de collecte peut faire lobjet dune analyse complte et
constitue un objectif de renseignement en soi (Ribaux et al., 2010).
12
Analyse
criminelle
et
visualisation
personnes, des traces. Lintgration prsuppose la capacit transposer des donnes dans une
mmoire commune en termes dencodage, de formatage et de structuration. Les mcanismes
dalimentation, dinterrogation et de modification de la mmoire constituent les ponts entre
les processus dacquisition et de reprsentation dcrite ci-dessous. Lintgration est ltape
globale visant la prennisation des informations afin deffectuer une analyse permanente. La
mise en commun et le suivi du flux dinformations rcoltes au cours dune enqute ou plus
globalement dun phnomne criminel, font partie des tches principales de lanalyste
criminel.
Le terme de signe est dfini comme la runion dun signifiant et dun signifi. Le signifiant est
la partie perceptible du signe (une image, un symbole, un mot, etc.). Le signifi est le concept
mental immatriel associ au signe. Par exemple, peut signifier flche. Trois rles de la
reprsentation sont dfinis par Bertin. Ils sont discuts en dtail dans la section suivante.
Lobservation est un concept gnral englobant les notions dinformation et de connaissance.
3
Une distinction entre les termes visualisation et reprsentation est prsente dans la section processus de
visualisation du chapitre Impact sur la conception doutils de la deuxime partie, page 195. Ces deux termes
sont toutefois utiliss comme synonymes afin dviter des rptitions trop lourdes.
Processus
de
lanalyse
criminelle
13
Linformation est observe ; regarde avec attention. La connaissance est une observation
dans le sens o elle est le rsultat de lexamen minutieux dune information pour la
comprendre. En analyse criminelle, la visualisation de linformation pourrait se dcrire comme
la reprsentation dobservations. La notion de ncessit introduite par Bertin peut
probablement sinterprter de diverses manires. Elle semble englober les notions dintgrit
et defficacit qui sont discutes plus loin. Bertin souligne le fait que les observations
reprsentes doivent tre utiles et requises pour atteindre un objectif dfini.
14
Analyse
criminelle
et
visualisation
La visualisation est exploite lors de cette tape du processus afin de faciliter les
raisonnements. Des cartes sont exploites pour dtecter des zones gographiques touches
par un phnomne criminel ou pour suivre lactivit dun auteur particulier. Des schmas
relationnels (reprsentation de rseaux) sont produits pour comprendre la structure dune
organisation criminelle, pour obtenir une vue densemble sur un trafic de marchandises ou
pour dcomposer une mode opratoire complexe. Des reprsentations temporelles sont
produites pour analyser la squence dune infraction particulire ou pour dtecter une
augmentation anormale dun phnomne criminel. Diverses formes de reprsentation sont
donc exploites en analyse criminelle pour analyser les informations collectes selon divers
axes qui rejoignent le questionnement Quintilien : qui, quoi, o, avec quels moyens,
pourquoi, comment et quand ? . Les reprsentations cartographiques et les schmas
relationnels sont les principales techniques exploites en analyse criminelle (Innes et al., 2005).
Les schmas relationnels permettent notamment davoir une vue densemble sur les relations
entre les suspects, leurs activits, les moyens utiliss et les cibles.
Processus
de
lanalyse
criminelle
15
R l e s d e l a v i s u a l i s a t i o n d a n s l e p r o c e s s u s
La visualisation est lun des supports externes dvelopps par lhomme pour augmenter ses
capacits cognitives (Norman, 1993) (Scaife & Rogers, 1996). Elle sert de mmoire et de
support de raisonnement, au mme titre que tous les autres supports (texte, bande son, etc.).
Lune des raisons pour lesquelles les reprsentations graphiques sont si utiles, est que
lhumain prouve des difficults traiter mentalement des problmes complexes. Les
reprsentations graphiques facilitent la rsolution de problmes en offrant une mmoire
vive externe (une mmoire court terme permettant de stocker linformation pendant un
raisonnement). Par exemple, des visualisations peuvent tre exploites au cours dune enqute
pour regrouper et synthtiser lensemble des informations collectes. Lenquteur peut ainsi
se remmorer rapidement les lments pertinents aprs une absence ou lorsquil doit prparer
une sance. Au tribunal, une reprsentation peut galement tre exploite pour regrouper en
un seul document un ensemble de donnes, souvent stockes dans une masse importante de
4
Voir notamment le logiciel TextChart de la socit i2 : http://www.i2group.com/us/products--services/analysis-
product-line/textchart (dernier accs le 26 aot 2010)
16
Analyse
criminelle
et
visualisation
rapports, procs-verbaux, etc. La visualisation sert alors de support commode vitant les
efforts de mmorisation et facilitant la vue densemble (Bertin, 2005).
En effet, la visualisation est particulirement efficace par rapport une prsentation textuelle,
pour diverses raisons. Dans un texte, les informations sont disperses sur plusieurs pages, ce
qui rend la vision globale des donnes difficile. Linformation est structure squentiellement
plutt que simultanment (en parallle), rendant difficile la comparaison de plusieurs
variables. Une reprsentation visuelle est en revanche perue selon des processus parallles,
qui facilitent la vue densemble (Ware, 2004) (Atzenbeck et al., 2009a). Une reprsentation
adquate facilite la comparaison, la dtection de diffrences, lidentification de rgularits et
de tendances, ainsi que la dtection danomalies (Miles & Huberman, 1994) (Scaife & Rogers,
1996). Elle peut donc avoir un rle cl lors de ltape danalyse.
Comme dj mentionn, il est gnralement reconnu que la visualisation peut tre exploite
pour raisonner et communiquer (Card et al., 1999) (Chen et al., 2008). Certains auteurs font la
distinction entre lanalyse et lexploration des donnes. Lanalyse est considre comme
lvaluation dhypothses identifies, alors que lexploration vise la gnration dhypothses et
la recherche de connaissances sans ide a priori. Les termes danalyse exploratoire et danalyse
confirmatoire sont galement employs (Anselin & Getis, 1992). La visualisation est exploite
dans de nombreux domaines de connaissances o ces deux objectifs gnraux sont reconnus.
Processus
de
lanalyse
criminelle
17
discut), quun graphique prsent quelques secondes au journal tlvis. Le public, son
attention, ses intrts, le moyen de communication et le temps de lecture disponible sont
autant de paramtres influenant le choix dune mthode de visualisation dans un objectif de
communication efficace (produire leffet voulu). En effet, la visualisation offre des perspectives
de communication trs intressantes dans le domaine de la rhtorique et, notamment,
lorsquil sagit de convaincre (de la qualit dun produit, de la pertinence dun propos, etc.). En
se basant sur des effets de perception connus, la visualisation peut tre exploite afin de
tronquer ou modifier la ralit des informations reprsentes. Des effets de design peuvent
galement tre exploits afin daccroitre une certaine attractivit, notamment lorsque la
visualisation est exploite des fins mdiatiques, politiques ou commerciales.
Dans son exploitation policire et judiciaire, la visualisation doit toutefois tre intgre. Elle ne
doit pas biaiser linformation initiale. En effet, les dcisions prises sur la base de visualisations,
peuvent avoir un impact important (notamment au niveau judiciaire) ou engendrer des cots
non ngligeables en termes de ressources et de temps (par exemple, lorsquil sagit de mettre
sur pied des oprations policires ou des mesures de prvention). Les reprsentations
graphiques se doivent donc dtre efficaces et intgres (Tufte, 2001). Elles doivent faciliter la
communication et plus particulirement lapprhension des renseignements en reprsentant la
ralit des informations sans ajouter des biais.
Confirmer: l'analyse confirmatoire vise tester les hypothses dfinies. Elle sert de base la
prise de dcision. Lobjectif est de dtecter les lments confirmant ou non les hypothses
labores.
18
Analyse
criminelle
et
visualisation
Le tableau prsent ci-contre couvre une grande proportion des objectifs tels quils ont pu
tre formaliss dans la littrature. Cette classification distingue les objectifs cognitifs attendus
et les manires de les atteindre par le biais de processus interactifs. Une telle formalisation
permet, notamment, de dfinir des protocoles d'valuation. En effet, les visualisations peuvent
ainsi tre testes en fonction de leurs possibilits, avantages et faiblesses pour la rsolution
dun objectif particulier. Bien que les types d'interactivits puissent tre varis est classifis de
manires plus ou moins hirarchises, le formalisme des niveaux de lecture5 propos par
Bertin (2005) a t choisi pour les classifier.
En conclusion, les rles de la visualisation dcrits dans cette section sont gnriques et
indpendants du problme reprsent et du contexte dexploitation. La section suivante
rsume les diverses formes danalyse dfinies dans la littrature afin de prsenter les diffrents
contextes dexploitation possible de la visualisation des fins de renseignement.
5
Alors quil y a autant de types de questions que de composantes (temporelle, spatiale, etc.) dans une information,
trois niveaux de lecture sont possibles : le niveau lmentaire de questionnement qui porte sur un lment
particulier ( quel moment? quel date?), le niveau intermdiaire qui porte sur un groupe dlments (pour une telle
zone, dans une telle priode que sest-il pass?) et le niveau global qui porte sur lensemble des lments analyss
(quelle est lvolution gnrale?).
Processus
de
lanalyse
criminelle
19
Classification
synthtisant
les
formalisations
de:
(Bertin,
2005),
(Wehrend
&
Lewis,
1990),
(Shneiderman,
1996),
(Tweedie,
1997),
(Pfitzner
et
al.,
2003),
(Amar
et
al.,
2005),
(Senator,
2005)
et
(Lee
et
al.,
2006).
20
Analyse
criminelle
et
visualisation
R e n s e i g n e m e n t
e t
f o r m e s
d a n a l y s e
Le renseignement peut se dcomposer selon diverses perspectives. Dune part, en fonction de
la finalit de lanalyse, telle que la comprhension dun phnomne criminel afin de mettre en
uvre des mesures de luttes ou dvelopper de stratgies de prvention. Dautre part, en
regard des informations analyses comme lanalyse financire ou lanalyse de donnes de
facturation tlphonique par exemple. Diverses formes danalyse ont ainsi t dfinies dans la
littrature et reprises dans les manuels et modles nationaux. Les produits de renseignement
labors sont souvent accompagns de reprsentations graphiques adaptes pour rpondre
lobjectif danalyse et dfinies en fonction de la nature des donnes traites.
Certaines formes de visualisation apparaissent a priori plus adaptes pour certaines formes
danalyse (tel que suggr dans le guide sur lanalyse criminelle dInterpol (Interpol, 1997)). A
titre dexemple, lanalyse dun phnomne criminel est souvent accompagne dune carte
gographique reprsentant ltendue du phnomne. Lanalyse dun rseau criminel seffectue
galement en exploitant une reprsentation des relations et des rles des protagonistes. Afin
de discuter cette hypothse, les classifications dfinies en analyse criminelle sont prsentes. Il
est globalement admis que le renseignement peut se dcomposer en deux formes
principales :
Le renseignement stratgique fournit une vision long terme de l'volution d'un problme
de scurit. Les valuations stratgiques doivent permettre d'valuer les risques, prvoir
l'volution venir du problme et dfinir des stratgies et des priorits de lutte (en terme de
prvention et de rpression) (NCIS, 2000) (NCPE, 2005). Elles permettent galement
l'identification de lacunes combler en matire de renseignement. En effet, lanalyse aboutit
parfois la conclusion quil manque des informations, que les processus et fonctionnements
organisationnels sont inadapts et quil est ncessaire de repenser laction de renseignement.
Renseignement
et
formes
danalyse
21
techniques exploites ont rapidement t identifies comme efficaces et utiles pour traiter les
affaires dites complexes. Lanalyse criminelle ntant que peu ou pas du tout enseigne aux
enquteurs, le mtier danalyste criminel oprationnel sest dvelopp en tant que fonction de
soutien linvestigation criminelle. Cette dnomination engendre de la confusion entre le rle
de soutien lenqute et la fonction de renseignement criminel oprationnel. Le terme
danalyse criminelle tactique est parfois utilis pour faire cette distinction. Toutefois, il est
exploit par certains auteurs et dans certains pays pour dcrire la fonction de renseignement
oprationnel ou le soutien lenqute judiciaire.
Bien que le processus de lenqute vise la rsolution de cas et la prsentation des preuves
des fins judiciaires, les informations collectes par lenquteur, notamment lors des auditions,
sont exploitables pour des objectifs plus globaux de comprhension de lactivit criminelle. A
titre dexemples, des lments informatifs sur la structure et lorganisation des groupes
criminels, sur les motivations et les processus de recel sont des informations prcieuses des
fins de renseignement oprationnel, voire stratgique.
22
Analyse
criminelle
et
visualisation
Renseignement
et
formes
danalyse
23
Stratgique Oprationnel
Les formes dfinies dans la littrature anglo-saxonne sont nombreuses et leur classification
hirarchise nest pas vidente. Elles se distinguent et se recoupent selon diverses dimensions.
Une reprsentation a t labore pour regrouper ces formes danalyses et les contextualiser.
Elles sont organises au sein de cinq types gnraux et positionnes en fonction des relations
quelles entretiennent entre elles. Ces relations ne sont pas explicites sur le schma, car elles
sont trop nombreuses et surchargeraient la reprsentation. Une brve description de chaque
forme danalyse est incluse.
24
Analyse
criminelle
et
visualisation
La
position
des
formes
Crime
Intelligence
analysis
Criminal
Investigative
danalyses
sur
le
plan
nest
analysis
Activity-Flow
analysis
Bank-Record
analysis
pas
rigoureuse.
Elle
soutient
Modus
operandi
la
contextualisation
des
Investigative
analysis
Commodity-flow
a.
termes.
Content
analysis
Physical,
behavioral
and
psychological
Financial
analysis
profile
of
suspect
Communication
a.
Pattern
detection
and
identification
to
Target Profile analysis Oral and written communication discover a criminal activity
Analyse
de
profil
Police
Operations
analysis
spcifique
Operations
analysis
Geographic
profiling
Case
analysis
Needs
and
U ses
of
internal
ressources
Prioritize
suspect
investigations
based
on
the
geographic
distribution
of
serial
crimes
Analyse
denqute
Visual-Investigative
a.
Criminal
Business
Steps
taken
in
the
course
o f
an
Profile
investigation
How
criminal
work
and
choose
victims
Renseignement
et
formes
danalyse
25
(Gottlieb
et
al.,
1994)
:
Crime
analysis:
From
first
report
to
final
arrest
(Interpol,
1997)
:
Guide
sur
l'analyse
criminelle
(NCIS,
2000)
:
The
National
Intelligence
Model
(NIM)
(Peterson
et
al.,
2000)
:
Intelligence
2000:
Revising
the
Basic
Elements;
A
Guide
for
Intelligence
Professionals
(IALEIA,
2004):
Law
Enforcement
Analytic
Standards
(reprend
les
dfinitions
du
NIM
compltes
par
dautres
formes
danalyses)
(Paulsen
et
al.,
2010):
Tactical
Crime
Analysis:
Research
and
Investigation
spot
analysis
and
general
profile
analysis
Market
Profiles
Risk
analysis
Statistical
analysis
Survey
of
criminal
market
around
a
particular
commodity
Assess
the
scale
o f
risks
Review
of
n umerical
data
to
summarize
Association
analysis
Indicator
analysis
Analyse
de
profil
Network
analysis
gnral
Review
of
p ast
criminal
activity
to
Significance
of
links
and
roles
develop
models
to
prevention
purpose
Criminal
Business
Analyse
de
groupe
Profiles
dauteurs
Operations,
techniques,
victims,
etc.
Administrative
Operational
Results
analysis
Analyse
de
mthode
Intelligence
gnrale
assessment
Evaluate
effectiveness
of
activities
analysis
Real
time
evaluation
of
all
incoming
Administrative
data
to
set
priorities
analysis
Resource
Allocation
Departmental
and
Budgeting
Planning
activities
Nice
to
know
stuff
26
Analyse
criminelle
et
visualisation
A n a l y s e , p r o f i l e t p a t t e r n
Un vocabulaire rcurrent se dgage des formes de lanalyse criminelle. En effet, les termes de
profil et de pattern sont largement utiliss pour dcrire ce qui semble tre des produits de
lanalyse. Les deux notions sont discutes ici afin de clarifier la manire dont elles seront
utilises dans cette thse. Par ailleurs, la reconstruction dun profil et la dtection de patterns
sont des tches rcurrentes de lanalyse criminelle qui peuvent tre facilites par lutilisation
de reprsentation graphiques. Cet aspect est brivement introduit en fin de section.
En analyse criminelle, le terme de pattern est gnralement utilis pour dcrire un ensemble
de cas. Le terme de profil quant lui est principalement exploit pour dcrire un auteur ou un
groupe dauteurs. Ces nuances terminologiques apparaissent comme le rsultat de la
dcomposition du domaine en deux communauts : les analystes du crime et les analystes du
criminel. De manire plus gnrale, ces deux termes dcrivent toutefois des concepts
diffrents. Le terme de pattern a notamment un double sens quil sagira de ne pas confondre.
Un pattern dcrit un schma rcurrent ou une structure particulire. Il sera toutefois
galement utilis dans cette thse pour dcrire une solution adapte pour un problme
rcurrent de conception7 (en loccurrence, pour llaboration dune reprsentation graphique
utile pour un problme danalyse rcurrent).
Un profil peut se dfinir comme la description dun ensemble de similitudes observes entre
des personnes ou des objets. Il peut tre utilis pour identifier ou reprsenter un individu ou
un groupe (Ribaux, 2008). En matire danalyse comparative de cas, un profil dcrit un
ensemble dvnements pouvant tre de deux types : les sries et les groupes (Ribaux, 1997).
Une srie dcrit un regroupement de cas dont les similitudes permettent dinfrer un auteur
ou un groupe dauteurs commun, voire une cause commune en matire de scurit (par
exemple, dans le cas de lanalyse dune srie dincendies) (Ribaux & Margot, 2008). La notion
de groupe est plus gnrale. Un groupe est un sous-ensemble de cas partageant certaines
similitudes (spatio-temporelle, mode opratoire, cible, butin, etc.). Un profil peut tre
spcifique une dimension danalyse ou en inclure plusieurs (profil gographique ou profil
spatio-temporel par exemple). Lorsque lanalyse porte sur un auteur ou un groupe dauteurs,
le profil dcrit un ensemble de traits caractristiques de lauteur ou de son activit : profils
psychologiques, gographiques, etc. Dans le domaine forensique, un profil chimique ou
physique reprsente un ensemble de composs ou de caractristiques identifis et quantifis.
Il apparat que dans tous ces usages, le profil est le rsultat dun processus de reconstruction.
7
Cf. Patterns de visualisation relationnelle, page 144.
Renseignement
et
formes
danalyse
27
Les lments constitutifs du profil sont slectionns et valus selon leur pouvoir
discriminatoire (leur capacit distinguer). Ils dfinissent la spcificit du profil.
Dans le processus danalyse, un pattern peut tre dtect ou tre exploit comme infrence
lorsquil a t formalis (Senator, 2005). Dun point de vue cognitif, un pattern dcrit une
connaissance a priori exploite pour interprter et catgoriser de nouvelles observations
(Mennis et al., 2000). Lanalyste infre quune observation fait partie dun pattern lorsquil
observe des caractristiques constitutives de la dfinition du pattern. Un pattern est donc une
construction, un ensemble de relations quil est ncessaire de dtecter. Une relation est le
rsultat de lobservation dune correspondance, dune similarit ou dune rgularit
particulire par exemple. Le processus danalyse englobe le processus de dtection de pattern
et la comparaison dune nouvelle information avec un pattern connu. Tel que dcrit
prcdemment dans la section Rles de la visualisation dans le processus , les termes
danalyse exploratoire (ou analyse base sur les donnes) et danalyse confirmatoire (ou
analyse base sur un modle) sont parfois utiliss pour dcrire ces deux processus (Anselin &
Getis, 1992).
Les notions de profil, de pattern et de relations sont donc fortement lies. Un profil se
distingue toutefois dun pattern par sa complexit intrinsque et sa valeur informationnelle. Il
peut dcrire un ensemble de relations et de concepts varis. Le profil dcrit un groupe dont la
28
Analyse
criminelle
et
visualisation
spcificit est suffisante pour tre pertinente en termes danalyse de la criminalit. Lobjectif
est dobtenir la meilleure reprsentation possible du groupe dfini. La construction dun profil
est une infrence en elle-mme (Ribaux & Margot, 1999), mais sa spcificit peut galement
conduire infrer lidentit. Cest le cas, par exemple, dun ensemble de loci formant un profil
ADN. Dans cette thse, lorsque le niveau de spcificit dun profil permet dinfrer une source
commune ou un type de source commun, le terme de relation est utilis (p. ex. les relations
ADN, les relations selon le motif de trace de semelles, etc.). Le terme de pattern est exploit
dans son sens de description dune certaine forme de rgularit.
Diverses formes de reprsentation peuvent tre exploites pour reprsenter des profils, des
patterns ou des relations8. Par exemple, les diagrammes coordonnes parallles (prsents
dans lannexe un) ont t invents spcifiquement pour lanalyse globale dun ensemble de
variables (comme le temps, le lieu, le type de cible, etc.) pour identifier des profils particuliers.
La description gnrale dun mode opratoire ou le profil dune activit criminelle particulire
peuvent tre reprsents par des schmas dactivits. Par ailleurs, des rgularits spatiales
peuvent tre dtectes en exploitant des cartes. Lors de la reprsentation de transactions
financires par un schma de flux, des mcanismes financiers rcurrents (des patterns)
peuvent tre dtects. Finalement, les relations identifies entre les membres dun rseau
criminel sont gnralement reprsentes au moyen dun schma relationnel qui facilite la
comprhension de la structure du rseau et la formulation dhypothses sur les rles de
chaque protagoniste. Des formes de visualisation particulire peuvent donc tre exploites
pour reprsenter des relations particulires, pour dtecter des patterns, voire des profils.
8
Les diffrents types de reprsentation sont prsents dans la section suivante et dans lannexe un.
Renseignement
et
formes
danalyse
29
A n a l y s e s e l o n l e t y p e d e d o n n e s
Lobjectif danalyse est intimement li la nature du problme abord. Les formes danalyse se
dcomposent dailleurs en fonction du type de donnes trait. Lensemble des modles
classifient lanalyse selon quelle traite des infractions, des personnes ou des mthodes.
Lanalyse des mthodes (analyse denqute, doprations) ne traite pas directement de
lactivit criminelle, mais de la rponse policire. Cette forme danalyse traite des questions
lies lallocation et lefficience des ressources, afin dvaluer et dfinir de nouvelles stratgies
organisationnelles ou de nouvelles mesures policire (Bruce, 2009). En tant quobjet de
renseignement, la mthode policire ne fait pas partie de lanalyse de la criminalit.
La dcomposition de lanalyse criminelle selon quelle porte sur les cas ou sur les auteurs a t
largement discute dans la littrature (Ratcliffe, 2008) (Bruce, 2009). Il ressort de ces
discussions que les comptences et processus de ces deux formes gnrales se rejoignent. Les
diffrences se situent au niveau des objectifs et des missions danalyse. Les structures
policires et les stratgies daction de scurit mises en uvre influencent notamment la
dfinition de ceux-ci. Aux Etats-Unis, The Crime Analyst tudie les vnements criminels
afin de dtecter des patterns permettant de dfinir des stratgies de prvention et des
mesures de suppression ou de perturbation de la criminalit. The Criminal Intelligence
Analyst tudie les organisations criminelles afin de soutenir le processus de linvestigation
criminelle (Bruce, 2009). Cette dcomposition reflte un choix stratgique national important.
Linvestigation criminelle est choisie comme mesure de lutte prioritaire lors de crimes graves.
Alors que les rponses policires face aux dlits sriels lis aux infractions contre le patrimoine
sont prventives ou axes sur la rsolution de problmes : Local crime analysis identifies the location
of crime problems, criminal targets and vulnerable victims to prevent and reduce crime, while investigative analysis
assists with solving and the prosecution of offenders by providing information for presentation at court (Cope,
2003). Lanalyse criminelle sintgre donc dans un contexte complexe qui a influenc la
dfinition des formes danalyse. Comme en tmoigne le diagramme prsent prcdemment,
limage globale actuelle de ces diffrentes formes est difficilement structurable.
Dautres formes danalyse sont dfinies selon la nature des problmes de scurit traits. Cest
le cas par exemple, de lanalyse financire criminelle : L'analyse Financire Criminelle (AFC) est un
ensemble de mthodes techniques et d'outils appliqus l'investigation conomique et financire. Elle consiste
principalement l'exploration, l'analyse et l'exploitation de donnes, d'origines et de nature diffrentes, destine
donner une reprsentation spatio-temporelle, des liens existant et de rapprochement entre des entits et des
faits. (AGIS, 2004) En suivant ce modle, il serait alors possible de dfinir dautres types
danalyse, tels que lanalyse criminelle des dlits contre le patrimoine, de la criminalit
30
Analyse
criminelle
et
visualisation
organise, des dlits contre lintgrit corporelle, ou encore lanalyse criminelle de trafics de
stupfiants. Toutes ces formes danalyse ont une ralit, mais une telle dcomposition ne
semble pas adquate pour classifier les mthodes exploites. En effet, les mthodes et
techniques ne se diffrencient pas forcment en fonction du sujet trait. Des formes de
reprsentation particulires sont effectivement plus utiles pour certains problmes spcifiques.
A titre dexemples, un schma de flux permet de reprsenter un trafic de stupfiants et un
schma dvnements est exploit pour reprsenter une srie de cambriolage. Une telle
classification est utile afin de structurer des connaissances particulires lies la dmarche et
lexploitation des techniques pour des situations danalyses spcifiques. Toutefois, il est
reconnu que ces formes danalyse ne permettent pas de classifier les mthodes et techniques
de lanalyse criminelle de manire globale (Bruce, 2009). En effet, les mthodes de traitement,
de gestion et de reprsentation des informations sont exploites de faon transversale. Un
schma relationnel peut notamment tre utilis pour reprsenter les relations existantes entre
des vnements, mais galement pour reprsenter un rseau criminel. Une classification plus
globale des formes danalyse est ncessaire afin de guider les choix effectuer en matire de
visualisation.
D i m e n s i o n s
d a n a l y s e
e t
f o r m e s
d e
v i s u a l i s a t i o n
Lobjectif de cette section est de proposer une dcomposition des formes danalyse utile pour
slectionner une mthode de visualisation adapte en vue de rsoudre les questions poses.
Certains auteurs suggrent que le choix dun graphique est essentiellement dtermin par la
nature des donnes et parfois par lobjectif de la prsentation (Pattyn & Dickens, 2001).
Lapproche dcrite ici, quant elle, part dune dcomposition de lobjectif danalyse selon une
ou plusieurs dimensions dominantes pour dterminer le type de reprsentation concevoir.
Dans le domaine de lanalyse criminelle, la dfinition des dimensions danalyse est visiblement
une tche difficile :
Event visualization can be defined as the visual representation of spatial, temporal and other dimensions of
events... Events involving more than one dimension frequently occur because humans often handle multiple event
dimensions concurrently with their various senses. These events require powerful visualization capabilities to
display various dimensions (e.g., space, time, person, event aggregation). (Chung et al., 2005)
Dimensions
danalyse
et
formes
de
visualisation
31
Typical crime data will have either a geographical nature, and/or contain a large number of features, and/or
involve networks of offenders. Types of technologies relevant to these different aspects are: geocoded data, large
feature sets, offender networks. (Oatley et al., 2006)
Il est intressant de noter que les analystes spcialiss dans lanalyse de rseaux criminels ne
dfinissent pas le temps comme une dimension dominante (le modle de lIALEIA (Peterson et
al., 2000) ne dcrit pas formellement de temporal analysis). La notion de dominance semble
tre une des cls de dcomposition. Une dimension est juge comme dominante si elle
impose les plus fortes contraintes sur lanalyse (Mennis et al., 2000). Par exemple, si lanalyse
porte sur la distribution gographique dun phnomne criminel pour une priode donne, la
dimension spatiale est la dimension dominante (ou principale). En effet, dans cet exemple, le
temps est invariant (une seule priode). En revanche, si la question porte sur la chronologie
des vnements, le temps devient alors la dimension dominante.
Dfinir formellement la dimension relationnelle nest pas une tche facile. Afin de tenter de
lexpliciter pour le domaine de lanalyse criminelle, les diffrents types de rgularits dtectes
dans cette dimension sont dcrits. Rachelle Boba dfinit sept types de patterns principaux
32
Analyse
criminelle
et
visualisation
(Boba, 2009): la srie9, le spree (ensemble de cas perptrs sur une priode trs courte par
un individu ou un groupe spcifique ; plus spcifique quune srie qui peut durer sur une
priode plus ou moins longue), la multi-victimisation (dun mme individu ou dun ensemble
de victimes partageant des caractristiques communes), la rcidive (auteur ou groupe
dauteurs), le Hot spot (point chaud : lieu spcifique ou rgion peu tendue o un nombre
inhabituel de cas est observ sur une courte priode), la Hot target (types de lieu, de cible
frquemment touchs) et le Hot product (type de bien frquemment cibl par un type de
criminalit). Les formes de rgularits formalises ne sont pas mutuellement exclusives et elles
intgrent plusieurs dimensions (notamment les dimensions spatiales et temporelles). Les
rgularits sont galement recherches parmi les attributs des auteurs, des cibles (victimes et
objets) et des lieux (pas seulement au niveau de leurs positionnements gographiques, mais
galement de leurs spcificits). Cette dcomposition rejoint le formalisme du problem
analysis triangle 10 (Felson & Clarke, 1998) (Eck, 2003).
Lie
teu
Une quatrime dimension dominante semble ncessaire pour classifier les mthodes de
visualisation de manire efficace en regard des types de questionnements : la composante
quantitative. En effet, de nombreuses questions sont du type : quel est le nombre de . Sil
fallait illustrer graphiquement ce propos, il ne serait pas ncessaire de chercher une
visualisation de type relationnelle, spatiale ou temporelle. Un nombre important de
visualisation a t spcifiquement dvelopp pour lanalyse quantitative. Il est vrai que le
dnombrement est trs frquemment mis en regard dune dimension complmentaire : quel
est le nombre de cas par rgion, quel est lvolution temporelle du nombre de victime, etc.
Dans ces cas, se pose invitablement la question de la dominance : quelle est la dimension
principale ? Mais les questions de type combien sont nanmoins frquentes et impliquent
des reprsentations propres.
9
Cf. Analyse, profil et pattern, page 26
10
http://www.popcenter.org/about/?p=triangle, dernier accs le 7 septembre 2010
Dimensions
danalyse
et
formes
de
visualisation
33
D i m e n s i o n s d a n a l y s e
Les questions danalyse semblent pouvoir se dcomposer selon quatre dimensions principales.
Cest--dire quatre composantes dans lesquelles la variabilit est observe et qui sont
rcurrentes dans les questions danalyse.
La dimension spatiale couvre les questions lies lanalyse dune distribution gographique.
Lespace est la composante principale de lanalyse. Les rponses aux questions poses
doivent se chercher dans la variabilit spatiale : o, dans quelle rgion, selon quel parcours,
quelle tendue gographique, etc.
La dimension relationnelle couvre les questions lies lanalyse des relations entre les
entits pertinentes, telles que les vnements, les personnes, les objets et les traces. La
relation est la composante principale de lanalyse. Les rponses aux questions poses doivent
se chercher dans la variabilit relationnelle : qui, quoi, entre qui, entre quoi, avec quoi, etc.
Pour chaque dimension, des reprsentations spcifiques sont exploites. Cette dcomposition
selon quatre formes de questionnement principales permet de classifier et tudier les diverses
formes de reprsentation exploitables en analyse criminelle. En effet, les formes de
reprsentation classifies dans les recherches sur la visualisation rejoignent ces dimensions.
Elles sont prsentes dans la section suivante.
34
Analyse
criminelle
et
visualisation
F o r m e s d e v i s u a l i s a t i o n
Selon Bertin (2005), on ne saurait analyser un systme de signes sans le dlimiter strictement :
la graphique recouvre lunivers des rseaux, celui des diagrammes, et lunivers des
cartes.
- Les rseaux sont des constructions bases sur la reprsentation de sommets relis par des
artes. Selon Bertin (explicitation libre de la dfinition), une visualisation est un rseau
lorsque tous les lments dune des dimensions reprsentes sur le plan peuvent tre en
relation. Ils offrent donc une libert dexpressivit, pour une dimension donne,
suprieure aux autres formes de graphique. Ils font lobjet dtudes approfondies
subsquentes aux travaux de Bertin. En analyse criminelle, il est dusage de parler de
schmas relationnels lorsque des rseaux sont labors pour effectuer des analyses dans
la dimension relationnelle.
Cette classification tripartite des mthodes de visualisation propose par Bertin (2005) est la
seule taxonomie trouve dans la littrature qui est uniquement base sur la reprsentation
graphique et qui permet une classification simple. En effet, les autres classifications (voir
Dimensions
danalyse
et
formes
de
visualisation
35
notamment (Lohse et al., 1994), (Card & Mackinlay, 1997) et (Card et al., 1999)) dcrivent des
classes en fonction de la nature des donnes, des tches accomplir, ou proposent des sous-
catgories de la taxonomie de Bertin. Les icnes et les images sont parfois galement
considres comme des mthodes de visualisation (Lohse et al., 1994).
http://www.wikiviz.org/wiki/Techniques (Wikiviz)
Wiki cr et maintenu par Riccardo Mazza, professeur l'Institute of Innovative Technologies
at the University of Applied Sciences of Southern Switzerland. Les reprsentations sont
classifies en sept catgories: donnes uni-, bi- et tri-varies, donnes multi-varies, donnes
temporelles, donnes spatiales, donnes hirarchiques, rseaux et donnes textuelles.
11
URL : mots-cls Google (premier rsultat), (Derniers accs pour lensemble des sites, le 01 septembre 2009)
36
Analyse
criminelle
et
visualisation
permet de dcouvrir des exemples pour chaque catgorie. Alors que les dtails de cette
taxonomie ne seront pas discuts ici, il est intressant de relever l'objectif dfini pour ce
projet. Les auteurs proposent une taxonomie permettant au lecteur d'identifier rapidement
une mthode adapte pour une tche particulire dans un domaine d'activit dfini (le
management). Cette taxonomie, principalement axe sur la mtaphore graphique employe,
combine des classifications lies la nature des donnes et aux tches effectuer.
Cette thse se focalise sur les reprsentations de lanalyse relationnelle. Elle est prsente dans
la section suivante. Les dimensions temporelle, spatiale et quantitative et leurs formes de
reprsentations respectives sont prsentes dans lannexe un.
A n a l y s e
e t
v i s u a l i s a t i o n
r e l a t i o n n e l l e
Lanalyse relationnelle est centrale en analyse criminelle. Elle consiste en la dtection, la
compilation et linterprtation des informations afin didentifier la prsence de relations entre
des entits dintrts (p. ex. des personnes, des vnements, des vhicules, des socits, etc.)
(Harper & Harris, 1975) (Schroeder et al., 2007) (Heuer & Pherson, 2010). Elles permettent de
rechercher et de poser des propositions telles que, quelle est la source de cette trace, qui a
tlphon avec qui, etc. Lorsque beaucoup de relations sont en jeu dans une affaire, il devient
videmment utile de les visualiser. Alors que certains auteurs dfinissent lanalyse relationnelle
comme le processus didentification et dextraction des entits et relations au sein des
donnes collectes (Pottenger et al., 2007), le terme danalyse relationnelle est gnralement
exploit en analyse criminelle pour dcrire lexploitation de reprsentations relationnelles
des fins danalyse. Le terme de visualisation relationnelle semble plus adapt dans ce sens.
Analyse
et
visualisation
relationnelle
37
identifiable12 (littralement Chen dfinit lentit comme une chose pouvant tre distinctement
identifie) (Chen, 1976). Les entits sont regroupes par type dans des classes, telles que les
personnes, les traces, les moyens de communications, etc. Les termes de type et classe seront
utiliss comme synonyme. Un type dcrit le prdicat est un . Par exemple John Doe est
une entit de la classe personnes .
Ltape didentification des entits constitue lune des tapes les plus accaparantes du
processus de lanalyse relationnelle. Un domaine de connaissances est notamment souvent
dcrit comme un ensemble de relations entre des entits quil a t possible de nommer. La
notion dentit nomme (Named entity) fait rfrence ltape de raisonnement utilise pour
dfinir la relation entre une observation (une valeur, un objet) et son type (sa catgorie, sa
classe). Cette tape concentre un nombre important de recherches et defforts afin dextraire
des entits nommes au sein de donnes textuelles non structures (Mennis et al., 2000) (Chen
et al., 2003) (Kolda et al., 2004) (Schroeder et al., 2007) et (Pottenger et al., 2007).
En matire danalyse criminelle, lanalyse relationnelle est trs souvent dcrite comme lanalyse
de relations entre des entits nommes :
Link analysis: this type of diagram displays the associations between different entities, which may be a person,
vehicle, organisation, telephone number etc. It will also show the flow of commodities such as money or
property. (Adderley & Musgrove, 2001) p.106
Link analysis puts information about the relationships among entities individuals, organizations, locations and
so on into a graphic format and context that will clarify relationships and aid in inference development. (UNODC,
2002) p.29
There are four types of searches available to the user: person, vehicle, incident and location. The system can
automatically identify relationships among Person, Organization, Location, Vehicle, and Incident and Crime
type. (Chen et al., 2003) p.30
Link analysis by visualizing associations between entities and events. Typically, the entities of interest include:
places, organisations, facilities, individuals, components, documents, money, weapons, vehicles, drugs.
(Mena, 2003) p.80
In crime analysis, it is often useful to identify the relationships among different entities such as people, vehicles,
addresses, organizations, etc. (Xiang et al., 2005) p.70
Link diagrams, showing the connections between people, places, events, and things, are invaluable tools in these
domains. (Senator, 2005) p.80
Relational data about world-wide terrorist events is available, as well as ontologies describing the organization of
this data. (Barthlemy et al., 2005) p.97
Through link analysis, investigators draw, lay out, and link people, facts, locations, events, objects, and data in
hopes of discovering key trends, patterns, and insights. (Wong et al., 2006) p.67
In law enforcement, intelligence analysts often refer to nodes and links in a criminal network as entities and
relationships. The entities may be criminals, organisations, vehicles, weapons or bank accounts. The
relationships between the entities specify how these entities are associated together. (Oatley et al., 2006) p.66
12
http://www.merriam-webster.com/dictionary/entity, dernier accs le 4 avril 2001
38
Analyse
criminelle
et
visualisation
We developed a model for organizing local data into a network of annotated relationships between people,
vehicles, and locations. (Marshall et al., 2008) p.14
We already applied Jigsaw to explore connections between people, places, and organizations in the Bible. (Stasko
et al., 2008) p.127
Using such tools it is possible to extract entities (such as people, places, dates, and organizations) from the
evidence and relate them to each other through time lines or other relation schemes. These tools thus provide the
analysts with a visual overview of the case at hand and the connections between various types of entities. (van den
Braak, 2010) p.5
The essence of a criminal investigation, therefore, may be summarised as the study of actual and potential time
dependent relationships between people, organisations, objects, places and events that may be associated with
criminal activity in order to model and reason about possible patterns of activity. (Maller, 1996) p. 94
people
places
ce
ur
so
Documents
source
reports
links
vehicles
etc.
so
u rce
cases
De cette revue bibliographique, il ressort que des types dentits sont gnralement dcrits. Ils
correspondent aux types dentits sur lesquels portent les investigations : des vnements, des
personnes, des socits, des objets, des vhicules, des lieux, des traces, etc. Il est trs
intressant de relever que la description de types de relations est plus gnrale. A lexception
des relations de types spatio-temporelles, aucun autre type de relation nest clairement dfini.
La diversit de la nature des relations pose alors la question de la dfinition de types
gnriques. Une dmarche de classification en diffrents types de relation ne pourrait-elle pas
aider dfinir la manire de les reprsenter ?
Analyse
et
visualisation
relationnelle
39
Par ailleurs, les schmas relationnels exploits visent rpondre des problmes danalyse.
Ces questionnements sont souvent exprims au travers dexemples spcifiques :
- Quelles sont les relations existantes ou absentes entre les individus ? (Harper & Harris, 1975) (Schroeder et
al., 2007)
- Qui est la personne centrale dune organisation ? (Harper & Harris, 1975) (Sparrow, 1991) (UNODC, 2002)
(Mena, 2003)
- Quelle est la frquence des relations ? (UNODC, 2002)
- Quelles sont les relations entre les identits des individus (les alias) ? (Sparrow, 1991) (UNODC, 2002)
(Mena, 2003)
- Quelle est la structure hirarchie dun groupe criminel ? (Harper & Harris, 1975) (UNODC, 2002) (Senator,
2005) (Xu & Chen, 2005)
- Quelles sont les personnes les plus importantes dun trafic (dont la suppression limpact le plus
perturbant sur le rseau) ? (Sparrow, 1991) (UNODC, 2002) (Mena, 2003)
- Quel est le rle de chaque individu dans lorganisation ? (Sparrow, 1991) (UNODC, 2002) (Xu & Chen,
2005)
- Quel individu fait office de pont entre les membres de lorganisation ? (UNODC, 2002)
- Quel est le chemin (ensemble de relations indirectes) entre deux individus ? (Schroeder et al., 2007)
- Existe-t-il des sous-rseaux dans un rseau complexe ? (Mena, 2003) (Xu & Chen, 2005)
- Quels sont les relations entre les sous-rseaux ? (Xu & Chen, 2005)
- Existe-t-il des relations ou des entits caches ? (Mena, 2003)
- Quels sont les rles des individus pour chaque vnement ? (Senator, 2005) (Schroeder et al., 2007)
- Quelles sont les cooccurrences dvnements entre des individus ? (Schroeder et al., 2007)
- Quelles sont les rgularits ou les anomalies observes dans un flux financier ? (Sparrow, 1991)
- Quelles sont les communications tlphoniques les plus pertinentes et utiles surveiller ? (Sparrow, 1991)
(UNODC, 2002)
- Quelles sont les relations de causalit entre les observations ? (Bex et al., 2003)
- Quels patterns relationnels sont observables et en quoi permettent-ils de comprendre un comportement
particulier ? (UNODC, 2002)
Une terminologie riche existe pour dcrire les reprsentations associes lanalyse
relationnelle. On parle parfois dun schma relationnel, dun rseau, dun arbre, dun
diagramme ou dun graphique relationnel, ou encore dune carte smantique ou conceptuelle.
Ces formes de reprsentation sont modlises en mathmatiques par la thorie des graphes
qui remonterait aux travaux de Leonhard Euler en 173514. Un graphe est une reprsentation
abstraite dun ensemble dobjets (des sommets), dont certaines paires sont relies par des
liens (des artes). La dimension mathmatique nest pas aborde dans cette thse qui traite
uniquement de la dimension visuelle des graphes. En mathmatique, les artes dun graphe ne
peuvent relier que deux sommets. Dun point de vue purement visuel, cette limitation nest pas
forcment souhaitable. Les schmas tudis dans cette recherche sont donc parfois des
13
Cf.
Annexe 1: Dimensions danalyse et visualisation, page 233
14
http://www.math.dartmouth.edu/~euler/pages/E053.html, dernier accs le 16 aot 2010
40
Analyse
criminelle
et
visualisation
hypergraphes (graphes o les artes peuvent lier plusieurs nuds), au sens mathmatique.
Dans le cadre de cette thse, nous assimilerons les schmas relationnels des rseaux ou
des graphes.
Lapproche manuelle initie la fin des annes soixante aux Etats-Unis par le programme
Anacapa (http://www.anacapasciences.com/, dernier accs le 13 septembre 2010) (Harper &
Harris, 1975) et dcrit par Morris dans son livre The Crime Analysis Charting (Morris, 1986)
se base sur la cration dune matrice reprsentant les relations entre les personnes qui
apparaissent dans laffaire. Un schma relationnel est ensuite produit sur la base de cette
matrice. Lapproche manuelle est encore utilise, mais les graphes sont produits en utilisant
des logiciels spcialiss qui permettent dtendre les attributs graphiques exploitables (icnes,
couleurs, paisseur des
traits, etc.). Initialement, la
mthode reposait sur une
reprsentation simplifie
de cercles (les personnes),
de traits (les relations) et
de cadres (les groupes :
organisations criminelles et
entreprises) (Harper &
Harris, 1975) (Sparrow,
1991).
Harper et Harris (1975) rfrencent des exploitations antrieures de schmas relationnels dans
le domaine de lingnierie o ils sont notamment utiliss pour reprsenter des processus de
Analyse
et
visualisation
relationnelle
41
fabrication. En fait, lexploitation de graphes pour reprsenter les informations dune enqute,
se retrouve dj dans les travaux de John Henry Wigmore (1863-1943) (Wigmore, 1913). La
mthode de Wigmore appele argument diagram et un rsum des travaux rcents bass
sur sa mthode sont prsents dans lannexe deux.
La seconde gnration de techniques est base sur lutilisation de logiciels. Par le biais dun
filtre dimportation, les donnes structures sous la forme de tableaux sont visualises par des
graphes. Certains auteurs relvent le fait que ces approches se basent sur les capacits des
utilisateurs identifier les entits et les relations et quelles ne permettent pas de rsoudre le
problme de la surcharge dinformations (Schroeder et al., 2007). De plus, il est observ
lusage que la conception de telle reprsentation ncessite beaucoup de temps (Innes et al.,
2005). En effet, les visualisations relationnelles semblent bien fonctionner lorsque le nombre
dobservations (vnements, personnes, etc.) reprsentes est limit (Mena, 2003). Des
approches parallles ont t dveloppes pour analyser et reprsenter des graphes de
grandes tailles, comme lamlioration des algorithmes de placement des nuds, le
dveloppement de nouvelles mthodes dinteractions (en matire dinterface) et lexploitation
de reprsentations en trois dimensions. Laxe de cette recherche est diffrent et ces aspects du
domaine ne seront pas abords plus en dtails. Les reprsentations en trois dimensions ont
t exclues pour des raisons qui sont dtailles en annexe15. Selon Klerks (2001) ces outils
noffrent que peu de perspectives en termes danalyse et il prconise lexploitation des rseaux
sociaux en tant quapproche de troisime gnration.
Lapproche des rseaux sociaux dvelopps dans le domaine de la sociologie se base sur la
combinaison de la visualisation par les graphes afin de reprsenter les relations entre des
personnes et le calcul de mesures mathmatiques. Ces mesures, associes aux entits des
graphes, dcrivent notamment la centralit dune entit au sein du rseau ou limportance
relative de chaque entit dans le rseau. Ltude de lapplication des rseaux sociaux en
analyse criminelle est un domaine mergeant depuis une vingtaine dannes notamment en
matire de criminalit organise (Sparrow, 1991) (Klerks & Smeets, 2001) (Chen et al., 2005)
(Xu & Chen, 2005). Ces mesures mathmatiques sont exploites afin de pallier les difficults
rencontres pour analyser des rseaux complexes et particulirement lorsque la taille des
graphes ne permet plus une analyse visuelle suffisante. Cet aspect du domaine nest pas
abord dans cette thse. En effet, cette recherche porte sur les aspects visuels de la
reprsentation.
15
Cf.
Annexe 3 : Visualisation tridimensionnelle, page 259
42
Analyse
criminelle
et
visualisation
Les schmas
relationnels
(forme gnrique)
Schmas reprsentant les relations entre des entits personnes, vnements, traces, objets,
lieux afin de clarifier les relations, faciliter les raisonnements et faciliter la communication.
Les schmas de
flux
Schmas reprsentant les flux de marchandises, financiers ou tlphoniques (par des flches)
entre les entits personnes, comptes et tlphones reprsentes par les sommets.
Les schmas
dactivit
Analyse
et
visualisation
relationnelle
43
Les formes de reprsentation ci-dessous sont des adaptations des schmas relationnels qui
intgrent la composante temporelle. Ces formes de reprsentation sont probablement issues
de visualisations dveloppes dans les annes cinquante : les diagrammes de PERT et CPM16.
Les schmas
dvnements
Schmas reprsentant la squence et les relations des vnements qui sont positionns
chronologiquement. Une brve description des vnements est incluse pour chaque nud.
Les liens reprsentent les relations entre les vnements et dautres entits (personnes, traces,
vhicules, etc.).
Les schmas
chronologiques
Ces schmas sont identiques aux schmas dvnements, mais les entits lies (personnes,
traces, vhicules, etc.) ne sont pas reprsentes. Lobjectif est de prsenter une squence
dvnements prcis sur le mme modle que les schmas dactivits, en intgrant la
dimension temporelle. Les flches et les positions des nuds dfinissent la squence.
16
Cf. Annexe 1: Dimensions danalyse et visualisation Analyse temporelle, page 246
44
Analyse
criminelle
et
visualisation
Les schmas de
flux
temporels
Schmas bass sur une dfinition des types de nud et de lien identique aux schmas de flux.
Le temps est reprsent sur laxe horizontal.
Sur un graph, la dimension quantitative est gnralement reprsente selon deux variables
visuelles principales : lpaisseur des liens et la taille
des entits (ex. paisseur des arcs proportionnelle au
nombre de relations ou une variable quantitative,
taille des cercles proportionnelle au nombre dautres
sommets lis).
Des formes de reprsentation relationnelle intgrant la dimension spatiale ne sont pas dfinies
dans les manuels du domaine. Pourtant, de telles reprsentations sont exploites depuis le
milieu du dix-neuvime sicle17. Labsence de ces reprsentations dans les manuels
professionnels peut probablement sexpliquer par labsence doutils informatiques permettant
leur laboration de manire facile ou automatise.
17
Cf. Annexe 1: Dimensions danalyse et visualisation - Analyse spatiale, page 255
Analyse
et
visualisation
relationnelle
45
R e c o m m a n d a t i o n s e t s t a n d a r d s
E n t i t s
- Les symboles doivent tre simples et comprhensibles. Les symboles ne doivent pas
prter confusion et ne doivent pas tre interprts de faon trop littrale. (Interpol,
1997) (Fedpol, 2010)
L i e n s
- Trois types de liens sont ncessaires : lien fort (sr), faible (incertain) et aucun lien
(Harper & Harris, 1975)
- Reprsenter les liens confirms par une ligne pleine et les liens non confirms par une
ligne de pointills. (Harper & Harris, 1975) (Morris, 1986) (Interpol, 1997) (UNODC,
2002) (Mena, 2003) (Fedpol, 2010)
- Les relations non qualifies (sans label) portent confusion. (Fedpol, 2010)
- Limiter lusage des liens directionnels la reprsentation de flux dargent ou de
marchandises et les appels tlphoniques. (Fedpol, 2010)
C a d r e s
- Les organisations sont reprsentes par des cadres. (Harper & Harris, 1975) (Morris,
1986) (Morris, 1986) (Interpol, 1997) (UNODC, 2002) (Mena, 2003) (Mowbray, 2009)
(Fedpol, 2010)
- Lutilisation de cadres pour reprsenter des entreprises est possible, mais quand le
nombre de personnes et dentreprises est grand, il est recommand dutiliser des
icnes. (Mena, 2003) (Fedpol, 2010)
- Les cadres peuvent tre utiliss pour reprsenter des pays, dans ce cas il est
recommand de positionner les cadres en fonction de la position gographique des
pays. (Fedpol, 2010)
46
Analyse
criminelle
et
visualisation
C o u l e u r s
- Exploiter la couleur pour diffrencier des types de liens et dentits. (Interpol, 1997)
(Senator, 2005) (Fedpol, 2010)
- Toujours utiliser la mme couleur pour certains processus dans un mme graphique.
(Fedpol, 2010)
- Lutilisation des couleurs et des icnes est libre. Une convention doit tre utilise au
sein dune mme agence. (Mowbray, 2009)
S t r u c t u r e
A u t r e s
Ces recommandations dcrivent des lments mthodologiques et des conseils bass sur la
pratique. Le niveau de gnralit des recommandations est variable. En outre, aucun des
ouvrages ne prsente ces recommandations dans un cadre clairement formalis, mais plutt
sous la forme de listes.
Conclusion
47
C o n c l u s i o n
Le processus systmatique de lanalyse criminelle nintgre pas formellement une tape de
visualisation de linformation. La dcomposition en cinq tapes prsente (acquisition,
intgration, reprsentation, analyse et communication) permet de clarifier les rles de la
visualisation dans la mthode: (1) faciliter la mmorisation en regroupant de faon synthtique
et simplifie les informations pertinentes, (2) soutenir le processus dexploration des
informations et faciliter la dcouverte de nouvelles connaissances, (3) soutenir le processus de
validation des hypothses par la dtection des lments les confirmant ou non, (4) faciliter la
communication et lapprhension par les dcideurs comptents du renseignement produit.
Les schmas relationnels exploits dans les enqutes judiciaires ont t choisis comme sujet
dtude pour les raisons suivantes. Premirement, les questions danalyse sont souvent
exprimes au travers dexemples spcifiques, alors que des cadres conceptuels ont t plus
clairement formaliss pour dcrire les autres dimensions. Deuximement, la diversit de la
nature des entits et des relations investigues lors de lenqute pose la question de la
dfinition de types gnriques. Une dmarche de classification en diffrents types de relation
ne pourrait-elle pas aider dfinir la manire de les reprsenter ? Finalement, les
recommandations dfinies dans la littrature et les manuels de bonnes pratiques ne sont pas
intgres dans une dmarche de conception des schmas relationnels clairement formalise.
E x p l o i t a t i o n s
p o u r
l e n q u t e
j u d i c i a i r e
Lobjectif de ce chapitre est de dcrire le contexte dexploitation de la visualisation dune part
pour lenqute judiciaire et dautre part pour le jugement. Les objectifs danalyse qui guident
le choix dune visualisation et les contraintes imposes par ce contexte sur la reprsentation
de linformation sont explicits.
Le terme danalyse criminelle oprationnelle (ACO) se dfinit, en Suisse, par son champ
dapplication dans le processus denqute et de jugement (Fedpol, 2010). Les tapes du
processus judicaire impliquent diffrents acteurs dont les besoins sont variables. La
visualisation est donc exploite de diverses manires selon les objectifs dfinis par les
participants du processus judiciaire. Kind relve que les produits du renseignement doivent
tre labors daprs les choix et besoins des destinataires (Kind, 1990). Une reprsentation
graphique peut notamment tre exploite afin de regrouper les informations dune
investigation, de faciliter la communication au sein dune quipe denquteurs ou comme
support lors dune plaidoirie au tribunal (Marshall et al., 2008).
E n q u t e
P r o c e s s u s
d e
l e n q u t e
e t
o b j e c t i f s
d a n a l y s e
Enqute
49
dans un processus de structuration des indices, afin dtablir un dossier qui sera transmis au
tribunal. Finalement, lenqute se termine par la mise en accusation du prvenu et lvaluation
de sa culpabilit qui aboutit son jugement. Brodeur dcompose lenqute initie par la
constatation dune infraction selon un processus qui rejoint le paradigme de Kind (Brodeur,
2005b). Il dfinit lenqute didentification comme premire partie du processus dont lobjectif
est didentifier lauteur du crime . Lenqute de localisation subsquente vise larrestation
du suspect. Finalement la structuration et la prsentation de la preuve (ou plutt des indices)
visent la mise en accusation et la condamnation. Simms et Petersen (Simms & Petersen, 1991)
dcomposent le processus denqute en trois tapes : la dtection dinfractions ou de
suspects, la reconstruction des circonstances de lactivit et la rsolution du problme en
reliant le(s) suspect(s) lactivit. Lenqute peut en effet tre initie sur la base dinformations
sur un suspect (Simms & Petersen, 1991) (Atkin, 1998) (Brodeur, 2005b), par exemple,
lorsquun informateur fournit des renseignements sur une possible activit dlictueuse en
matire de stupfiants dun individu ou lorsquune socit est suspecte dune activit illgale.
Dans ces situations, lobjectif initial de lenqute nest pas didentifier un suspect, mais bien de
lier un suspect une activit.
Condamnation
Lors de la premire phase, le raisonnement est principalement inductif (ou plus prcisment
abductif) (Harper & Harris, 1975) (Kind, 1987) (Kind, 1994). Lenquteur recherche les causes
des effets quil observe. Selon Atkin (1998), la premire question qui devrait tre formule,
lorsquune enqute dbute sur un cas, est quelles sont les conditions qui peuvent expliquer
la commission du crime ? ; pourquoi maintenant et ici, pourquoi cette cible et pourquoi
cette manire de procder en se plaant dans la perspective des choix de lauteur et des
raisons sous-jacentes ses choix. La dmarche dinvestigation suit le questionnement
50
Exploitations
pour
lenqute
judiciaire
Quintilien. Lorsque lenqute dmarre par un suspect, les questionnements sont par exemple :
quelles relations le suspect entretient-il avec dautres individus et quels sont les activits
imputables. Lobjectif premier de lenqute est de relier un suspect une activit (Atkin, 1998).
Pour atteindre cet objectif, lenquteur raisonne galement par analogie en valuant un
nouveau cas en regard de cas prcdemment connus et traits (Ribaux & Margot, 2003). Un
bon enquteur construit son exprience en se basant sur ses expriences quotidiennes et sur
le sens commun (Kind, 1987) (Kind, 1994). Il cherche comprendre et reconstruire lactivit
passe en variant le plus possible les points de vue sur les informations quil collecte (Kind,
1992). Il cherche identifier et comprendre les relations existantes entre des vnements, des
personnes, des vhicules et des socits. Maintenir une vision holistique des informations
collectes en regroupant les diverses sources dinformation constitue lun des principes
essentiels la base du processus de lanalyse criminelle (Aepli et al., 2011). Des
reprsentations graphiques peuvent alors tre conues pour regrouper lensemble des
informations collectes et mettre en vidence des relations afin de reconstruire et comprendre
une activit criminelle.
Lors de la phase initiale de lenqute, une ou plusieurs pistes peuvent tre privilgies au
dtriment dhypothses alternatives. En effet, les limitations des capacits cognitives humaines
conduisent mettre en uvre des stratgies de simplification afin de prendre des dcisions
(Heuer, 1999). Des biais tels que leffet tunnel, de confirmation (renforcement) et de la pense
de groupe peuvent conduire un groupe denquteurs se focaliser sur une hypothse
particulire et influencer la collecte et lanalyse des informations pour la confirmer. Lanalyste
criminel apporte une mthode de travail qui vise minimiser ces biais. En effet, ltape
danalyse survient volontairement tardivement dans le processus (aprs les tapes
dacquisition, dintgration et de reprsentation) afin de minimiser les hypothses htives et
pour baser les raisonnements sur lensemble des informations (Aepli et al., 2011).
Abductif
Dductif Raisonnements
Hypothtico-dductif
Enqute
51
denqute, voire den dtecter dautres (Carillo, 2010). Dans les premires phases denqutes,
le nombre de pistes et dhypothses formules pour identifier les causes des effets observs
sont plus nombreuses quen fin de processus. Ces rflexions conduisent dcider des mesures
prendre pour tester ces hypothses, telles que la mise sous surveillance dun individu,
laudition de tmoins, lanalyse dune trace, voir lapprhension ou larrestation dun suspect.
Chacune de ces mesures des consquences importantes (en particulier les mesures de
contraintes). Elles ncessitent des changes permanents entre enquteurs, forensiciens,
analystes criminels et magistrats. La visualisation peut alors tre exploite pour structurer les
lments pertinents pour la prise de dcision et faciliter la communication entre les acteurs du
processus. Un schma relationnel peut par exemple mettre en perspective les traces
matrielles collectes en fonction des lieux de prlvement et des rsultats danalyse afin de
choisir sur quelles traces des analyses complmentaires vont tre entreprises. Un schma
reprsentant les communications tlphoniques effectues par un suspect peut conduire la
dtection dun numro sur lequel des contrles pourraient tre effectus (de lidentification de
son dtenteur la mise sous coute par exemple).
En fin denqute le raisonnement et principalement dductif. Les indices collects sont valus
en regard des hypothses retenues. Lacceptation des risques derreur diminue galement au
fil du processus, pour aboutir une valuation au-del de tout doute raisonnable de la
culpabilit lors du jugement (Brodeur, 2005b).
Hypothses
Dngation des risques Risques
Les visualisations produites au cours de lenqute doivent donc soutenir ces formes de
raisonnement et aider rduire les risques derreur. En raison de limpact des dcisions prises
en cours denqute, lanalyse effectue se doit dtre la plus objective possible. Les
reprsentations graphiques exploites doivent donc tre de qualit. Elles doivent faciliter
lanalyse et elles doivent tre intgres par rapport aux donnes collectes. Idalement, aucun
biais ne doit tre engendr par leur utilisation.
52
Exploitations
pour
lenqute
judiciaire
I n t g r a t i o n
d e
l a n a l y s e
c r i m i n e l l e
o p r a t i o n n e l l e
Intgr
Spcialiste
ACO Autonome
Enquteur
L a n a l y s t e c r i m i n e l s p c i a l i s t e
La premire approche consiste considrer lanalyse criminelle comme une discipline part
entire. Des spcialistes viennent ainsi soutenir les enquteurs. Lanalyste peut alors tre
intgr directement dans lquipe denqute ou travailler de manire autonome sur le cas.
Lorsque que celui-ci travaille de faon autonome, il est charg dlaborer des scnarios
alternatifs non identifis. Il value les indices afin de dtecter de nouvelles pistes denqute ou
didentifier des informations manquantes. Il aboutit la prsentation des indices afin
dapporter de nouvelles connaissances utiles prise de dcisions, telle que prendre des
nouvelles mesures denqute. Le processus de travail de lanalyste se dcompose alors en trois
tapes : la reconstruction, lvaluation et la communication de scnarios pouvant expliquer
lactivit criminelle observe. Des schmas de scnarios18 peuvent notamment tre exploits
pour confronter diverses versions et confronter les indices collects (van den Braak, 2010).
Lanalyste criminel prend, dans une certaine mesure, un rle dvaluateur. Il traite
18
Cf. Annexe 2 : Schmas de scnarios, page 256
Enqute
53
gnralement laffaire a posteriori et joue le rle de lavocat du diable . Il est cens apporter
un regard neuf en suivant une dmarche adapte, afin didentifier des lacunes dans lenqute
et apporter de nouvelles hypothses. Une telle dmarche dintgration de lanalyste criminel
dans lenqute judicaire induit toutefois un nombre important de frustrations ; tant pour
lenquteur qui voit son travail valu, que pour lanalyste qui a le sentiment darriver aprs
la bataille . En effet, un tel processus dvaluation est gnralement effectu sur des affaires
complexes, ayant impliqu un nombre important de mesures denqute. Le temps ncessaire
la lecture des informations collectes, leurs intgrations dans un systme de gestion, voire la
cration de visualisations facilitant lanalyse, est gnralement long. Les renseignements
produits par lanalyste peuvent alors perdre en validit dans la mesure o de nouveaux actes
denqutes ne sont plus forcment possibles.
Une autre approche consiste intgrer lanalyste criminel directement au cours de lenqute.
Lanalyste endosse alors un rle de soutien linvestigation. Lanalyste offre ses comptences
en matire de traitement, de gestion et de visualisation des informations au service des
enquteurs. Intgr, ds les phases initiales de lenqute, lanalyste peut entreprendre
llaboration de divers produits (tableaux, banque de donnes, reprsentations graphiques,
etc.) pour soutenir les tches des enquteurs et linvestigation dans son ensemble (Peterson,
1998). Les analystes engags dans les services de police sont souvent des employs civils ne
disposant pas dune formation policire (Peterson, 1998). Lanalyste civil bien que disposant
des comptences en matire de gestion de linformation, ne possde parfois pas lexprience
ou la formation suffisante pour assimiler tous les tenants et aboutissants de linvestigation
criminelle. Lanalyste doit alors accepter limage de navet quil gnre. Une certaine
incomprhension, voire des problmes de communication peuvent donc survenir entre
lanalyste et lenquteur. Ces difficults peuvent galement tre renforces par un sentiment
de ne pas appartenir la mme communaut (civile ou policire). Les visualisations produites
par lanalyste peuvent galement gnrer un sentiment de frustration chez lenquteur. En
effet, une reprsentation synthtique et efficace peut tre apprcie et mise en valeur, au
dtriment de lensemble des tches accomplies lors de linvestigation. La visualisation, de par
sa nature rendre explicite et comprhensible les informations, cache souvent lensemble dun
processus complexe. Globalement, il faut constater que le processus dintgration de lanalyste
criminel dans linvestigation nest pas trivial (Peterson, 1998). Selon Atkin (1998), la
collaboration entre analyste et enquteur sur une mme affaire reste un compromis idal.
Lexprience de lenquteur base sur les cas prcdemment traits contrebalance le regard
externe objectif (dans le sens o il est absent de connaissances a priori) de lanalyste.
54
Exploitations
pour
lenqute
judiciaire
L e n q u t e u r a n a l y s t e
Jugement
55
J u g e m e n t
Pendant trs longtemps, lanalyse criminelle est reste trs prudente dans ses relations
directes avec les magistrats. Ceux-ci sont nanmoins de plus en plus demandeur. Ce
mouvement rcent tend le champ dapplication de lanalyse criminelle et pose des questions
nouvelles. Les produits de renseignement labors en cours denqute peuvent en effet se voir
intgrer comme pices du dossier, au risque de voir de nouvelles difficults apparatre. A titre
dexemple, lors de la phase initiale de lenqute, des hypothses formules sur limplication de
suspects peuvent avoir t intgre sur des schmas de travail. Alors mme que ces pistes
denqute peuvent tre cartes en fin denqute, la prsence de ces hypothses dans le
dossier peut mettre en difficult lanalyste lors du jugement. Une rticence persiste donc sur
lintgration des produits de lanalyse dans le dossier de justice. Celle-ci semble nanmoins se
justifier pour plusieurs raisons dcrites dans cette section. Les contraintes imposes par le
contexte judiciaire sur lutilisation de reprsentations graphiques sont galement dcrites.
O b j e c t i f s d a n a l y s e
Le magistrat souhaitera qualifier les infractions en regard des lois. Il sagira donc de connatre
les lments pertinents et ncessaires pour cette tche, afin de les inclure dans les produits de
lanalyse. Par exemple, le prix de vente est un lment capital afin destimer si un acheteur
pouvait raisonnablement se douter quil faisait lacquisition dune contrefaon ou du butin
dun vol. Dans les phases initiales de lenqute, une telle question ne sera certainement pas
juge primordiale pour reconstruire la structure dun trafic (en identifiant ses protagonistes et
en valuant leurs rles respectifs, par exemple). Un analyste nest ni un juriste, ni un enquteur.
Il na donc pas ncessairement les connaissances suffisantes (ou la sensibilit) pour identifier
lensemble des paramtres dimportance pour la rsolution dune affaire. Dans la situation
prcite, limportance du prix est certainement vidente. Toutefois, les paramtres
dimportance pour une qualification pnale ne sont pas forcment vidents matriser. Ces
dimensions doivent donc tre discutes et explicites ds lintgration dun analyste dans
linvestigation criminelle. Il est du ressort de lanalyste de sassurer quil a bien compris les
56
Exploitations
pour
lenqute
judiciaire
objectifs et les dimensions dimportance pour la poursuite pnale. Ces dimensions tant, du
point de vue du magistrat instructeur et de lenquteur, certainement des vidences.
Du point de vue du procureur et des avocats, lanalyse criminelle est souvent perue comme
une mthode de linvestigation (Peterson, 1998). Toutefois, les produits de lanalyse et plus
particulirement les reprsentations graphiques peuvent galement tre exploits lors du
jugement. En effet, la visualisation peut jouer un rle important en facilitant la comprhension
dune affaire dite complexe. Morris relve (1993) quune affaire juge complexe lors de
linvestigation sera certainement presque impossible apprhender lors du jugement
(notamment par le jury). Il souligne alors limportance dexploiter des reprsentations
graphiques pour soutenir lenqute, mais galement faciliter la comprhension du dossier.
C o n t r a i n t e s i m p o s e s s u r l e s v i s u a l i s a t i o n s
En droit amricain (Joseph, 2006), les schmas (croquis), diagrammes, et graphes qui sont
impartiaux et pertinents sont admissibles. Ils servent faciliter la comprhension des
questions traites par la cour. La recevabilit est apprcie par la cour. Ils sont rejets en cas
dabus avr. Les reprsentations visuelles sont classifies en deux catgories : les
reprsentations but illustratif (ne sont pas recevables en tant que preuve, mais utilises des
fins pdagogiques et de comprhension, leur usage est la discrtion de la cour) et les
reprsentations recevables en tant qulment de preuve de fond (substantive evidence).
Visant tablir un fait, elles doivent satisfaire les critres de recevabilit.
Les reprsentations illustratives peuvent tre utilises par tout tmoin afin dillustrer, de
clarifier et de visualiser son tmoignage. A des fins illustratives, une reprsentation ne doit pas
forcment tre exacte dans ces moindres dtails. Des croquis sont notamment exploitables
pour autant quils facilitent la comprhension du propos par le jury. Le juge peut dcider de
refuser une reprsentation si elle engendre de la confusion, quelle induit en erreur ou que les
lments reprsents sont trop simples (la rendant ainsi superflue et inutile). Mme si la
Jugement
57
reprsentation nest pas recevable en tant que preuve (par exemple lorsque les sources
dinformations reprsentes ne sont pas suffisamment documentes), elle peut tre prsente
des fins illustratives dans la mesure o une explication initiale est effectue (sur la nature des
donnes reprsentes et lusage illustratif, de comprhension).
Lusage de reprsentations graphiques en tant que preuve est dfini dans la Federal Rule of
Evidence 1006 : The contents of voluminous writings, recordings, or photographs which cannot conveniently
be examined in court may be presented in the form of a chart, summary, or calculation, the originals, or duplicates,
shall be made available for examination or copying, or both, by the other parties at reasonable time and place. The
court may order that they be produced in court.
Les reprsentations dont lexactitude et la prcision sont juges insuffisantes ou qui prtent
confusion peuvent tre rejetes. Labsence de donnes volumineuses sous-jacentes la
reprsentation est rarement un critre accept pour rejeter une reprsentation (Joseph, 2006).
De plus, il est possible dexploiter des reprsentations rsumant les faits. Dans des affaires
complexes, la tendance est clairement daccepter ce genre de reprsentations (Joseph, 2006).
Des reprsentations rsumant uniquement les lments charge (ou dcharge) peuvent
mme tre utilises pour autant quelles ne soient pas prsentes comme rsumant
lensemble des lments de preuve. Les conditions dadmissibilit de ces reprsentations
simplificatrices (de synthse) sont dfinies en regard de la Federal Rule of Evidence 611(a)19 : la
dure du procs, la complexit de laffaire, et la confusion engendres par un nombre
19
The court shall exercise reasonable control over the mode and order of interrogating witnesses and presenting
evidence so as to:
1. make the interrogation and presentation effective for the ascertainment of the truth,
2. avoid needless consumption of time, and
3. protect witnesses from harassment or undue embarrassment.
58
Exploitations
pour
lenqute
judiciaire
important dinformations (Joseph, 2006). Le jury doit galement tre inform sur la manire
dapprhender le schma.
C o n c l u s i o n
En regard du processus judiciaire, la visualisation peut tre exploite pour soutenir un nombre
importants dobjectifs, tels quanalyser des informations collectes au cours de lenqute,
valuer a posteriori une investigation, aider qualifier les infractions, faciliter lapprhension
dun dossier et soutenir une argumentation lors du procs. Lexploitation des graphes pour
valuer les hypothses alternatives formules en cours denqute et lors du procs fait lobjet
de recherches spcifiques qui ont abouti la formalisation de langages graphiques spcifiques
facilitant la comparaison de scnarios. En amont, ils sont galement utiliss pour soutenir
lanalyse des donnes collectes et le dveloppement dhypothses.
Bien que les observations effectues soutiennent probablement dans une certaine mesure
lensemble de ces objectifs, les problmes analyss et les gnralisations proposes se basent
en quasi-totalit sur des exemples rels dutilisation de la visualisation au cours de lenqute
judiciaire. Les problmes abords et les solutions proposes traitent principalement dune
exploitation au cours de lenqute pour faciliter lanalyse des informations collectes. Dans
une large mesure, les problmes investigus portent plus particulirement sur lanalyse des
traces. Lusage des schmas relationnels est notamment tudi dans une perspective de
renseignement forensique.
M t h o d e s
d v a l u a t i o n
d e
v i s u a l i s a t i o n s
Notre premier objectif est dvaluer quelques pratiques en matire de visualisation. Nous
souponnons que ces pratiques sont disparates et que les schmas produits sont plus ou
moins bons . Que veut dire plus ou moins bons dans ce contexte ? Les critres qui
permettent de dfinir et dvaluer la qualit dune reprsentation doivent tre dcrits. Par
ailleurs, les mthodes dvaluation empiriques dveloppes pour valuer des visualisations
sont galement prsentes.
Lorsquune reprsentation est exploite pour raisonner sur des informations, elle se doit dtre
intgre : elle doit reprsenter la ralit des informations sous-jacentes sans ajouter des biais
visuels qui peuvent fausser les observations. Par exemple, lorsque des informations
quantitatives sont reprsentes par des diffrences de tailles (de barres, de symboles ou
dicnes), celles-ci doivent tre proportionnelles aux variations observes au sein des donnes.
Une visualisation est intgre lorsquelle est claire, dtaille, documente et quelle nengendre
pas dambigut (Tufte, 2001). Bertin souligne limportance du caractre monosmique de la
graphique en tant que condition sine qua non de lintgrit :
60
Mthodes
dvaluation
de
visualisations
Groupe A Groupe B
Critres
dvaluation
61
Mackinlay dfinit le critre dexpressivit: un ensemble de faits est bien exprim dans un langage
visuel si les phrases (c.--d. les lments de reprsentation) du langage expriment la totalit des faits et
uniquement les faits contenus dans les donnes (traduction libre) (Mackinlay, 1986). Cette notion
dexpressivit rejoint les notions dintgrit dfinie par Tufte (2001) et de rationalit dfinie
par Bertin (2005). En analyse criminelle, la monosmie dune reprsentation est capitale. En
effet, une mauvaise interprtation peut avoir des consquences importantes, notamment lors
du jugement. Une reprsentation qui engendre un biais de perception, qui induit des
ambiguts ou qui peut tre interprte de plus manire ne satisfait pas le critre
dexpressivit. Celle-ci est alors considre comme moins bonne quune reprsentation
respectant ce principe. Plusieurs reprsentations intgres peuvent toutefois tre produites
pour reprsenter une mme situation. Quels sont alors les critres permettant de comparer et
valuer leurs qualits ?
C r i t r e s
d v a l u a t i o n
Au-del de la monosmie si une reprsentation est intgre, son efficacit nest pas pour
autant dmontre. Pour certains, lefficacit est atteinte lorsque la visualisation produit leffet
attendu ou lorsquelle permet de persuader (Besson, 2004). Cette vision est probablement
pertinente dans les domaines artistiques et certainement pour une exploitation rhtorique de
la visualisation (journalisme, publicit, etc.). Elle nest toutefois pas adapte pour dcrire ce
que lon attend dune reprsentation graphique des fins danalyse. En effet, privilgier
lefficacit en termes deffet de persuasion peut tre au dtriment de la condition sine qua non
dintgrit.
Une visualisation est plus efficace quune autre, si les informations transmises sont plus
facilement perues. Lefficacit est donc notamment dpendante des capacits du lecteur
(Mackinlay, 1986). Lefficacit se dfinit alors ainsi :
Si, pour obtenir une rponse correcte et complte une question donne et toutes choses
gales, une construction requiert un temps de perception plus court quune autre
construction, on dira quelle est plus efficace pour cette question. (Bertin, 2005)
Bertin relve galement que la graphique est un outil rationnel et efficace lorsque les
proprits de la perception visuelle sont pleinement employes (Bertin, 2005). Cette observation
62
Mthodes
dvaluation
de
visualisations
Cette dfinition permet de dfinir clairement les indicateurs comparer pour valuer
lefficacit dune reprsentation : lexactitude et la compltude de la rponse, ainsi que le
temps ncessaire pour y rpondre. Le nombre total de rponses correctes pour une tche
particulire est un indice de lefficacit. Combin au temps de rponse, il permet dvaluer
lefficience (Chen & Yu, 2000) (Xu & Chen, 2005).
Ces mesures de performance sont communment exploites. Elles permettent de quantifier
limpact dun choix de visualisation (p. ex. par le nombre derreurs), mais les raisons des
diffrences observes ne sont pas pour autant toujours explicites. Dautres indicateurs
peuvent tre exploits de faon complmentaire (Huang et al., 2008) :
- Les questionnaires : des indicateurs dmographiques complmentaires sont relevs
(ge, sexe, niveau de formation, etc.). Des indicateurs subjectifs peuvent galement
tre mesurs : tel le niveau de satisfaction ou la prfrence pour raliser la tche.
- Le suivi du regard (eye tracking) : laide de camras, le processus cognitif est dtaill
en enregistrant les mouvements oculaires. Lobjectif est de comprendre comment le
lecteur parcourt le schma.
- Leffort mental : le lecteur doit valuer la reprsentation en utilisant une chelle
verbale. Une chelle neuf niveaux (1. effort mental trs trs faible 9. effort mental
extrmement lev) est propose par Paas (Paas et al., 2003) (Tuovinen & Paas, 2004).
Procdures
dvaluation
63
P r o c d u r e s
d v a l u a t i o n
En se basant sur une tude mene sur une cinquantaine dvaluations empiriques, Plaisant
classifie quatre procdures distinctes (Plaisant, 2004) :
- les exprimentations contrles comparant des transpositions graphiques : par
exemple, la couleur est-elle plus efficace que la forme pour encoder une variable
quantitative ?
- les exprimentations contrles comparant des formes de reprsentation : lobjectif de
ces valuations consiste comparer plusieurs types de reprsentations diffrents (un
histogramme, un diagramme circulaire, etc.) et dvaluer leur efficacit pour accomplir
des tches particulires (comparer des valeurs quantitatives, retrouver une information,
comparer des proportions, etc.)
- les valuations de lutilisabilit (ou de lergonomie) : les solutions dveloppes sont
testes par des utilisateurs qui fournissent un feedback sur les problmes rencontrs et
les amliorations apporter
- les tudes de cas : lobjectif consiste exploiter la solution dans une situation relle,
dans un environnement oprationnel. Les possibilits dexploitation pour rsoudre des
problmes rels sont alors illustres (afin de montrer la faisabilit et lutilit). Induire
des principes gnraux sur la base dtudes de cas ncessite toutefois un nombre
important dexploitations dans des contextes varis.
Une autre approche consiste poser des questions ouvertes, ncessitant danalyser le
problme pos en fonction de connaissances spcifiques lies au domaine (valuation base
sur la comprhension / insight-based evaluation). Le lecteur interprte ainsi la visualisation
selon ses propres choix et les exprime librement. Une telle dmarche engendre des difficults
pour catgoriser les rsultats, mais offre une perspective dvaluation de la comprhension de
la reprsentation et de son impact sur les raisonnements (North, 2006) (Carpendale, 2008).
64
Mthodes
dvaluation
de
visualisations
Des taxonomies de tches valuer sont proposes par (Ghoniem et al., 2005), (Shneiderman
& Aris, 2006) et (Lee et al., 2006) pour valuer des graphes. La lisibilit de la reprsentation est
value en fonction des performances de recherche de linformation:
- tches lies aux caractristiques des sommets : estimer le nombre total de sommets,
identifier le sommet li au plus grand (ou petit) nombre de sommets, retrouver un
sommet particulier partir de son label
- tches lies aux caractristiques des liens : estimer le nombre total de liens, retrouver
un voisin commun entre plusieurs sommets, trouver lexistence dun chemin entre deux
sommets, identifier le chemin le plus court, retrouver les sommets lis par un type
spcifique de lien, retrouver le sommet central
- tches lies aux caractristiques des sous-graphes : retrouver un sous-graphe
particulier, retrouver les sommets lis un sommet ou un groupe de sommets,
retrouver des groupes de sommets fortement relis (des cliques).
Par analogie, les schmas relationnels labors en analyse criminelle peuvent tre valus par
des tches similaires. Sur un schma reprsentant des communications tlphoniques, il est
frquent de chercher identifier des numros en relations avec des numros spcifiques
(retrouver un voisin commun entre plusieurs sommets). Lors de lanalyse dun trafic de
marchandise, la dtection des intermdiaires entre deux individus particuliers est galement
une question rcurrente afin de comprendre la structure dun rseau (trouver lexistence dun
chemin entre deux sommets). Lefficacit dune visualisation est donc value pour des tches
spcifiques et ne saurait tre dmontre globalement.
E v a l u a t i o n s
p r l i m i n a i r e s
Tel que relev prcdemment, nous souponnons que les visualisations produites dans la
pratique de lanalyse criminelle oprationnelle sont disparates. Des valuations prliminaires
ont t effectues avec des praticiens et des tudiants afin de tester cette hypothse.
D i s p a r i t s
d e
r e p r s e n t a t i o n
Les trois exemples ci-dessous illustrent la variabilit observe lorsquil est demand
diffrentes personnes de produire des reprsentations relationnelles. Les deux premiers
exemples se basent sur la reprsentation dune information sommaire (une phrase), afin de
montrer la variabilit dans des situations simples. Le troisime exemple est tir dun exercice
de reprsentation bas sur une affaire complte. Lobjectif est de montrer laide dindicateur
objectifs (nombre dentits, de liens, structures des schmas, etc.) ltendue des variations
observes sur une affaire relle. Limpact des choix de reprsentation sur lanalyse et la
communication est discut dans la section suivante.
R e p r s e n t a t i o n d u n s c n a r i o s i m p l e
Lors dun examen thorique sur lanalyse criminelle oprationnelle, une des questions poses
consiste dessiner un schma relationnel partir du scnario suivant :
66
Evaluations
prliminaires
Pour cette illustration, soixante rsultats dtudiants ont t tudis. La question a galement
t pose six analystes (six collgues travaillant comme analyste criminel oprationnel, au
sein dune police).
Sur les 66 participants, il a t relev 48 schmas diffrents pour reprsenter la mme phrase
constitue de six informations : un auteur (individu), une victime (dame), une arme (arme
blanche), un vnement (menace), une date (16.02.07), un lieu (Lausanne, rue de bourg).
Les schmas ont t regroups en quatre catgories (Type A D) dfinies selon quatre
structures gnrales de reprsentation :
Nombre
de
Type
Structure
gnrale
participants
A
16
B
8
(dont
2
sans
lentit
victime)
C
16
D
17
(dont
4
sans
lentit
couteau)
Disparits
de
reprsentation
67
Ces quatre structures ont t identifies en comparant les 48 solutions (lensemble des
reprsentations peuvent tre consultes dans lannexe quatre). Elles dcrivent quatre manires
rcurrentes de reprsenter linformation. Dix schmas ne sont pas classs parmi ces quatre
formes, car leurs structures sont singulires. Les plus grandes variations sont observes au
niveau de lintgration de linformation temporelle et du lieu. Globalement, les informations
sont reprsentes de quatre faon diffrentes : en tant quentit (une icne), un attribut (un
texte li une icne ou un lien), un lien (un trait entre deux icnes), un cadre (entourant un
ensemble dicnes et de liens).
Dun point de vue de la reprsentation des relations, il est intressant de noter quaucun
participant na trac de lien entre plus de deux entits. Dix-huit personnes ont utilis des
flches et un tudiant a utilis une double-flche. La flche est gnralement exploite pour
dcrire le sens du lien entre lauteur et la victime. Dans cet exemple, la flche met en vidence
le rle des personnes.
68
Evaluations
prliminaires
R e p r s e n t a t i o n d u n e v e n t e
Lors dun cours sur la visualisation de donnes, les participants doivent crer un schma
relationnel reprsentant une vente :
Sur les 10 participants, cinq schmas diffrents ont t produits pour reprsenter la mme
phrase constitue de cinq informations : deux individus, un vnement, un ensemble dobjet,
un prix. Les schmas ont t regroups en deux catgories (Type A B) dfinies selon deux
structures gnrales de reprsentation. Les trois autres schmas ont des structures
diffrentes20:
Les seules informations qui sont reprsentes de faon analogue sur lensemble des schmas
sont les individus qui sont reprsents par des entits. A noter que dans lexemple prcdent,
la quasi-totalit des participants a galement reprsent les deux individus (lauteur et la
victime). Deux personnes nont pas reprsent la victime et deux autres nont reprsent que
lvnement. A noter que dans cet exemple aucun participant na identifi la vente (un
vnement) comme une entit. Ces deux exemples illustrent que mme pour un scnario
simple (une seule phrase) de nombreuses variations sont observes entre les diffrents
participants. Lexemple suivant vise quantifier ltendue des variations pour reprsenter un
scnario plus complexe issu dune affaire relle.
20
Cf. Annexe 4 : Evaluations prliminaires - Reprsentation dune vente, page 268
Disparits
de
reprsentation
69
R e p r s e n t a t i o n d u n e a f f a i r e c o m p l e x e
Les schmas produits par quarante enquteurs ont t compars. Lexercice a galement t
soumis dix tudiants de Master professionnel22 et sept spcialistes ayant une exprience
sur la conception de schmas.
Lensemble des cinquante-sept schmas produits nest pas annex. Seuls des tableaux
rcapitulatifs sont prsents (voir notamment lannexe quatre). Les indicateurs de variabilits
analyss sont : les nombres totaux dentits et de liens reprsents et les types dentits et de
liens exploits.
N o m b r e d e n t i t s
21
Formation Analyse Criminelle Oprationnelle niveau I organis par linstitut suisse de police et lcole des
sciences criminelles.
22
Master of Advanced Studies en lutte contre la criminalit conomique de linstitut de lutte contre la
criminalit conomique de la haute cole ARC de Neuchtel.
70
Evaluations
prliminaires
N o m b r e d e l i e n s
Nombre
de
Pourcentage
pardcipants
(courbe
cumuladve)
10
100
9
90
8
80
7
70
6
60
5
50
4
40
3
30
2
20
1
10
0
0
0
5
10
15
20
25
30
35
40
45
50
55
60
65
Nombre
de
liens
Alors que lensemble des participants a reu la mme consigne et les mmes donnes
reprsenter, les nombres dentits et de liens exploits varient considrablement (de 13 52
entits et de 10 66 liens). Les variations sont importantes indpendamment du fait que le
schma a t produit par des personnes ayant lhabitude ou non de produire de telles
reprsentations. La principale raison de cette variabilit semble tre une diffrence de
perception sur lusage du schma. Pour certains, lobjectif consiste reprsenter lensemble
des informations utiles afin de les regrouper dans un schma unique. Alors que pour dautres
lobjectif dun tel schma est de synthtiser les informations de la manire la plus simple et la
plus claire possible.
Disparits
de
reprsentation
71
T y p e s d e n t i t
Etudiants MAS
Spcialistes
Enquteurs
Enquteurs
Etudiants
MAS
Spcialistes
Pourcentage
de
pardcpants
100
Tlphone
3-6
1-11
4-8
90
2-12
3-20
Personne
4-11
80
Lieu
1-9
1-10
1-5
70
Voiture
0-3
1-3
0-1
60
Police
0-5
0-3
0-4
50
Trace
0-5
0-6
0-5
40
Arme
0-4
0-6
0-3
30
Evnement
0-9
0-4
1-5
20
Document
0-1
0-7
0-2
10
0
Affaire
0-3
0-1
0-3
0-4
0-3
0-7
Personne
Groupe
Lieu
Voiture
Police
Trace
Arme
Evnement
Aaire
Drapeau
Explosion
Quespon
Autre
Tlphone
Document
Couleur
Drapeau
Explosion
0-2
0-2
0-1
Couleur
0-3
0
0-1
Types
d'endt
Question
0-3
0-4
0-1
Groupe
0-2
0-0
0-1
Autre
0-2
0-2
0-3
Le programme utilis offre la possibilit de dfinir des types dentits caractriss par des
icnes spcifiques (tels que ceux prsents dans les exemples prcdents). Les graphiques ci-
dessus regroupent les diffrents types en catgories gnriques qui sont dfinis dun point de
vue smantique. Par exemple, les icnes homme , femme , inconnu , etc. sont
regroups dans la catgorie personne . Des tableaux, prsentant le nombre dutilisation de
chaque type spcifique, sont prsents en annexe. Il faut noter quaucun type (c.--d. aucune
icne) na t exploit par lensemble des participants. Au niveau des catgories dicnes, seuls
les tlphones, les personnes et les lieux ont t utiliss par tous les participants. Il est
intressant de noter que tous les spcialistes ont galement exploit des icnes reprsentant
des vnements, alors que trente pourcent des enquteurs et quarante pourcent des tudiants
MAS nont pas exploit ce type dentit. Par ailleurs, seuls trente pourcent des spcialistes ont
reprsent des icnes de type police . Finalement, le nombre dutilisation de chaque type
dentit varie galement fortement entre les participants (cf. tableau ci-dessus). Alors que
laffaire reprsente est identique, certains participants nont exploit, par exemple, que deux
icnes de personnes et dautres vingt. De plus, alors que le rapport ne fait mention que de
quatre numros de tlphone, de une onze icnes de tlphones sont exploites.
72
Evaluations
prliminaires
T y p e s d e l i e n s
Les dtails des types de lien utiliss sont prsents en annexe. Globalement, quarante types
diffrents ont t exploits et aucun na t utilis par lensemble des participants. Il faut
relever que les types sont prdfinis par le programme utilis (un seul participant a dfini des
types personnaliss). Pour chaque type de lien une couleur peut tre choisie, le programme ne
dfinit pas dattributs spcifiques en fonction du type de lien. La seule raison visuelle
dexploitation des types est de faire varier la couleur des liens.
Vingt-neuf participants ont galement utilis des cadres pour reprsenter des relations entre
les entits. Les cadres sont exploits pour dcrire diffrents types de relations : des relations
gographiques ou spatio-temporelles (15x), des groupes dentits (groupe de personnes, de
tlphones, etc.) (13x), des vnements (5x) et la source des informations (6x). A noter
galement que huit des participants ont reprsent des liens entre des cadres et dautres
entits (pour exprimer une relation commune avec lensemble des entits prsentes dans le
cadre).
D i s c u s s i o n
Lors de la conception dun schma relationnel, de nombreux choix doivent tre effectus pour
transposer linformation contenue dans du texte sous la forme dun graphe. Comment
dcomposer les informations en entits et relations, quelles sont les entits pertinentes,
comment reprsenter les relations, quels sont les attributs des entits et des relations, sont
autant de questions qui sont rpondues de manire varie suivant les concepteurs. Mme
lorsque linformation initiale est succincte, les variations observes sont importantes. Il ne
semble pas exister de consensus mergeant. Les choix de reprsentation et les objectifs sont
multiples.
Dans le cadre de ces trois exemples, aucun objectif spcifique na t impos aux participants.
Il sagit peut-tre dune des causes expliquant les variations observes, mais alors cela
signifierait aussi une grande disparit de perception sur lutilit dune telle visualisation. Pour
certains, le schma doit reprsenter lensemble des informations de manire dtaille afin
dexploiter la reprsentation comme une mmoire de travail, pour dautres, dcomposer
linformation peut servir identifier des lacunes ou des erreurs de raisonnement. Finalement,
la visualisation peut galement tre exploite pour synthtiser les lments pertinents afin de
faciliter la communication dune affaire complexe.
Impact
sur
lanalyse
et
la
communication
73
I m p a c t
s u r
l a n a l y s e
e t
l a
c o m m u n i c a t i o n
Certains choix de visualisation sont-ils plus adapts que dautres ? Quel est limpact de ces
choix sur lanalyse et la communication ? Cette section prsente les observations effectues
sur le dernier exemple, ainsi que sur des exemples dexploitation de la visualisation dans le
cadre denqutes, afin de prsenter limpact de ces choix sur lanalyse et la communication.
R e p r s e n t a t i o n d u n e a f f a i r e c o m p l e x e
Dans la section prcdente, des indicateurs objectifs ont t utiliss afin de prsenter
ltendue de la variabilit observe lors de la cration dun schma relationnel. Certaines
portions particulires de laffaire et les reprsentations produites sont reprises ici afin
dillustrer limpact des choix sur lanalyse et la communication des informations.
Des ambiguts de reprsentation ont t observes sur quarante-trois schmas (75% des
schmas). Ces ambiguts peuvent tre classifies en deux catgories. Dune part, lorsquune
entit nest pas identifie et reprsente comme telle, une dmultiplication de liens peu clairs
est observe (situation observe sur vingt-neuf schmas). Dautre part, des liens mal
positionns peuvent engendrer des difficults de comprhension. Un lien mal plac est un lien
qui aurait d tre trac avec une autre entit pour minimiser lambigut (situation observe
sur trente-cinq schmas). Les portions de schmas ci-dessous illustrent cette problmatique :
Une quittance de location de vhicule a galement t dcouverte dans la chambre elle concernait un vhicule ...
provenant de la firme la personne ayant rempli et sign la quittance est un certain
La quittance nest pas identifie comme une entit, les relations entre la chambre, le loueur et la voiture ne sont
pas claires et peuvent porter confusion.
74
Evaluations
prliminaires
2 personnes se prsentrent devant les agents. Alors que ceux-ci les enjoignaient de prsenter leurs papiers, ils
ouvrirent immdiatement le feu sur les gendarmes au moyen darmes de poing. Les gendarmes ripostrent et lun
des 2 individus fut touch
Lvnement (la fussillade) nest pas identifi comme une entit. Les liens tracs entre les entits ne sont donc pas
explicitement ratachs un vnement particulier : lensemble des coups de feu fait-il rfrence plusieurs
vnements, les utilisations des armes ont-elles t faites au mme moment, etc.
Le lien devrait tre avec le lieu et la trace ADN (le rapport ne dit
pas que les individus sont les sources de la trace).
Dautre part, huit des schmas contiennent des liens errons (des relations qui ne sont pas
dcrites dans le texte). Cinq participants ont reprsent par plusieurs entits une mme
personne. Ce qui a pour consquence de ne pas observer visuellement lensemble des
informations en lien avec cette personne. Cinq participants nont pas diffrenci visuellement
les hypothses des faits. Finalement, quarante-quatre participants (77% des schmas) nont
pas reprsent une incertitude lie lidentit dune des personnes impliques dans laffaire.
En effet, alors quil existe une convention pour reprsenter lincertitude sur les liens (traits-
tills), aucun standard nest dfini pour les entits.
D i s c u s s i o n
Globalement, une mauvaise dfinition des entits et des relations peut engendrer des
ambiguts sur la reprsentation. Les erreurs observes sont probablement lies au fait que le
concepteur dun schma connait bien laffaire quil reprsente. Le schma produit est
Impact
sur
lanalyse
et
la
communication
75
certainement clair ces yeux. Pourtant pour un lecteur externe qui na pas connaissances des
informations initiales, certains choix de reprsentation peuvent tre sujets interprtation et
conduire une mauvaise comprhension de laffaire.
R e p r s e n t a t i o n d u n t r a f i c d e m a r c h a n d i s e s
Lexemple prsent ici est tir dune affaire relle qui porte sur un trafic important dobjets
vols. Il est prsent afin dillustrer limpact des choix effectus en matire de reprsentation
sur lutilisabilit des schmas. En effet, le schma ci-dessous a t effectu en se basant sur
une structure relationnelle labore en suivant des recommandations gnrales dfinies dans
les manuels de lanalyse criminelle23 : reprsenter lensemble des informations et lier les
entits concernes lors de lvnement (la vente). Dans le
cadre de cette analyse, lensemble des informations a t
intgr dans une banque de donnes relationnelle structure
autour dune table centrale contenant les vnements.
Lobjectif du schma est de reprsenter lensemble des informations issues de dclarations des
personnes impliques dans laffaire, afin de comparer la fois les versions dune mme
personne et les versions de plusieurs personnes pour un mme vnement.
Chaque cadre contient lensemble des informations issues des dclarations dune personne
entendue par les services de police. Les entits ont t positionnes afin de faciliter le plus
23
Cf. Recommandations et standards, page 45
76
Evaluations
prliminaires
En plus du changement de structure, les dclarations portant sur une mme vente (ou un
ensemble de ventes) ont t regroupes. Par mme vente, il est entendu une vente entre deux
individus particuliers. Les dclarations sont rprsentes par des attributs sur les liens. Ce
schma visiblement plus efficace que le prcdent offre une image claire de la structure
globale du trafic. Il permet galement de comparer visuellement les quantits de produits
Impact
sur
lanalyse
et
la
communication
77
vendus qui sont reprsentes par lpaisseur des relations. Plusieurs schmas ont t produits
sur ce modle et exploits dans lenqute. Malheureusement, il nont pu tre utiliss qu la fin
de lenqute lors de la mise en accusation par le magistrat instructeur. En effet, les outils
exploits pour produire ces schmas (la banque de donnes et loutil de visualisation) ne
permettent pas deffectuer dynamiquement un tel changement.
D i s c u s s i o n
Cet exemple, illustre deux problmes principaux. Premirement, les choix effectus pour
dfinir la structure et les attributs visuels exploits (par exemple, lpaisseur des liens) dun
schma relationnel peuvent avoir un impact considrable sur la lisibilit et le potentiel
dexploitation de la reprsentation. Des rgles rutilisables peuvent-elles dfinies afin de
guider ces choix ? Le schma prsent semble tout au moins constituer une solution plus
efficace pour analyser cette situation particulire. Les trafics de marchandise tant des
problmes rccurents, la solution prsente est certainement exploitable pour le traitement
daffaires analogues.
R e p r s e n t a t i o n d e s r i e s d e c a m b r i o l a g e
Des schmas relationnels sont galement souvent exploits dans le cadre denqutes sur des
sries de cambriolages. Les relations dtectes entre les diffrents cas de la srie (cas lis par
des traces, lis spatio-temporellement, lis par des vhicules, etc.) sont visualises afin de
synthtiser lensemble des informations et ainsi faciliter la comprhension globale de la srie,
tout en offrant la possibilit den questionner les parties.
Les deux exemples prsents ci-dessous sont des cas rels dexploitation en cours denqute.
Le premier schma a t reu par un enquteur de la police judiciaire qui souhaitait savoir sil
78
Evaluations
prliminaires
tait possible de le rendre plus explicite. Le second schma a t restructur, car lenquteur
layant produit le jugeait difficile comprendre. En effet, lorsque le nombre dinformations
reprsenter augmente, conserver la lisibilit dun schma nest pas une tche vidente.
Schma initial
Schma restructur
mercredi 19th mars 2008 20--31st mars 2008 10--15th avril 2008 15--20th avril 2008 mercredi 23rd avril 2008 jeudi 24th avril 2008
12:00 18:00 00:00 06:00 21st 18:00 25th 1st 5th 10th 12th 13th 14th 15th 16th 17th 04:30 06:00 12:00 18th 12:00 19th 20th 21st 00:00 07:00 12:00 18:00 00:00 06:00 12:00
Standard CAT
Video surveillance
ADN 2 (PCN23...)
Suspect ?
Trace CAT
Traces ADIDAS
Boudry
Adresse
Boudeviliers
VPE Service industr.
19-20.03.2008 2030-0630 VPE Services Techniques
VPE Entreprise
11.04.2008 0200-0300 ADN mlange (PCN23...)
16-17.04.2008 2345-0700
vol
lis
vole retrouv
voles
Impact
sur
lanalyse
et
la
communication
79
Schma initial
Semelle
E20/l
Semelle
3 vnements E20/l
Semelle
sur canton de
E20/l Cas 12
Berne
BE Saint-Blaise
Uetendorf Semelle 30.05.2005
07.04.2005 E20/l ADIDAS Semelle E20/l
Semelle E20/l Cas 14 E20/l Empreintes digitales
Peseux Semelle Semelle
Semelle
14.09.2005 E20/l Semelle E20/l
E20/l
E20/l
Semelle Semelle
Semelle J01/o J10/o
J10/o
Cas 13 Lien ADN
4 vnements
Fleurier
sur canton de
13.06.2005
Berne
Semelles D21/h & E20/l
Identifi par ADN
empreinte digitale Empreintes digitales
NIKE Shox
J10/o Semelle
Semelle Semelle D21/h
C/q J10/o
Cas 1 Lien ADN
Marque inconnue Fleurier
C/q 15.04.2005 Lieu
Semelles C/q & autre (E10/b) Semelle
ADN G20/f Cas XX
Natel Cas 8 Travers
Empreintes digitales Travers 22.06.2005
12.05.2005 ADN Marque inconnue
Semelles G20/f & J10/o et autre Semelles autres D21/h Semelle
Cas 2 2 vnements
D21/h
Fleurier sur canton de Semelle
15.04.2005 Berne (Kniz et Marque inconnue D21/h
Biglen) G20/f Semelle
E10/c
Semelle Cas 15 et 16
Mis en cause G20/f Marin-Epagnier
par xxx
Semelle 08.04.2005
Identifi Cas 17 D21/h Semelles D21/h & J22/2b
par ADN Neuchtel ADN
Cas 4
20.04.2005
Fleurier
Logement Semelle Semelles D21/h & autres
Mis en cause 24.04.2005
G20/f MEMPHIS
par xxx Semelle G20/f
E10/c
Etablissement public
Semelle
D21/h
?Identifi
par Evnement VD
Btiment divers semelle? hors canton Leysin
Mis en cause 31.05.2005
par xxx Cas 5 24.04.2005 Cas 7 Semelle D21/h
Fleurier Fleurier Fleurier Semelle
24.04.2005 24.04.2005 D21/h
Magasin-kiosque
Semelle G20/f
Cas 3
Evnement
Fleurier Cas 6 BE
25.03.2005 Fleurier Gmligen
Link Link
Semelle autre 24.04.2005 27.05.2005
ADN Semelle D21/h
Link
Schma restructur
25--31st mars 2005 1--10th avril 2005 20--25th avril 2005 25--30th avril 2005 mai 2005 juin 2005 juillet--septembre 2005
18:00 00:00 06:00 26th 1st 5th 8th 10th 17th 20th 23rd 24th 25th 26th 27th 28th 1st 9th11th 12th 15th 17th 12:00 20th 25th 29th 31st 1st 5th 10th 15th 12:00 20th 1st aot septembre octobre 10th 18:00
Cas 15 et 16 Cas 17 BE VD
Marin-Epagnier Neuchtel Marque inconnue Gmligen Leysin
D21/h
08.04.2005 22.04.2005 27.05.2005 31.05.2005
(ADN et trace J22/2b) (et autres traces de semelles)
Fleurier
Lieu
Cas 5
Fleurier
24.04.2005 Cas 8
Travers
Identifi par Cas 1 12.05.2005
empreinte digitale Fleurier Marque inconnue MEMPHIS
(et autre trace de semelles)
15.04.2005 G20/f E10/c
(Semelles: E10/b et C/q)
(ADN et Empreintes digitales)
Cas 7
Fleurier
24.04.2005
Butin son
domicile
Identifi par Identifi Identifi
empreinte digitale par ADN par ADN
Logement
Contrle routier
29.12.2005
Btiment divers Neuchtel
Etablissement public
Magasin-kiosque
AaBbYyZz AaBbYyZz
??? ???
80
Evaluations
prliminaires
Les schmas restructurs sont plus faciles apprhender et ont rpondu aux attentes des
enquteurs. Plusieurs amliorations ont t apportes. Sur le premier, la structure globale a
t revisite. Sur le second, le placement des entits a t optimis.
D i s c u s s i o n
Alors que les deux schmas initiaux sont trs diffrents, les deux solutions proposes sont trs
similaires. En effet, les deux affaires portent sur les mmes types dinformation et lobjectif
danalyse est similaire : reconstruire et dcrire une srie. Les deux schmas produits sont des
schmas dvnements24. Est-il alors possible de formaliser une solution adapte pour cette
situation rcurrente ?
R e p r s e n t a t i o n d u n c a s d a b u s s e x u e l
La visualisation peut galement tre exploite au tribunal pour faciliter la communication dun
argument et accroitre limpact motionnel dun propos (Feigenson & Sherwin, 2007). Les effets
psychologiques et rhtoriques engendrs par la visualisation devraient tre vits ou au moins
contrls, afin que la ralit des informations prsentes ne soit pas dtourne pour soutenir
24
Cf. Analyse et visualisation relationnelle, page 43
Impact
sur
lanalyse
et
la
communication
81
Il sagit dun schma chronologique o chaque employ est reprsent par une ligne
horizontale (icne de personne : rouge pour les femmes et bleu pour les hommes), les dates
de dbut et fin dactivits sont reprsentes par des icnes relies par une ligne horizontale
qui dcrit donc la priode dactivit. Des informations textuelles sont ajoutes sur chaque
ligne. Celles-ci rsument les dclarations des employs concernant les svices subis (ou
labsence de svices). Le graphique est divis en deux parties distinctes sur laxe vertical : en
haut, les employs ayant dclar avoir subis des actes dordre sexuel et en bas, les employs
non victimes.
82
Evaluations
prliminaires
Il semble a priori relativement difficile de se prvaloir dun tels biais. Une discussion plus
labore sur les objectifs attendus de la visualisation (pourquoi est-il relevant de comparer les
priodes dactivits entre victimes et non victimes ?), ainsi quune discussion avec des lecteurs
sur la manire dont ils interprtent le schma auraient peut-tre permis de dtecter ce biais.
Cet exemple, illustre limportance de deux tapes importantes du processus de visualisation :
la dfinition et lvaluation des objectifs de lanalyse ou des observations communiquer et
lvaluation du produit de renseignement labor.
S y n t h s e
C o n s t a t
C o n t e x t e d e x p l o i t a t i o n
Les dcisions prises dans le cadre de lenqute judiciaire sur la base de visualisations, peuvent
avoir un impact important (notamment au niveau du jugement) ou engendrer des cots
importants en terme de ressources et de temps (par exemple, lorsquil sagit de mettre sur
pied des oprations policires ou des mesures de prvention). La visualisation est exploite
pour soutenir diverses dcisions qui peuvent galement avoir un impact sur la rsolution du
cas, voire la condamnation dun prvenu. Les reprsentations graphiques se doivent donc
dtre intgres. Elles doivent faciliter lanalyse et lapprhension des renseignements en
reprsentant la ralit des informations sans ajouter des biais. Les choix effectus pour
produire des reprsentations se doivent donc dtre guids afin de concevoir des produits de
renseignement efficients.
La visualisation peut tre exploite pour soutenir un nombre importants dobjectifs ; tels
quanalyser des informations collectes au cours de lenqute, valuer a posteriori une
investigation, aider qualifier les infractions, faciliter lapprhension dun dossier et soutenir
une argumentation lors du procs. Il nest a priori pas certain quune forme de visualisation
particulire puisse rpondre lensemble des attentes des diffrents acteurs du processus. Les
objectifs et les contraintes voluent au cours de lenqute. Les reprsentations exploites
peuvent donc varier au fil du processus.
84
Synthse
N a t u r e d e s c o n c e p t s r e p r s e n t e r
La diversit des concepts reprsenter dans le cadre de lenqute criminelle est certainement
lune des causes des difficults observes. Dune part le domaine du discours (lensemble des
entits nommes) nest certainement pas universellement dfinissable. Une enqute financire
porte sur des concepts tels que des comptes et des transactions. En matire de stupfiants, les
investigations portent sur des saisies, des chantillons, etc. Chaque champ dinvestigation
implique des raisonnements bass sur des concepts souvent spcifiques. Bien que certains
concepts puissent tre formaliss de manire apparemment gnrique (comme les
vnements, les personnes, les objets et les traces), il nest absolument pas certain quil existe
des manires gnriques de reprsenter les informations. En outre, le domaine du discours
change en fonction de lvolution des problmes traits. Une structure dfinie un moment
prcis dune affaire peut se voir bouleverse par larrive de nouvelles informations.
Au cours du processus, diverses hypothses sont mises et il est capital de pouvoir rattacher
lensemble des informations reprsentes aux informations collectes et leurs sources. Les
diffrents types de sources doivent tre clairement identifiables (tels que les traces physiques
et les tmoignages), afin de permettre lvaluation de la fiabilit des informations. Les
informations sont souvent imprcises, voire incertaines. Il est donc ncessaire de pouvoir
exprimer visuellement lincertitude. Les hypothses doivent galement tre clairement
distinguables des informations factuelles et testimoniales.
La gestion de la ngation est, par ailleurs, une question ouverte en termes de reprsentation.
Comment reprsenter par exemple le fait quun individu est inconnu des services de police ou
reprsenter le fait quun individu nie avoir particip un vnement particulier. Ne pas
reprsenter la ngation engendre une confusion avec labsence dinformation. Selon Bertin
(2005), labsence de signe signifie labsence dinformation. La ngation doit donc tre
reprsente sur un graphe. Toutefois tracer un lien entre deux entits est gnralement
interprt comme la prsence dune association et non de la ngation. Visuellement la
premire impression est donc fausse. Des conventions doivent donc tre dfinies pour
exprimer la ngation et la distinguer de labsence dinformation.
V a r i a b i l i t d e s r e p r s e n t a t i o n s
Constat
85
peut tre reprsente sous la forme dune entit, dun lien, dun cadre ou dun attribut. La
transformation dune information textuelle en reprsentation relationnelle ne semble en effet
pas tre une tche triviale. Les graphes offrent une libert dexpression trs grande. Tous les
lments reprsents peuvent tre en relation (dfinition smiologie dun graphe) et le
nombre de degrs de libert disponibles est considrable. En dautres termes, de nombreuses
variables visuelles sont exploitables pour encoder une information. De plus, il nexiste que peu
de recommandations et de rgles sur la manire de les exploiter (cest le cas notamment de la
position des sommets sur le plan, de leur couleur, de leur forme). Le constat est dautant plus
proccupant en regard de limpact de ces choix de reprsentation sur lanalyse et la
communication du renseignement.
B i a i s
d i n t e r p r t a t i o n
e n g e n d r s
p a r
l a
r e p r s e n t a t i o n
Diffrents biais peuvent tre engendrs par un usage inadapt de reprsentations graphiques.
Ces biais peuvent tre issus dun mauvais usage de la visualisation (par son crateur) ou dune
mauvaise lecture (par son destinataire). Lors de la cration dune reprsentation des biais
peuvent tre ajouts intentionnellement ou non. Lors de la lecture des biais peuvent avoir de
nombreux effets : engendrer de la confusion, une mauvaise interprtation, distraire, faciliter la
manipulation, voire limiter la rflexion (Bresciani & Eppler, 2008). En regard du contexte
dexploitation, de tels biais doivent tre vits. Lajout intentionnel de biais ne sera pas discut
dans cette thse. Par contre le fait quune reprsentation engendre des ambiguts lors de sa
lecture, ou quelle puisse mener des erreurs de raisonnements sont considrs comme des
critres fondamentaux dvaluation et de comparaison des solutions tudies : le critre
dintgrit. La transposition dun discours crit sur un graphe prsuppose que le langage
visuel offre la possibilit dexprimer les concepts de faon cohrente. Les possibilits offertes
pour reprsenter les informations sont multiples et les choix effectus influencent dune part
lintgrit de la reprsentation (le graphique reprsente-il toujours la ralit des informations
sous-jacentes), mais galement la facilit dapprhension de la reprsentation.
I m p o r t a n c e
d e
l e f f i c a c i t
d e
l a
r e p r s e n t a t i o n
Lefficacit dune reprsentation graphique nest pas dfinie dans labsolu, mais toujours en
regard dune autre forme de visualisation. Une reprsentation est juge plus efficace si le
temps de lecture ncessaire pour rpondre une question danalyse de faon correcte et
complte est plus court quen exploitant une autre forme de reprsentation. Loptimisation de
lefficacit des reprsentations relationnelles est ncessaire afin dassurer quelles soient
86
Synthse
V i d e m t h o d o l o g i q u e
Alors que lutilisation des techniques de visualisation est recommande en analyse criminelle
afin danalyser et de communiquer les informations collectes, les manuels et la littrature du
domaine noffrent que peu de recommandations en la matire. Des types gnriques de
schmas relationnels sont dfinis et quelques recommandations gnrales sont proposes25.
Les outils de visualisations disponibles donnent limpression de sintgrer de faon
harmonieuse dans une mthode standardise. Pourtant, il ne semble pas exister lheure
actuelle une dmarche clairement formalise guidant les choix effectuer. Le processus de
raisonnement exploit pour transposer une information sur un graphe nest pas formalis. Le
langage visuel nest que partiellement dcrit. Finalement, les avantages et limites des
proprits visuelles exploitables sur un graphe ne sont pas clairement dcrits et valus.
Llaboration de telles reprsentations reste, dans une large mesure, base sur des
connaissances tacites lies lexprience, la capacit de se remmorer des solutions ayant
dmontr leur efficacit et transposer leur usage de nouvelles situations (tel que prsent
dans lexemple de la reprsentation dun trafic de marchandises).
L i m i t e s i m p o s e s p a r l e s o u t i l s
Les outils exploits pour produire les visualisations limitent galement les choix. La graphique
offre thoriquement un ventail de possibilits uniquement limit par limagination.
Cependant, lavnement de linformatique bien quayant facilit lautomatisation de la
production des reprsentations a galement conduit un appauvrissement des possibilits
qui sont maintenant dlimites par les fonctionnalits proposes par les outils. Les
informations sont intgres dans un nombre restreint de structures visuelles (par exemple, une
icne, un texte, un cadre, un lien), alors que les structures visuelles devraient raisonnablement
tre adaptes en regard de la nature des informations reprsenter. Par ailleurs, afin de
pouvoir grer lvolution des objectifs danalyse au cours dune enqute et la diversit des
25
Cf.
Recommandations
et
standards,
page
45
Consolidation
des
mthodes
87
concepts reprsenter, les outils devraient offrir des possibilits dadaptation dynamique des
formes de reprsentation (notamment au niveau de la structure des graphes, des possibilits
de slection et de faire varier les niveaux dagrgation). Les outils actuellement exploits
large chelle semblent stre imposs en raison de leurs simplicits dutilisation. Toutefois le
traitement de linformation et les formes de raisonnements mis en uvre pour rsoudre une
affaire criminelle nen restent pas moins complexes. Les outils devraient tre dvelopps en
regard des raisonnements impliqus et permettre une souplesse de reprsentation ncessaire
lors de lanalyse dun cas.
C o n s o l i d a t i o n d e s m t h o d e s
D l i m i t a t i o n d u c a d r e
Quatre dimensions danalyse ont t dfinies afin de classifier les mthodes de visualisation en
regard des objectifs danalyse : les dimensions relationnelle, temporelle, spatiale et
quantitative. Chaque dimension est constitutive dune forme danalyse et des reprsentations
propres sont exploites pour chacune delles. Cette thse se focalise sur les reprsentations de
lanalyse relationnelle.
De plus, lensemble des reprsentations graphiques traites dans cette recherche sont
produites dans un espace deux dimensions. Il faut relever que de nombreuses recherches
ont t effectues en matire de visualisation trois dimensions. Lannexe trois rsume les
tudes ayant valu et dcrit les avantages et faiblesses de la visualisation trois dimensions.
Les raisons lies au contexte dexploitation de la visualisation en analyse criminelle qui ont
motiv le choix de focaliser cette tude sur les reprsentations deux dimensions sont
galement explicites en annexe. Par ailleurs, lintgration de la dimension temporelle par
lusage de reprsentations dynamiques nest pas tudie en dtails. Les limites des outils
exploits pour produire des graphes sont toutefois discutes (notamment en regard de la
ncessit de pouvoir dynamiquement modifier la structure dun graphe).
88
Synthse
O b j e c t i f s
M t h o d o l o g i e
Il faut dailleurs relever que cette recherche a t initie suite au traitement du cas prsent
comme exemple de reprsentation dun trafic de marchandises26. En effet, le changement de
structure opr sur le graphe a t effectu en relevant une analogie avec la reprsentation de
donnes dappels tlphoniques. La solution retenue ayant montre une certaine efficacit
lusage, Il a t dcid de rpertorier des cas dutilisation de la visualisation, afin dinitier le
dveloppement dun catalogue de situations rcurrentes et leurs reprsentations propres.
Cette approche vise la formalisation de bonnes pratiques lies lusage de reprsentation des
informations rgulirement traites dans lenqute judiciaire (telles que les donnes de
tlphonie, les donnes financires et les traces physiques) en fonction dobjectifs spcifiques.
Des formes de visualisations adaptes pour chaque situation sont ainsi dcrites. Lide ici nest
pas formaliser des meilleures pratiques , mais des pratiques ayant prouv lusage une
certaine efficacit.
26
Cf.
Reprsentation
dun
trafic
de
marchandises,
page
75
Consolidation
des
mthodes
89
Finalement, lors de ltude des cas et la ralisation des schmas relationnels, des limites
imposs par les outils et des difficults techniques ont t identifies. La mthode dcrite dans
le premier chapitre et les exemples prsents dans le second reposent notamment sur les
possibilits offertes par les outils. Alors que les outils devraient sintgrer et soutenir la
dmarche danalyse, ils crent parfois des ruptures dans le processus de raisonnement et
imposent des contraintes lies aux fonctionnalits offertes. Limpact sur les outils des lments
de mthodes formaliss est donc discut. Un prototype de visualisation intgrant plusieurs
des dimensions danalyse a par ailleurs t labor.
Les thories et recommandations issues des travaux sur la visualisation ont t intgres tant
au niveau de la mthode, des bonnes pratiques et de la discussion sur les outils.
P A R T I E
I I
:
C O N T R I B U T I O N
A U X
M T H O D E S
D E
C O N C E P T I O N
D E S
S C H M A S
R E L A T I O N N E L S
P r o c e s s u s
d e
c o n c e p t i o n
d u n
s c h m a
r e l a t i o n n e l
Toute communication graphique se base sur lutilisation de conventions entre le rdacteur et
le lecteur. Elles dterminent la manire dont les messages sont produits et interprts. En
matire de reprsentations graphiques, les conventions dfinissent notamment le lien entre
les composants visuels et leurs significations propres (Mackinlay, 1986). La signification du
signe est dfinie lavance dans un systme monosmique27. Par exemple, une flche peut
reprsenter le signifi direction ou sur un graphe relation dirige :
Un systme de signe est donc dfini par un ensemble de conventions. Toutefois, lors de la
production dun graphe, le signe flche est gnralement exploit pour
reprsenter une autre information que direction ou flche ou relation dirige . Par
exemple, les schmas de flux labors en analyse criminelle exploitent ce signe pour dcrire
une communication tlphonique, une transaction bancaire, voire une vente. Un signe
adapt doit tre choisi pour chaque information reprsenter. Le processus nest cependant
pas direct ; une tape de raisonnement intermdiaire est ncessaire. Pour chaque
information, un signifi (pour lequel un signifiant est dfini) est choisi: communication
tlphonique (relation dirige), vente (relation dirige), amis (relation non dirige), etc.
Pour un systme monosmique donn, le passage du signifi au signifiant (le signe visible)
est dfini par le langage visuel. En effet, si une vente est identifie comme une relation
dirige, lutilisation de la flche comme signifiant est dfini par le systme de signe utilis.
Toutefois, diffrents systmes de signe peuvent tre exploits. Par exemple, une entreprise
(information) peut tre considre comme un groupe (signifi) qui peut tre reprsent de
diverses manires (signifiants):
27
Cf.
Mthodes
dvaluation
de
visualisations,
page
59
92
Processus
de
conception
dun
schma
relationnel
Systme de signes
Ce formalisme ne dcrit pas le processus gnral de production dune reprsentation
graphique. Il permet toutefois de dcomposer les tapes de raisonnements effectues pour
produire un schma et distinguer des causes possibles expliquant certaines des difficults
observes (la diversit des manires de reprsenter la mme information, les ambiguts et
les erreurs de lecture) :
Lune des lacunes identifies en analyse criminelle est labsence dune dfinition formelle du
langage visuel exploit sur les graphes. Une syntaxe uniforme et correcte est ncessaire afin
de produire un graphe prservant la smantique des concepts et des relations reprsents
(Reed & Kocura, 2005).
Consolidation
des
mthodes
93
Hypothse : une classification des types de relations mettre en vidence entre les
objets analyser est ncessaire.
La dmarche propose consiste identifier des types de relations gnriques et dcrire leurs
proprits. Puis de proposer et valuer une manire efficace de les reprsenter. Comme en
tmoigne les valuations prliminaires effectues, choisir une manire efficace de
reprsenter les relations semble tre une tche importante du processus.
2. Le systme de signe doit tre clairement dfini. Pour chaque signifiant, le signifi doit
tre pralablement dfini afin de pouvoir tre interprter et viter les ambiguts.
Hypothse : le langage visuel peut tre dfini en regard des types de relation
identifis.
Dans la mesure o des types de relations gnriques peuvent tre formaliss, le langage
visuel devrait tre dfini en regard de cette typologie. Pour chaque type, un signe est dfini
afin de constituer un langage commun monosmique. La signification des signes ainsi
clairement dfinie, le raisonnement ncessaire pour produire un graphe est simplifi. Si le
langage dfinit par exemple le cadre comme signe pour reprsenter un groupe, choisir un
signe adapt pour reprsenter une entreprise revient dterminer si celle-ci est un groupe.
Les types de relations doivent donc tre clairement dfinis et distinguables.
Hypothse : pour chaque type de relation, un signifiant adapt peut tre dfini en
fonction des critres dintgrit et defficacit.
28
Cf.
Analyse
et
visualisation
relationnelle,
page
38
94
Processus
de
conception
dun
schma
relationnel
Ltape finale du processus consiste dfinir un signifiant adapt pour chaque type de
relation. Choisir une manire efficace et intgre de reprsenter les relations est certainement
lune des tapes cl du processus pour assurer la qualit de la reprsentation (Senator, 2005).
Le choix peut tre intuitif, mais il peut aussi se baser sur une valuation de lefficacit relative
de chaque signifiant selon des critres objectifs29.
Afin de prsenter les recherches et les valuations effectues pour tester les hypothses
prsentes ci-dessus, ce chapitre est structur en trois parties. Premirement, le langage
visuel exploit pour reprsenter des informations sur un graphe est dcrit. Les proprits
visuelles utilisables pour reprsenter des relations sont prsentes et une typologie de
relations est propose. Afin de faciliter la description de cette classification, les dfinitions
smantiques des types de relations sont prsentes avec leur reprsentation propre. Une
valuation empirique de lefficacit de certaines des formes de reprsentation proposes a
t entreprise. Les rsultats sont prsents et discuts. Finalement la dernire partie
regroupe les lments de mthode formaliss. Ils sont prsents en suivant le processus de
conception dun graphe.
D e s c r i p t i o n d u l a n g a g e v i s u e l
P r o p r i t s d u p l a n
Les composants du langage visuel sintgrent dans le plan selon des structures visuelles qui
peuvent en elles-mmes possder une signification. Selon la thorie de la Gestalt (thorie de
la forme, du pattern), une structure perue par un positionnement non alatoire des
composants sur le plan, induit un message souvent implicite et automatique (Card et al.,
1999) (Chang et al., 2002) (Ware, 2004).
Certains principes de la Gestalt sont trs connus : tel le postulat que le tout est diffrent de la
somme de ses parties et celui que le tout est peru avant les parties qui le composent. Ce
dernier principe semble tre caus par la morphologie de lil humain. Nous percevons les
informations selon deux mcanismes distincts (lis la diffrence entre les rcepteurs de la
rtine et de la fova). Premirement, l'aspect global est peru, puis nous avons la capacit de
focaliser notre attention sur un lment plus prcis. La perception globale et immdiate,
alors que la focalisation est contrle. Une visualisation est donc perue den un premier
29
Cf.
Critres
dvaluation,
page
61
Description
du
langage
visuel
95
temps dans sa globalit, puis ces composants sont lus en dtails (Ware, 2004). De plus, une
partie dun tout, nest pas perue de la mme manire, si elle est reprsente seule ou dans
un ensemble. Le contexte global, notamment la mise en place sur le plan des composants,
est un aspect important du langage visuel. En effet, les positions relatives des entits sur le
plan permettent dexprimer des relations (par exemple, de distinguer des groupes de
personnes ou de dcrire une chronologie dvnements).
Ces lois explicitent comment les positions relatives des composants gnrent des structures.
Celles-ci peuvent tre exploites afin de reprsenter des groupes dentits, voire des
relations. En matire danalyse criminelle, la position sur le plan des composants est parfois
exploite pour reprsenter une certaine proximit. Par exemple lors de la reprsentation dun
rseau, la proximit de deux individus sur un graphe est reprsentative de leur proximit
dans le rseau. Une position centrale sur le graphique peut galement exprimer une position
centrale dans le rseau (Sparrow, 1991). Ce dernier point est toutefois sujet interprtation.
96
Processus
de
conception
dun
schma
relationnel
En effet, la centralit dune personne sur un graphe peut galement tre lie au fait que le
nombre de donnes rcoltes sur cette personne est simplement plus grand (notamment
lorsque lenqute a dmarre partir delle). De manire gnrale, les entits positionnes au
centre dun schma sont perues plus rapidement que celles places en priphrie (Eppler &
Aeschimann, 2009). Il convient donc de positionner les informations de faon adapte pour
ne pas mettre en valeur involontairement des entits positionnes au centre dun schma.
Le positionnement des entits sur le plan peut galement influencer linterprtation des
relations et la dtection de sous-groupes indpendamment de la prsence relle de relations
traces par des traits entre les entits (McGrath et al., 1997). Des entits positionnes
proximits peuvent tre considre comme lie uniquement sur la base de leur placement.
En effet, la position sur le plan des composants constitue lune des variables visuelles la plus
efficace pour encoder des relations entre les entits (Mackinlay, 1986). Par exemple une
relation temporelle peut tre reprsente par un alignement des composants sur laxe
horizontal en fonction du temps30.
C o m p o s a n t s d u n g r a p h e
Selon Bertin (2005) toute reprsentation graphique est constitue de trois implantations
fondamentales : le point, la ligne et la zone. La tche qui rend visible un point peut varier de
taille, valeur, grain, couleur, orientation et forme. En matire de visualisation relationnelle par
un graphe, les composants lmentaires du langage visuel rejoignent les implantations
dfinies par Bertin :
Le nud (ou sommet) qui reprsente un point du plan. Le nud est
gnralement exploit pour reprsenter une entit.
Larte (ou arc) qui reprsente une ligne entre des nuds. Larte est
gnralement exploite pour reprsenter une relation entre deux
nuds.
30
Cf. Annexe 1: Dimensions danalyse et visualisation - Analyse temporelle, page 239
Description
du
langage
visuel
97
Lune des lois de la Gestalt dcrit lutilisation combine de ces signes (Palmer & Rock, 1994)
(Ware, 2004):
Loi de connectivit : connecter des composants par un trait ou un
cadre permet de reprsenter des relations entre des entits. La
perception de la connectivit prvaut en principe sur la perception
de la proximit ou de la similarit (prsente ci-dessous).
Des informations peuvent galement tre reprsentes sous la forme de texte sur
un graphe. Le texte peut tre inclus de deux manires: sous la forme
dun label (ou tiquette) directement sur lun des composants
Label
graphiques et sous la forme dune annotation (description,
commentaire).
Une
annotation
permettant
dinclure
un
commentaire
ou
une
description.
A t t r i b u t s
g r a p h i q u e s
La Gestalt dfinit galement une loi indpendante du placement :
La loi de similarit est induite par un usage contrl des variables graphiques appeles
variables retiennes par Bertin (2005) (p. ex. taille, valeur, grain, couleur, orientation et forme).
Lefficacit de ces variables pour encoder une information a t largement tudie dans la
littrature depuis les travaux de Bertin (Mackinlay, 1986). En effet, certaines variables sont
plus efficaces pour encoder des donnes quantitatives, nominatives ou ordinales (Bertin,
2005)31.
31
Une composante est nominale lorsque ses catgories ne s'ordonnent pas de faon universelle (par exemple, les
zones gographiques qui sont notamment classables par ordre alphabtique, par superficies ou en fonction du
nombre d'habitants), une composante est ordonne lorsque ses catgories s'ordonnent d'une seule manire
universelle (par exemple, le choix d'une cuisson de viande: bleu, saignant, point, cuit, trs cuit), finalement une
composante est dite quantitative lorsqu'elle a comme objet de prciser une variation de distance entre deux
catgories (le systme mtrique, le temps, etc.).
98
Processus
de
conception
dun
schma
relationnel
Les tableaux ci-dessous rsument les principales variables exploites sur un graphe en regard
du type dinformation quelles permettent de reprsenter efficacement (inspir de (Mackinlay,
1986), p. 125, (Ware, 2004), p. 214 et (Ware, 2008), p. 63-64):
A t t r i b u t s d e s n u d s
Variable Type de
Description
graphique donnes
Licne est gnralement exploite pour reprsenter le type
Licne ou la
Nominale dentit (p. ex. une personne, un vhicule, etc.). Licne
forme
permet de dcrire le prdicat est un .
La couleur permet galement de distinguer des types. La
Nominale
La couleur couleur peut tre exploite pour encoder des variables
ou ordinale
ordinales.
La taille de lentit peut tre exploite pour reprsenter une
La taille Quantitative
variable quantitative (p. ex. le nombre dentits lies).
A t t r i b u t s d e s a r t e s e t d e s c a d r e s
Variable Type de
Description
graphique donnes
La couleur permet de reprsenter des types de relation en
Nominale
La couleur fonction de leur nature : relations familiales, relations
ou ordinale
tlphoniques, financires, etc.
Lpaisseur des artes peut encoder une variable quantitative
(comme le nombre de relations par exemple). Les variations
Lpaisseur Quantitative dpaisseur des liens sont plus facilement comparables que
les variations de taille des nuds (variation sur une seule
dimension pour les artes).
Le style de trait (continu, trait-till, etc.) est exploit pour
dcrit la fiabilit de la relation. La convention est que le trait-
Nominale
Le style till dcrit des relations incertaines et le trait continu des
ou ordinale
relations srs32. Dautres types de style peuvent galement
tre exploits pour distinguer des types de relation.
Les variables rtiniennes comme la couleur ou le style peuvent tre exploites pour
distinguer des types de dentits et de relations et pour exprimer la fiabilit des relations
32
Cf. Recommandations et standards, page 45
99
notamment. Elles doivent faire lobjet dune convention entre le lecteur et le concepteur de la
reprsentation (par exemple par le biais dune lgende). Les variables retiennes sont donc
gnralement exploites pour reprsenter les types dentits et de relations. Elles servent
visualiser des classes, dcrire les relations est un et est du type .
I m p o r t a n c e d e l a c o u l e u r
100
Processus
de
conception
dun
schma
relationnel
T y p o l o g i e
d e
r e l a t i o n s
Les formes syntaxiques dcrites dans cette section dcrivent des manires de combiner et
disposer les composants graphiques afin de former une structure visuelle associe une
catgorie particulire de relation.
- Le lien : une relation entre deux entits. Elle reprsente le prdicat est li . Elle est
dfinie par son type (par exemple, une relation familiale, professionnelle, etc). Par
dfinition, le lien ne dcrit pas une relation entre plusieurs entits (visuellement un lien
est reprsent par une arte, un trait entre deux entits).
- Le lien dirig : une relation avec un sens entre une entit source et une entit cible. Par
exemple, les relations de filiation ont un sens. Le rle dune entit dans la relation dcrit
la fonction quelle occupe. Par exemple pre et fils sont des rles dune relation
de filiation. Dautres types de relation ont galement un sens : les relations de causalit
et les relations dfinissant un ordre ou une squence, telle que les relations
chronologiques. Une relation peut donc tre dirige ou non.
- Le lien bidirectionnel : une relation qui se ralise dans les deux sens. Par exemple un
change de biens entre deux individus est une relation commerciale double sens. Alors
que la causalit est une relation directionnelle, linfluence par exemple peut tre
bidirectionnelle (deux personnes ou deux groupes dindividus peuvent sinfluencer
mutuellement).
Typologie
de
relations
101
Certaines relations existent entre plus de deux entits ; telle que lappartenance une famille
qui est une relation entre plusieurs individus. Afin de distinguer les relations entre deux
entits des relations entre plusieurs entits, les notions de groupe, densemble et de lien
multiple sont dfinies :
- Le lien multiple : une relation entre plusieurs entits de diffrents types. Alors quun
groupe possde un identifiant, la relation multiple nen possde pas. Par exemple, lors
de contrle de vhicules, un lien multiple existe entre lvnement, le vhicule et la
plaque. Cet exemple est prsent sous la forme dun pattern dans le chapitre suivant.
Visuellement, il nest pas possible de reprsenter les relations entre les vnements, les
vhicules et les plaques par des liens simples sans engendrer de lambigut. Un signe
spcifique est ncessaire.
Le tableau ci-contre rsume lensemble des signes formaliss pour dcrire ces relations. Ces
catgories gnriques ont t dfinies en regard des cas traits et analyss qui sont
prsents dans le chapitre suivant. Le systme de signe est ainsi clairement dfini (pour
chaque signifiant le signifi est dcrit). Il est important de relever que le langage visuel dfini
est une extension du langage propos par les logiciels actuellement utiliss dans la pratique.
En effet, les signes dcrivant le lien bidirectionnel, le lien multiple et lensemble ne sont pas
disponibles dans loutil principalement exploit en analyse criminel33.
33
Analysts Notebook 8 de la socit i2, http://i2.co.uk, dernier accs le 12.01.2011
102
Processus
de
conception
dun
schma
relationnel
Typologie
de
relations
103
Les variables graphiques et le positionnement peut galement tre exploit pour reprsenter
des relations :
D i s c u s s i o n s u r l u t i l i s a t i o n d u l a n g a g e
Slectionner un signe adapt pour reprsenter un concept (sous la forme dune entit ou
dun type de relation) nest pas trivial. Par exemple, le fait dtre maris dcrit une relation
entre deux personnes. Pourtant, le mariage peut tre considr comme une entit (un
vnement). Une information peut, de plus, tre reprsente sous la forme dun attribut
dune entit ou comme une entit lie. La localisation dun vnement peut, par exemple,
tre reprsente pour chaque cas en tant quattribut (visuellement reprsent sous la forme
104
Processus
de
conception
dun
schma
relationnel
dun texte, ou dune icne par exemple). Les vnements survenus dans un mme lieu seront
alors visuellement dtects selon le principe de similarit. Il est toutefois galement possible
de reprsenter les lieux par des entits distinctes relies aux vnements. Dans ce cas les
relations de localisation sont perues selon le principe de connectivit qui prvaut sur la
perception de la similarit. Selon Chen (1976) et (Barthlemy et al., 2005), il sagit en fait de
choix guids par lobjectif danalyse qui dfinit limportance des paramtres et des relations
reprsenter.
E v a l u a t i o n
d e
l a
r e p r s e n t a t i o n
d e
r e l a t i o n s
Les choix effectus pour reprsenter les relations entre les entits dintrts pour une
question danalyse peuvent avoir un impact import sur la lisibilit et lutilisabilit des
reprsentations. En effet, une reprsentation perue comme complexe ou difficile lire ne
remplit certainement pas son rle de soutien aux processus danalyse et de communication
des informations. Lobjectif de cette valuation est de comparer par des indicateurs
quantitatifs objectifs, plusieurs structures de graphe tablies laide de la typologie de
relations propose.
35
Par exemple, o une vente reprsente par une entit engendre une structure inadapte rendant le schma
difficile lire (cf. Reprsentation dun trafic de marchandises, page 75).
Evaluation
de
la
reprsentation
de
relations
105
M t h o d e
C o n d i t i o n s d e x p r i m e n t a t i o n
Lvaluation a t effectue au moyen dun sondage en ligne. Pour chaque question, les
participants rpondent en cliquant directement sur les graphes. Le questionnaire est envoy
par courriel aux participants qui sont libres dy rpondre au moment de leur choix. Il est
demand aux participants de remplir le questionnaire sans interruption. Afin de tester que
chaque participant bien compris le fonctionnement du questionnaire, une question
prliminaire est pose (cliquer sur des sommets de couleurs en fonction de leurs liens avec
dautres sommets).
Pour chaque question, deux reprsentations diffrentes sont testes. Le graphe affich pour
chaque participant et slectionn alatoirement. Les participants ne sont pas au courant que
les comparaisons sont effectues entre deux schmas pour chaque question et non entre les
questions. Lordre des questions est identique pour tous les participants. La question et les
donnes reprsentes sont identiques pour chaque paire de schma. La mthodologie
dvaluation a t dveloppe pour comparer les diffrences de perception entre deux
manires de reprsenter les mmes informations. Les schmas exploits sont inspirs ou
directement issus de cas rels. Les donnes ont t simplifies et rendues anonymes.
P r o p r i t s v i s u e l l e s v a l u e s
106
Processus
de
conception
dun
schma
relationnel
T c h e s c o g n i t i v e s t e s t e s
Pour chaque type de relation test au moins deux questions diffrentes ont t poses, afin
de comparer les rsultats pour des questions diffrentes. Les questions ont t choisies en
fonction des exemples et recommandations dfinies dans la littrature37.
- Question 1 et 5 : trouver les chemins possibles entre deux sommets dtermins
(cliquer sur les sommets intermdiaires)
- Question 2, 6 et 10 : trouver un ou plusieurs sommet(s) en fonction des valeurs dun
attribut sur les liens
- Question 3 et 9 : trouver les sommets lis un sommet dtermin
- Question 4 et 7, 8 : trouver le sommet avec le plus de liens directs.
V a r i a b l e s d p e n d a n t e s
Pour chaque question, le temps de rponse total et les positions des clics souris ont t
relevs. Les clics corrects ont t dtermins en fonction de leurs positions avec une marge
derreur variable suivant les schmas (gnralement de lordre de 10 20 pixels). Certaines
questions (2, 4, 6, 7 et 8) portent sur lidentification dun sommet particulier, dans ces cas,
seule lexactitude est mesure. Pour lensemble des autres questions, plusieurs sommets
doivent tre identifis, la compltude est donc prise en compte dans lvaluation.
S c h m a s d e r f r e n c e s
37
Cf. Procdures dvaluation, page 64
38
Cf. Procdures dvaluation, page 64
Evaluation
de
la
reprsentation
de
relations
107
D e s c r i p t i o n d e l c h a n t i l l o n
Participants N % Formation N %
Etudiants 84 35 Apprentissage, CFC 55 23
Policiers 101 42 Formation professionnelle (matrise, brevet) 46 19
Employs ESC 33 14 Maturit (gymnasiale ou professionnelle) 9 4
Les deux 17 7 Universit, EPF, Haute cole spcialise 125 51
Autres 8 3 Autre diplme 8 3
Il faut noter que lobjectif de lvaluation nest pas de tester ces paramtres, mais de tester
limpact dun changement de reprsentation. Les versions des schmas ont donc t
attribues alatoirement aux participants. Aucune diffrence significative na t observe
entre les distributions de ces paramtres pour chaque version des schmas (cet aspect a t
test un test non paramtrique). Ces paramtres nexpliquent donc pas les diffrences
observes lors de cette valuation.
108
Processus
de
conception
dun
schma
relationnel
R s u l t a t s
Les visualisations exploites pour lvaluation, le dtail des rsultats et des tests statistiques
effectus sont prsents dans lannexe cinq.
R e p r s e n t a t i o n d e l i e n s d i r i g s
Structure 1 Structure 2
Lobjectif ici est de comparer la reprsentation de ventes sous la forme dune entit (lie aux
personnes et lobjet vendu) et sous la forme dun lien directionnel. Cette valuation a t
effectue sur la base du cas rel prsent dans la premire partie39.
Question 1 : Cliquer sur les personnes qui peuvent avoir t des intermdiaires entre les deux
personnes en rouge.
Question 2 : Cliquer sur la personne qui vous semble avoir vendu bien plus qu'elle n'a achet.
Pour la question une, une augmentation de 14.8% de rponses correctes et compltes est
observe avec la structure 2 (F (1,239) = 5.08, p = 0.025). Aucune diffrence significative, na
t observe sur le temps de rponse entre les deux structures. Les schmas ci-dessous
contiennent les positions des clics effectus par les participants (les chiffres affichs
correspondent au pourcentage de participants).
39
Cf. Reprsentation dun trafic de marchandises, page 75
Evaluation
de
la
reprsentation
de
relations
109
N = 113
Les deux intermdiaires du centre en bas, ont t slectionns par moins de participants
(une diminution denviron vingt pourcents). Certains participants peuvent avoir mal compris
la question et navoir slectionns quune squence dintermdiaires possible. Cet effet est
par contre beaucoup moins marqu pour la seconde structure. Seul lintermdiaire du bas a
t slectionn moins que les autres. Les schmas ayant t transmis alatoirement aux
participants cette observation tend rfuter lhypothse dune mauvaise comprhension. La
diffrence pourrait tre issue de la surcharge dinformation (nombre dentits) sur le premier
graphe. Le positionnement des entits semblent nanmoins avoir un impact. Il est
galement intressant de relever que les personnes directement lies aux personnes
reprsentes en rouges sont plus souvent identifies (sur les deux schmas).
N = 128
+1.6% +2.2%
+22.3% +0.6%
+6.2%
110
Processus
de
conception
dun
schma
relationnel
Globalement, cette structure est donc plus efficace pour rpondre la question. La position
des entits semble tre une variable importante au niveau de la perception et pourrait
expliquer les diffrences au sein dun mme schma.
Pour la question deux, une augmentation de 16.2% de rponses correctes est observe avec
la structure 2 (F (1,231) = 6.412, p = 0.012). Les schmas ci-dessous contiennent les positions
des clics effectus par les participants (les chiffres affichs correspondent au pourcentage de
participants).
N = 110
N = 123
-15.5%
+16.2%
Evaluation
de
la
reprsentation
de
relations
111
La rponse correcte est lindividu de droite qui a t slectionn par 48% des participants
pour la structure deux (augmentation du taux de rponse correcte de 16.2%). Pour les deux
schmas, environ 20% des participants ont slectionn lindividu de gauche qui selon les
informations reprsentes na pas achet de marchandise (dans le cadre de laffaire, il sagit
en fait de lindividu ayant commis les vols). Le nombre derreurs est par contre
significativement diminu pour lindividu du centre. En effet, bien quil a le plus de clients, le
nombre total de marchandises vendu et environ gal au nombre achet (respectivement
entre 77 et 89 vendues, contre 60 70 achetes).
Le temps de rponse moyen pour les rponses correctes est plus court de 28.2% pour la
structure 2 (F (1,92) = 8.947, p = 0.0036). Il passe de 89 +/- 67 secondes 58 +/- 35
secondes. Pour les rponses incorrectes le temps de rponse est similaire entre les deux
schmas. Pour le premier schma, le temps de rponse pour les rponses incorrectes et
40.4% plus court que pour les rponses correctes (F (1,108) = 12.731, p = 0.00054). Il
correspond au temps de rponse observ pour le deuxime schma. Alors que pour la
deuxime structure, les temps de rponses ne sont pas significativement diffrents entre les
rponses correctes et fausses.
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fausses
10
Schma
2:
Rponses
fausses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
Temps
de
rponse
en
secondes
Il semble donc que la comparaison des quantits de marchandises vendues et achetes est
plus difficile avec la premire structure. Leffort de lecture ncessaire pour compter et
comparer les proportions semble plus important avec la premire structure, en regard du
temps de rponse.
112
Processus
de
conception
dun
schma
relationnel
R e p r s e n t a t i o n
d u n e
e n t i t
s o u s
l a
f o r m e
d u n
l i e n
Structure 1 Structure 2
Lobjectif est de comparer la reprsentation dun concept sous la forme dune entit ou sous
la forme dun lien. Par exemple, dans le cadre de la reprsentation des relations entre des
saisies de stupfiants40. Les chantillons peuvent tre soit reprsents comme une entit (lie
une entit saisie et une entit classe chimique ) ou comme un lien (entre les deux
mmes entits). Lexemple utilis pour les questions trois et quatre est tir dune affaire
relle. Les entits reprsentant les saisies ont t remplaces par des carrs noirs, les
chantillons par des losanges gris et les classes chimiques par des ronds rouges.
Question 3 : Cliquer sur tous les ronds rouges lis directement et indirectement au carr
bleu.
Question 4 : Cliquer sur le rond rouge ayant le plus de liens directs avec des carrs noirs.
Pour la question quatre, une augmentation de 8.9% de rponses correctes est observe avec
la structure 2 (F (1,226) = 2.973, p = 0.086). Le temps de rponse moyen pour les rponses
correctes est galement plus court de 27.3% avec la structure 2 (F (1, 183) = 8.739, p =
0.0035). Il passe de 69 +/- 51 secondes 50 +/- 31 secondes. Pour la question quatre,
40
Cf. Saisies de stupfiant et classes chimiques, page 155
Evaluation
de
la
reprsentation
de
relations
113
lexactitude est donc augmente et le temps de rponse diminu lorsque la structure 2 est
prsente. La structure deux est donc plus efficace que la structure 1 pour cette question.
Question 10 : Cliquer sur les 3 groupes lis avec le plus grand nombre de photocopieurs.
Cette question a t estime plus difficile par les participants (information transmise la fin
du questionnaire). En effet, la question porte sur lidentification de sommets lis aux
photocopieurs. Ceux-ci sont reprsents, sur le premier graphique, par des losanges et par
des liens sur le deuxime schma. Il ntait donc pas possible de formuler une question
identique pour les deux schmas en se basant uniquement sur la reprsentation (par
exemple, en demandant de cliquer sur les ronds bleus lis au plus grand nombre de losanges
verts). Les participants ont donc d effectuer tout le processus dcrit prcdemment :
comprendre la problmatique et identifier les types dentit et de relations, puis comprendre
limplantation visuelle de chaque concept. Le temps de rponse est donc globalement plus
long.
114
Processus
de
conception
dun
schma
relationnel
structure 2 (F (1, 113) = 2.557, p = 0.113). Lamlioration nest donc pas certaine, mais un
effet tendanciel est observ.
R e p r s e n t a t i o n d e l i e n s b i d i r e c t i o n n e l s
Structure 1 Structure 2
Question 5 : Cliquer sur tous les tlphones bleus ayant eu des communications avec le
tlphone orange ET le tlphone vert.
Evaluation
de
la
reprsentation
de
relations
115
Pour les questions cinq et six, aucune diffrence significative na t observe au niveau de
lexactitude et de la compltude entre les deux structures. Il faut relever que pour la question
six, le nombre de rponses correctes est faible pour les deux schmas : 22.7 % des
participants pour la structure 1 et 16.5% pour la structure 2. La diffrence nest cependant
pas statistiquement significative (F (1,211) = 1.297, p = 0.256). De plus, le temps de rponse
est 50% plus rapide pour les rponses fausses, indpendamment du type de schma.
Les schmas sont donc peu efficaces pour rpondre cette question. En fait, la question
porte sur le nombre dappels total reu. La dimension dominante est donc la dimension
quantitative. Lutilisation dun schma relationnel pour rpondre une question de ce type
ne semble pas un choix adapt. Pour rpondre la question, il est ncessaire de faire la
somme des valeurs inscrites sur les relations. Un histogramme prsentant le total des appels
reus par numro est certainement une solution beaucoup plus adapte pour ce type de
question. Le choix du type de reprsentation en fonction de la question danalyse et discut
plus loin.
Pour la question sept par contre, le taux de rponses correctes augmente de 13.4% pour la
structure 2 (F (1, 206) = 6.526, p = 0.011). Le temps de rponse moyen pour les rponses
correctes est galement plus court de 14.7% avec la structure 2 (F (1, 169) = 3.674, p =
0.0057). Il passe de 37 +/- 20 secondes 31 +/- 16 secondes. Cette dernire est donc plus
efficace pour rpondre cette question. Le nombre de traits ncessaires pour reprsenter
lensemble des relations est diminu. Cette amlioration de la lisibilit du schma peut
expliquer laugmentation de lefficacit. Il faut toutefois relever quaucun effet na t
observ pour la question cinq.
116
Processus
de
conception
dun
schma
relationnel
R e p r s e n t a t i o n
d e
g r o u p e s
d e n t i t s
s o u s
l a
f o r m e
d u n
c a d r e
Structure 1 Structure 2
Il est gnralement dusage de reprsenter des groupes dentits (par exemple des
personnes travaillant dans une mme entreprise ou des cas perptrs dans une mme zone
gographique) par un cadre contenant les entits lis41. Lobjectif de cette question consiste
comparer la reprsentation dun groupe par un cadre ou par une entit lie aux membres
du groupe. Pour cette comparaison, les positions des entits ont d tre modifies pour
effectuer le changement de structure, afin de conserver une lisibilit correcte des schmas. Le
schma prsent est issu dune affaire relle portant sur les activits dun groupe de suspects
de brigandages agissant au niveau international.
Question 8 : Cliquer sur le membre du groupe criminel qui est li au plus grand nombre
d'individus en vert.
Question 9 : Cliquer sur les individus (vert et rouge) qui semblent avoir eu une activit en
Espagne.
Pour la question huit, le taux de rponses correctes augmente de 9.7% pour la structure 2 (F
(1, 197) = 3.861, p = 0.051). Aucune diffrence significative nest observe pour le temps de
rponse.
41
Cf. Recommandations et standards, page 45
Evaluation
de
la
reprsentation
de
relations
117
Pour la question neuf, aucune diffrence nest observe au niveau du taux de rponses
compltes et correctes. Le temps de rponse pour les rponses compltes et correctes
diminue de 28.6% pour la structure 1 (F (1, 36) = 5.490, p = 0.025). Il passe de 56 +/- 22
secondes 40 +/- 20 secondes.
Il est trs intressant les rsultats en dtails pour chaque schma (les aires sont
proportionnelles au pourcentage de participants):
N = 110
Ces
entits
ont
t
slectionnes
m
oins
souvent
(-6%
des
participants
pour
les
deux
entits
de
gauche
et
-14%
des
participants
pour
lentit
centrale),
par
dans
les
mmes
cadres.
Les
croisements
de
rapport
aux
autres
entits
prsentes
tre
la
cause
de
cet
effet.
traits
avec
dautres
cadres
semblent
Cette
tendance
est
galement
observe
pour
lindividu
de
droite
(53%
des
participants
lont
slectionn).
Il
faut
relever
quil
nest
pas
dans
le
cadre
reprsentant
le
brigandage
commis
en
Espagne.
De
plus,
le
lien
trac
en
trait-till
peut
avoir
un
effet
(en
raison
de
la
convention
dutilisation
du
trait-till
pour
exprimer
un
lien
incertain).
118
Processus
de
conception
dun
schma
relationnel
N = 92
-30%
+12% +14%
- 25%
+7%
+6%
Globalement,
toutes
ces
entits
ont
t
Ces
deux
entits
ont
t
slectionnes
slectionnes
plus
souvent
par
rapport
moins
souvent
par
rapport
la
structure
2.
la
structure
2.
Le
positionnement
plus
loign
de
ces
entits
est
certainement
la
raison
de
cette
diminution.
Leffet positif observ pour le groupe dentits de gauche et donc contrebalanc par leffet
ngatif de lloignement des deux entits de droite. Le positionnement peut expliquer
globalement pourquoi aucune diffrence significative nest observe entre les deux
structures pour cette question. Cet effet, illustre bien la complexit de la comparaison de
deux reprsentations graphiques. En effet, plusieurs variables visuelles peuvent avoir un
impact simultan sur la perception (comme ici la structure du graphe et les positions des
entits). Cest pourquoi, pour lensemble des autres questions les positions, les couleurs, les
tailles et les icnes nont pas t modifies entre les schmas. Pour cet exemple, conserver
les positions ntait pas possible.
Cet exemple, a t ralis afin de montrer limpact sur la lisibilit de lutilisation de cadres
pour reprsenter deux types de relations. Pour la structure une, les cadres reprsentent des
relations spatiales entre les activits des protagonistes qui sont reprsentes par des entits.
Pour la structure deux, les cadres reprsentent les activits elles-mmes qui entourent les
Evaluation
de
la
reprsentation
de
relations
119
personnes impliques. Globalement, la structure une est plus lisible que la structure deux.
Lorsque les activits sont reprsentes par des cadres, des croisements de traits sont
invitables si des individus ont particip plusieurs vnements. Ces croisements de traits
(de cadres) diminuent la lisibilit du schma (dans le cadre de cette valuation, une
diminution de 6 14% de clics est observe pour les entits lies plusieurs activits). Cet
effet nest pas observ lorsque les vnements sont reprsents par des entits lies par des
artes aux individus. Le temps de rponse est galement plus court pour cette structure de
graphe. Lutilisation de cadres est donc possible pour exprimer des relations entre des
entits, mais lorsque les cadres se croisent, lefficacit du schma diminue.
T a b l e a u d e s y n t h s e
D i s c u s s i o n g n r a l e s u r l e s r s u l t a t s
120
Processus
de
conception
dun
schma
relationnel
lexactitude. Les reprsentations ont t cres pour chaque structure de faon pouvoir
rpondre au mieux aux questions. En effet, ces schmas ont t conus et exploits dans le
cadre daffaires relles42 (en loccurrence les solutions les moins efficaces). Ils ont t crs
avec lintention de faciliter lanalyse et la communication. Les schmas de rfrence nont
donc pas t produits pour dmontrer lefficacit des solutions proposes. Les comparaisons
effectues semblent donc intgres et confirment globalement limportance des choix de
reprsentation.
Par ailleurs, le temps de rponse est gnralement plus court pour les rponses fausses ou
incompltes que pour les rponses correctes et compltes. Lexactitude semble globalement
corrle au temps de rponse (telle que releve dans la littrature43). Une hypothse possible
est que si pour une question donne, leffort ncessaire pour y rpondre parait trop
important, les participants choisissent une rponse plus rapidement sans vrifier en dtails
lexactitude de la rponse. Il faut toutefois noter que pour la premire question leffet est
invers avec le schma deux (le temps de rponse moyen pour les rponses correctes et
compltes est plus court). Cest galement le cas pour la question huit avec les deux
schmas. Globalement, il ressort galement des rsultats que :
1. Diminuer le nombre dentits sur un graphe au profit dune reprsentation par des
liens augmente la lisibilit.
2. Les positions relatives des entits entre elles jouent un rle important au niveau de la
perception dun graphe.
3. Lutilisation de cadres pour reprsenter des relations diminue la lisibilit lorsque les
cadres se croisent.
D i s c u s s i o n s u r l a m t h o d e d v a l u a t i o n
Evaluation
de
la
reprsentation
de
relations
121
chaque comparaison une centaine de personnes ont rpondu aux questions pour chaque
schma. Les schmas ayant t attribus alatoirement, les diffrences de niveau de
formation, dge, de connaissances en matire danalyse criminelle et dexprience sur la
lecture et la conception de schmas nexpliquent pas les diffrences observes.
Il faut relever encore que les conditions de lexprimentation effectue ne correspondent pas
aux conditions relles dexploitation des schmas. Au cours dune enqute, les schmas sont
exploits par des enquteurs motivs par la rsolution des cas traits et qui exploitent ces
schmas dans un contexte diffrent et avec dautres motivations que rpondre correctement
des questions spcifiques. Les schmas sont exploits globalement pour mieux
comprendre lensemble des informations et souvent pour rpondre de multiples questions
sur diffrents aspects dune affaire. Les diffrences defficacit observes en termes
dexactitude pourraient donc tre plus faibles dans un contexte rel. Il faut toutefois relever
que ces exemples se basent sur des cas rels o il a t parfois ncessaire deffectuer des
modifications de structures, la demande des enquteurs, pour que les reprsentations
soient exploitables. En effet, limpression de lisibilit initiale dun schma est trs importante
pour quil soit utilis. Si un schma semble compliqu ou confus, il ne suscite gnralement
que peu dintrt.
Cette valuation se base sur des indicateurs quantitatifs pour mesurer les diffrences
defficacit. Ce choix a t effectu pour confirmer par des indicateurs objectifs, les tudes de
cas prsents dans le chapitre Evaluations prliminaires et pour valuer limpact des choix
de reprsentation. Au vu des diffrences dexactitudes observes, une valuation qualitative
complmentaire aurait t utile pour valider les hypothses formules pour expliquer les
diffrences. En effet, il aurait t souhaitable de demander aux participants ayant commis des
erreurs ou rpondu partiellement, dexpliquer les raisons de leurs choix. Une telle dmarche
ncessite toutefois de dvelopper un systme de validation des rponses en temps rels. Le
systme utilis pour rpondre aux questions en cliquant directement sur les images a t
spcifiquement dvelopp pour ce sondage. Inclure un systme automatique de contrle des
rponses ncessite donc des dveloppements techniques complmentaires. Il faut toutefois
souligner que lobjectif de cette valuation tait de montrer que choisir une manire adapte
de reprsenter les informations en fonction de la nature des relations accrot objectivement
la lisibilit du schma. La mthodologie dvaluation dveloppe a rpondu lobjectif.
122
Processus
de
conception
dun
schma
relationnel
E l m e n t s
d e
m t h o d e
Dans les sections prcdentes, le processus de conception dun graphe et le langage visuel
ont t explicits. Des structures syntaxiques ont t formalises pour reprsenter des types
de relations gnriques. Certaines de ces structures ont t compares et leur efficacit a t
value pour reprsenter certains types de relations spcifiques. Lhypothse que la manire
de reprsenter les relations sur un graphe influence la perception et lefficacit de la
reprsentation a pu tre confirme pour diffrentes structures et diffrentes questions
spcifiques.
Les diffrents lments de mthode identifis sur la base des cas traits, des valuations
effectues et issus de la littrature sont prsents dans cette section. Une bauche de
dmarche gnrale exploitable pour concevoir un schma relationnel, en analyse criminelle,
est propose.
I d e n t i f i c a t i o n d e l a d i m e n s i o n d o m i n a n t e
La premire tape de la mthode propose consiste donc identifier quelle est la dimension
dominante en regard de la question danalyse pose. Dans le cadre de lvaluation prsente
dans le chapitre prcdent, lune des questions poses aux participants tait : Cliquer sur le
tlphone ayant reu le plus d'appels . Le schma relationnel propos pour rpondre la
question nest certainement pas le choix le plus adapt pour rpondre cette question. En
effet, pour les deux schmas proposs, moins de vingt-cinq pourcent des participants ont
russi y rpondre correctement.
44
Cf. Dimensions danalyse, page 33
Elments
de
mthode
123
Appels reus
Tlphone
1
Tlphone
2
Tlphone
3
Tlphone
4
Tlphone
5
Ces deux questions portent la fois sur la dimension relationnelle (les contacts entre des
individus) et sur la dimension temporelle (la frquence / des priodes temporelles dfinies).
Ces deux questions ncessitent pourtant deux formes de reprsentation diffrentes pour y
rpondre :
Question 1 Question 2
Priode
1
temps
Priode
2
124
Processus
de
conception
dun
schma
relationnel
question, la variabilit temporelle est limite quelques priodes dfinies (par exemple deux
sur le schma). De plus, la question porte sur lidentification de contacts lis un ou
plusieurs numros particuliers. Le degr de variabilit des informations analyses pour
chaque dimension permet dans ce cas, didentifier la dimension dominante : le nombre de
priodes est beaucoup plus restreint que le nombre de contacts. Par contre pour la premire
question, le nombre de contacts est limit (par exemple un nombre restreint de numros
dintrt) et lensemble des communications sont reprsentes temporellement afin de
visualiser globalement la frquence et le rythme des contacts.
Limportance de lidentification de la dimension dominante a galement t mise en
vidence lors de lvaluation du changement de type de graphique pour analyser la
distribution gographique des envoyeurs de spams45. Dtecter des zones gographiques
plus fortement touches, implique de comparer le nombre de courriels envoy en fonction
de la distribution spatiale. La dimension spatiale est dominante. La carte permet donc
deffectuer visuellement une telle analyse de manire plus efficace. Lors de lvaluation, il a
t observ que le nombre dobservations effectues par les tudiants en se basant sur la
carte est environ dix fois suprieur quavec les graphiques pour le niveau de lecture
intermdiaire (qui correspond une lecture aux niveaux de rgions gographiques).
La slection dun type de reprsentation adapt a un impact important sur les possibilits
danalyse. La dcomposition propose en fonction des quatre dimensions danalyse, semble
tre un guide utile lors de ce choix. Cette proposition initiale est gnrale. Elle est
certainement utile lors de llaboration de toutes les formes de reprsentation. Les lments
45
Cf. Annexe 4 : Evaluations prliminaires - Modification du type de reprsentation, page 272
Elments
de
mthode
125
de mthode dcrits dans les sections suivantes concernent par contre uniquement la
dimension relationnelle. Des descriptions des formes de reprsentation exploitables pour
lanalyse quantitative, temporelle et spatiale en regard de diffrents objectifs danalyse sont
prsentes dans lannexe un.
E l a b o r a t i o n d u m o d l e r e l a t i o n n e l
La premire tape effectuer lors de la conception dun schma relationnel consiste dfinir
le modle relationnel du problme trait : une dcomposition sous la forme dentits (des
personnes, des vnements, des objets, des traces, etc.) et de leurs relations. Parce que le
modle dfini omet les lments non essentiels pour la question danalyse, il facilite le
traitement des informations en rduisant leur complexit. Labstraction dfinie par le modle
relationnel permet disoler les aspects importants pour la question danalyse. Il est donc par
nature incomplet et imprcis. Il ny a cependant pas un modle correct pour une
situation, uniquement des modles adquats ou non en fonction de lobjectif danalyse
(Rumbaugh et al., 1991).
Pour chaque entit les attributs dintrts doivent galement tre identifis. Par exemple,
dans le cadre de lanalyse dun trafic de marchandises, la date et le lieu des ventes, ainsi que
le prix et la quantit des produits vendus sont des lments gnralement pertinents pour
chaque transaction investigue. La dmarche gnrale recommande consiste faire
linventaire le plus exhaustif possible des entits pertinentes reprsenter, puis de tracer les
relations existantes entre celles-ci.
En effet, il est frquemment observ que des ambiguts de reprsentation sont issues dune
mauvaise identification dune entit. Dans le cadre de lexemple prsent dans le chapitre
Evaluations prliminaires de telles ambiguts sont observes sur un peu plus de
cinquante pourcent des schmas analyss46. Lors des formations de base sur la conception
de schmas relationnelles, il est trs souvent observ notamment que les vnements sont
apparemment les entits les plus difficiles identifier. Il sagit du moins du type dentit le
plus frquemment omis. De multiples liens sont alors tracs entre les entits impliques lors
46
Avec un total de cinquante-sept participants (cf. Reprsentation dune affaire complexe, page 73)
126
Processus
de
conception
dun
schma
relationnel
de lvnement (comme des personnes, des vhicules ou des objets). Le schma sen trouve
alors beaucoup plus complexe, voire dans certains cas ambigu.
Une fois les entits dintrts identifis, leurs relations doivent tre dfinies. Par exemple, les
personnes sont gnralement relies aux vnements par des relations de type rle . Les
traces sont collectes sur des scnes de crimes, des objets ou des personnes. Lors de
lvaluation effectue, dans plus de soixante pourcent des schmas, certaines relations sont
mal positionnes par les participants.
Ceux deux types derreur semblent tre les causes principales des ambigits observes sur
des schmas relationnels. Il ressort globalement des valuations que la dcomposition dune
situation en entits et relations nest pas une tche vidente. En effet, dans les exemples
traits, aucune dcomposition mergeante nest observe. Cette tape du processus
ncessite donc un certain entrainement et une bonne comprhension de la notion dentit et
de limportance dune dcomposition adapte en regard des objectifs danalyse.
La nature des informations reprsentes doit galement tre comprise est matrise. Lors du
pr-test ralis lors de lvaluation de la section prcdente, des difficults de
comprhension ont t observes. Les schmas qui portaient sur des entits peu familires
des participants, telles que les saisies, les chantillons et les classes chimiques taient
visiblement plus difficiles comprendre. Les participants ont passs en moyenne une dizaine
de minutes de plus pour rpondre aux questions. Cette observation souligne limportance
dune dfinition claire des entits en jeu.
Elments
de
mthode
127
S i m p l i f i c a t i o n s
Il a t montr47 que les reprsentations qui sont visuellement les plus simples sont
gnralement les plus efficaces. Le nombre dentits et de liens est notamment un facteur de
complexit. Il est en effet reconnu que plus le nombre dentits est grand, plus le graphe est
difficile lire. Moreno (1953) recommande de construire des rseaux dune trentaine
dentits au maximum et de simplifier le schma si le nombre de sommets est trop
important. Dautres auteurs soutiennent galement que les graphes les plus efficaces sont de
petites tailles (de dix cinquante entits et entre vingt cent liens) (Shneiderman & Aris,
2006) (Teyseyre & Campo, 2009).
Simplifier le schma en reprsentant certains concepts par des cadres ou par des attributs
permet notamment de rduire le nombre dentits et de liens et ainsi daugmenter sa clart.
Lorsque deux choix de reprsentation sont possibles, il est recommand dexploiter la forme
la plus simple : celle offrant la meilleure lisibilit.
I d e n t i f i c a t i o n d e s e n t i t s p r i n c i p a l e s
Afin deffectuer des simplifications sur le schma, il est ncessaire didentifier quelles sont
les entits principales sur lesquelles porte la question danalyse et entre lesquelles des
relations doivent tre cherches et reprsentes, par exemple :
1. Si lobjectif danalyse consiste reconstruire une srie dvnements, la
reprsentation est labore afin de visualiser les relations entre les cas. Lvnement
est le type dentit principal. Lors de la reconstruction de la srie, il est notamment
ncessaire de dcider quels cas font partie de la srie en fonction des relations
dtectes, telles que des relations bases sur les traces ou la proximit
spatiotemporelle.
47
par les exemples prsents dans la premire partie (page 73 et suivantes) et lvaluation effectue sur la
reprsentation des relations (pages 104 et suivantes).
128
Processus
de
conception
dun
schma
relationnel
2. Dans le cas de la reconstruction dun rseau criminel, les personnes sont les entits
principales entre lesquelles lenquteur cherche identifier et comprendre les
relations et les rles respectifs de chaque protagoniste.
3. Lors de lvaluation de la pertinence des traces, un schma relationnel peut tre
labor afin davoir une vue densemble des informations. La trace est lentit
principale. La dcision porte sur le choix des traces analyser en priorit.
Identifier les entits principales sur lesquelles portent la question danalyse et la prise de
dcision permet de guider les choix de simplification.
Cette tape de processus est importante, car elle permet de guider les choix de
reprsentation, notamment lorsque des simplifications de reprsentation sont ncessaires
pour augmenter la lisibilit. En principe, les concepts sur lesquels se base la prise de dcision
sont reprsents par des entits. Les simplifications sont en priorit effectues sur les entits
lies, telles que les socits qui peuvent tre reprsentes par des cadres pour exprimer des
relations professionnelles entre des individus sur le schma dun rseau criminel.
S i m p l i f i c a t i o n p a r s l e c t i o n
Elments
de
mthode
129
Lexemple ci-dessous est tir dune affaire relle. Lobjectif tait de reprsenter la structure
dun trafic de stupfiants. Sur ce schma les informations ont t dcomposes en cinq types
entits principales : des personnes, des numros de tlphones, des arrestations et des
adresses. Les relations en rouge reprsentent des ventes de stupfiants. Les personnes sont
les entits principales. Leurs relations mutuelles et le rle de chaque individu dans le trafic
sont investigus.
Les relations tlphoniques entre les personnes ntant pas reprsentes, il nest pas utile de
reprsenter les numros de tlphone sous la forme dentits. En outre, lexception de deux
arrestations, tous les individus ont t arrts seul. La question de lutilit de reprsenter les
relations tablies sur la base des arrestations peut galement se poser. Finalement, la plupart
des informations sur les domiciles des personnes ne permettent pas de mettre en vidence
des relations. Il a donc t choisi de reprsenter ces informations sous la forme dattributs
plutt que sous la forme dentits. Le nombre global dentits est ainsi diminu rendant le
schma plus lisible.
130
Processus
de
conception
dun
schma
relationnel
Globalement, il convient donc dtablir si reprsenter certains types dinformations par des
entits permet de mettre en vidence des relations utiles pour lanalyse. Dans le cas contraire
ces informations peuvent tre supprimes de la reprsentation ou reprsentes sous la
forme dattributs. Dautres simplifications peuvent tre apportes ce schma, elles sont
prsentes dans les sections suivantes.
Elments
de
mthode
131
M o d i f i c a t i o n d e l a s t r u c t u r e
Une fois lensemble des entits et des relations identifies, il convient de dfinir la manire
de reprsenter les relations entre les concepts en fonction des objectifs danalyse dfinis. En
effet, la reprsentation des informations dcomposes en entits lmentaires et en
lensemble de leurs relations ne constitue pas toujours une solution efficace. Tel quil a t
montr dans le cas de la reprsentation dun trafic de marchandise48, reprsenter les ventes
sous la forme dentits lies aux acheteurs, vendeurs et objets nest pas une solution adapte
lorsque le nombre de transactions est important. Un changement de structure est parfois
ncessaire pour pouvoir exploiter tout le potentiel de la reprsentation graphique. La
dmarche propose repose sur un usage adapt des formes de reprsentation des relations
dfinies : le lien, le lien dirig, le lien bidirectionnel, le lien multiple, le groupe, lensemble ou
le type.
Identifier les types de relation entre les entits principales et slectionner une forme de
reprsentation adapte pour chacun deux.
Afin dexpliciter la dmarche, les schmas relationnels produits pour reprsenter les liens
tablis entre des saisies de stupfiants par lanalyse chimique est prsent (deux chantillons
ont le mme profil chimique, lorsquils ont t dans la mme masse un moment du trafic
(Guniat & Esseiva, 2005))49. La reprsentation des relations entre les saisies se base sur trois
types dentits : les saisies, les chantillons et les classes chimiques. Pour chaque saisie, un ou
plusieurs chantillons sont prlevs des masses de stupfiant saisies, puis analyses par un
laboratoire. Pour chaque chantillon, une classe chimique est dtermine. Des relations avec
dautres saisies sont tablies avec les autres chantillons de la mme classe. Les saisies, les
chantillons et les classes chimiques sont des entits qui peuvent tre reprsentes comme
telles. Lexemple prsent est tir dune affaire relle.
48
Cf. Reprsentation dun trafic de marchandises, page 75
49
Cf. Saisies de stupfiant et classes chimiques, page 155
132
Processus
de
conception
dun
schma
relationnel
19/01/03 17/06/03 08/01/04 22/05/03 01/11/02 18/06/03 14/10/03 15/10/04 19/08/02 02/08/02 11/04/02 04/08/01 20/06/04 01/01/05 26/02/03 27/07/03 08/10/03 30/01/04 05/09/02 15/01/03 13/02/03 31/07/01 11/12/01 21/08/01 13/05/01 25/01/04 16/09/02
Diepoldsau Milan Cavenago Paderno Dugnano Turin Felizzano Melegnano Munich Slovnie Slovenie Milan Milan Zurich Delmont France Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 5'000 g 35'000 g 19'600 g 1g 28'500 g 26'500 g 191'000 g 14'000 g 8'357 g 6'000 g 20'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
129-03.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 424-10.04 033-02.03 033-02.03 015-01.05 015-01.05 150-03.05 219-05.05 033-02.03 033-02.03 033-02.03 486-12.04 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05
95 g
6500 g 39 %
25 % 6500 g
7500 g 23500 g 9500 g 5000 g 35000 g 19600 g 1 g 0 g 191000 g 14000 g 6000 g
2000 g 25 % 4500 g 4500 g
4% 4% 4% 4% 4% 4% 1% 2000 g 6% 16 % 12 %
1000 g 7000 g 500 g 3000 g 0 g 22 % 0 g 82800 g 10500 g 32700 g 30000 g 69000 g 99600 g 30000 g 8800 g 9900 g
500 g 29 % 12 % 3% 3%
28 % 30 % 41 % 30 % 36 % 4% 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
25 %
2000 g
12 %
h009 h992 h007 h993 h008 h010 h003 h002 h999 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
1'000 g 500 g 11'107 g 500 g 3'465 g h005 h006 h001 5g 4'535 g 11'500 g 0g 9'500 g 2'030 g 4'505 g 5'125 g 82'800 g 10'500 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
heroine heroine heroine heroine heroine 112'060 g 178'826 g 8'205 g heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine morpine cocaine cocaine
heroine heroine heroine
60 g 5 g 1000 g 30 g 5 g
25 g 75 g 5000 g 125 g 5 g 1000 g 172 g 0 g 0 g 2000 g 0 g 0.1 g 3500 g 0.7 g 75 g 2.6 g
0.4 g 5 g 4080 g 8 g 7 g 7 g 415 g 20 g 10 g 20 g 2% 10 % 16 % 12 % 10 %
1% 8% 34 % 14 % 16 % 31 % 4% 10 % 10 % 8% 13 % 8% 14 % 14 % 16 % 25 %
7% 9% 10 % 10 % 10 % 13 % 22 % 19 % 21 % 16 %
1000 g 4000 g 30 g
12 % 39 % 15 %
01/04/03 23/04/01 27/06/03 10/06/99 13/07/04 24/06/99 25/03/03 08/06/99 22/06/99 14/07/04 12/11/04 19/04/01 02/12/02 12/09/03 14/07/04 10/12/04 23/04/01 03/04/01 19/07/04 29/04/04 10/06/04 26/06/04 07/06/04 22/05/01 09/12/04 29/01/04 15/03/04 21/06/01 30/10/03 11/03/03 07/04/04
Geneve Geneve Lausanne Geneve Lausanne Lancy Geneve Geneve Geneve Vernier Yverdon Grand-Saconnex St-Margrethen Geneve Grand-Saconnex Geneve Geneve Renens Onex Bad Reichenhall Vernier Geneve Vernier Vernier Meyrin Vernier Geneve Bellinzona Geneve Geneve Geneve Bellinzona
16 g 54 g 1'361 g 8g 7g 43 g 419 g 30 g 40 g 20 g 85 g 1'300 g 40'000 g 129 g 57 g 2'700 g 10 g 172 g 97 g 43'500 g 78 g 2'061 g 7'269 g 1'450 g 1'576 g 1'000 g 15'360 g 570 g 230 g 950 g 3g
154-05.03 164-05.01 194-06.03 286-06.99 305-07.04 313-06.99 137-05.03 283-06.99 310-06.99 317-07.04 477-11.04 305-09.01 185-03.05 311-10.03 319-07.04 508-12.04 165-05.01 105-04.01 368-09.04 306-07.04 281-06.04 367-09.04 278-06.04 189-06.01 047-02.05 069-02.04 124-03.04 242-07.01 386-11.03 136-05.03 162-04.04
5 g 6 g 50 g
9% 4% 25 g 3000 g 14 % 5 g 2043 g 2.7 g
10 g 8% 32 % 19 % 12 % 15 %
26 %
h886 h019
275 g 75 g
h012 h990 h889 h017 h884 h018 h020
heroine heroine
50 g 25 g 3'000 g 980 g 5g 2'063 g 23 g
heroine heroine heroine heroine heroine heroine heroine
270 g
8% 62 g 7.1 g 40 g 20 g 20 g
0 g 19 % 11 %
10 % 11 % 11 %
22 % 30 g 900 g
8% 11 %
Diepoldsau Milan Cavenago Paderno Dugnano Munich Melegnano Felizzano Turin Slovnie Zurich Slovenie Milan Milan France Delmont Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 28'500 g 8'357 g 26'500 g 14'000 g 191'000 g 20'000 g 6'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
6'500 g 4'500 g
25 % 4'500 g 3%
2'000 g
3%
2'000 g 0g 12 %
0g 6'000 g 0g 14'000 g 191'000 g 6'500 g 2'000 g 95 g 82'800 g 10'500 g 32'700 g 30'000 g 69'000 g 99'600 g 30'000 g 8'800 g 9'900 g
500 g 500 g 1'000 g 3'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 4%
7'000 g 29 % 22 % 6% 12 % 16 % 25 % 12 %
25 % 41 % 28 % 30 % 4% 4% 4% 4% 36 % 39 % 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
30 % 4% 4% 1%
h992 h993 h009 h008 h010 h001 h999 h002 h003 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
h007 1'000 g 3'465 g 5g 8'205 g 0g 11'500 g 4'535 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
11'107 g h005 h006
112'060 g 178'826 g
60 g 25 g
2% 1% 30 g 5g 1g 75 g
2'000 g 0g 3'500 g 0g 0g 172 g 30 g 1'000 g 4'000 g 3g
7g 4'080 g 20 g 20 g 415 g 5g 1'000 g 75 g 125 g 5'000 g 12 % 10 % 14 % 16 %
0g 5g 7g 8g 10 g 5g 0g 8% 8% 14 % 10 % 10 % 4% 15 % 12 % 39 % 25 %
7% 9% 10 % 13 % 10 % 10 % 21 % 19 % 16 % 22 % 10 % 31 % 16 % 8% 14 % 34 % 13 %
Bad Reichenhall Vernier Vernier Onex Renens Meyrin Vernier Geneve Geneve Bellinzona Geneve Geneve Bellinzona
Geneve Geneve Lausanne Lancy Geneve Lausanne Geneve Geneve Vernier Geneve Yverdon Geneve Geneve Grand-Saconnex Grand-Saconnex Geneve St-Margrethen Vernier Geneve 43'500 g 2'061 g 7'269 g 97 g 172 g 1'450 g 1'576 g 570 g 1'000 g 15'360 g 230 g 950 g 3g
16 g 54 g 7g 43 g 8g 1'361 g 40 g 30 g 20 g 419 g 85 g 10 g 121 g 57 g 1'300 g 129 g 40'000 g 78 g
25 g
8%
3'000 g 2'043 g
5g 6g 10 g 50 g 5g 3g
32 % 12 %
9% 4% 26 % 14 % 19 % 15 %
1'000 g
16 %
270 g 62 g 7g 0g 40 g 900 g 30 g 20 g 20 g
8% 10 % 11 % 22 % 11 % 11 % 8% 19 % 11 %
Une telle modification de la structure du schma amliore sa lisibilit 51. La reprsentation des
relations entre les saisies de stupfiants fait lobjet dun pattern dtaill dans le chapitre
suivant.
50
Cf. Typologie de relations, page 102
51
Cf. Reprsentation dune entit sous la forme dun lien, page 112
Elments
de
mthode
133
Sur le schma du trafic de stupfiant prsent dans la section prcdente, les liens tablis sur
la base du domicile des personnes peuvent tre reprsentes en exploitant des cadres par
exemple.
Dautre part, des ensembles de personnes sont galement mis en vidence par lutilisation
des accolades (signifiant dfini pour reprsenter un groupe dentits dun mme type). En
effet, les quatre icnes de personnes en bas du schma reprsentaient, sur le schma initial,
des groupes de clients toxicomanes. Lusage des accolades permet deffectuer cette
distinction rapidement. Alors que sur le premier schma, la lecture du label des entits est
ncessaire pour faire cette distinction.
134
Processus
de
conception
dun
schma
relationnel
S i m p l i f i c a t i o n p a r a g r g a t i o n
Procder par agrgation afin de varier la perspective sur les informations et rduire le
nombre dinformations par regroupement
C2 C2
C4 5 C4
4
3
C1 C3 1
C1 5 C3
Elments
de
mthode
135
C o n s t a n c e e t d f i n i t i o n d e c o n v e n t i o n s
Dfinir des conventions de reprsentation : lensemble des informations dun mme type
doivent tre reprsents de faon similaire.
A titre dexemple, la couleur des liens peut tre exploite pour distinguer des types de
relations, tels que le bleu pour les relations familiales et le vert pour les relations
professionnels entre des personnes, etc. Si sur un mme schma ces couleurs sont galement
exploites pour reprsenter dautres types de relations, sa lecture est rendue plus difficile,
voire mme ambigu si les liens ne sont pas documents par des labels.
Des conventions doivent galement tre dfinies pour exprimer lincertitude, pour distinguer
les faits des hypothses et pour reprsenter la ngation (Atzenbeck et al., 2009b). Les choix
peuvent tre divers, mais ils doivent tre appliqus de manire constante et documents par
une lgende.
R e p r s e n t e r l i n c e r t i t u d e
Une convention existe pour distinguer des relations confirmes de relations incertaines. En
effet, lusage du trait-till semble globalement admis pour exprimer lincertitude.
Par contre, aucune convention nexiste pour exprimer lincertitude sur les nuds. Pourtant, il
nest pas rare que des informations descriptives des entits soient
incertaines (comme lidentit dune personne par exemple). De ces cas, il est
utile dexprimer visuellement cette incertitude. Le style de la police
dcriture peut tre utilis : par exemple, litalique.
136
Processus
de
conception
dun
schma
relationnel
Dans le cadre de lenqute judiciaire, lincertitude est permanente, notamment lorsque les
informations reprsentes sont issues de dclarations de victimes, de tmoins ou de
prvenus. Lincertitude est alors reprsente en fonction de la source. Si celle-ci dclare avoir
des doutes, linformation est reprsente comme incertaine. Si par contre elle affirme un fait,
linformation est reprsente comme confirme. Il est donc important de reprsenter
galement la source de linformation pour en valuer la fiabilit.
D i s t i n g u e r l e s f a i t s d e s h y p o t h s e s
Les notions dincertitude et dhypothse sont trs proches. Il est toutefois utile de distinguer
les hypothses formules sur la base des donnes collectes de lincertitude ou des
hypothses faites par les sources dinformations. Par exemple, lanalyste peut faire
lhypothse dun lien entre une personne inconnue (lie une activit particulire) et un
suspect potentiel. Sur le second schma, lincertitude est issue du tmoignage :
Une hypothse tant par dfinition incertaine, la convention du trait-till est exploite. La
police de caractre est alors utilise pour distinguer lhypothse de lincertitude. Des points
dinterrogation peuvent galement tre ajouts pour renforcer la distinction.
R e p r s e n t e r l a n g a t i o n
Dun point de vue visuel, toutefois, tracer un lien entre deux entits exprime la prsence
dune relation. Une lecture dtaille des labels des liens est alors ncessaire pour distinguer
la ngation. Sur un graphe de taille plus importante, ne pas distinguer visuellement la
ngation peut engendrer une perception visuelle fausse des relations. Distinguer
visuellement la ngation en exploitant la couleur, le style de trait, voire la police savre
ncessaire :
Elments
de
mthode
137
Il est donc important de dfinir trois conventions diffrentes pour distinguer ces dimensions.
O r d o n n a n c e m e n t d e s c o m p o s a n t s
Lorsque la structure du graphe est dfinie et simplifie par slection, par lexploitation de
reprsentations adaptes des relations ou par agrgation, le positionnement des entits peut
tre optimis afin daccrotre la lisibilit du schma. Des algorithmes automatiques ont t
dvelopps pour optimiser ce placement (cet aspect technique fait lobjet de nombreuses
recherches qui ne sont pas discutes dans cette thse).
Lorigine exacte de ces recommandations est difficile tablir. En effet, de nombreux auteurs
ont discuts et valus ces recommandations sans toujours en citer une origine. Bertin (2005)
relevait dj quil est ncessaire de chercher la disposition qui offre le minimum de
croisements ou la figure la plus simple, tout en conservant les groupements, oppositions ou ordres
ventuels . Moreno (1953), dont les travaux semblent tre lorigine des rseaux sociaux,
recommande galement de minimiser les croisements de traits. Les travaux de recherches
mens sur limpact du placement des nuds sur la lisibilit dun graphe ont montr que
minimiser les croisements de traits amliore significativement la lisibilit. Lorthogonalit et
le paralllisme des relations semblent avoir par contre un impact plus faible. Lorthogonalit
et le paralllisme augmente toutefois lesthtisme du graphe et rend sa lecture plus agrable
et facile (Purchase, 2000).
138
Processus
de
conception
dun
schma
relationnel
Lexemple ci-dessous illustre limpact du positionnement des entits sur la lisibilit et son
impact sur lutilisabilit du schma. Lexemple prsent est issu dune affaire relle. Il rsume
les nombreuses relations tlphoniques entre les protagonistes de laffaire. Quatre types
dentits sont reprsents : des personnes, des socits, des tlphones et des cartes SIM. Les
tlphones et les cartes SIM sont spars en deux types dentits, car certains individus ont
utilis plusieurs cartes dans un mme botier.
Elments
de
mthode
139
Le schma final est visiblement plus clair et simple lire. Les modifications apportes se
basent sur les deux principes dcrits prcdemment (minimiser les croisements de traits et
maximiser lorthogonalit), mais galement sur un placement ordonn des nuds en
fonction de leurs types. En effet, les personnes, les botiers et les cartes SIM sont repartis sur
laxe vertical sur des lignes bien spares.
Par ailleurs, les couleurs des relations nont pas t modifies par rapport au schma initial.
Pourtant sur le schma final, les couleurs crent un effet souhait de couches qui permet de
distinguer plus facilement les relations et minimise limpact sur la lisibilit des croisements
de traits. Dans cet exemple, la couleur est dfinie en regard des personnes lies (une couleur
par personne ou groupe de personnes). Il est galement intressant de relev que lindividu
en haut au centre du schma est mis en vidence par rapport aux autres personnes. Cet effet
visuel est connu (Eppler & Aeschimann, 2009). Moreno (1953) relevait dj que la position
centrale en fait un groupe privilgi qui crase les autres groupes. Un ordonnancement
linaire des nuds peut nanmoins lgrement attnuer ce biais visuel (tel que dans
lexemple ci-dessus).
Un positionnement adapt des nuds est donc important pour accrotre la lisibilit dun
schma. Il peut galement tre exploit pour reprsenter des relations particulires entre les
entits. Reprsenter une chronologie dans le cas dun schma temporel ou sparer des
groupes de personnes lors de la reprsentation dun rseau sont des exemples dexploitation
du positionnement pour reprsenter des relations.
140
Processus
de
conception
dun
schma
relationnel
Positionner les sommets sur le plan pour exprimer un type de relation particulier tel que la
chronologie et/ou en fonction des types dentits, tout en veillant minimiser les
croisements de traits et maximiser lorthogonalit afin daccroitre la lisibilit.
Les deux individus centraux sont les trafiquants sur lesquels lenqute cest focalise. Les
individus au-dessus sont les fournisseurs identifis et les personnes en dessous sont les
dealeurs auxquels ils ont vendu des stupfiants. Les entits en bas reprsentent des groupes
de clients. Le positionnement est donc dfini en fonction du rle des personnes afin de
reprsenter la structure du rseau.
Elments
de
mthode
141
R s u m d e l a m t h o d e p r o p o s e
c. Identifier les types de relation entre les entits principales et slectionner une
forme de reprsentation adapte pour chacun deux : le lien, le lien dirig, le
lien bidirectionnel, le lien multiple, le groupe, lensemble ou le type.
6. Positionner les sommets sur le plan pour exprimer un type de relation particulier tel
que la chronologie et/ou en fonction des types dentits, tout en veillant minimiser
les croisements de traits et maximiser lorthogonalit afin daccroitre la lisibilit.
P a t t e r n s
d e
v i s u a l i s a t i o n
r e l a t i o n n e l l e
Les recommandations et les lments de mthode formaliss dans le chapitre prcdent sont
en partie issus de recherches empiriques et de principes issus de la littrature. Mais ils ont
galement t formaliss sur la base dobservations effectues au cours denqutes. Ce
chapitre prsente les bonnes pratiques identifies pour reprsenter certaines situations
rcurrentes traites dans le cadre denqutes judiciaires, telles que le traitement de sries de
cambriolages ou lanalyse de donnes tlphoniques. La dmarche est ainsi explicite par des
exemples concrets. Lobjectif est damorcer le dveloppement dun catalogue de bonnes
pratiques qui rpertorie des situations qui se rptent et des solutions qui sont appropries. Il
ne saurait tre dmontr que les solutions proposes sont les meilleures possible. Elles ont
toutefois montr une certaine efficacit lors de lanalyse des cas ou pour la communication
des rsultats denqute lors de la transmission de dossiers aux magistrats instructeurs.
Inventorier des formes de reprsentations adaptes pour des situations frquemment traites
devrait tre utile pour faciliter lchange de connaissances entre praticiens et galement en
matire denseignement.
Le terme de pattern est utilis pour dcrire ces bonnes pratiques. La notion de pattern est
issue des travaux de Christopher Alexander qui, dans les annes septante, a dvelopp des
solutions pour des problmes spcifiques de conception architecturale (Alexander, 1979). La
formalisation propose par Alexander a par la suite t reprise dans le domaine de la
conception logiciel o des patterns ont t dfinis pour dcrire des solutions spcifiques pour
des problmes de dveloppement informatique rcurrents (Gamma et al., 1995). Un pattern
peut se dfinir comme la description dune solution adapte pour un problme rcurrent de
conception. Dans le cadre de cette thse, les patterns formaliss dcrivent des solutions
efficaces pour reprsenter des situations rcurrentes. Chaque pattern est compos de quatre
parties : (1) une description du contexte dexploitation, (2) une description du ou des objectifs
Analyser
une
srie
dvnements
143
danalyse, (3) une description des concepts reprsenter et (4) une description de la solution
graphique propose. Pour chaque pattern, au moins un exemple dexploitation est prsent et
les choix de reprsentation sont discuts. Seuls trois patterns ont t formaliss sur la base
des cas traits par lauteur et de discussions avec des praticiens : analyser une srie
dvnements, valuer la pertinence de traces et analyser des transactions. Lide de ce
chapitre est damorcer le dveloppement dun catalogue de patterns plus large.
A n a l y s e r u n e s r i e d v n e m e n t s
C o n t e x t e
De nombreuses enqutes portent sur le traitement de sries de dlits perptrs par des
auteurs dits prolifiques. Il nest pas rare, par exemple, que des cambrioleurs commettent de
nombreux cas. Savoir dtecter, reconstruire et analyser une srie dvnements offre de
nombreuses perspectives oprationnelles. Dtecter des rgularits spatio-temporelles pour la
mise en place de surveillances, confirmer lhypothse quun ensemble de cas a t commis par
le mme individu ou groupe dindividus des fins de poursuites judiciaires ou encore
identifier des modes opratoires mergeant des fins de prvention, sont autant de
renseignements qui dcoulent de lanalyse dune srie. Dans ce contexte, plusieurs formes de
visualisation peuvent tre exploites pour soutenir lanalyse : reprsenter les distributions
temporelles et spatiales par des diagrammes et des cartes52 ou reprsenter lensemble des
relations entre les cas sur des schmas dvnements53 afin notamment de tester lhypothse
de la srie. La conception de ce type de schmas est explicite dans ce pattern.
O b j e c t i f s d e l a r e p r s e n t a t i o n
Les schmas dvnements sont exploits au cours de lenqute pour reconstruire la srie et
faciliter sa vue densemble. En fin denqute, ces schmas servent galement faciliter
lapprhension du dossier par les acteurs du processus judiciaire.
52
Cf. Annexe 1: Dimensions danalyse et visualisation, page 233
53
Cf. Analyse et visualisation relationnelle, page 43
144
Patterns
de
visualisation
relationnelle
C o n c e p t s r e p r s e n t e r
Diffrents types de relations entre les cas peuvent tre reprsents : les relations forensiques,
les liens spatio-temporelles, les liens avec des vhicules vols et retrouvs lors de la
commission des cas ou proximit ou des objets (tels que le butin des vols. Chaque type de
relation doit tre clairement distinguable et les incertitudes associes chaque lien (par
exemple, lorsque les traces sont partielles) doivent galement tre reprsentes afin de
pouvoir valuer la fiabilit des relations.
Les principaux types de liens sont dcrits dans les sections suivantes. La manire de
reprsenter chacun deux est prsente et discute dans des sections spares.
Liens
spatiotemporels
Analyser
une
srie
dvnements
145
E x e m p l e d e c a s
Lexemple
i 30th dcembre 2006 ci-dessous
31st dcembre 2006 intgre,lundi
au 1st
sein dune
janvier 2007mme affaire,
mardi 2ndlensemble
janvier 2007 desmercredi
types de3rd relations
janvier 2007 jeudi 4th janvie
12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00
frquemment observs lors de lanalyse dune srie de cambriolages.
Visuellement
reconnaissable Suspect ?
Sur lui lors
de l'arrestation
Profil ADN
Profil ADN
{ }
Motif CAT ?
Plusieurs cas
sur VD
Motif ADIDAS
Boudry
Boudeviliers
mme rue
vol
{ }
lis selon
enqute baloise retrouve
Plusieurs cas VPE garage
sur BL 26-27.03.2008 Ordinateur
retrouv
vole
NE9XXXX
Reprsentation
par
un
cadre
des
relations
spatiotemporelles
(relations
reprsentes
selon
le
principe
de
connectivit)
Reprsentation
du
type
dvnement
par
une
icne
(ou
ici
du
canton,
par
exemple)
(relations
reprsentes
selon
le
principe
de
similarit)
146
Patterns
de
visualisation
relationnelle
dcembre 2006 31st dcembre 2006 lundi 1st janvier 2007 mardi 2nd janvier 2007 mercredi 3rd janvier 2007 jeudi 4th janvier 2007
Distinction
des
types
de
relations
par
des
couleurs
2:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00
(bleu
:
motif
de
semelle
/
rouge
:
profil
adn)
(reprsentation
des
types
selon
le
principe
de
similarit)
Reprsentation
de
lincertitude
ou
des
hypothses
(en
exploitant
des
conventions)
Visuellement
reconnaissable Suspect ?
Sur lui lors
de l'arrestation
Profil ADN
Profil ADN
{ }
Motif CAT ?
Plusieurs cas
sur VD
Motif ADIDAS
Boudry
Boudeviliers
mme rue
vol
{ }
lis selon
enqute baloise retrouve
Plusieurs cas VPE garage
sur BL 26-27.03.2008 Ordinateur
retrouv
vole
NE9XXXX
Les
relations
avec
des
vhicules
et
plaques
sont
reprsentes
par
des
liens
multiples
(relations
reprsentes
selon
le
principe
de
connectivit)
Analyser
une
srie
dvnements
147
Sur ce schma, six types dentit sont reprsentes : des vnements, des personnes, des
profils (les motifs de semelles et les profils ADN), des vhicules, des plaques et des objets. Ces
types sont distingus par des icnes symbolisant les concepts (selon le principe de similarit).
Les traces sont visuellement reprsentes par des liens entre les vnements et les profils. Ce
choix de reprsentation est explicit dans les sections suivantes. La reprsentation est
volontairement simplifie (au niveau des labels des entits et des liens) afin de faciliter sa
lecture et mettre en vidence sa structure.
De tels schmas peuvent galement tre exploits pour reprsenter des sries plus
importantes, voire 20--31st
10--20th janvier 2009
mettre en vidence des1--5th
janvier 2009
relations
fvrier 2009
particulires
5--10th fvrier 2009
entre plusieurs sries.
10--15th fvrier 2009
Dans le
15--20th fvrier 2009
12th 14:00 13th 20th 08:00 29th 30th 12:00 21:00 22:00 1st 2nd 3rd 4th 5th 6th 8th 06:00 10th 12th 07:30 12:00 15th 18th 07:00 08:30 19th
cas prsent ci-dessous, un cas vaudois et un vhicule permettent de relier deux
sries initialement perues comme spares: une srie dtecte par des traces de semelles (en
vert) et une srie dtecte par un profil ADN (en bleu).
LU...
VD
Me 28.01.09,
00:30-05:30, VD
St-Prex/VD.
NOTTE
Ve 30.01.09,
16:15-21:15, VW Golf blanche vhc vol vhc retrouv
CHIGNOLE,
Genolier/VD.
Cambriolage
Villa.
SERA, vhc vol LU
VW TOURAN grise BL
Cambriolage Je 12.02.09, Ve 13.02.09,
28.01.2009 Villa. 02:00-05:00, Sissach/BL.
05:30:00 Kriens/LU. Dcouverte
30.01.2009
21:15:00 NOTTE vhicule
CHIGNOLE, Vol Voiture.
de vhicules 13.02.2009
SO
Lu 09.02.09,
SO... Voiture. 12:00:00
12.02.2009
01:00-05:00,
05:00:00
Oberbuchsiten/
VD SO. NOTTE
VD VD VD VD VD CHIGNOLE, Vol
Lu 12.01.09, Je 29.01.09, VD VD VD VD VD
Lu 12.01.09, Je 15.01.09, Me 28.01.09, Me 28.01.09, VD de vhicules
08:50-12:50, 08:10-17:10, 07:15-15:15, 00:00-05:00, 07:00-20:00, Ve 30.01.09, Ve 30.01.09, Sa 31 / Di Lu 02.02.09,
13:00-20:00, Ve 30.01.09, Sa 31.01.09, Voiture.
Mies/VD. Mies/VD. Tolochenaz/VD. St-Prex/VD. St-Prex/VD. 16:15-21:15, 16:30-21:30, 01.02.09, 02:00, SO1...
Gland/VD. 08:15-20:15, 15:40-22:40, 09.02.2009
GIORNO GIORNO GIORNO NOTTE SERA, Genolier/VD. Genolier/VD. 13:30-15:30, Chamby/VD.
SERA, Arzier/VD. Etoy/VD. SERA, 05:00:00
FINESTRA, PIATTO, FINESTRA, CHIGNOLE, Cambriolage SERA, SERA, Morges/VD. NOTTE
Cambriolage GIORNO Cambriolage
Cambriolage Cambriolage Cambriolage Cambriolage Appartement. Cambriolage Cambriolage Cambriolage CHIGNOLE,
Appartement. FINESTRA, Appartement.
Appartement. Villa. Villa. Villa. Villa. Appartement. Appartement. Cambriolage
28.01.2009 29.01.2009 Cambriolage 31.01.2009
12.01.2009 12.01.2009 15.01.2009 28.01.2009 20:00:00 30.01.2009 01.02.2009 Villa.
20:00:00 Villa. 30.01.2009 22:40:00
12:50:00 17:10:00 15:15:00 05:00:00 21:15:00 15:30:00 02.02.2009
30.01.2009 21:30:00
02:00:00
20:15:00
ZH
Ve 06.02.09,
BE Adlikon b. GE GE GE GE
Me 04.02.09, Regensdorf/ZH. Ma 17 / Me Ma 17 / Me Ma 17 / Me Ma 17 / Me
01:15, NOTTE 18.02.09, 18.02.09, 18.02.09, 18.02.09,
Hindelbank/BE. CHIGNOLE, VD 22:45-06:32, 23:00-07:00, 00:01-08:00, 23:30-09:00,
NOTTE Cambriolage Ma 17.02.09, Bellevue/GE. Bellevue/GE. Bellevue/GE. Bellevue/GE.
CHIGNOLE, Villa. 00:00-05:00, NOTTE Cambriolage
VD VD NOTTE NOTTE
VD VD Cambriolage 06.02.2009 Yens/VD. CHIGNOLE, Villa.
Ve 30.01.09, Ve 30.01.09, CHIGNOLE, CHIGNOLE,
Ve 30.01.09, Ve 30.01.09, Caf/restaurant 12:00:00 Cambriolage Cambriolage 18.02.2009
18:45-21:45, 22:45-23:45, Cambriolage Cambriolage
FR 20:25, 18:30-22:30, 04.02.2009 Villa. Villa. 07:00:00
FR Nyon/VD. Nyon/VD. Villa. Villa.
Nyon/VD. Nyon/VD. 01:15:00 17.02.2009 18.02.2009
Ve 30.01.09, Ve 30.01.09, SERA, SERA, 18.02.2009 18.02.2009
SERA, SERA, 05:00:00 06:32:00
02:24, 00:00-08:15, Cambriolage Cambriolage 08:00:00 09:00:00
Cambriolage Cambriolage
Estavayer-le-La Estavayer-le-La Appartement. Villa.
Appartement. Appartement.
c/FR. NOTTE c/FR. NOTTE 30.01.2009 30.01.2009
CHIGNOLE, 30.01.2009 30.01.2009
CHIGNOLE, 20:25:00 21:45:00 22:30:00 23:45:00
Tent. Tent. LU
Cambriolage BL ZH BL NW GE GE
Cambriolage AG AG AG Je 12.02.09, VD VD GE GE
Villa. Me 04 / Je Ve 06.02.09, Di 08.02.09, Je 12.02.09, Ma 17 / Me Ma 17 / Me
Villa. Ma 03 / Je Lu 09.02.09, Ma 10.02.09, Kriens/LU. Ma 17.02.09, Ma 17.02.09, Ma 17 / Me Ma 17 / Me
30.01.2009 05.02.09, Adlikon b. 17:30-20:30, 01:25, 18.02.09, 18.02.09,
30.01.2009 05.02.09, Stein AG/AG. Stetten AG/AG. NOTTE 01:00-05:00, 01:00-06:00, 18.02.09, 18.02.09,
02:24:00 23:15-05:45, Regensdorf/ZH. Arisdorf/BL. Hergiswil 00:01-06:40, 23:30-07:00,
08:15:00 Mellingen/AG. Cambriolage Cambriolage CHIGNOLE, Yens/VD. Yens/VD. 23:00-06:30, 23:30-08:30,
Diegten/BL. NOTTE NOTTE NW/NW. Bellevue/GE. Bellevue/GE.
NOTTE Villa. Villa. Cambriolage NOTTE NOTTE Bellevue/GE. Bellevue/GE.
NOTTE CHIGNOLE, CHIGNOLE, NOTTE NOTTE NOTTE
CHIGNOLE, 10.02.2009 Villa. CHIGNOLE, CHIGNOLE, NOTTE NOTTE
CHIGNOLE, Cambriolage Cambriolage 09.02.2009 CHIGNOLE, CHIGNOLE, CHIGNOLE,
Cambriolage 12:00:00 12.02.2009 Tent. Cambriolage CHIGNOLE, CHIGNOLE,
Cambriolage Villa. Villa. 12:00:00 Individu/vhc Cambriolage Cambriolage
Appartement. 12:00:00 Cambriolage Villa. Cambriolage Cambriolage
Villa. 06.02.2009 08.02.2009 suspect Villa. Villa.
05.02.2009 Villa. Villa. Villa.
05.02.2009 12:00:00 20:30:00 Voiture. 17.02.2009 18.02.2009 18.02.2009
12:00:00 17.02.2009 06:00:00 18.02.2009 18.02.2009
05:45:00 12.02.2009 06:40:00 07:00:00
05:00:00 06:30:00 08:30:00
01:25:00
ADN2...
ZH
Ve 06.02.09,
Adlikon b.
Regensdorf/ZH.
NOTTE
CHIGNOLE,
Cambriolage
Villa.
06.02.2009
12:00:00
148
Patterns
de
visualisation
relationnelle
R e p r s e n t a t i o n d e s l i e n s f o r e n s i q u e s
La trace physique offre de nombreuses perspectives pour dtecter des relations entre des
vnements. De manire gnrale, diffrents types de liens peuvent tre tablis sur la base des
traces : un lien avec la source de la trace (une personne ou un objet), des liens vers plusieurs
sources (notamment lorsque la trace est partielle), voire des sources apparentes dans le cas
de lADN, ainsi que des liens tablis sur la base du type de source, comme le motif dune
semelle (Ribaux & Margot, 1999). Lensemble de ces relations se basent sur la dtection dune
correspondance de profils (un ensemble de caractristiques observes et mesures54). Par
exemple, un ensemble de minuties concordantes (le profil) est observ entre une trace digitale
releve sur une scne de crime et lempreinte dun suspect.
C o n c e p t s r e p r s e n t e r
Dans le cadre de lanalyse dune srie, il est ncessaire de pouvoir reprsenter pour chaque
trace :
- lendroit de prlvement de la trace (sur les lieux ou sur un objet) afin de pouvoir
valuer la pertinence de la trace par rapport lactivit
- le type de trace afin de connatre la nature de la relation
- lincertitude entre la trace et le profil sur la base duquel des relations sont tablies
- le type de relation entre le profil et la ou les sources possibles.
R e p r s e n t a t i o n d e s r e l a t i o n s
Chaque trace est prleve sur un lieu ou un objet particulier. Elle nest donc lie qu une seule
entit lieu ou objet. Dans la majeure partie des cas, la trace nest galement lie qu un seul
profil (des exceptions sont prsentes plus loin). En regard de la typologie des relations
dfinies55, la trace peut donc tre reprsente par un lien :
54
Cf. Analyse, profil et pattern, page 26
55
Cf. Typologie de relations, page 102
Analyser
une
srie
dvnements
149
150
Patterns
de
visualisation
relationnelle
Dans les sections suivantes, la reprsentation de diffrents types de trace est dcrite. Certains
cas particuliers, o lutilisation de ce modle est discutable voire nest pas souhaitable, sont
galement prsents.
T r a c e s d e s e m e l l e s e t m o t i f s
Des traces de semelles sont rgulirement recherches et releves sur des scnes de crimes
afin de reconstituer des cheminements et comprendre lactivit, destimer le nombre de
personnes impliques, voire de guider la collecte dautres traces. En suisse plus
particulirement, ces traces sont recherches en routine sur des cas de cambriolages
notamment en raison de leur potentiel pour lier des cas. En effet, il nest pas rare que des
auteurs sriels conservent leurs chaussures sur des priodes plus ou moins importantes. Des
relations sont alors dtectes entre les cas sur la base des motifs de semelle et peuvent
contribuer dtecter des sries particulires (Girod et al., 2008). Lutilisation de
reprsentations spatiotemporelles facilite notamment la dtection de regroupements
inhabituels, signes dune possible activit srielle (Ribaux et al., 2003). Sur un schma
relationnel, ces relations sont misent en perspective avec lensemble des relations dtectes,
afin de tester lhypothse de la srie.
Analyser
une
srie
dvnements
151
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
Lorsque la qualit de la trace est suffisante, il est possible didentifier le motif correspondant
au dessin de la semelle. La trace peut alors tre reprsente par un lien, puisquelle ne peut
provenir que dun vnement et quune semelle na quun seul motif. Le lien tabli est groupal.
Il se base sur le type de trace. La comparaison des caractristiques acquises des traces peuvent
conduire en infrer une source. La relation est alors tablie avec la source (une chaussure)
(Girod et al., 2008). Dans ce cas de figure galement la trace peut tre reprsente par un lien.
152
Patterns
de
visualisation
relationnelle
E x e m p l e d e c a s
Schma relationnel
Ce schma tir dune affaire relle reprsente les relations tablies sur la base de trois motifs
de traces de semelles. Deux sries supposes sur la base des motifs sont lies par un vhicule
vol lors dun cas en Valais et retrouv proximit dun cas Fribourg. Sur les cas vaudois un
troisime motif (en bleu) a galement t retrouv.
Schma temporel
La srie peut galement tre reprsente chronologiquement. Chaque cas est positionn sur
laxe horizontal en fonction de sa date. Les relations tablies sur la base du motif sont
reprsentes par des lignes horizontales lies aux cas.
Analyser
une
srie
dvnements
153
T r a c e s b i o l o g i q u e s e t p r o f i l A D N
Les traces biologiques, telles que des traces de sang et de rsidus de peau, sont trs
largement exploites pour lier des cas sur la base du profil extrait de lADN. Contrairement aux
systmes automatiques exploits pour la gestion des traces digitales, les bases de donnes
stockant les profils ADN issus de traces permettent la dtection automatise de relations entre
cas (indpendamment de lidentification du profil). Deux traces biologiques sont lies lorsque
leurs profils sont concordants (sur la base de la comparaison des locus analyss).
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
Une trace biologique ne peut tre lie qu un seul vnement. Par contre, il arrive parfois que
certaines traces contiennent plusieurs profils (par exemple lors de prlvements sur des
victimes ou lorsque plusieurs personnes ont touch un mme objet). Dans ce cas, la trace ne
saurait tre reprsente par un lien, puisquelle peut tre lie plusieurs profils. Trois solutions
graphiques sont alors exploitables :
154
Patterns
de
visualisation
relationnelle
Des liens sont galement tablis sur la base de profils dits partiels issus de traces dont
lensemble des loci nont pas pu tre dtects. Des relations plus ou moins certaines peuvent
donc tre tablies en fonction du nombre de loci correspondants. Visuellement, il est possible
de distinguer les liens tablis sur la base de profils
complets et partiels en exploitant la convention du
trait-till pour les liens incertains. Le nombre de loci
correspondants peut alors tre indiqu sous la forme
dun attribut de la trace.
56
Un profil de mlange peut toutefois tre considr comme le rsultat de plusieurs traces. Dans cette optique
cette structure visuelle explicite la prsence de plusieurs traces (vestiges des activits de plusieurs personnes).
Analyser
une
srie
dvnements
155
E x e m p l e d e c a s
La srie reprsente ci-dessous a t dtecte sur la base de trois profils ADN. Le premier
schma reprsente les traces par des entits lies aux cas et aux profils. Le second exploite la
simplification propose.
Reprsentation de la trace par un lien
S a i s i e s d e s t u p f i a n t e t c l a s s e s c h i m i q u e s
Ltablissement de liens entre des chantillons de stupfiants saisis peut tre ralis par
diffrents moyens, tels que la comparaison des proprits physiques (formes, tailles ou
couleurs de pilules par exemple) ou lanalyse chimiques du contenu des stupfiants (tels que
des principes actifs, des impurets ou des produits de coupage). Les liens dtects partir de
la composition chimique du stupfiant se basent sur lhypothse que des variations
importantes sont observables entre diffrents lots et quil est possible de dfinir des profils
dont la spcificit permet dinfrer que deux chantillons dont les profils sont similaires
proviennent dune mme masse (Guniat & Esseiva, 2005).
156
Patterns
de
visualisation
relationnelle
La dtermination du profil chimique dun chantillon de stupfiants permet dtablir des liens
entre les saisies et par l-mme de dtecter des groupes de cas. Les relations issues du
profilage peuvent alors tre interprtes en regard des donnes circonstancielles de l'enqute
et permettent ainsi de reconstruire lactivit de suspects.
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
Un chantillon de stupfiants ne peut tre li qu un seul vnement et une seule classe
chimique (par dfinition de la classe chimique). Il peut donc tre reprsent par un lien.
57
ATF 109 IV 143 (Art. 19 ch. 2 lettre a LStup : ds 12g dhrone, 18g de cocane, 4 kg de haschich ou 200 trips de
LSD) et ATF 113 IV 32 (ds 36g damphtamines).
Analyser
une
srie
dvnements
157
E x e m p l e d e c a s
Le cas prsent est tir dune affaire relle ayant une porte internationale. Lobjectif du
schma tait de reprsenter lensemble des relations tablies par le profilage entre les
diffrentes saisies. Le schma initialement produit a t labor en dcomposant les
informations en trois entits principales : les saisies, les chantillons et les classes chimiques.
Le second schma illustre la simplification apporte en reprsentant les chantillons par des
liens. Ce cas t utilis lors de lvaluation de la reprsentation des relations58. Pour rappel, le
changement de structure propos a engendr une augmentation du taux de rponses
correctes de 8.9% et une rduction du temps de rponse moyen de 27.3% pour identifier la
classe chimique lie au plus grand nombre de saisies59.
19/01/03 17/06/03 08/01/04 22/05/03 01/11/02 18/06/03 14/10/03 15/10/04 19/08/02 02/08/02 11/04/02 04/08/01 20/06/04 01/01/05 26/02/03 27/07/03 08/10/03 30/01/04 05/09/02 15/01/03 13/02/03 31/07/01 11/12/01 21/08/01 13/05/01 25/01/04 16/09/02
Diepoldsau Milan Cavenago Paderno Dugnano Turin Felizzano Melegnano Munich Slovnie Slovenie Milan Milan Zurich Delmont France Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 5'000 g 35'000 g 19'600 g 1g 28'500 g 26'500 g 191'000 g 14'000 g 8'357 g 6'000 g 20'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
129-03.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 424-10.04 033-02.03 033-02.03 015-01.05 015-01.05 150-03.05 219-05.05 033-02.03 033-02.03 033-02.03 486-12.04 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05
95 g
6500 g 39 %
25 % 6500 g
7500 g 23500 g 9500 g 5000 g 35000 g 19600 g 1 g 0 g 191000 g 14000 g 6000 g
2000 g 25 % 4500 g 4500 g
4% 4% 4% 4% 4% 4% 1% 2000 g 6% 16 % 12 %
1000 g 7000 g 500 g 3000 g 0 g 22 % 0 g 82800 g 10500 g 32700 g 30000 g 69000 g 99600 g 30000 g 8800 g 9900 g
500 g 29 % 12 % 3% 3%
28 % 30 % 41 % 30 % 36 % 4% 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
25 %
2000 g
12 %
h009 h992 h007 h993 h008 h010 h003 h002 h999 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
1'000 g 500 g 11'107 g 500 g 3'465 g h005 h006 h001 5g 4'535 g 11'500 g 0g 9'500 g 2'030 g 4'505 g 5'125 g 82'800 g 10'500 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
heroine heroine heroine heroine heroine 112'060 g 178'826 g 8'205 g heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine morpine cocaine cocaine
heroine heroine heroine
60 g 5 g 1000 g 30 g 5 g
25 g 75 g 5000 g 125 g 5 g 1000 g 172 g 0 g 0 g 2000 g 0 g 0.1 g 3500 g 0.7 g 75 g 2.6 g
0.4 g 5 g 4080 g 8 g 7 g 7 g 415 g 20 g 10 g 20 g 2% 10 % 16 % 12 % 10 %
1% 8% 34 % 14 % 16 % 31 % 4% 10 % 10 % 8% 13 % 8% 14 % 14 % 16 % 25 %
7% 9% 10 % 10 % 10 % 13 % 22 % 19 % 21 % 16 %
1000 g 4000 g 30 g
12 % 39 % 15 %
01/04/03 23/04/01 27/06/03 10/06/99 13/07/04 24/06/99 25/03/03 08/06/99 22/06/99 14/07/04 12/11/04 19/04/01 02/12/02 12/09/03 14/07/04 10/12/04 23/04/01 03/04/01 19/07/04 29/04/04 10/06/04 26/06/04 07/06/04 22/05/01 09/12/04 29/01/04 15/03/04 21/06/01 30/10/03 11/03/03 07/04/04
Geneve Geneve Lausanne Geneve Lausanne Lancy Geneve Geneve Geneve Vernier Yverdon Grand-Saconnex St-Margrethen Geneve Grand-Saconnex Geneve Geneve Renens Onex Bad Reichenhall Vernier Geneve Vernier Vernier Meyrin Vernier Geneve Bellinzona Geneve Geneve Geneve Bellinzona
16 g 54 g 1'361 g 8g 7g 43 g 419 g 30 g 40 g 20 g 85 g 1'300 g 40'000 g 129 g 57 g 2'700 g 10 g 172 g 97 g 43'500 g 78 g 2'061 g 7'269 g 1'450 g 1'576 g 1'000 g 15'360 g 570 g 230 g 950 g 3g
154-05.03 164-05.01 194-06.03 286-06.99 305-07.04 313-06.99 137-05.03 283-06.99 310-06.99 317-07.04 477-11.04 305-09.01 185-03.05 311-10.03 319-07.04 508-12.04 165-05.01 105-04.01 368-09.04 306-07.04 281-06.04 367-09.04 278-06.04 189-06.01 047-02.05 069-02.04 124-03.04 242-07.01 386-11.03 136-05.03 162-04.04
5 g 6 g 50 g
9% 4% 25 g 3000 g 14 % 5 g 2043 g 2.7 g
10 g 8% 32 % 19 % 12 % 15 %
26 %
h886 h019
275 g 75 g
h012 h990 h889 h017 h884 h018 h020
heroine heroine
50 g 25 g 3'000 g 980 g 5g 2'063 g 23 g
heroine heroine heroine heroine heroine heroine heroine
270 g
8% 62 g 7.1 g 40 g 20 g 20 g
0 g 19 % 11 %
10 % 11 % 11 %
22 % 30 g 900 g
8% 11 %
En raison du nombre important d'chantillons, tous ceux faisant partie d'une mme saisie et
lis la mme classe chimique ont t regroups et reprsents par une seule icne. Des
drapeaux ont t utiliss comme icnes des saisies afin de mettre en vidence les liens
gographiques.
58
Cf. Reprsentation dune entit sous la forme dun lien, page 112
59
Dans lvaluation: le rond rouge ayant le plus de liens directs avec des carrs noirs
158
Patterns
de
visualisation
relationnelle
Reprsentation des chantillons par des liens entre les saisies et les classes chimiques
Diepoldsau Milan Cavenago Paderno Dugnano Munich Melegnano Felizzano Turin Slovnie Zurich Slovenie Milan Milan France Delmont Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 28'500 g 8'357 g 26'500 g 14'000 g 191'000 g 20'000 g 6'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
6'500 g 4'500 g
25 % 4'500 g 3%
2'000 g
3%
2'000 g 0g 12 %
0g 6'000 g 0g 14'000 g 191'000 g 6'500 g 2'000 g 95 g 82'800 g 10'500 g 32'700 g 30'000 g 69'000 g 99'600 g 30'000 g 8'800 g 9'900 g
500 g 500 g 1'000 g 3'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 4%
7'000 g 29 % 22 % 6% 12 % 16 % 25 % 12 %
25 % 41 % 28 % 30 % 4% 4% 4% 4% 36 % 39 % 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
30 % 4% 4% 1%
h992 h993 h009 h008 h010 h001 h999 h002 h003 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
h007 1'000 g 3'465 g 5g 8'205 g 0g 11'500 g 4'535 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
11'107 g h005 h006
112'060 g 178'826 g
60 g 25 g
2% 1% 30 g 5g 1g 75 g
2'000 g 0g 3'500 g 0g 0g 172 g 30 g 1'000 g 4'000 g 3g
7g 4'080 g 20 g 20 g 415 g 5g 1'000 g 75 g 125 g 5'000 g 12 % 10 % 14 % 16 %
0g 5g 7g 8g 10 g 5g 0g 8% 8% 14 % 10 % 10 % 4% 15 % 12 % 39 % 25 %
7% 9% 10 % 13 % 10 % 10 % 21 % 19 % 16 % 22 % 10 % 31 % 16 % 8% 14 % 34 % 13 %
Bad Reichenhall Vernier Vernier Onex Renens Meyrin Vernier Geneve Geneve Bellinzona Geneve Geneve Bellinzona
Geneve Geneve Lausanne Lancy Geneve Lausanne Geneve Geneve Vernier Geneve Yverdon Geneve Geneve Grand-Saconnex Grand-Saconnex Geneve St-Margrethen Vernier Geneve 43'500 g 2'061 g 7'269 g 97 g 172 g 1'450 g 1'576 g 570 g 1'000 g 15'360 g 230 g 950 g 3g
16 g 54 g 7g 43 g 8g 1'361 g 40 g 30 g 20 g 419 g 85 g 10 g 121 g 57 g 1'300 g 129 g 40'000 g 78 g
25 g
8%
3'000 g 2'043 g
5g 6g 10 g 50 g 5g 3g
32 % 12 %
9% 4% 26 % 14 % 19 % 15 %
1'000 g
16 %
270 g 62 g 7g 0g 40 g 900 g 30 g 20 g 20 g
8% 10 % 11 % 22 % 11 % 11 % 8% 19 % 11 %
332 g 7g 546 g 121 g 92 g 145 g 76 g
Les chantillons sont reprsents par des liens entre les saisies et les classes chimiques.
L'paisseur des liens est proportionnelle la masse de stupfiant saisie. La couleur du lien
dcrit le type de stupfiant (gris pour l'hrone et vert pour la cocane). La quantit et la puret
sont affiches sur le lien. Le nombre d'chantillons ainsi que leurs numros pourraient
galement y tre inscrit. L'espace utilis pour reprsenter la mme information est rduit. Les
relations entre les saisies sont mises en vidence et des groupes de saisies apparaissent de
manire plus vidente. Un repositionnement global des icnes amliorerait encore cet aspect.
De nouvelles informations apparaissent plus rapidement, telles que le type et la masse des
chantillons (ici regroups par classe chimique). La rpartition gographique des chantillons
est plus facilement comparable (essentiellement grce au nombre rduit d'icnes).
Lexemple prsent ci-dessous a t effectu pour reprsenter les relations tablies avec une
saisie particulire (laffaire numro huit sur le schma) :
Analyser
une
srie
dvnements
159
Sur
ce
schma
les
deux
structures
ont
t
exploites
afin
de
reprsenter
deux
niveaux
de
dtails
diffrents.
Pour
laffaire
en
cours,
lensemble
des
chantillons
a
t
reprsent
par
des
entits.
Les
chantillons
analyss
pour
les
saisies
lies
sont
quant
eux
reprsents
de
manire
simplifie.
Lobjectif
ici
tait
de
faciliter
la
communication
des
rsultats
danalyse.
Chaque
chantillon
est
reprsent
pour
laffaire
en
cours
afin
que
les
enquteurs
puissent
mettre
en
relation
ces
informations
avec
les
autres
lments
de
lenqute
(notamment
les
donnes
issues
des
auditions).
R e l a t i o n s a v e c d e s v h i c u l e s
Lors de la commission de dlits, il nest pas rare que les auteurs volent des vhicules pour se
dplacer entre des lieux de cambriolages ou pour transporter leurs butins par exemple.
Certains vhicules sont vols directement lors de cambriolage (par exemple en volant les cls
du vhicule), tandis que dautres sont parfois retrouvs proximit de cambriolages. Ces
vhicules permettent donc de mettre en vidence des relations entre diffrents cas de
cambriolages. De plus, les auteurs changent souvent les plaques dimmatriculations des
vhicules afin dviter les contrles et dexploiter les vhicules sur de plus longues priodes.
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
160
Patterns
de
visualisation
relationnelle
Les relations entre les vnements, les vhicules et les plaques dimmatriculation sont
reprsentes par des liens multiples. Bien que diverses structures de graphe soient
envisageables, le lien multiple est la seule reprsentation qui permet de reprsenter ces
relations efficacement et sans ambigut.
Les structures bases sur lutilisation de liens simples (entre deux entits) sont prsentes ci-
dessous afin dexpliquer les difficults de reprsentation :
Exemple : un vhicule est vol avec une plaque, puis retrouv avec une autre.
Lorsquune plaque est lie plusieurs
vnements et vhicules, il nest plus possible de
dterminer quel vhicule est li chaque
vnement.
Exemple : une plaque est vole sur un vhicule et retrouve sur un autre.
Exemple : plusieurs vhicules sont vols, contrl sou retrouvs en mme temps.
Afin dviter les ambigits prsentes ci-dessus, les trois types dentits peuvent tre lies par
trois liens :
Certaines situations peuvent toutefois porter confusion. Dans cet exemple, deux vhicules (1
et 2) sont lis un vnement (E1). Pour dterminer quel vhicule les plaques A sont lies
Analyser
une
srie
dvnements
161
lors de lvnement E1, il est ncessaire de se baser sur les relations des plaques B. Si le
vhicule 1 navait pas de plaques lors de lvnement E1, il ne serait pas possible de le voir
visuellement. Dans cette situation, la reprsentation est donc ambige. De telles relations
ncessitent donc une forme adapte de reprsentation : les liens multiples. Il faut relever que
la plupart des logiciels utiliss actuellement ne permettent pas de crer de telles relations. Lier
lensemble des entits est alors recommand en prenant garde aux situations particulires
prsentes ci-dessus.
E x e m p l e d e c a s
Les schmas ci-dessous reprsentent des relations issues dune banque de donnes de police.
Le premier schma a t ralis en utilisant des liens multiples. Le second schma reprsente
les mmes relations avec des liens simples. Lefficacit des liens multiples par rapport aux liens
simples na pas t teste dans le cadre de lvaluation prsente dans le chapitre prcdent,
puisque lutilisation de liens simples peut engendrer des ambigits. Lintgrit de la
reprsentation nest donc pas garantie en exploitant des liens simples. Visuellement,
lutilisation des liens multiples semble rendre la reprsentation plus lisible. Cet aspect pourrait
galement tre valu formellement.
Reprsentation des relations avec des liens Reprsentation des relations avec des liens
multiples simples (entre deux entits)
162
Patterns
de
visualisation
relationnelle
Dans la majeure partie des sries analyses, les relations tablies sur la base de vhicules
vols, retrouvs ou observs sont plus simples. Les situations o lutilisation de liens multiples
est ncessaire pour viter de lambigut sont assez rares. Il est donc possible dexploiter des
liens simples (entre deux entits) pour reprsenter les relations :
Les relations avec des vhicules et des plaques ont t volontairement mises en vidence pour
cet exemple (contrairement au schma transmis dans le cadre de laffaire).
R e l a t i o n s s p a t i o - t e m p o r e l l e s
C o n c e p t s r e p r s e n t e r
Analyser
une
srie
dvnements
163
R e p r s e n t a t i o n d e s r e l a t i o n s
Comme dj mentionn, il est dusage de reprsenter le temps par la position des vnements
sur laxe horizontal. Les relations spatiales peuvent tre reprsentes de diverses manires :
par des entits spcifiques, par les icnes ou les couleurs des vnements ou encore par des
cadres. Dans lexemple de la reprsentation des relations entre des saisies de stupfiant
prsent prcdemment, des icnes sont utilises pour distinguer des pays ou des cantons.
Les relations spatiales peuvent galement tre reprsentes par la couleur :
Des cadres peuvent galement tre exploits. Toutefois, lorsque de nombreux vnements
sont reprsents, il nest pas rare que des vnements aient lieu dans les mmes rgions sur
plusieurs priodes distinctes. Des croisements de cadres peuvent alors tre crs :
Les croisements peuvent tre vits en exploitant le positionnement sur laxe vertical :
Une modification de placements sur laxe vertical nest cependant pas toujours suffisante pour
viter tous les croisements de traits (notamment en raison des autres relations reprsentes
entre les cas). Dans une telle situation, les cadres peuvent tre diviss et reprsentent alors
une proximit spatio-temporelle :
Les relations peuvent aussi tre reprsentes par des entits lieux lies chaque
vnement :
164
Patterns
de
visualisation
relationnelle
Afin de minimiser le nombre dentits et de liens et ainsi rduire les risques de croisements de
traits, un tel choix nest gnralement pas adapt. En effet, lors de la reprsentation de
grandes sries (plusieurs dizaines, voire centaines de cas), ajouter des entits et des liens
supplmentaires complexifie inutilement la reprsentation. Exploiter des cadres est, dans ce
contexte, particulirement efficace. Un effet de couches est engendr. Celui-ci permet de
distinguer les diffrents types de relations.
E x e m p l e d e c a s
La srie reprsente regroupe plus de cent cas de cambriolages du soir supposs avoir t
commis par un mme groupe dauteurs.
La ligne horizontale bleue reprsente un profil ADN dtect sur plus de cinquante cas. Des
relations tablies sur la base de motifs de traces de semelle sont galement reprsentes. Les
images des motifs ont t insres pour les reprsenter.
Les relations tablies sur la base des traces ont permis de lier prs de quatre-vingt pourcent
des cas de la srie. Les autres vingt pourcent ont t lis sur la base de proximits spatio-
temporelles. Un schma dvnement a donc t produit. La chronologie est reprsente par
la position sur laxe horizontal et la proximit spatiale est visualise par des cadres. Le schma
ci-dessous met en vidence ces relations qui sont surlignes en rouge :
Slectionner
des
traces
analyser
165
S l e c t i o n n e r
d e s
t r a c e s
a n a l y s e r
Dans le prcdent pattern, la reprsentation visait soutenir lanalyse des relations entre un
ensemble dvnements afin de reconstruire une srie. Lvnement tait lentit principale de
lanalyse et les traces taient considres parmi un ensemble de relations, telles que les
relations spatio-temporelles, les relations avec des vhicules, du butin, etc. Dans le cadre de la
situation prsente ici, la trace est lentit centrale de lanalyse.
C o n t e x t e
Lors dinfractions graves, comme des brigandages ou des meurtres par exemple, il nest pas
rare quun nombre important de traces soient prleves sur la ou les scnes de crimes, ainsi
que sur lensemble des lieux ou des objets en relation avec laffaire. Dans de tels cas, des choix
doivent tre effectus afin de dterminer quelles traces seront analyses et dans quel ordre de
priorit. En effet, lanalyse des traces ncessite un temps plus ou moins important et parfois
des cots levs. Cest le cas plus particulirement des analyses ADN qui peuvent prendre
plusieurs jours, voire quelques semaines et coter plusieurs centaines de francs par trace. Des
choix doivent tre effectus et les priorits sont dfinies et rvalues diffrents stades de
lenqute. Dans la phase initiale de lenqute, ces choix sont parfois vidents, notamment
lorsque les traces sont prleves sur des armes, sur des victimes ou sur des voies daccs. Par
contre, lorsque certains rsultats sont obtenus et quil sagit de dfinir quelles sont les autres
traces qui seront analyses en regard des informations dj disponibles, les choix peuvent tre
plus compliqus.
O b j e c t i f d e l a r e p r s e n t a t i o n
Des schmas relationnels peuvent tre produits afin de faciliter et guider la prise de dcision
pour slectionner quelles sont les traces les plus pertinentes analyser.
C o n c e p t s r e p r s e n t e r
Pour valuer la pertinence des traces, plusieurs paramtres doivent tre considrs en
parallle :
- chaque scne doit tre clairement distingue
- lendroit de prlvement de la trace (sur les lieux ou sur un objet) est reprsent afin
dvaluer la pertinence en fonction des chances de retrouver une trace. Celles-ci sont
values en regard du support des traces (transfert, affinit, etc.) et des lments
circonstanciels sur lactivit (issus notamment des dclarations de tmoins).
166
Patterns
de
visualisation
relationnelle
- le rsultat d'analyse doit tre inclus. Pour lanalyse ADN, il peut se classifier : pas
analys, ngatif, profil tabli (complet, partiel, mlange) et profil non-interprtable
- les relations avec des individus (identifi ou non) et le degr de certitude des relations
R e p r s e n t a t i o n d e s r e l a t i o n s
Slectionner
des
traces
analyser
167
E x e m p l e d e c a s
Profil non interprtable Profil non interprtable Profil complet Non Transmis Profil non interprtable Profil non interprtable
Non Transmis Profil non interprtable Profil partiel Salle 2a
Non Transmis
Profil partiel Profil partiel Profil complet Profil partiel Profil partiel Profil partiel
Profil non interprtable Profil non interprtable Sur le sol
Non Transmis 8/10 4/10 7/10 9/10 5/10
Non Transmis 9/10 trace de semelle
TPTR225241
Appuie-tte arrire droit + levier porte + ceinture de scurit Mains courantes escaliers salle 1b, vitrine 2, sur langle de saisie (selon vido)
Non Transmis Profil de mlange Profil de mlange 7/10 Non Transmis
complet 1er - 2me tage
complet
Profil non interprtable salle 1b, vitrines restantes, sur langle de saisie (selon vido)
Appuie-tte arrire gauche + levier porte + ceinture scurit
Non Transmis
Non Transmis 7/10
rez - 1er tage,
sur la deuxime portion de la rampe
Profil de mlange
Profil mineur non interprtable Salle 2b
portire arrire droite
salle 2b, vitrine 1, sur langle de saisie (selon vido)
Profil non interprtable
Autocollant HOPP SCHWIIZ (en Non Transmis
trois langues)
Au dos du paquet froiss Divers
salle 2b, vitrine 2, sur langle de saisie (selon vido)
Suspendue - Sur la gauche du volant Profil complet Profil complet Profil complet Profil de mlange Profil de mlange Profil complet Profil partiel Profil complet Profil complet poigne extrieure porte local vido (1er tage)
Au dos du paquet froiss Non Transmis
Non Transmis Profil non interprtable
Cl de marque inconnue avec
inscription V. STEP Au dos du paquet froiss salle 2b, vitrines restantes, sur langle de saisie (selon vido)
coffre-fort du local vido (1er tage), niveau systme douverture
Au dos du paquet froiss Non Transmis
propritaire de la porsche Non Transmis
Non Transmis salle 2b, devant vitrine 2 - sur prsentoir se trouvant au sol
Sac plastique
Carte SIM Orange Sur le recto du paquet froiss
"Spar-Natur pur" Extrmits Non Transmis
Sur sige arrire gauche Profil complet 2 bandes adhsives colles sur
bouteille en PET 0.75l bouteille en PET 0.75l bouteille PET Vslauer sans bouteille en PET 0.75l le pantalon de marque
Non Transmis Vslauer lgrement plie Vslauer gaz carbonique Vslauer
Une pice en plastique blanc BIAGGINI, taille 46, avec
ceinture,
bouteille en PET 0.75l bouteille en PET EVIAN 1.5l Bouteille en PET 0.5l Coca Light canette RedBull 0.25l
Vslauer
Emballage de boulangerie froiss.
Profil complet Profil complet Profil non interprtable Profil non interprtable sur le recto de la carte sur le recto de la carte
une carte routire MICHELIN, FRANCE
Profil de mlange
Bien quapparemment complexe, le schma faciliter les discussions sur la pertinence des
traces. En moins dune heure de sance, lensemble des traces non transmises avaient t
discutes et directement annotes sur le schma.
168
Patterns
de
visualisation
relationnelle
Non Transmis
Au fond de la grande poche Profil partiel
Au fond de la grande poche Profil complet Profil majeur complet sur vitre casse
Non Transmis
Sur le sol
Non Transmis
ds vide poche portire conducteur Profil complet
poigne intrieure
Profil mineur partiel (7/10)
Un tui en cuir Profil complet
Non Transmis
poigne extrieure
Sur le goulot - ct passager av, au sol Profil complet
Profil non interprtable
une canette Profil complet
Non Transmis
Sur le volant
Non Transmis
Sur lappuie-tte passager
Non Transmis
Sa 01.12.07,
16:30-23:40, Ma 04.12.07,
Cornaux 13:30-18:35, Les
Cambriolage Villa. Geneveys-s/Coffr.
Num Comm: ... Cambriolage Villa.
Num SF: ... Num Comm: ...
Adresse: ... Num SF: ...
Ve 30 / Sa Adresse: ...
01.12.07,
16:55-00:15,
Cormondrche
Cambriolage Villa.
Num Comm: ... Ma 04.12.07,
Num SF: ... 15:30-18:15, Les
Adresse: ...
Geneveys-s/Coffr.
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
NE-S141
Di 20.01.08,
14:30-20:30,
Saules
Je 22 / Di Cambriolage Villa.
Num Comm: ...
25.11.07,
Di 25.11.07, Num SF: ...
10:00-14:25,
16:30-19:20, Adresse: ...
Coffrane
Colombier
Cambriolage Villa.
Num Comm: ... Cambriolage Villa.
Num Comm: ...
Num SF: ...
Num SF: ...
Je 01.11.07, Adresse: ...
Adresse: ...
19:25-21:40,
Wavre
Cambriolage Villa. Sa 17.11.07,
Num Comm: ... 21:30-22:00,
NE-S259
Sa 24.11.07,
16:30-20:30, Les
Geneveys-s/Coffr.
Cambriolage Villa.
Di 21.10.07, Ve 23.11.07, Num Comm: ...
16:00-20:45, 19:40-21:45, Les Num SF: ...
Montezillon Ve 26 / Di Je 06.12.07,
Sa 24.11.07, Hauts-Geneveys Adresse: ... 28.10.07, 10:00-19:30,
Cambriolage Villa.
Ve 07.11.08,
09:00-20:55,
Ve 23.11.07, Saules Lu 21.01.08,
18:15-21:30, Les Cambriolage Villa. 18:39-19:10,
Hauts-Geneveys Di 04.11.07, Num Comm: ...
Cormondrche
Tent. Cambriolage 20:20-20:30, Les Num SF: ...
NE-ADN8 Cambriolage Villa.
Villa. Geneveys-s/Coffr. Adresse: ... Num Comm: ...
Num Comm: ...
Tent. Cambriolage Num SF: ...
Num SF: ...
Villa. Adresse: ...
Adresse: ... Num Comm: ...
Ve 09 / Sa Adresse: ...
10.11.07,
16:15-22:50, Ve 07.11.08,
Fontaines 19:00-20:10,
Cambriolage Villa. Boudevilliers
Num Comm: ... Cambriolage Villa.
Sa 10 / Di Num Comm: ...
Num SF: ...
11.11.07, Num SF: ...
Adresse: ... 19:15-10:00,
NE-S4718 Adresse: ...
Colombier
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
Ma 27.11.07,
17:40-18:50,
Montezillon Tent.
Cambriolage Villa.
Num Comm: ...
NE-S215
Ve 31.10.08,
Ma 18.11.08, 19:30-22:45, Fenin
18:00-19:45, Ble
Cambriolage Villa.
Cambriolage Villa. Num Comm: ...
Num Comm: ...
Num SF: ...
Num SF: ...
Adresse: ...
Adresse: ...
Je 15.11.07,
13:30-18:00,
Colombier
Cambriolage Villa. Je 15 / Lu
Num Comm: ...
19.11.07,
Num SF: ...
14:00-08:00,
Adresse: ... Ve 16.11.07,
Montezillon
16:00-20:15, Les Cambriolage Villa.
Geneveys-s/Coffr. Num Comm: ...
Cambriolage Villa. Num SF: ...
Num Comm: ...
Adresse: ...
Num SF: ...
Adresse: ...
Analyser
des
transactions
169
A n a l y s e r d e s t r a n s a c t i o n s
C o n t e x t e
Les appels tlphoniques entre des numros de tlphones, les oprations financires entre
des comptes et les ventes entre des personnes sont des relations frquemment rencontres
dans le cadre denqutes. Ces relations sont diriges : un appel est effectu depuis un numro
appelant vers un numro appel, une transaction financire sopre entre un compte dbiteur
et un compte crditeur, finalement une vente est ralise entre un vendeur et un acheteur.
Bien quissues de sources diffrentes, toutes ces relations peuvent tre reprsentes de faon
similaire par un lien dirig.
Un pattern danalyse de transactions est formalis sur la base des similitudes observes entre
ces trois situations danalyse. Dans certains manuels, ce type danalyse est appele analyse
de flux (Interpol, 1997) (Peterson, 1998) (UNODC, 2002) (Fedpol, 2010). Celle-ci est
gnralement dcomposes en plusieurs sous catgories. Lanalyse de flux de marchandises se
focalise sur le transfert de biens et dargent entre des personnes et/ou entre des socits. Elle
vise la reconstruction de la structure dun trafic et lidentification des rles des protagonistes.
Lanalyse de flux dvnements (Event Flow Analysis) et lanalyse de flux dactivits (Activity
Flow Analysis) sont parfois galement dfinies (Peterson, 1998) (UNODC, 2002). Celles-ci
visent ce pendant des objectifs diffrents : dcomposer une squence dvnements pour
mieux comprendre leurs relations (temporelles et de causalit) et respectivement comprendre
une activit criminelle par la description des tapes ncessaires sa ralisation. Elles
exploitent les schmas chronologiques et respectivement les schmas dactivits
prcdemment dcrits60.
Le pattern propos intgre lanalyse de flux de marchandises, mais se diffrencie des analyses
de flux dvnements et dactivits qui exploitent des formes de reprsentation diffrentes. Il
inclut par contre lanalyse de donnes de tlphonie et lanalyse de donnes financires. Ces
trois formes danalyse sont souvent abordes sparment et des formes de reprsentations
propres sont dfinies (Peterson, 1990) (Peterson, 1998) (UNODC, 2002) (AGIS, 2004). Bien que
chacune delles rponde des besoins spcifiques, plusieurs similitudes sont observes entre
elles. Une abstraction plus globale est donc propose sous la forme dun pattern danalyse de
transactions (ou de flux). Son application est galement dcrite pour chaque type de
60
Cf. Analyse et visualisation relationnelle, page 42
170
Patterns
de
visualisation
relationnelle
Communications tlphoniques
Ventes
de
marchandises
O b j e c t i f s d e l a r e p r s e n t a t i o n
Les schmas de flux relationnels reprsentent des transactions afin de dtecter des rgularits
particulires signes dune activit illicite, de reconstruire la structure dun trafic de
marchandises, didentifier des entits (des personnes, des socits, des tlphones)
intressantes pour lenqute, notamment par leur position centrale dans le flux.
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
Analyser
des
transactions
171
Que cela soit des ventes, des communications ou des transactions financires, les transactions
peuvent tre reprsentes par des liens entre des entits (respectivement des personnes, des
comptes ou des numros de tlphones).
172
Patterns
de
visualisation
relationnelle
C o m m u n i c a t i o n s t l p h o n i q u e s
C o n t e x t e
Lintrt du contenu des communications interceptes par le biais dcoutes actives est
vident. De manire complmentaire, les mtadonnes techniques (tels que les numros des
correspondants, la date et lheure des appels) sont galement prcieuses. Lhistorique des
appels contenant ces donnes techniques peut tre obtenu rtroactivement sur des priodes
plus ou moins longues en fonction des lgislations nationales. Les reprsentations discutes
ici portent sur lanalyse de ces informations techniques indpendamment du contenu des
communications.
Ces donnes sont dites massives . En effet, les donnes rcoltes pour un seul numro
peuvent contenir plusieurs centaines, voire milliers de communications sur quelques mois. Des
techniques particulires sont donc ncessaires pour les analyser. Lapport de la visualisation
pour traiter ces informations est reconnu depuis plusieurs dcennies (Peterson, 1990). Lors
dune investigation sur un trafic de stupfiants, lanalyse des contacts dun suspect peut, entre
autres, permettre didentifier des fournisseurs (lors dappels internationaux notamment) ou
des transporteurs sur la base de dplacements spcifiques connus.
Analyser
des
transactions
173
Dun point de vue quantitatif, le nombre et la frquence des appels pour chaque
correspondant sont, par exemple, des questions rcurrentes. Ces aspects ne sont pas dtaills
dans cette section qui prsente les formes de reprsentations exploites pour analyser ces
donnes dans la dimension relationnelle afin de reprsenter les contacts.
O b j e c t i f s d e l a r e p r s e n t a t i o n
Les schmas de flux relationnels sont produits sur la base des communications tlphoniques
entre diffrents numros. Des schmas reprsentant les relations entre les numros et les
botiers peuvent galement tre produits lors de lutilisation de tlphones portables. En effet,
il est parfois observ que des individus schangent ou se prtent ponctuellement leurs
botiers, alors mme quaucune communication nest dtecte entre leurs numros.
C o n c e p t s r e p r s e n t e r
De manire gnrale, les relations tablies sur la base des donnes de tlphonie permettent
de lier des raccordements, voire des appareils et non directement des individus. Les relations
avec des personnes physiques ou morales sont tablies sur la base de lenregistrement du
numro auprs des fournisseurs de services.
174
Patterns
de
visualisation
relationnelle
R e p r s e n t a t i o n d e s r e l a t i o n s
La relation principale sur laquelle porte lanalyse est la communication tablie entre les
numros de tlphone:
Une communication tant par dfinition lie un numro appelant et un numro appel,
peut tre reprsente par un lien ( lexception des confrences tlphoniques). Le lien a un
sens entre le numro appelant et le numro appel :
Sur chaque relation, la date, lheure, la localisation et le type de communication sont des
informations qui peuvent tre reprsentes sous forme de texte notamment. Chaque entit
reprsente un numro. Licne et la couleur peuvent tre exploites pour diffrencier des
types de numro (fixe, mobile, cabine tlphonique), ou pour distinguer des pays dorigine ou
des cantons par exemple. La couleur des relations peut galement tre exploite pour
diffrencier des types de communications :
Analyser
des
transactions
175
Le nombre de communications entre deux numros peut tre trs grand. La reprsentation
devient rapidement illisible si un lien est trac pour chaque communication. Cest pourquoi, il
est dusage de regrouper les communications (le nombre de communications est
gnralement inscrit sur le label du lien) :
Plusieurs stratgies peuvent tre exploites pour reprsenter les communications de faon
agrge :
176
Patterns
de
visualisation
relationnelle
Le modle propos se base sur une reprsentation spcifique des relations bidirectionnelles61 :
La largeur globale du lien reprsente le nombre total de communications. Un seul lien permet
de reprsenter les deux sens de communication. La position des flches permet d'valuer
visuellement la proportion de communications dans chaque sens. Cette forme de
reprsentation a t value dans le chapitre prcdent par rapport lutilisation de deux liens
dirigs. Pour rappel, une amlioration significative a t observe pour identifier le numro
ayant le plus de contacts, tant au niveau du taux de rponses correctes que du temps de
rponse62.
Comme mentionn ci-dessus, il est souvent ncessaire de distinguer des types de numros
tels que des cabines, des tlphones mobiles, etc. Certains numros sont parfois lis entre eux
et forment des groupes particuliers. Cest le cas notamment dun ensemble de numros
appartenant une mme socit ou une mme personne. A titre dexemple, des cabines
tlphoniques situes dans une mme rgion gographique forment galement des groupes
particuliers. Ces groupes peuvent tre reprsents soit par le biais dune entit lie ou par un
cadre :
61
Cf. Typologie de relations, page 103
62
Cf. Reprsentation de liens bidirectionnels, page 116
Analyser
des
transactions
177
Des groupes de numros peuvent galement tre reprsents sous la forme dun ensemble63
afin de diminuer le nombre dentits et simplifier la reprsentation. Une telle simplification
peut tre utile notamment pour regrouper lensemble des numros dune mme socit :
Les relations entre les numros ainsi fusionns ne sont videmment plus visibles. Mais en
fonction de la question danalyse une telle simplification peut tre trs efficace. Les outils
actuellement disponibles ne permettent cependant pas dexploiter ce type de reprsentation.
63
Cf. Typologie de relations, page 102
178
Patterns
de
visualisation
relationnelle
Des relations sont galement tablies sur la base dchanges de botiers entre les utilisateurs.
En effet, pour chaque communication le numro IMEI64 est prsent pour le numro partir
duquel les donnes ont t obtenues. Des schmas relationnels peuvent tre produits pour
reprsenter les relations entre les numros et les botiers.
Finalement, pour chaque numro, le dtenteur est identifiable auprs des oprateurs. Des
informations denqute peuvent galement tre disponibles sur les utilisateurs des tlphones.
Il est alors possible de reprsenter ces relations sur les schmas relationnels (sous la forme
dentits lies, telles que prsentes ci-dessus, ou sous la forme dun attribut de chaque
numro). Lorsque le nombre de numros de tlphone utiliss par chaque individu s'accrot,
une simplification de visualisation peut tre effectue en ne reprsentant que les relations
entre les personnes :
Toutefois des incertitudes sur les liens entre les personnes et les numros existent. Le fait
quun individu soit bel est bien lutilisateur dun tlphone est trs souvent incertain. Il n'est
dailleurs pas rare de voir des communications entre des numros attribus une mme
personne. Ceci peut sexpliquer par la vente ou le prt de cartes SIM ou simplement par lachat
dune carte effectu sous un faux nom. Il nest donc pas recommand deffectuer cette
simplification qui cache cette indirection importante.
64
lInternational Mobile Equipment Identity est un numro didentification des appareils mobiles. Il permet
notamment didentifier le fabricant et le modle de lappareil.
Analyser
des
transactions
179
E x e m p l e d e c a s
Cet exemple met en vidence lusage des icnes et des couleurs pour distinguer des types de
tlphone (fixe, mobile, cabine, etc.), ainsi que des pays. Le placement des nuds a galement
t ralis en fonction des types de numros pour faciliter la lecture du schma, tel que
discut dans le chapitre prcdent. Cet exemple illustre lutilit de positionner les entits en
fonction de leurs types. Malheureusement, il nexiste lheure actuelle aucun algorithme
automatique facilitant un tel positionnement. Le travail est donc compltement manuel.
Finalement la taille des icnes est proportionnelle au nombre de communications.
65
Cf. Reprsentation de liens bidirectionnels, page 114
180
Patterns
de
visualisation
relationnelle
dtenteur de ce
30/01/2010 12:21:03 30/01/2010 23:42:15 8
30/01/2010 22:50:51
1 1 30/01/2010 23:43:17
17/01/2010 19:17:22 17/01/2010 15:55:36
1
17/01/2010 19:21:48
1 1
19/01/2010 16:32:21 17/01/2010 18:58:49
2
17/01/2010 16:21:11
2 17/01/2010 16:50:55 1
2 1
17/01/2010 17:31:36 29/01/2010 14:38:47
1 10:16:54
18/01/2010 2
20/01/2010 19:00:34 17/01/2010 17:15:33
15-30.03.2010 2 4
Deux priodes
3 1 1
25/01/2010 22:56:34 30/01/2010 15:42:10 29/01/2010 14:34:29
29/01/2010 20:35:54
1 5
28/01/2010 18:10:04 17/01/2010 15:53:26
1 21:42:51
22/01/2010
protagonistes de
17/01/2010 19:00:51
1
29/01/2010 20:15:59
13
18/01/2010 17:49:14
3 21/01/2010 17:22:21
25/01/2010 22:56:34
6
29/01/2010 20:35:54 13
27/01/2010 13:01:49
5
16/01/2010 13:20:23 15/03/2010 16:44:52
6 29/01/2010 18:20:19
15/03/2010 20:35:02 30/01/2010 15:05:04 17/03/2010 17:04:08
10 3 66 1
4 1 1
16/03/2010 18:02:15 29/01/2010 14:35:02 18/03/2010 17:26:29
25/03/2010 21:45:55 1
25/01/2010 10:50:53 19/03/2010 18:44:25
2 3 1
19/03/2010 03:17:32 16/01/2010 18:46:42 30/03/2010 16:37:56
19/03/2010 03:19:57 29/01/2010 19:37:37
deux priodes.
19 1
20/01/2010 18:58:58 27/03/2010 16:49:52
30/01/2010 08:12:16 1
27/03/2010 16:50:12
7 2
16/01/2010 17:28:11 24/03/2010 13:36:55
30/01/2010 18:02:36 16 24/03/2010 13:41:27 1
23/01/2010 16:56:08 24/03/2010 13:41:30
7 30/01/2010 17:30:18 71
17/01/2010 19:22:25 15/01/2010 12:14:12
30/01/2010 17:30:32 5 30/01/2010 17:45:46 1
18/01/2010 16:20:52 15/03/2010 10:12:19
Lanalyse porte
29/01/2010 20:02:42 36
27/01/2010 11:49:37
30/01/2010 22:01:04
2
17/03/2010 10:17:51
17/03/2010 13:58:46
40 2 2
17/01/2010 15:44:03 20/01/2010 10:48:49 15/01/2010 17:07:23
30/01/2010 14:26:26 61 25/01/2010 17:20:07 3 15/01/2010 17:12:18 3
17/01/2010 17:42:48 20/01/2010 10:52:02 15/01/2010 16:38:17
80 30/01/2010 19:52:22 20/01/2010 11:25:46 15/01/2010 17:11:46
8 27/01/2010 10:32:27
principalement sur
21/03/2010 16:22:28
30/01/2010 22:18:33 46 2 3
21/03/2010 18:30:30 27/01/2010 10:27:26 28/01/2010 17:17:44 21/01/2010 19:20:18
5 2
18/01/2010 15:29:53 18/01/2010 10:35:24 30/01/2010 13:43:52 28/01/2010 17:28:09 27/01/2010 12:14:15
31
19/01/2010 16:46:00 29/01/2010 00:34:04 18/01/2010 13:24:17 2 1
26/01/2010 18:05:21 4 25/01/2010 13:36:07 16/01/2010 21:19:31
7 26/01/2010 18:05:08
28/01/2010 15:58:27 25/01/2010 13:36:10 2 1
27/01/2010 10:27:01 24/01/2010 21:27:14 19/01/2010 14:14:47
28/01/2010 21:59:44
18 9 25/01/2010 13:46:55 1
19/03/2010 03:22:07 17/03/2010 09:24:43
16 16/01/2010 17:17:38
21/01/2010 16:49:44
28/03/2010 18:01:45 1 23/03/2010 16:30:32 1 5
25/03/2010 14:20:33 19/03/2010 11:49:16 27/01/2010 08:15:36 30/01/2010 10:28:20
les contacts. La
30/01/2010 18:59:23 1 1 2
30/01/2010 10:28:15 30/01/2010 18:58:13 19/01/2010 19:53:44
5 2 19/01/2010 19:55:09
16/03/2010 18:01:12 17/03/2010 22:45:50
28/03/2010 18:24:37 20/03/2010 17:42:23 2
23/01/2010 11:14:35
11 4
4 1 26/01/2010 17:48:45 23/01/2010 11:22:14
15/03/2010 20:34:04 24/03/2010 20:05:39 19/01/2010 16:01:18
26/01/2010 17:51:30
28/03/2010 04:22:18 29/01/2010 00:31:11
10 2
18/01/2010 10:33:58 18/01/2010 15:28:25
10 2 28/01/2010 18:46:07 19/01/2010 15:03:01
dimension
15/03/2010 17:42:29 19/03/2010 19:13:50
27/03/2010 16:09:25 21/03/2010 18:10:35
4 2
5 3 19/01/2010 16:07:11 26/01/2010 17:49:21 2 2
16/03/2010 18:07:13 17/03/2010 17:44:26 19/01/2010 17:33:13 15/01/2010 14:50:40 28/01/2010 12:43:21
26/01/2010 17:59:39 3
22/03/2010 19:59:29 25/03/2010 18:38:08 22/01/2010 22:59:04 28/01/2010 12:53:55
1
28/01/2010 11:52:07 15/03/2010 06:33:01
3 5 2
15/03/2010 17:46:27 19/03/2010 18:54:31 19/03/2010 11:49:23 28/01/2010 12:58:51 15/03/2010 06:33:01
relationnelle est
17/03/2010 18:55:46 16/03/2010 15:02:15 21/03/2010 08:54:17
28/03/2010 18:15:23 44 23/03/2010 12:40:05 43 21/03/2010 18:49:14 26
22/03/2010 21:30:44 17/03/2010 15:43:21 15/03/2010 17:36:57
28/03/2010 18:01:45 23/03/2010 07:42:23
29 21/03/2010 20:15:50
16/01/2010 16:37:55
3
6 2 19/01/2010 20:16:50 18/01/2010 23:36:16 1
17/03/2010 15:25:44 19/03/2010 19:03:26 19/01/2010 12:57:11 19/03/2010 11:01:13
1 20/03/2010 23:17:37 20/03/2010 23:08:57
12
17/03/2010 14:01:31 18/01/2010 12:18:10
23 9 19/01/2010 16:01:53 1
15/03/2010 20:14:28 21/03/2010 16:23:06
5 24/01/2010 14:45:09
28 29/01/2010 00:32:33
28/03/2010 04:11:49 22/03/2010 11:54:49 3
donc dominante.
26/01/2010 17:47:17 30/01/2010 22:11:32
20/03/2010 19:26:05
1 1 10 30/01/2010 22:35:33 2
20/03/2010 19:26:31
20/03/2010 22:10:21 21/03/2010 21:04:53 21/03/2010 14:34:51 2 26/01/2010 08:58:25
1 22 22/03/2010 14:42:51 30/01/2010 20:37:31 26/01/2010 08:59:22
20/03/2010 21:49:32 15/03/2010 20:25:43 2 30/01/2010 20:37:50
2 28/03/2010 04:13:15 20/03/2010 22:17:18 1
27/03/2010 18:00:45 20/03/2010 22:17:45 17/03/2010 10:48:23
28/03/2010 19:55:05
3 1
26/03/2010 16:59:00 21/03/2010 14:55:51
4
Dans la dimension
27/03/2010 16:44:28
28/03/2010 04:33:13
1 28/03/2010 04:34:05 2
17/03/2010 23:57:30 28/03/2010 04:07:21
28/03/2010 04:07:22 1
19/03/2010 10:31:37
1
23/03/2010 12:31:39
1
17/03/2010 15:30:50
temporelle, la 2
19/03/2010 16:07:09
19/03/2010 16:07:15
3
27/03/2010 22:58:55
28/03/2010 04:32:35
7
10
23/01/2010 18:51:02 16/03/2010 16:48:12 2
1
17/03/2010 16:19:45
variabilit est
19/03/2010 10:43:12
2
16/01/2010 17:50:21
1 16/01/2010 17:50:26
28/03/2010 10:41:03
1 2 1 1
28/03/2010 20:44:03 19/01/2010 18:52:07 28/03/2010 14:09:30 27/03/2010 20:58:09
19/01/2010 18:52:31 1 1
23/03/2010 17:05:49 25/03/2010 15:40:22
1 2 1
17/03/2010 15:06:07 22/01/2010 10:52:33 21/03/2010 19:08:17
priodes.
22/01/2010 15:15:32
1 4
18/03/2010 09:28:37 16/01/2010 11:55:26
29/01/2010 18:25:55 1 1
21/01/2010 20:49:02 16/03/2010 17:01:57 16/03/2010 17:04:55
1 1
18/03/2010 08:43:44 23/01/2010 08:13:52
2
1
1 25/03/2010 10:53:34
19/01/2010 16:11:21 18/03/2010 09:43:01
1 3
16/03/2010 14:59:16 17/01/2010 09:56:20 19/01/2010 16:14:08 18/03/2010 09:43:01
5
19/01/2010 18:15:37 3
1 20/01/2010 11:30:10
18/01/2010 08:48:54 22/03/2010 10:51:42
1 1 27/01/2010 16:23:10
22/03/2010 09:40:11 25/01/2010 12:03:29 26/01/2010 08:54:50 22/03/2010 10:51:42
3
1 1 2
22/03/2010 09:54:34 21/01/2010 16:25:34
1 17/03/2010 17:49:56
25/01/2010 13:33:36 18/03/2010 09:07:21
18/03/2010 10:29:51
25/01/2010 18:19:33 18/03/2010 09:07:21
6
1
22/01/2010 10:56:17
20
1 19/01/2010 11:20:58 15/03/2010 20:00:18
1 1
24/03/2010 18:47:42
8 27/01/2010 16:00:00 27/03/2010 14:46:33 25/03/2010 10:39:19
19/01/2010 19:16:09 15/03/2010 20:25:20
1
14/01/2010 17:32:08 19/01/2010 19:16:09 27/03/2010 12:09:24
1
3 2
16/03/2010 15:20:19 15/01/2010 10:43:27
2
25/01/2010 15:20:44 16/03/2010 10:30:36
16/03/2010 15:29:03 2 26/01/2010 09:09:45
20/01/2010 19:05:21 25/01/2010 15:20:44 16/03/2010 10:49:38
1 20/01/2010 19:05:34
24/03/2010 11:46:52
2 1 1
22/01/2010 14:20:51 19/03/2010 09:05:32 19/03/2010 08:11:30
2 22/01/2010 14:21:07 1
19/03/2010 11:31:40 19/03/2010 08:43:13
19/03/2010 11:43:03 4 2 2
25/01/2010 10:19:38 28/03/2010 20:37:53 15/03/2010 15:26:15
1 25/01/2010 10:28:07 28/03/2010 20:38:20 20/03/2010 15:15:04 7
15/03/2010 11:21:08 15/03/2010 15:42:29
1 1 5 25/03/2010 08:45:46
23/01/2010 16:44:09 22/03/2010 16:20:15 15/03/2010 17:50:08
1 26/03/2010 17:11:35 3
18/03/2010 14:50:53 25/03/2010 19:53:38
3 26/03/2010 13:34:29
28/01/2010 19:46:26
28/01/2010 19:46:52 3 1
27/01/2010 16:16:42 27/03/2010 20:58:05
2 2 27/01/2010 16:17:08 14
23/01/2010 16:42:42 27/01/2010 16:27:09 15/03/2010 15:02:44
1 25/01/2010 12:02:07 27/01/2010 16:28:57 28/03/2010 16:22:26
24/03/2010 07:22:11
3
23/01/2010 16:44:01
1 23/01/2010 16:44:25 1 3
18/03/2010 14:51:17 18/01/2010 08:50:48 19/01/2010 18:06:37 19/03/2010 17:30:44
11 4 25/01/2010 15:46:38 21/03/2010 16:50:22 7
20/01/2010 16:35:12 15/01/2010 13:05:33 19/01/2010 18:07:28 15/03/2010 17:40:13
1 24/01/2010 20:26:33 30/01/2010 09:33:47 27/01/2010 11:49:22 21/03/2010 16:53:08
28/03/2010 14:09:26
1 1 1
28/01/2010 09:59:59 22/01/2010 15:32:52 30/01/2010 14:38:54 16/03/2010 12:04:05
1
16/03/2010 11:54:40
1
28/01/2010 09:52:32
2
15/03/2010 21:11:23
2
15/03/2010 21:21:55 40 2
20/01/2010 15:44:18 20/03/2010 17:08:43
1
20/01/2010 13:13:05 27/03/2010 16:14:05
4 24/01/2010 20:26:47 20/03/2010 17:08:54 8
16/03/2010 21:22:11 26/01/2010 09:58:21 27/03/2010 16:14:05
21/01/2010 10:35:33 15/03/2010 18:08:39
19/03/2010 12:58:45 27/01/2010 08:54:04 27/03/2010 16:12:59
3
18/01/2010 14:47:21
18/01/2010 14:47:47
1 9
22/03/2010 16:20:04 24/01/2010 12:01:53 044...
24/01/2010 16:25:04 35
24/01/2010 12:02:36
1 24/01/2010 15:44:34
25/03/2010 09:51:15
86
1
30/01/2010 18:32:46
10
15/01/2010 15:01:46 15/03/2010 17:53:35
1
26/03/2010 18:37:12 30/01/2010 15:36:09 17/03/2010 18:17:36
9
19/01/2010 16:03:25
28/01/2010 18:44:22 78
18/01/2010 17:49:21
1 3 30/01/2010 02:11:32
16/03/2010 15:29:14 25/01/2010 12:27:54
25/01/2010 12:28:20
1 1
19/03/2010 17:59:56 18/01/2010 17:25:22
19
16/01/2010 15:59:11
27/01/2010 15:32:49
11 13
18/01/2010 21:07:36 15/03/2010 21:06:42
23/01/2010 16:17:40 19/03/2010 12:58:31
5 2
22/01/2010 22:51:32 19/03/2010 03:58:50
25/01/2010 17:49:16 19/03/2010 03:59:04
1
16/01/2010 19:33:31
4 4
18/01/2010 17:50:46 27/01/2010 09:08:55 21/03/2010 09:55:56
19/01/2010 13:55:53 28/01/2010 16:33:19 28/03/2010 19:21:11
2
1
27/01/2010 12:18:56
4
23/01/2010 16:55:01 15/03/2010 09:56:18
23/01/2010 16:55:14 15/03/2010 11:21:20
1
27/01/2010 13:08:38
1
2
25/01/2010 14:27:34 16/03/2010 15:32:42
1
23/01/2010 18:59:03 25/01/2010 14:27:34 22/03/2010 09:07:19
3
1
16/01/2010 12:04:26 17/03/2010 09:41:12
1
26/01/2010 18:06:57 16/01/2010 12:05:43 17/03/2010 09:41:12
3
2
25/01/2010 10:31:31 24/03/2010 09:36:48
1
19/01/2010 22:21:08 25/01/2010 10:35:51 24/03/2010 09:38:07
1
23/01/2010 16:18:20
2
1
29/01/2010 16:54:59 23/03/2010 19:16:10 2
1
17/01/2010 20:26:02 29/01/2010 16:55:15 23/03/2010 19:16:10 1
21/01/2010 20:03:37 23/03/2010 20:08:59
21/01/2010 20:08:01 23/03/2010 20:08:59
3
1
19/01/2010 13:24:52
5
28/01/2010 20:33:42 15/03/2010 17:55:52
30/01/2010 15:36:18 17/03/2010 18:17:51
Analyser
des
transactions
181
Ce schma a permis de comparer le scnario dcrit par le suspect et les traces laisses par son
activit tlphonique. Il a ainsi t possible didentifier des incohrences.
182
Patterns
de
visualisation
relationnelle
Le schma ci-dessous reprsente les relations tablies sur la base dchange de tlphones
portables :
276 appels
31.10.2002 10:15:22
05.12.2002 17:30:19
2 appels 32 appels
25.12.2002 13:07:07
2 appels
16.04.2003 11:08:42 2 appels
08.02.2003 13:36:38 10.06.2003 08:55:25
09.02.2003 11:37:25 10.06.2003 22:06:39
10.06.2003 11:59:41
12.02.2003 19:06:21
8 appels 3 appels
21.04.2003 19:15:41
08.01.2003 17:30:25
08.06.2003 19:10:49
09.01.2003 20:41:55
1 appel 64 appels 7 appels
20 appels 05.06.2003 20:44:15 07.06.2003 19:05:55 14.06.2003 23:10:59
09.01.2003 08:54:50 05.06.2003 20:44:15 09.06.2003 19:33:12 17.06.2003 01:34:55
27.04.2003 21:54:12
585 appels
28.03.2003 14:35:47 1365 appels
16.10.2002 09:34:32
15.04.2003 23:48:11
14.04.2003 20:10:36
18 appels 186 appels 552 appels 3 appels 1742 appels
23.02.2003 19:13:50
1 appel 21.10.2002 15:55:24
28.03.2003 15:18:54 21.10.2002 10:42:43 01.12.2002 20:29:16
07.04.2003 13:59:19
23.02.2003 19:23:54 09.04.2003 21:34:06 22.11.2002 13:20:51 21.10.2002 10:46:09 27.03.2003 19:39:57
07.04.2003 13:59:19
De tels schmas sont notamment utiles pour dtecter des relations entre deux cartes SIM,
mme si aucun appel na t effectu. En effet, il peut arriver que des complices veillent ne
pas se contacter directement, mais schangent leurs botiers.
T r a n s a c t i o n s f i n a n c i r e s
C o n t e x t e
Les informations sont gnralement fournies directement par des organismes financiers, voire
saisies lors de perquisitions. Lintgration de ces informations pose en Suisse notamment de
nombreux problmes lis aux variations de formats et au support de transmission (la plus
grande partie des banques transmettent les informations sous forme papier). Par ailleurs, ces
donnes sont gnralement fragmentaires. En effet, les relevs de comptes, bien quintgrant
Analyser
des
transactions
183
O b j e c t i f s d e l a r e p r s e n t a t i o n
Les schmas de flux relationnels de flux sont produits sur la base de transactions financires
afin dexpliciter un mcanisme financier particulier ou de dtecter une activit de fraude ou de
blanchiment par exemple. Ils permettent de dtecter des patterns correspondant des modes
opratoires particuliers (par exemple afin de dissimuler la provenance de fonds).
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
La relation principale sur laquelle porte lanalyse est la transaction financire effectue entre
un compte dbit et un compte crdit. Les transactions financires peuvent donc tre
reprsentes par des liens dirigs.
184
Patterns
de
visualisation
relationnelle
Produire un schma relationnel efficace est une tche difficile pour les raisons suivantes :
Lors de la cration dun schma de flux temporel, plusieurs transactions entre deux mmes
comptes peuvent avoir t effectues le mme jour. Contrairement aux communications
tlphoniques dont lheure et la dure sont dfinies, seule la date de la transaction est
disponible en matire de finance. Les transactions doivent donc tre au minimum agrges
par jour pour viter des superpositions visuelles.
Pour exploiter au mieux la reprsentation, des slections et des agrgations peuvent tre
effectues. Un sous-groupe de transactions peut tre filtr pour reprsenter une portion
particulire des donnes. De telles slections sont gnralement effectues pour rpondre
des questions spcifiques : pour telles priodes, tels comptes, telles personnes, etc. quelles
sont les relations ? Des agrgations particulires peuvent galement tre effectues. Elles sont
dcrites dans ce pattern.
Lensemble des transactions entre deux comptes sont regroupes. Le lien reprsente alors un
groupe de transactions avec comme attributs: le nombre et le montant total des transactions.
Agrgation de lensemble des transactions entre deux comptes. Lpaisseur des liens est alors
proportionnelle au nombre de relations regroupes ou la somme des montants.
Analyser
des
transactions
185
Lensemble des comptes dune mme personne ou dune mme socit peut tre fusionn.
Les transactions entre ces comptes ne sont plus visibles, mais les entres et sorties dargent
peuvent tre analyses de manire globale.
Agrgation de lensemble des comptes dune mme personne ou dune mme socit (en vert).
Une autre stratgie dagrgation consiste regrouper des transactions en fonction de leurs
types (retraits cash, payements, etc.). Cette mthode permet notamment de grer
lincompltude des donnes, puisquil nest plus ncessaire de connatre prcisment la source
ou la destination de la transaction, mais uniquement son type (reprsent ci-dessous par la
couleur) :
Sur le schma de gauche, la couleur distingue des types de transaction et les nuds reprsentent des
comptes ( ? lorsque celui est inconnu). Sur les deux schmas de droite, les nuds reprsentent les types
de transaction. Lagrgation par type permet de simplifier le schma et deffectuer des analyses
particulires, telles que lanalyse des entres et sorties des comptes dune socit.
Sur le schma temporel o chaque transaction est reprsent par un lien vertical, le compte li
la transaction peut tre reprsent sous la forme dun attribut du lien. La couleur peut
galement tre exploite pour distinguer des personnes ou des socits (voir lexemple de cas
prsent plus loin).
186
Patterns
de
visualisation
relationnelle
E x e m p l e d e c a s
Des schmas relationnels peuvent tre produits pour reprsenter un mcanisme financier
particulier ou un ensemble de transactions suspectes. Le cas prsent porte sur lanalyse des
comptes dune socit de placement suspecte davoir une activit frauduleuse. En effet, sur
lensemble de la priode dactivit de cette socit, seul un placement financier a t retrouv
dans les comptes. Le schma ci-dessous a t produit pour dcrire ce placement.
Le schma dcrit lensemble des transactions depuis les comptes des clients ayant apport des
avoirs jusqu lachat de titres. Les entits ont t positionnes en fonction des types de
comptes. De tels schmas sont utiles pour faciliter la description des mouvements bancaires.
Analyser
des
transactions
187
Comptes
de
la
socit
entres
sorties
Le rsultat est peu lisible. Des stratgies de simplification ont t appliques pour pouvoir
analyser les donner. Le schma final produit est le suivant :
Les comptes de la socit ont t regroups et reprsents par une seule ligne horizontale (au
centre, car les mouvements internes ne sont pas pertinents pour lobjectif danalyse. De plus,
seules les transactions dun montant suprieur dix milles francs ont t slectionnes. Ce
choix a t effectu par le magistrat instructeur. Une telle slection permet de rduire le
nombre dinformations reprsenter et donc la complexit du schma. Un tel choix doit
toutefois tre justifi en fonction du contexte de laffaire. Finalement lensemble des entres et
188
Patterns
de
visualisation
relationnelle
des sorties ont t regroupes selon leurs types (apports de clients, dactionnaires et cash,
frais divers, retraits cash, retraits au profit des actionnaires, etc.). La couleur a t exploite
pour distinguer les diffrents clients.
Des reprsentations peuvent galement tre produites pour mettre en relation des
transactions financires avec dautres informations. Sur le schma ci-dessous, les apports
effectus sur des comptes sont mis en relation avec des vols particuliers.
Analyser
des
transactions
189
Laffaire porte sur la dtection dapports supposs frauduleux dor auprs dune socit.
Lanalyse des communications tlphoniques de cette socit a permis de dtecter un numro
de tlphone ayant effectu des communications avec la socit de faon rgulire ; deux ou
trois jours avant chaque apports. Cette analyse a permis de remonter la source des dpts.
V e n t e s d e m a r c h a n d i s e s
C o n t e x t e
Des transactions sont galement frquemment analyses lors de lanalyse dun trafic (par
exemple en matire de stupfiants). A la diffrence des analyses effectues sur la base de
donnes de tlphonie ou de transactions financires, lanalyse dun trafic se base
gnralement sur les dclarations de suspects ou de tmoins.
O b j e c t i f s d e l a r e p r s e n t a t i o n
Les schmas de flux relationnels reprsentent un ensemble de ventes entre des personnes, afin
dobtenir une vue densemble du trafic et afin notamment de comparer les versions des
diffrentes sources dinformation.
C o n c e p t s r e p r s e n t e r
R e p r s e n t a t i o n d e s r e l a t i o n s
Une vente est un type particulier dvnement o chaque individu possde un rle particulier :
le vendeur, lacheteur, voire un intermdiaire. Bien quune vente puisse tre ralise entre plus
de deux personnes, la majeure partie dentre elles est effectue entre un acheteur et un
vendeur.
190
Patterns
de
visualisation
relationnelle
Les ventes peuvent alors tre considres comme des transactions entre deux personnes,
cest--dire des relations diriges entre le vendeur est lacheteur :
Les informations sur la nature, la quantit et le prix des objets vendus peuvent tre
reprsentes comme attributs sur les liens :
Analyser
des
transactions
191
E x e m p l e d e c a s
Cet exemple (dj prsent dans la section Reprsentation dun trafic de marchandises du
chapitre Evaluations prliminaires ) porte sur lanalyse dun trafic dobjets vols ou
contrefaits. Le schma ci-dessous rsume les informations tires dune cinquantaine de
procs-verbaux effectus au cours de lenqute. Il dcrit lensemble des transactions pour une
marque particulire dobjets. Les personnes impliques dans cette affaire ont effectu un
nombre trs important de ventes et dchanges dobjets de diverses marques. Le deuxime
schma reprsente lensemble du trafic. La couleur des liens a t exploite pour diffrencier
les marques et permettre de lier visuellement les schmas de dtails (tel que celui prsent ci-
dessous) et le schma gnral.
192
Patterns
de
visualisation
relationnelle
The methods and technologies that are supposed to support data analysis and reporting
known as business intelligence - have failed so far to deliver on their promise of intelligence.
Despite great technical progress in data acquisition, data integration, data improvement
through cleansing and transformation, and the construction of huge data warehouses that we
can access at incredible speeds, the business intelligence industry has largely ignored the fact
that intelligence resides in human beings, and that information only becomes valuable when it
is understood, not just when its made available. (Few, 2009, p.3)
I m p a c t s u r l a c o n c e p t i o n d o u t i l s
P r o b l m a t i q u e
Avant lavnement du micro-ordinateur, les reprsentations graphiques taient produites la
main. Actuellement elles sont produites, quasiment en totalit, laide de logiciels de
visualisation spcialiss. Ceux-ci imposent parfois leurs propres standards et les possibilits
sont videmment cantonnes aux fonctionnalits offertes. De plus, les logiciels sont trs
souvent dvelopps pour rpondre aux attentes du plus grand nombre. Ils offrent donc des
solutions gnriques, alors que les problmes rsoudre sont souvent spcifiques. Dun ct
lanalyste dispose de donnes propres la situation traite qui sont souvent volumineuses
(telles que des donnes tlphoniques, des procs-verbaux dauditions ou des listings de cas).
De lautre, il exploite des outils qui, malgr un nombre impressionnant de fonctionnalits, ne
le guident que rarement vers des choix de reprsentation adapts aux questions danalyse.
La mthode dcrite dans le premier chapitre et les exemples prsents dans le second
reposent sur les possibilits offertes par les outils. Il a t montr par les exemples que le
langage visuel actuellement disponible est malheureusement encore insuffisant. Par exemple,
194
Impact
sur
la
conception
doutils
les notions de groupe, densemble et de relation multiple sont rarement intgres de faon
formelle dans les outils de visualisation relationnelle. Slectionner une structure de graphe
adapte nest pas toujours une tche vidente : il est souvent ncessaire deffectuer plusieurs
essais avant daboutir une solution efficace. De plus, pour un mme problme et un mme
jeu de donnes, plusieurs questions peuvent se poser. Elles peuvent porter sur plusieurs
dimensions danalyse, sur lensemble des donnes, une partie ou un lment spcifique. Afin
de faciliter la conception dun graphe, il devrait techniquement tre possible dintgrer des
donnes indpendamment de leurs structures et par le biais de transformations, reprsenter
les informations selon divers modles de graphe (Senator, 2005). Les outils exploits pour
soutenir le processus danalyse doivent donc permettre de modifier dynamiquement la
reprsentation afin de pouvoir tester diffrentes solutions et changer les points de vue sur les
donnes. Certains auteurs relvent mme que les outils actuellement utiliss sont plus utiles
pour llaboration de comptes-rendus, quen tant quoutils danalyse facilitant les
raisonnements et le dveloppement dhypothses alternatives (Wright et al., 2006).
La premire partie de ce chapitre dcrit le processus dtaill de conception dun graphe dun
point de vue technique et tel quil devrait tre intgr dans les outils. La seconde section
prsente des exemples de transformations dynamiques qui sont gnralement utiles pour
faciliter lanalyse des donnes par un graphe et modifier les points de vue sur les donnes. La
question de lintgration de lensemble des quatre dimensions dans un outil global est
aborde dans la troisime partie. Finalement un prototype de visualisation multidimensionnel
est prsent. Le prototype dvelopp est une extension dun logiciel de visualisation spatiale
au sein duquel un module temporel a t intgr. Lintgration de reprsentations
relationnelles na pu tre ralise dans le cadre de cette recherche, mais la manire de la
raliser est prsente.
Processus
de
visualisation
195
P r o c e s s u s
d e
v i s u a l i s a t i o n
Une adaptation du modle labor par Ed H. Chi (Chi & Riedl, 1998), (Chi, 2000) et (Chi &
Panizzi, 2002) sous le nom de "data state model" puis repris dans (Card et al., 1999) sous le
nom de "information visualization reference model" est propose. La description du processus
prsente ci-dessous intgre des aspects dcrits par (Tang et al., 2004) et (Heer & Agrawala,
2006). Etonnamment, aucun de ces modles ne formalisent le processus global selon une
dcomposition en cinq tapes, telle que dcrite ici.
Modlisation
Modlisation
des
donnes
de
la
reprsentation
Ce processus dcrit la relation qui lie les donnes et les vues par une combinaison de
transformations entre diffrents tats. Il permet une dcomposition des problmatiques
rencontres lors de l'laboration d'une reprsentation graphique et met en vidence
l'existence d'oprations (combinaisons de transformations) lies soit la nature des donnes
traites, soit aux caractristiques de la vue (Chi & Riedl, 1998). Afin d'expliciter le modle, la
visualisation des donnes issues des contrles policiers de personnes et de vhicules est prise
comme exemple plus loin. Cette formalisation met en vidence lune des difficults du
processus : les reprsentations graphiques ncessitent une structuration de linformation qui
nest pas toujours en adquation avec le modle de donnes conu lors de lintgration. Cette
problmatique est identifie, dans le domaine de la conception logicielle, sous le nom
dImpedance Mismatch66. Les termes de reprsentation et de visualisation sont parfois utiliss
pour diffrencier les reprsentations statiques des visualisations dynamiques67 (Card et al.,
1999).
66
http://c2.com/cgi/wiki?ImpedanceMismatch (dernier accs le 14 aot 2010)
67
Des techniques de transformations dynamiques sont utilises pour faciliter les interactions avec lutilisateur ;
telles que lutilisation de popups, doutils de slection ou des distorsions de la vue.
196
Impact
sur
la
conception
doutils
Contrles de personnes et de
Modlisation
du
domaine
Prtraitement
Personnes
d'intgration
np
-
ne
Nom
Prnom
Evnements
Modle
de
Date
donnes
Lieu
Vhicules
Marque
Modle
nv
-
ne
Transformation
de
modle
Transposition
visuelle
Reprsentation
Nombre
de
A
B
C
D
contrles
Personnes
Processus
de
visualisation
197
La premire tape du processus consiste intgrer les donnes sources brutes dans une ou
plusieurs tables formant le modle des donnes. Cette structure de donnes est dfinie par la
modlisation du domaine pour le problme traiter. Dans le processus danalyse, cette tape
est effectue dans le processus dintgration.
Toutefois ce modle ne permet pas toujours une transposition directe vers la vue. Par
exemple, afin de produire un histogramme du nombre de contrles par personne, une table
contenant les identits des individus et leurs nombres respectifs de
contrles est ncessaire. Un processus de transformation du modle
(constitu d'oprations spcifiques) est ncessaire pour transfrer les
donnes dans le modle de la reprsentation. Ces oprations sont, pour
cet exemple, une slection des attributs d'intrt (nom, prnom, date de
temps
naissance des personnes) et le calcul du nombre de cas par individu. Cette
dcomposition entre le modle de donnes et le modle de la vue, permet
de dcrire les visualisations indpendamment de la nature des donnes.
Par ailleurs, pour un mme modle de donnes, plusieurs modles de vue B
Exemples
de
transpositions
6
5
7
3
visuelles
A
B
C
D
A
B
C
D
A
B
C
D
198
Impact
sur
la
conception
doutils
Modle
de
donnes
Modle
de
vue
Vue
Le modle de vue est identique, mais pas les modles des donnes sous-jacents. Une
transformation du modle doit donc tre effectue pour produire la reprsentation. Cette
incompatibilit de modles implique donc deffectuer des traitements sur le donnes. Dans
lidal ce processus devrait tre automatis et intgr dans loutil.
Modification
dynamique
de
la
structure
du
graphe
199
M o d i f i c a t i o n
d y n a m i q u e
d e
l a
s t r u c t u r e
d u
g r a p h e
Afin de faciliter lexploration des donnes, ils serait trs utile que les outils de visualisation
relationnelle disposent de mcanismes de modification de la structure des graphes.
Actuellement, lorsque lutilisateur souhaite effectuer des modifications, il peut soit les
effectuer manuellement sur le graphe, soit rimporter les donnes pralablement modifies.
Dans ce deuxime cas, si le modle des donnes nest pas adapte pour la nouvelle structure
visuelle souhaite, des transformations manuelles et fastidieuses doivent tre effectues pour
reconstruire une modle de donnes adapt pour la vue.
Lors du traitement des diffrents cas prsents dans cette thse, un certain nombre de
transformations gnriques frquemment utiles ont t identifies. La ncessit de telles
transformations a t confirme lors de discussions avec des praticiens. Labsence de cette
fonctionnalit gnre de nombreuses frustrations et des pertes de temps parfois importantes.
Il est dailleurs intressant de relever que, lors de formations, il est frquent que les utilisateurs
dbutants identifient cette lacune et sinterrogent sur cette absence tant elle leur parat
frappante.
Le tableau ci-dessous dcrit les principales transformations identifies comme utiles pour
explorer visuellement les informations sur un graphe. La liste nest certainement pas
exhaustive. Elle regroupe des types gnriques de transformation et permet dexpliciter la
nature des modifications frquemment effectues. Ces transformations sont videmment
dfinies en regard de la typologie de relations proposes. Elles permettraient notamment de
faciliter la deuxime tape de la mthode qui consiste dfinir quelle est la manire la plus
adapte de reprsenter les relations entre les entits pertinentes. En effet, cette tape nest pas
toujours vidente et elle pourrait tre facilite si loutil permettait deffectuer ces changements
dynamiquement. Il serait alors possible de modifier la reprsentation en cours danalyse et
mettre en avant certaines relations plutt que dautres au fil des questionnements. Par
exemple lors de lanalyse dune srie de cambriolages, extraire le lieu de commission du dlit
sous la forme dune entit lie permet de visualiser rapidement les relations spatiales selon le
principe de connectivit dcrit prcdemment.
200
Impact
sur
la
conception
doutils
Reprsenter une entit sous la
forme dun cadre
Transformer une clique68 en lien
multiple
Exemples de modifications dynamiques de la structure dun graphe utiles lors de lanalyse des informations
68
Portion dun graphe dont lensemble des sommets sont lis deux deux.
Intgration
des
dimensions
danalyse
201
I n t g r a t i o n
d e s
d i m e n s i o n s
d a n a l y s e
Lanalyse simultane des informations dans les quatre dimensions danalyse constitue lune
des problmatiques majeures de la visualisation de linformation. De nombreuses recherches
ont t menes sur le sujet (notamment en matire danalyse spatio-temporelle) depuis le
dbut des annes deux-mille. A lpoque, il tait constat que peu doutils offraient des
possibilits danalyse dans plusieurs dimensions simultanment (Buetow et al., 2003). Depuis
lors, de nouveaux outils performants ont t dvelopps dans ce sens (voir notamment (Guo
et al., 2006) et (Brunsdon et al., 2007)). Les logiciels actuels, tels que Tableau Software ,
Spotfire et Analysts Notebook 69 intgrent dj plusieurs des dimensions danalyse. La
tendance actuelle est clairement de dvelopper des outils intgrateurs, dcomposant les
problmes selon ces dimensions afin de faciliter lexploration des donnes. La dmarche
propose rejoint cette tendance actuelle.
P r o t o t y p e
d e
v i s u a l i s a t i o n
m u l t i d i m e n s i o n n e l l e
202
Impact
sur
la
conception
doutils
Intgration
des
dimensions
danalyse
203
ont t dveloppes pour grer la superposition spatiale des points : les animations, les treillis
et lier des vues par le symbole.
A n i m a t i o n s
Certaines tudes ont montr que lutilisation danimations pour reprsenter des donnes
spatio-temporelles semble tre un moyen efficace offrant de nombreuses perspectives
(Brunsdon et al., 2007). En effet, une animation est souvent intuitive et elle peut tre
directement associe au temps. Cependant, les animations se basent sur les capacits de
mmorisation de lutilisateur. Cette contrainte pose problme lorsque celles-ci sont longues.
De plus les animations ncessitent dtre contrles par lutilisateur (notamment au niveau de
la vitesse de dfilement des cas) et des supports de transmission adapts doivent tre
dvelopps. Dans le cadre de lenqute judiciaire, des reprsentations annexes un rapport
crit sont souvent souhaitables. Lusage danimations est donc relativement peu frquent et
moins pratique que lusage de reprsentations statiques.
T r e i l l i s ( c o m a p , s m a l l - m u l t i p l e s )
Un treillis est la juxtaposition de plus cartes en parallle. Chaque carte peut alors reprsenter
la rpartition spatiale pour une priode temporelle dfinie (Keim et al., 2005). Lanalyse spatio-
temporelle est effectue par comparaison des cartes. Tufte (1990) dcrit cette technique sous
le nom de small-multiples . Il relve notamment que lensemble des diagrammes aligns
cte--cte doit pouvoir tre observ en une seule fois, afin de deffectuer des comparaisons
sur lensemble des donnes. Selon lui, cette technique fait partie des meilleures solutions
exploitables pour effectuer des comparaisons entre plusieurs groupes dintrts. Cette
technique nest cependant efficace que pour un nombre limit de cartes et donc pour un
nombre de limit de priodes. Dans le cas contraire, le nombre de comparaisons et le temps
de lecture ncessaires pour interprter les rsultats sont gnralement trop importants.
Certains chercheurs rejettent dailleurs lhypothse que cette technique est efficace, car ils
estiment que le processus de comparaison est difficile voire imprcis (MacEachren, 2004).
204
Impact
sur
la
conception
doutils
L i e r d e s v u e s ( f o c u s i n g , l i n k i n g a n d a r r a n g i n g )
Une troisime technique consiste exploiter plusieurs vues spares pour explorer les
donnes en parallle pour chaque dimension. Diverses techniques peuvent tre utilises pour
lier les vues suivant que la reprsentation est dynamique ou non, et que les vues sont
prsentes simultanment ou en squence (Fredrikson et al., 1999). Par exemple, un moyen
courant consiste utiliser des techniques de slections. Lorsque lutilisateur slectionne une
zone particulire sur lune des vues, les donnes sont filtres ou mises en valeur sur les autres
vues (technique dite du Brushing (Keim et al., 2005) (Chen & Czerwinski, 2000)). Une autre
approche consiste exploiter la couleur pour reprsenter un attribut particulier. Les couleurs
ainsi dfinies sont reportes dans chaque vue (cette technique est notamment exploit dans
(Guo et al., 2006)). Lier des vues laide de la couleur est gnralement fait sur la base dun
attribut de la dimension relationnelle (comme le type dvnement, lge dune personne, etc.)
Cette technique est reconnue comme efficace et exploite par de nombreux outils (Brunsdon
et al., 2007). Lhypothse fondamentale de cette technique est quil est plus efficace de
chercher combiner plusieurs vues spcifiques et adaptes pour reprsenter des dimensions
particulires, plutt que de tenter de dvelopper une vue unique optimale (MacEachren, 2004).
Lapproche propose se base sur cette technique de reprsentation combine la mthode
des treillis.
Intgration
des
dimensions
danalyse
205
A p p r o c h e d v e l o p p e
Lapproche imagine pour dvelopper le prototype est issue du travail de master en sciences
forensiques effectu par Bndict Heidl (Heidl, 2007). Loutil dvelopp est disponible en
ligne70.
La mthode de reprsentation dveloppe est base sur lide que lanalyse visuelle est
facilite en intgrant la dimension temporelle sur des vues spcifique plutt que directement
sur une carte. Le lien entre les vues est ralis par un usage spcifique de la couleur. La
distribution gographique est divise en sous-rgions et une couleur est attribue chaque
delles. Pour chaque sous-groupe dobservations (des cas, des positions GPS ou dans le cas
prsent ci-dessus des appels tlphoniques), la couleur est reporte sur les vues temporelles
afin de reprsenter chaque distribution. Dans cet exemple, le diagramme du haut est une ligne
de temps linaire (les donnes sont reprsentes par semaine). Le diagramme de droite
exploite la technique des treillis pour reprsenter les distributions par heure de la journe
pour chaque sous-groupe.
70
http://www.analysecriminelle.org/visualist/, dernier accs le 23 janvier 2011.
206
Impact
sur
la
conception
doutils
1. Les groupes peuvent tre personnaliss par slection des cas sur la carte.
2. Les niveaux dagrgations sont modifiables dynamiquement sur les vues temporelles.
Les donnes peuvent tre reprsentes linairement (par jour, semaine, mois et par
annes) et cycliquement (par heure de la journe, jour de la semaine, jour du mois et
par jour de lanne).
3. Les niveaux dagrgations peuvent tre modifis sur la carte : au niveau des
observations ou par regroupement selon des rgions administratives telles que les
communes, districts, pays, etc. Diffrents type de reprsentation peuvent tre exploits
(tels que dcrit dans lannexe un) : carte points, symboles proportionnels ou
choroplthe.
P e r s p e c t i v e
D I S C U S S I O N G E N E R A L E
R s u l t a t s
e m p i r i q u e s
Les valuations prliminaires et les tudes de cas ralises mettent en vidence de relles
difficults de conception des schmas relationnels. Concevoir un schma efficace pour
rpondre une question danalyse requiert des capacits spcifiques en termes de
modlisation. Llaboration dun schma ncessite en effet de savoir isoler les aspects
essentiels du problme et didentifier clairement les entits pertinentes sur lesquelles portent
les questionnements et la recherche de relations. La ralisation dune visualisation ne relve
pas uniquement de lutilisation dun outil informatis, mais constitue essentiellement une
activit de modlisation. Cela confirme la ncessite dtendre la formation au-del de la
matrise des outils informatiss.
Les trois cas prsents pour illustrer les variabilits de reprsentation ont t slectionns
parmi un ensemble dexercices effectus par des tudiants et des praticiens. Plusieurs autres
exercices portant sur diverses thmatiques (telles que lanalyse de trafics de stupfiants, de
srie de cambriolages ou danalyse de spams par exemple) ont galement mis en exergue les
difficults observes. Lchantillon prsent dans cette thse na pas t slectionn pour
amplifier le constat. Au contraire, les exemples portant sur une seule phrase ont t choisis
pour leur simplicit, afin de montrer que la complexit des informations nest pas la seule
cause des variations. Le troisime cas a t choisi en raison du nombre de participants afin de
prsenter les difficults sur un chantillon le plus reprsentatif possible.
208
Discussion
generale
M t h o d e s
d v a l u a t i o n
Lors de la prsentation du plan de recherche, la question de lvaluation des
recommandations mthodologiques et techniques proposes a t souleve. Un effort
particulier avait dj t effectu pour rcolter des donnes empiriques afin dexpliciter et
valuer la ralit et lampleur de la problmatique. Lutilisation des exercices rendus lors de
formations a t choisie comme stratgie.
Cette dmarche a permis dobtenir plusieurs chantillons sans mettre en place des
exprimentations spcifiques trop difficile mettre en uvre. Les reprsentations ont t
produites sans pression de temps et selon des objectifs pdagogiques. Elles nont donc pas
t produites dans lobjectif spcifique des valuations, mais dans des conditions relles
Apports
sur
un
plan
mthodologique
209
dapprentissage. Il faut toutefois relever que les conditions ntaient pas formellement
contrles. En effet, les participants pouvaient librement discuter entre eux et consulter le
travail de leurs voisins. Une grande diversit de reprsentation a nanmoins t observe.
Par ailleurs, lvaluation effectue sur les modifications du type de reprsentation (une carte,
un histogramme et un diagramme circulaire) sest avre trs intressante et utile dun point
de vue qualitatif. En effet, la comparaison des constatations et des analyses effectues par les
tudiants a permis dillustrer limpact de choix de reprsentation sur lanalyse, mais galement
de profiter des commentaires des participants sur les reprsentations elles-mmes. En effet, la
totalit des observations discutes sur les avantages et limites de chaque reprsentation a t
releve par les participants. Une telle dmarche facilite la discussion en profitant des
commentaires de lensemble des participants. Une approche similaire aurait certainement pu
tre mise en place lors de lvaluation de la typologie de relations propose. Cette dernire a
cependant rpondu lobjectif dfini. Elle a confirm limpact sur lefficacit de la structure des
schmas. Les diffrences dexactitude observes ntaient dailleurs a priori pas attendues. Les
reprsentations ayant t conues en respectant lintgrit des donnes sous-jacentes, des
diffrences de temps de rponse taient plutt supposes. La lisibilit dun graphe semble
ainsi avoir un impact important sur lutilisabilit dune reprsentation.
A p p o r t s s u r u n p l a n m t h o d o l o g i q u e
D i m e n s i o n s d a n a l y s e
210
Discussion
generale
mauvais choix de reprsentation et, dautre part, de prsenter en dtails les choix qui ont
men aux solutions proposes.
P r o c e s s u s
d e
c o n c e p t i o n
d u n
s c h m a
r e l a t i o n n e l
Lapproche globale propose pour concevoir un graphe et grer les difficults lies la
complexit des informations reprsenter se fonde sur un usage adapt de structures
graphiques et des proprits visuelles pour amliorer la lisibilit de la visualisation par
diverses stratgies de simplification. Cette approche est certainement novatrice en analyse
criminelle. Elle se distingue des approches proposes dans la littrature. En effet, de nombreux
travaux ont t mens pour amliorer les algorithmes de placement des nuds, sans prendre
en compte la smantique des concepts reprsents et la possibilit dexprimer des relations
par le placement. Lapproche propose repose notamment sur un placement des entits en
regard de leurs types ou afin de distinguer des groupes. Lapproche est certes manuelle, mais
elle permet dobtenir un rsultat visuel efficace. Par ailleurs, lapproche des rseaux sociaux qui
connait un essor particulier pour rsoudre le problme de la surcharge dinformation,
namliore pas la qualit visuelle et lutilisabilit des reprsentations. Elle soutient lanalyse en
facilitant la dtection des entits centrales dun rseau par exemple, mais namliore pas la
reprsentation des fins de communication. Lapproche propose offre quant elle des pistes
pour exploiter de manire efficace la visualisation tant pour lanalyse que la communication en
amliorant la lisibilit du graphe.
Perspectives
211
pratiques est propos. Il faut relever ici que la dmarche gnrale propose a t formalise
sur la base des situations rcurrentes prsentes et des solutions identifies pour les traiter.
Mme si la mthode est probablement applicable dautres situations, il nest absolument pas
certain que les catgories de relations identifies soient exhaustives. Il semble toutefois que le
niveau dabstraction auquel elles ont t dfinies devrait permettre de les exploiter pour la
rsolution de nouveaux problmes, voire dtendre ultrieurement la classification.
P a t t e r n s d e v i s u a l i s a t i o n
Les solutions proposes bien quayant dmontr leur utilit dans le cadre daffaires relles, ne
sauraient tre considres comme les meilleures possible. La dcouverte de nouvelles
mthodes ou lapplication de meilleures stratgies de reprsentation peuvent remettre en
question les solutions proposes et enrichir les rsultats. L'optimisation de la mthode de
reprsentation des informations est donc une question permanente. Dans cette perspective, le
regroupement de solutions graphiques ayant montr une certaine efficacit est ncessaire.
Llaboration dun catalogue de situations rcurrentes a t amorce dans cette optique. Cette
approche fixe un cadre qui ouvre la voie des dveloppements ultrieurs.
P e r s p e c t i v e s
D v e l o p p e m e n t s e n t e r m e s d e r e c h e r c h e
212
Discussion
generale
Dans le cadre de lanalyse criminelle oprationnelle, les patterns dfinis ont t formaliss en
regard dobjectifs danalyse prcis. Ils sont cependant largement influencs et orients en
fonction de la nature des informations reprsentes. Il serait certainement souhaitable
dtendre la dmarche et de formaliser les pratiques en regard des types de raisonnement
exploits. A titre dexemple, lors de lanalyse de donnes de tlphonie, les traces rcoltes
sont issues de lactivit globale de suspects. Les indices en lien avec une activit suspecte
doivent donc tre distingus de lensemble des communications non pertinentes qui forment
un bruit de fond important. Lanalyse des traces seffectue au niveau de lactivit en exploitant
notamment les informations circonstancielles du cas :
Perspectives
213
E c h a n g e d e c o n n a i s s a n c e s
Le catalogue de patterns amorc dans le cadre de cette recherche est fond principalement
sur les cas traits par lauteur au cours des six annes passes collaborer sur des enqutes.
Les situations prsentes ne sont toutefois pas spcifiques un cas particulier, mais dcrites
un niveau dabstraction qui devrait permettre de r-exploiter les solutions sur des cas
analogues. Il faut noter quil a t difficile de rcolter des exemples traits par des collgues
en raison notamment de la sensibilit des informations reprsentes. De nombreuses
discussions avec des collgues analystes et enquteurs ont toutefois permis denrichir le
contenu des solutions proposes. A lexception de certaines propositions lies au
dveloppement du langage visuel, les patterns prsents ne sont certainement pas novateurs
pour des analystes expriments. Ils ont probablement une utilit plus grande pour des
analystes dbutants. La prochaine tape est certainement de mettre disposition ces
propositions afin de stimuler lchange dexpriences et faire voluer les propositions vers des
solutions peut-tre plus efficaces et innovantes et tendre le recueil de bonnes pratiques. Une
plateforme en ligne intgrant des patterns de visualisations est certainement un
dveloppement ncessaire pour stimuler ces changes.
I m p a c t s u r l e n s e i g n e m e n t
Les rsultats obtenus et les recommandations formalises ont une utilit directe en matire
denseignement. Ils ont dailleurs dj t intgrs lors de formations lanalyse criminelle
oprationnelle. Les mthodes de visualisation sont cependant exploites de manire plus
large. En criminologie par exemple, il est intressant de relever que les mthodes dvaluations
statistiques sont trs courantes et largement enseignes. La visualisation en tant que mthode
complmentaire reste quant elle principalement du domaine de lapprentissage personnel.
Alors que les statistiques permettent de tester des hypothses, la visualisation peut jouer un
rle important en amont lors de llaboration dhypothses. Il est dailleurs trs frquent de
trouver des chapitres sur le sujet dans des ouvrages sur la fouille de donnes et lanalyse
quantitative notamment. La reprsentation de linformation fait partie des mthodes facilitant
214
Discussion
generale
lexploration des donnes. Connatre les possibilits quelle offre, savoir valuer ses limites et
comprendre comment lexploiter de manire efficace pour analyser des informations sont
autant de motivations qui conduisent dailleurs au dveloppement de programmes
denseignement en la matire. Ils restent cependant pour la plupart intgrs dans des cursus
spcifiques, tels que le dveloppement informatique ou la pdagogie par exemple.
D v e l o p p e m e n t s i n f o r m a t i q u e s
C O N C L U S I O N
Dans ce travail, nous avons montr que lexploitation des mthodes de visualisation en
analyse criminelle soulve de nombreuses difficults mthodologiques. Le processus
systmatique de lanalyse criminelle se veut global et nintgre pas formellement une tape de
visualisation de linformation, alors que celle-ci forme certainement une partie centrale des
produits de renseignement.
Les schmas relationnels exploits dans les enqutes judiciaires ont t choisis comme sujet
dtude. Des manuels de bonnes pratiques existent, mais les niveaux de gnralit des
recommandations dfinies sur la conception de tels schmas sont variables et elles ne sont
pas prsentes dans un cadre clairement formalis.
Des valuations prliminaires ont t effectues afin de mesurer lampleur des difficults. Elles
fournissent une image empirique de ltendue des variations observables lors de la conception
des schmas et prsentent, par des exemples rels, limpact de choix inadapts sur lanalyse et
la communication. Elles rvlent limportance de consolider les mthodes. La lisibilit des
schmas produits semble notamment avoir un impact important sur leur utilisabilit.
Dans ce contexte, une double approche a t entreprise. Dune part, des rgles et des
recommandations gnrales issues notamment dtudes sur la visualisation ont t
recherches afin de proposer une dmarche de conception des schmas relationnels:
216
Conclusion
Dautre part, ltude de cas spcifiques a permis didentifier des situations rcurrentes pour
lesquelles des reprsentations efficaces ont pu tre dfinies. Le terme de pattern est utilis
pour dcrire ces bonnes pratiques. Chaque pattern est compos de quatre parties : le contexte
dexploitation, le ou les objectifs danalyse, les concepts reprsenter et la solution graphique
propose. Lobjectif est damorcer le dveloppement dun catalogue de patterns.
B I B L I O G R A P H I E
(Zachry & Thralls, 2004)
ADDERLEY, R. W. & MUSGROVE, P. (2001). Police crime recording and investigation systems -
A user's view. Policing 24, no. 1: 100-114.
AEPLI, P., RIBAUX, O. & SUMMERFIED, E. (2011). Decising making in policing. Lausanne,
Switzerland: EPFL Press.
AIGNER, W., BERTONE, A., MIKSCH, S., TOMINSKI, C. & SCHUMANN, H. (2007). Towards a
conceptual framework for visual analytics of time and time-oriented data. Dans
Proceedings of the 2007 Winter Simulation Conference, d. S. G. Henderson, B. Biller,
M.-H. Hsieh, J. Shortle, J. D. Tew, & R. R. Barton, 721-729. WSC '07. Piscataway, NJ:
IEEE Press.
ALEXANDER, C. (1979). The timeless way of building. New York, NY: Oxford University
Press.
AMAR, R., EAGAN, J. & STASKO, J. (2005). Low-level components of analytic activity in
information visualization. Dans Proceedings of the 2005 IEEE Symposium on
Information Visualization, 111117. INFOVIS '05. Minneapolis, MN: IEEE Computer
Society.
AMAR, R. & STASKO, J. (2005). A knowledge task-based framework for design and evaluation
of information visualizations. Dans Proceedings of the 2004 IEEE Symposium on
Information Visualization, 143150. INFOVIS '04. Austin, TX: IEEE Computer
Society.
218
Bibliographie
ANDRIENKO, N. & ANDRIENKO, G. (2005). Exploratory analysis of spatial and temporal data: a
systematic approach. 1er d. Berlin Heidelberg: Springer.
ANSELIN, L., COHEN, J., COOK, D., GORR, W. & TITA, G. (2000). Spatial analyses of crime.
Criminal Justice 4: 213262.
ANSELIN, L. & GETIS, A. (1992). Spatial statistical analysis and geographic information
systems. The Annals of Regional Science 26, no. 1: 19-33.
ATKIN, H. (2000). Criminal intelligence analysis: a scientific perspective. IALEIA Journal 13,
no. 1: 1-15.
ATZENBECK, C., HICKS, D. L. & MEMON, N. (2009a). Supporting emergent knowledge and team
communication in police investigations. Dans Proceedings of the 2009 IEEE
international conference on Intelligence and Security Informatics, 95-100. ISI '09.
Richardson, TX: IEEE Press.
ATZENBECK, C., OZGULYZ, F. & HICKS, D. L. (2009b). Linking and organising information in
law enforcement investigations. Dans Proceedings of the 2009 13th International
Conference Information Visualisation, 443-449. IV '09. Barcelona, Spain: IEEE
Computer Society.
BARCLAY, D. (2009). Using forensic science in major crime inquiries. Dans Handbook of
forensic science, d. J. Frazer & R. Williams, 337358. Cullompton, Willan.
BERTIN, J. (2005). Smiologie graphique: les diagrammes - les rseaux - les cartes. 4 d. Paris:
Les r-impressions des Editions de l'Ecole des Hautes Etudes en Sciences Sociales.
BESSON, J.-L. (2004). Les cartes du crime. 1er d. Paris: Presses Universitaires de France.
BEX, F., VAN DEN BRAAK, S. W., VAN OOSTENDORP, H., PRAKKEN, H., VERHEIJ, B. &
VREESWIJK, G. (2007). Sense-making software for crime investigation: how to combine
stories and arguments? Law, Probability and Risk 6, no. 1-4: 145168.
BEX, F., PRAKKEN, H., REED, C. & WALTON, D. (2003). Towards a formal account of reasoning
about evidence: argumentation schemes and generalisations. Artificial Intelligence and
Law 11, no. 2: 125165.
219
BOBA, R. (2009). Crime analysis and crime mapping. 2 d. Thousand Oaks, CA: Sage
Publications, Inc.
VAN DEN BRAAK, S. W. (2010). Sensemaking software for crime analysis. Utrecht, Netherlands:
PhD thesis, Utrecht University.
VAN DEN BRAAK, S. W., VAN OOSTENDORP, H., PRAKKEN, H. & VREESWIJK, G. (2006). A
critical review of argument visualization tools: do users become better reasoners. Dans
Workshop Notes of the ECAI-06 Workshop on Computational Models of Natural
Argument, d. F. Grasso, R. Kibble, & C. Reed, 67-75. CMNA '06. Riva del Garda,
Italy.
BRUCE, C. (2009). Fundamentals of crime analysis. Dans Exploring crime analysis: readings
on essential skills, d. S. Gwinn, C. Bruce, J. P. Cooper, & S. Hick. 2 d. Overland
Park, KS: BookSurge Publishing.
BRUNSDON, C., CORCORAN, J. & HIGGS, G. (2007). Visualising space and time in crime
patterns: a comparison of methods. Computers, Environment and Urban Systems 31,
no. 1: 52-75.
BUETOW, T., CHABOYA, L., OTOOLE, C., CUSHNA, T., DASPIT, D., PETERSEN, T., ATABAKHSH,
H. & CHEN, H. (2003). A spatio temporal visualizer for law enforcement. Dans
Proceedings of the 1st NSF/NIJ conference on Intelligence and Security Informatics,
181-194. ISI'03. Tucson, AZ: Springer.
CANTER, P. (2000). Using a geographic information system for tactical crime analysis. Dans
Analyzing crime patterns: frontiers of practice, d. V. Goldsmith, P. G. McGuire, J. H.
Mollenkopf, & T. A. Ross. Thousand Oaks, CA: Sage Publications, Inc.
CARD, S. K. & MACKINLAY, J. (1997). The structure of the information visualization design
space. Dans Proceedings of the 1997 IEEE Symposium on Information Visualization,
92-99. INFOVIS '97. Phoenix, AZ.
220
Bibliographie
CARLIS, J. V. & KONSTAN, J. A. (1998). Interactive visualization of serial periodic data. Dans
Proceedings of the 11th annual ACM symposium on User Interface Software and
Technology, 29-38. UIST '98. San Francisco, CA: ACM Press.
CHAINEY, S. & RATCLIFFE, J. (2005). GIS and crime mapping. London, England: John Wiley
and Sons.
CHANG, D., DOOLEY, L. & TUOVINEN, J. E. (2002). Gestalt theory in visual screen design: a
new look at an old subject. Dans Proceedings of the Seventh World Conference on
Computers in Education: Australian topics, 8:512. CRPIT '02. Darlinghurst, Australia:
Australian Computer Society, Inc.
CHEN, C., HRDLE, W. & UNWIN, A. (2008). Handbook of data visualization. 1er d. Berlin
Heidelberg: Springer.
CHEN, H., ATABAKHSH, H., TSENG, C., MARSHALL, B., KAZA, S., EGGERS, S., GOWDA, H.,
SHAH, A., PETERSEN, T. & VIOLETTE, C. (2005). Visualization in law enforcement. Dans
Extended abstracts on Human factors in computing systems, 12681271. CHI '05. New
York, NY: ACM Press.
CHEN, H., ZENG, D., ATABAKHSH, H., WYZGA, W. & SCHROEDER, J. (2003). COPLINK:
managing law enforcement data and knowledge. Communications of the ACM 46, no. 1:
28-34.
CHEN, P. P.-S. (1976). The entity-relationship model: toward a unified view of data. ACM
Transactions on Database Systems 1: 9-36.
CHI, ED H & PANIZZI, E. (2002). Expressiveness of the data flow and data state models in
visualization systems. Dans Proceedings of the Working Conference on Advanced
Visual Interfaces, d. M. De Marsico & S. Levialdi, 375-378. AVI '02. Trento, Italy:
ACM Press.
CHI, ED H. (2000). A taxonomy of visualization techniques using the data state reference
model. Dans Proceedings of the 2000 IEEE Symposium on Information Vizualization,
69-75. INFOVIS '00. Salt Lake City, UT: IEEE Computer Society.
221
CHI, ED H. & RIEDL, J. (1998). An operator interaction framework for visualization systems.
Dans Proceedings of the 1998 IEEE Symposium on Information Visualization, 6370.
INFOVIS '98. Research Triangle Park, NC: IEEE Computer Society.
CHUNG, W., CHEN, H., CHABOYA, L. G., O'TOOLE, C. D. & ATABAKHSH, H. (2005). Evaluating
event visualization: a usability study of COPLINK spatio-temporal visualizer.
International Journal of Human-Computer Studies 62, no. 1: 127-157.
COCKBURN, A. & MCKENZIE, B. (2001). 3D or not 3D?: evaluating the effect of the third
dimension in a document management system. Dans Proceedings of the SIGCHI
conference on Human factors in computing systems, 434-441. CHI '01. Seattle, WA:
ACM press.
COCKBURN, A. & MCKENZIE, B. (2004). Evaluating spatial memory in two and three
dimensions. International Journal of Human-Computer Studies 61, no. 3: 359-373.
COCKBURN, A. & MCKENZIE, B. (2000). An evaluation of cone trees. Dans People and
Computers XIV: British Computer Society Conference on Human Computer
Interaction, 425-436. HCI '00. University of Sunderland, UK: Springer.
COPE, N. (2003). Crime analysis: principles and practice. Dans Handbook of policing, d. T.
Newburn, 340-362. 1er d. Cullompton, Devon: Willan Publishing.
CROSBY, A. W. (1997). The measure of reality: quantification and western society, 1250-1600.
New York: Cambridge University Press.
ECK, J. (2003). Police problems: the complexity of problem theory, research and evaluation.
Crime Prevention Studies 15: 79114.
EPPLER, M. J. & AESCHIMANN, M. (2009). A systematic framework for risk visualization in risk
management and communication. Risk Management 11, no. 2: 67-89.
FEIGENSON, N. & SHERWIN, R. K. (2007). Thinking beyond the shown: implicit inferences in
evidence and argument. Law, Probability & Risk 6, no. 1-4: 295-310.
222
Bibliographie
FELSON, M. & CLARKE, R. V. (1998). Opportunity makes the thief: practical theory for crime
prevention. Police Research Series. London: Home Office: Policing and Reducing
Crime Unit (Research, Development and Statistics Directorate).
FEW, S. (2009). Now you see it: simple visualization techniques for quantitative analysis. 1er
d. Oakland, CA: Analytics Press.
FREDRIKSON, A., NORTH, C., PLAISANT, C. & SHNEIDERMAN, B. (1999). Temporal, geographical
and categorical aggregations viewed through coordinated displays: a case study with
highway incident data. Dans Proceedings of the 1999 workshop on new paradigms in
information visualization and manipulation, 26-34. NPIV '99. Kansas City, MI: ACM
press.
GAMMA, E., HELM, R., JOHNSON, R. & VLISSIDES, J. (1995). Design patterns: elements of
reusable object-oriented software. Boston, MA: Addison-Wesley Longman Publishing
Co., Inc.
GHONIEM, M., FEKETE, J.-D. & CASTAGLIOLA, P. (2005). A comparison of the readability of
graphs using node-link and matrix-based representations. Dans Proceedings of the 2004
IEEE Symposium on Information Visualization, 1724. INFOVIS '04. Austin, TX:
IEEE Computer Society.
GIROD, A., CHAMPOD, C. & RIBAUX, O. (2008). Traces de souliers. Lausanne, Switzerland:
Presses polytechniques et universitaires romandes.
GIWG. (2004). National criminal intelligence sharing plan. 1er d. Washington, DC:
Department of Justice (Global Intelligence Working Group).
GOODWIN, J. & FISHER, A. (2000). Wigmore's chart method. Informal Logic 20, no. 3: 223-243.
GOTTLIEB, S., ARENBERG, S. & SINGH, R. (1994). Crime analysis: from first report to final
arrest. Montclair, CA: Alpha Publishing.
GUERRY, A.-M. (1833). Essai sur la statistique morale de la France. Paris, France: Crochard.
GUO, D., CHEN, J., MACEACHREN, A. M. & LIAO, K. (2006). A visualization system for space-
time and multivariate patterns (VIS-STAMP). IEEE Transactions on Visualization and
Computer Graphics 12, no. 6: 1461-1474.
HARPER, W. R. & HARRIS, D. H. (1975). The application of link analysis to police intelligence.
Human Factors 17, no. 2: 157-164.
223
HEER, J. & AGRAWALA, M. (2006). Software design patterns for information visualization.
IEEE Transactions on Visualization and Computer Graphics 12, no. 5: 853860.
HELMS, D. (2009). Temporal analysis. Dans Exploring crime analysis: readings on essential
skills, d. S. Gwinn, C. Bruce, J. P. Cooper, & S. Hick, 214-257. 2 d. Overland Park,
KS: BookSurge Publishing.
HEUER, R. J. & PHERSON, R. H. (2010). Structured analytic techniques for intelligence analysis.
Washington, DC: CQ Press.
HICKS, M., O'MALLEY, C., NICHOLS, S. & ANDERSON, B. (2003). Comparison of 2D and 3D
representations for visualising telecommunication usage. Behaviour and Information
Technology 22, no. 3: 185-201.
HUANG, W., EADES, P. & HONG, S.-H. (2008). Beyond time and error: a cognitive approach to
the evaluation of graph drawings. Dans Proceedings of the 2008 conference on BEyond
time and errors: novel evaLuation methods for Information Visualization, 1-8. BELIV
'08. Florence, Italy: ACM press.
HUBONA, G. S., SHIRAH, G. W. & FOUT, D. G. (1997). 3D object recognition with motion. Dans
extended abstracts on Human factors in computing systems: looking to the future, 345-
346. CHI '97. Atlanta, GA: ACM press.
IALEIA. (2004). Law enforcement analytical standards. Richmond, VA: U.S. Department of
Justice (Bureau of Justice Assistance).
INMAN, K. & RUDIN, N. (2001). Principles and practices of criminalistics: the profession of
forensic science. Boca Raton: CRC Press.
INNES, M., FIELDING, N. & COPE, N. (2005). The appliance of science? The theory and practice
of crime intelligence analysis. British Journal of Criminology 45: 39-57.
INSELBERG, A. (1985). The plane with parallel coordinates. The Visual Computer 1, no. 2: 69-
91.
224
Bibliographie
INTERPOL. (1997). Guide sur l'analyse criminelle. 2 d. Lyon: Interpol (Groupe de travail sur
l'analyse criminelle).
JOSEPH, G. P. (2006). Modern visual evidence. New York, NY: Law Journal Press.
KEIM, D. & WARD, M. (2007). Visualization. Dans Intelligent data analysis, d. M. Berthold &
D. J. Hand, 403-427. 2 d. Berlin Heidelberg: Springer.
KEIM, D. A., PANSE, C. & SIPS, M. (2005). Information visualization: scope, techniques and
opportunities for geovisualization. Dans Exploring Geovisualization, d. Dykes, A. M.
MacEachren, & M.-J. Kraak, 23-52. Amsterdam: Elsevier.
KELLEY, J. E. JR & WALKER, M. R. (1959). Critical-path planning and scheduling. Dans Papers
presented at the December 1-3, 1959, eastern joint IRE-AIEE-ACM computer
conference, 160173. IRE-AIEE-ACM '59. New York, NY: ACM press.
KIND, S. S. (1987). The
scientific
investigation
of
crime. Harrogate: Forensic Science Services
Ltd.
KIND, S. S. (1990). What makes a good forensic scientist? Journal of the Forensic Science
Society 30, no. 4: 247-256.
KIND, S. S. (1992). Mental images in crime investigation. The Criminologist 16, no. 1: 15-24.
KIND, S. S. (1994). Crime investigation and the criminal trial: a three chapter paradigm of
evidence. Journal of the Forensic Science Society 34, no. 3: 155-164.
KLERKS, P. & SMEETS, E. (2001). The network paradigm applied to criminal organizations:
theoretical nitpicking or a relevant doctrine for investigators? Recent developments in
the Netherlands. Connections 24, no. 3: 53-65.
KOLDA, T., BROWN, D., CORONES, J., CRITCHLOW, T., ELIASSI-RAD, T., GETOOR, L.,
HENDRICKSON, B. ET AL. (2004). Data sciences technology for homeland security
information management and knowledge discovery. Lawrence Livermore Nat'l
Laboratory: Report of the DHS Workshop on Data Sciences.
LAXMAN, S. & SASTRY, P. S. (2006). A survey of temporal data mining. Sadhana 31, no. 2:
173198.
225
LEE, B., PLAISANT, C., PARR, C. S, FEKETE, J. D & HENRY, N. (2006). Task taxonomy for graph
visualization. Dans Proceedings of the 2006 AVI workshop on beyond time and errors:
novel evaluation methods for information visualization, 15. BELIV '06. New York,
NY: ACM press.
LENGLER, R. & EPPLER, M. J. (2007). Towards a periodic table of visualization methods for
management. Dans Proceedings of the Conference on Graphics and Visualization in
Engineering, 1-6. GVE '07. Clearwater, FL: ACTA press.
LOHSE, G. L., BIOLSI, K., WALKER, N. & RUETER, H. H. (1994). A classification of visual
representations. Communications of the ACM 37, no. 12: 36-49.
MACEACHREN, A. M. (2004). How maps work: representation, visualization, and design. New
York, NY: The Guilford Press.
MARSHALL, B., CHEN, H. & KAZA, S. (2008). Using importance flooding to identify interesting
networks of criminal activity. Journal of the American Society for Information Science
and Technology 59, no. 13: 20992114.
MCGRATH, C., BLYTHE, J. & KRACKHARDT, D. (1997). The effect of spatial arrangement on
judgments and errors in interpreting graphs. Social Networks 19, no. 3: 223-242.
MENA, J. (2003). Investigative data mining for security and criminal detection. Burlington,
MA: Butterworth-Heinemann.
MENNIS, J. L., PEUQUET, D. J. & QIAN, L. (2000). A conceptual framework for incorporating
cognitive principles into geographical database representation. International Journal of
Geographical Information Science 14, no. 6: 501520.
MORRIS, JACK. (1986). The Crime Analysis Charting. Loomis, CA: Palmer Press.
226
Bibliographie
MLLER, W. & SCHUMANN, H. (2003). Visualization for modeling and simulation: visualization
methods for time-dependent data - an overview. Dans Proceedings of the 35th
conference on Winter simulation: driving innovation, 1:737-745. WSC '03. New
Orleans, LA.
MULLET, K. (1995). 3D or not 3D: "more is better" or "less is more"? (panel session). Dans
Conference companion on Human factors in computing systems, 174-175. Denver, CO:
ACM press.
NCIS. (2000). The National Intelligence Model. National Crime Intelligence Service.
NCPE. (2005). Guidance on the national intelligence model. Wyboston, England: Association
of Chief Police Officers (National Centre for Policing Excellence).
NEWMAN, M. E. J. (2003). The structure and function of complex networks. SIAM Review 45,
no. 2: 167-256.
NORMAN, D. A. (1993). Things that make us smart: defending human attributes in the age of
the machine. New York, NY: Basic Books.
NORTH, C. (2006). Toward measuring visualization insight. IEEE Computer Graphics and
Applications 26, no. 3: 69.
OATLEY, G., EWART, B. & ZELEZNIKOW, J. (2006). Decision support systems for police:
Lessons from the application of data mining techniques to soft forensic evidence.
Artificial Intelligence and Law 14, no. 1-2: 35-1000.
OATLEY, G., ZELEZNIKOW, J., LEARY, R. & EWART, B. (2005). From links to meaning: a
burglary data case study. Dans International Conference on Knowledge-Based
Intelligent Information and Engineering Systems, 813822. Melbourne, Australia:
Springer.
PAAS, F., TUOVINEN, J. E., TABBERS, H. & VAN GERVEN, P. (2003). Cognitive load
measurement as a means to advance cognitive load theory. Educational psychologist
38, no. 1: 6371.
PALMER, S. & ROCK, I. (1994). Rethinking perceptual organization: the role of uniform
connectedness. Psychonomic Bulletin & Review 1, no. 1: 2955.
PARKER, G., FRANCK, G. & WARE, C. (1998). Visualization of large nested graphs in 3D:
navigation and interaction. Journal of Visual Languages and Computing 9, no. 3: 299-
317.
PATTYN, M & DICKENS, C. (2001). Formation analyse stratgique. Police fdrale belge
(CGC/AS).
227
PAULSEN, D. J., BAIR, S. & HELMS, D. (2010). Tactical crime analysis: research and
investigation. Boca Raton, FL: CRC Press.
PCSCO. (2002). Crime organis - Etude des meilleures pratiques no. 4. Conseil de l'Europe,
Direction Gnrale I (Groupe de Spcialistes sur les aspects de droit pnal et les aspects
criminologiques du crime organis).
PELEKIS, N., THEODOULIDIS, B., KOPANAKIS, I. & THEODORIDIS, Y. (2004). Literature review of
spatio-temporal database models. The Knowledge Engineering Review 19, no. 3: 235-
274.
PETERSON, M. B., MOREHOUSE, B. & WRIGHT, E. (2000). Intelligence 2000: revising the basic
elements. Lawrenceville, NJ: Law Enforcement Intelligence Unit and International
Association of Law Enforcement Intelligence Analysts.
PEUQUET, D. J. (1994). It's about time: a conceptual framework for the representation of
temporal dynamics in geographic information systems. Annals of the Association of
American Geographers 84, no. 3: 441461.
PFITZNER, D., HOBBS, V. & POWERS, D. (2003). A unified taxonomic framework for
information visualization. Dans Proceedings of the Asia-Pacific symposium on
Information visualisation - Volume 24, 24:5766. APVis '03. Darlinghurst, Australia:
Australian Computer Society, Inc.
PHAN, D., XIAO, L., YEH, R., HANRAHAN, P. & WINOGRAD, T. (2005). Flow map layout. Dans
Proceedings of the 2005 IEEE Symposium on Information Visualization, 219224.
INFOVIS '95. Minneapolis, MN: IEEE Computer Society.
PIROLLI, P. & CARD, S. (2005). The sensemaking process and leverage points for analyst
technology as identified through cognitive task analysis. Dans Proceedings of
International Conference on Intelligence Analysis. McLean, VA.
PLAYFAIR, W. (2005). Commercial and political atlas and statistical breviary. d. H. Wainer
& I. Spence. New York, NY: Cambridge University Press.
228
Bibliographie
POTTENGER, W. M., YANG, X. & ZANIAS, S. V. (2007). Link analysis survey status update -
january 2006. U.S. Department of Justice (National Criminal Justice Reference
Service).
QUETELET, A. (1842). A treatise on man and the development of his faculties. Edinburgh,
England : W. and R. Chambers.
REED, C. & ROWE, G. (2007). A pluralist approach to argument diagramming. Law, Probability
and Risk 6, no. 1-4: 5985.
REED, R. N. & KOCURA, P. (2005). Conceptual graph based criminal intelligence analysis. Dans
Common semantics for sharing knowledge: contributions to ICCS 2005 13th
International Conference on Conceptual Structures, d. F. Dau & M.-L. Mugnier, 146-
159. ICCS 2005. Kassel, Germany: Kassel university press.
RIBAUX, O. (1997). La recherche et la gestion des liens dans l'investigation criminelle: le cas
particulier du cambriolage. Thse de doctorat, Universit de Lausanne, Switzerland.
RIBAUX, O. (2008). Chapitre 3. Definitions. Dans D6.7c: Forensic Profiling, d. Z. Geradts &
P. Sommer, 12-30. FIDIS Future of Identity in the Information Society.
RIBAUX, O., BAYLON, A., LOCK, E., DELMONT, O., ROUX, C., ZINGG, C. & MARGOT, P. (2010).
Intelligence-led crime scene processing. Part II: Intelligence and crime scene
examination. Forensic Science International 199, no. 1-3: 63-71.
RIBAUX, O., GIROD, A., WALSH, S. J., MARGOT, P., MIZRAHI, S. & CLIVAZ, V. (2003). Forensic
intelligence and crime analysis. Law, Probability and Risk 2, no. 1: 47-60.
RIBAUX, O. & MARGOT, P. (1999). Inference structures for crime analysis and intelligence: the
example of burglary using forensic science data. Forensic Science International 100,
no. 3: 193210.
RIBAUX, O. & MARGOT, P. (2003). Case based reasoning in criminal intelligence using forensic
case data. Science and Justice 43, no. 3: 135144.
229
RIBAUX, O., WALSH, S. J. & MARGOT, P. (2006). The contribution of forensic science to crime
analysis and investigation: forensic intelligence. Forensic Science International 156,
no. 2-3: 171-181.
RUMBAUGH, J., BLAHA, M., LORENSEN, W., EDDY, F. & PREMERLANI, W. (1991). Object-
oriented modeling and design. New York, NY: Prentice-Hall International, Inc.
SCAIFE, M. & ROGERS, Y. (1996). External cognition: how do graphical representations work?
International Journal of Human-Computer Studies 45: 185213.
SCHROEDER, J., XU, J., CHEN, H. & CHAU, M. (2007). Automated criminal link analysis based
on domain knowledge. Journal of the American Society for Information Science and
Technology 58, no. 6: 842-855.
SHNEIDERMAN, B. (1996). The eyes have it: a task by data type taxonomy for information
visualizations. Dans Proceedings of the 1996 IEEE Symposium on Visual Languages,
336343. VL '96. Boulder, CO: IEEE Computer Society.
SHNEIDERMAN, B. (2003). Why not make interfaces better than 3D reality? IEEEE Computer
Graphics and Applications 23, no. 6: 12-15.
ST JOHN, M., COWEN, M. B., SMALLMAN, H. S. & OONK, H. M. (2001). The use of 2D and 3D
displays for shape-understanding versus relative-position tasks. Human Factors 43, no.
1: 79-98.
STASKO, J., GRG, C. & LIU, Z. (2008). Jigsaw: supporting investigative analysis through
interactive visualization. Information Visualization 7, no. 2: 118132.
TANG, D., STOLTE, C. & BOSCH, R. (2004). Design choices when architecting visualizations.
Information Visualization 3, no. 2: 65-79.
230
Bibliographie
TAVANTI, M. & LIND, M. (2001). 2D vs 3D, implications on spatial memory. Dans Proceedings
of the 2001 IEEE Symposium on Information Visualization, 139-145. INFOVIS '01. San
Diego, CA: IEEE Computer Society.
TAYLOR, B., KOWALYK, A. & BOBA, R. (2007). The integration of crime analysis into law
enforcement agencies: an exploratory study into the perceptions of crime analysts.
Police Quarterly 10, no. 2: 154-169.
TILLERS, P. (2007). Introduction: visualizing evidence and inference in legal settings. Law,
Probability and Risk 6, no. 1: 1-4.
TILLERS, P. & SCHUM, D. (1991). A theory of preliminary fact investigation. UC Davis Law
Review 24: 931-1012.
TORY, M., KIRKPATRICK, A. E., ATKINS, M. S. & MLLER, T. (2006). Visualization task
performance with 2D, 3D, and combination displays. IEEE Transactions on
Visualization and Computer Graphics 12, no. 1: 2-13.
TUFTE, E. R. (1997). Visual explanations: images and quantities, evidence and narrative.
Cheshire, CT: Graphics Press.
TUFTE, E. R. (2005). Visual and statistical thinking: displays of evidence for making decisions.
3 d. Cheshire, CT: Graphics Press.
UNODC. (2002). Criminal intelligence training: manual for analysts. United Nations Office on
Drugs and Crime.
WARE, C. (2004). Information visualization: perception for design. Burlington, MA: Morgan
Kaufmann.
WARE, C. (2008). Visual thinking for design. Burlington, MA: Morgan Kaufmann.
WARE, C. & FRANCK, G. (1994). Viewing a graph in a virtual reality display is three times as
good as a 2D diagram. Dans Proceedings of the 1994 IEEE Symposium on Visual
Languages, 182-183. St. Louis, MO: IEEE Computer Society.
231
WARE, C. & MITCHELL, P. (2008). Visualizing graphs in three dimensions. ACM Transactions
on Applied Perception 5, no. 1: 1-15.
WIGMORE, J. H. (1913). The principles of judicial proof as given by logic, psychology, and
general experience, and illustrated in judicial trials. Boston: Little, Brown, and
company.
WONG, P.C., CHIN, G., FOOTE, H., MACKEY, P. & THOMAS, J. (2006). Have green - a visual
analytics framework for large semantic graphs. Dans Proceedings of the IEEE
Symposium on Visual Analytics Science and Technology, 67-74. VAST '06. Baltimore,
MD: IEEE Computer Society.
WRIGHT, W., SCHROH, D., PROULX, P., SKABURSKIS, A. & CORT, B. (2006). The Sandbox for
analysis: concepts and methods. Dans Proceedings of the SIGCHI conference on
Human Factors in computing systems, d. R. Grinter, T. Rodden, P. Aoki, E. Cutrell, R.
Jeffries, & G. Olson, 810-810. CHI '06. Montral, Quebec: ACM press.
XIANG, Y., CHAU, M., ATABAKHSH, H. & CHEN, H. (2005). Visualizing criminal relationships:
comparison of a hyperbolic tree and a hierarchical list. Decision Support Systems 41,
no. 1: 6983.
XU, J. & CHEN, H. (2005). Criminal network analysis and visualization. Communications of the
ACM 48, no. 6: 100-107.
A N N E X E S
A n n e x e
1 :
D i m e n s i o n s
d a n a l y s e
e t
v i s u a l i s a t i o n
A n a l y s e
q u a n t i t a t i v e
De nombreuses reprsentations diffrentes ont t inventes au cours de lhistoire pour
analyser des donnes quantitatives. William Playfair (1759-1823) est considr comme
linventeur de la plupart des types de diagrammes utiliss de nos jours (linaires,
histogrammes, circulaires, etc.) (Playfair, 2005) (Friendly, 2008). Ces reprsentations ont t
largement tudies et dveloppes depuis les travaux de Playfair, comme en tmoigne
louvrage de Robert L. Harris qui rfrence une liste encyclopdique de reprsentations (Harris,
2000). Les travaux dEdward Tufte (Tufte, 2001),(Tufte, 1997),(Tufte, 1990) ont largement
contribu au dveloppement de ltude moderne de ces reprsentations. Laccent est mis, en
particulier sur les effets visuels exploits pour tronquer des donnes et par opposition sur les
techniques efficaces et intgres. Paralllement, depuis les travaux de Bertin sur la smiologie
graphique (Bertin, 2005), de nombreuses tudes ont explicit divers aspects de la
reprsentation de donnes quantitatives. A titre dexemple, citons les travaux sur le processus
de la visualisation (Card et al., 1999), sur limpact du processus de perception et la smiotique
visuelle (MacEachren, 2004) (Ware, 2008), ou encore sur les types danalyses effectues laide
de reprsentations quantitatives (Few, 2009). Selon Stephen Few, lanalyse quantitative vise
ltude des relations entre des valeurs. Les mthodes de visualisation exploites varient en
fonction de la nature de ces relations : temporelles, classements et proportions, dviations,
distributions, corrlations et multi-varies (Few, 2009). La dcomposition propose par Few est
utilise pour prsenter les principales techniques. Les reprsentations temporelles font lobjet
de la section suivante.
234
Annexe
1:
Dimensions
danalyse
et
visualisation
Les histogrammes
Les diagrammes
de Pareto
Ces diagrammes permettent de reprsenter la distribution par ordre dcroissant des valeurs et
incluent une courbe cumulative des valeurs, gnralement exprimes en pourcentage.
Analyse
quantitative
235
Les diagrammes
de Bumps
Les diagrammes de
dviations
Reprsentations de distributions
Diagramme reprsentant la distribution dune variable sur un seul axe (dans cet exemple,
le temps). Lexemple ci-dessus est un multiple strip plot puisque les distributions de
plusieurs catgories sont reprsentes (axe vertical).
236
Annexe
1:
Dimensions
danalyse
et
visualisation
Les diagrammes de
distribution
Les box plot reprsentent ltendue, la mdiane et les quartiles de la distribution. Dans
lexemple ci-dessus, la moyenne et le nombre dobservations (en bas) sont galement
reprsents. Ce type de diagramme a t invent par John Tukey (1915-2000), dans les annes
septantes.
Diagramme divis en deux parties : chaque ligne reprsente une tranche dune chelle (ci-
dessus les dizaines) affiche gauche de la ligne verticale. A droite, chaque observation est
reprsente par le reste (ici lunit). La longueur de chaque ligne est donc proportionnelle
au nombre dobservations par tranche. Ce type de diagramme a galement t invent par
John Tukey (1915-2000), dans les annes septantes.
Analyse
quantitative
237
Reprsentations de corrlations
Diagramme reprsentant les variations par une chelle de couleurs ou de niveaux de gris.
Reprsentation exploitant une forme de tableau o les valeurs sont reprsentes par des
diagrammes pour remplacer le texte (en plus de celui-ci dans lexemple ci-dessus)
Les diagrammes
coordonnes parallles
238
Annexe
1:
Dimensions
danalyse
et
visualisation
Alors que la majorit des diagrammes dvelopps pour lanalyse quantitative sont largement
utiliss en analyse criminelle, les graphiques coordonnes parallles semblent tre sous
exploits. Ils ont pourtant t spcifiquement dvelopps afin de faciliter la dtection et la
formalisation de profils71. En effet, la reprsentation par un graphe des profils peut tre trs
difficile voire inefficace si le nombre de relations du profil est important. Dans une telle
situation, lemploi dun diagramme coordonnes parallles est recommand. Ces
reprsentations sont dailleurs galement dsignes sous le nom de diagramme de profil.
Dans les ouvrages rcents (Card et al., 1999) (Few, 2009), linvention de cette forme de
reprsentation est attribue Alfred Inselberg (Inselberg, 1985) (Inselberg, 1997). Leur
exploitation remonterait en fait la fin du dix-neuvime sicle, priode laquelle, Maurice
dOcagne les auraient invents (Ocagne, 1885). La raison principale de la sous-utilisation de
cette forme de reprsentation rside dans la difficult initiale de les apprhender : The first
time I laid eyes on a parallel coordinates plot, I laughed and cringed simultaneously because it struck me as a
ridiculously complex and ineffective display. However, this frenzy of intersecting lines, when used properly for
multivariate analysis, can actually lead to great insight (Few, 2009).
Villa
Appart.
31.12.09
52
0
0
Lu
Source
:
banque
de
donnes
du
CICOP,
anne
2009,
canton
de
Vaud
71
Cf. Analyse, profil et pattern, page 26
Analyse
temporelle
239
Le choix de lordre des variables (et leur nombre) sur laxe horizontal et le nombre
dobservations reprsentes influence fortement la lisibilit de ces graphiques (Few, 2009).
Leur production ncessite des outils dynamiques afin de modifier les arrangements,
deffectuer des slections et de modifier les variables visuelles (telles que la couleur,
lpaisseur des traits et la transparence), afin didentifier des profils. Lexemple ci-dessus
reprsente un profil particulier de cambriolages dhabitations (cf. variable lieu ) commis
pendant la priode hivernale (cf. variables date1 et semaine ), le soir (cf. heure1 et
heure2 ). Il est notamment possible de dtecter une corrlation entre la variable heure2
(heure laquelle les victimes dtectent le cambriolage, cest--dire lorsquelles rentrent chez
elles) et le jour de la semaine. En effet, le week-end les victimes sabsentent visiblement plus
frquemment jusque tard le soir (en loccurrence tt le lendemain matin). Les variables
reprsentes dans ce cas sont principalement de type temporel. Dautres formes de
reprsentation temporelle peuvent tre exploites pour dtecter un tel profil (cf. section
suivante). Ces diagrammes sont particulirement efficaces pour regrouper dans une seule vue
un nombre important de variables diffrentes. Les diagrammes dit en toiles sont bass sur
le mme paradigme visuel, mais les axes sont positionns de faon radiale plutt quen
parallle.
A n a l y s e
t e m p o r e l l e
Lanalyse temporelle couvre un ensemble de questionnements complexes. Les objectifs de
cette forme danalyse peuvent tre classifis selon six tches principales : la prdiction, la
classification, le regroupement (clustering), la recherche et la rcupration, ainsi que la
dtection de pattern (Laxman & Sastry, 2006). En matire danalyse criminelle, deux objectifs
principaux sont dfinis : la comprhension des vnements qui se sont passs et la prdiction
de ce qui va se produire (Boba, 2009) (Helms, 2009).
240
Annexe
1:
Dimensions
danalyse
et
visualisation
Un cadre conceptuel est globalement reconnu pour dcrire la variable temporelle (Peuquet,
1994) (Mller & Schumann, 2003) (MacEachren, 2004) (Aigner et al., 2007) :
Analyse
temporelle
241
Structure
Linaire Cyclique
Discrte
Echelles
Continue
Evnement
Entits
Priode
pisode
phase
Ordonne
Perspectives Ramifie
Multiple
Aucune
Niveaux Simple
dagrgation
Multiple
242
Annexe
1:
Dimensions
danalyse
et
visualisation
Question danalyse
De nombreuses formes de visualisations ont t dveloppes pour analyser les donnes dans
la dimension temporelle, afin de dtecter des patterns et rpondre aux questions prsentes
ci-dessus. Certaines permettent de rpondre plusieurs questions, alors que dautres sont
spcifiques une question particulire. Sans tre exhaustifs, les tableaux des pages suivantes
rsument les diffrentes approches de visualisations exploites pour faciliter lanalyse
temporelle des donnes.
Analyse
temporelle
243
Les lignes de
temps
Diagramme une dimension : les vnements sont reprsents le long de laxe horizontal.
Des priodes peuvent galement tre reprsentes.
Les sries
chronologiques
Diagramme deux dimensions : laxe horizontal reprsente le temps. La variable peut tre
continue ou discrte et organise selon une structure linaire ou cyclique. Laxe vertical
reprsente une variable quantitative. De nombreuses sous-catgories de reprsentations
peuvent tre dfinies.
Les diagrammes
saisonniers
(Seasonal
Subseries Plot)
Les diagrammes
dactivit
(de Gantt)
244
Annexe
1:
Dimensions
danalyse
et
visualisation
10
8
Les diagrammes de 6
4
tempo 2
(Tempogram) 0
28.09.2009
30.09.2009
02.10.2009
04.10.2009
06.10.2009
08.10.2009
10.10.2009
12.10.2009
14.10.2009
16.10.2009
18.10.2009
20.10.2009
22.10.2009
24.10.2009
26.10.2009
28.10.2009
30.10.2009
01.11.2009
03.11.2009
Diagramme deux dimensions : laxe horizontal reprsente le temps et laxe vertical
lintervalle de temps avec loccurrence suivante.
Les topologies
temporelles
(Heatmaps)
72
Les donnes utilises sont les mmes que celle prsentes dans la section analyse quantitative . Le nombre de
cas est plus important les vendredis et samedis soirs (5 et 6 sur laxe vertical). Ltendue est plus grande sur ces
soires du week-end, comme prcdemment expliqu.
Analyse
temporelle
245
Les diagrammes
circulaires
(Radars)
Diagramme reprsentant le temps selon une structure cyclique discrte. Lobjectif de ces
graphiques est de comparer plusieurs itrations dun cycle (dfini par le niveau dagrgation)
afin de dtecter des rgularits et des anomalies.
Les diagrammes
en spirale
Diagramme reprsentant le temps selon une structure cyclique continue. Lobjectif est
similaire celui des diagrammes circulaires.
246
Annexe
1:
Dimensions
danalyse
et
visualisation
2 5
Mthode de chemin
1
3
4
6
critique
(Critical path method)
Diagramme exploit pour dcrire une squence dactivits (de priodes). Chaque flche
reprsente une activit dont la longueur sur laxe horizontal est proportionelle sa dure.
Les relations entre les activits sont illustres par des sommets numrots dcrivant la
squence (Kelley & Walker, 1959).
Rseau PERT
(PERT chart : Program
Evaluation and Review
Technique)
Diagramme exploit pour dcrire une squence dvnements. Chaque noeud reprsente
un vnement. La dure nest pas reprsente, mais uniquement le moment de lvnement.
Chaque activit est reprsent par une barre horizontale dont la longueur est
proportionnelle sa dure. Les relations entre les activits (par exemple, si lune ne peut
commencer qu la fin de certaines autres) sont reprsentes par des flches. Laxe vertical est
exploit pour dcomposer soit des types dactivits, de personnes, etc.
Analyse
temporelle
247
Diffrents types de patterns sont observables lors de lanalyse temporelle des donnes (Boba,
2009) (Helms, 2009) (Few, 2009) (Paulsen et al., 2010) :
- Les
tendances
dcrivent
un
comportement
gnral.
Elles
peuvent
tre
de
trois
types
:
dcroissante,
stable
ou
croissante73.
- La
variabilit
dcrit
le
degr
de
changement.
Elle
est
gnralement
dcrite
par
lcart-
type
et
ltendue
de
la
variable.
- Le
taux
de
changement
dcrit
la
diffrence
de
valeur
entre
deux
observations
successives.
- La
covariance
dcrit
la
relation
entre
deux
variables
temporelles
Covariance
entre
le
nombre
de
vols
de
mtaux
et
le
cours
du
cuivre.
73
Le
tempo
est
galement
classifi
selon
trois
types
de
tendances
:
acclration,
stabilisation
et
dclration.
248
Annexe
1:
Dimensions
danalyse
et
visualisation
- Les
rgularits
cycliques
sont
observes
lorsque
le
temps
est
analys
selon
une
structure
cyclique
(jour
de
la
semaine,
mois
de
lanne,
etc.)
Rptitions
saisonnires
des
cambriolages
du
soir
- Les
exceptions
sont
des
valeurs
anormales
qui
ne
suivent
pas
la
tendance
gnrale.
La gestion de lincertitude lie au temps est particulirement critique en analyse criminelle. En
effet, linformation temporelle collecte pour dcrire une activit criminelle est souvent
imprcise. Les vnements criminels sont gnralement dcrits par un intervalle entre deux
vnements (la date et lheure de dbut et la date et lheure de fin du dlit). Cet intervalle peut
dans certains cas dcrire avec prcision la dure du dlit (par exemple lors de brigandages),
mais il est plus souvent le fait dune incertitude (le dlit sest produit un moment
indtermin entre deux vnements). Cest gnralement le cas des cambriolages commis
pendant labsence des lss. Lintervalle est alors dfini par le moment o la victime a quitt le
lieu de commission du dlit et le moment o elle est revenue. Diffrents types destimateurs,
tels que la moyenne, le mdiane ou un calcul de frquences peuvent alors tre exploits pour
grer lincertitude temporelle (Ratcliffe, 2000).
Analyse
spatiale
249
A n a l y s e
s p a t i a l e
Lusage de reprsentations cartographiques de lenvironnement semble, pour la plupart des
civilisations, concider avec linvention de lcriture. La plus ancienne reprsentation
gographique dcouverte pourrait tre une carte babylonienne du monde (grav entre 500 et
700 av. J.-C.). La cartographie sest largement dveloppe au cours de lhistoire, notamment
pour la navigation. Ds le XIXe sicle apparaissent les premires cartes dites thmatiques
visant reprsenter des donnes qualitatives et quantitatives en relation avec leurs
distributions spatiales.
Le crime, comme tout vnement, possde videmment une ralit gographique. De trs
nombreuses tudes ont montr la nature non alatoire des phnomnes de criminalit dans la
dimension spatiale. Il ne semble toutefois pas exister de consensus sur les causes des
distributions observes (Canter, 2000).
Les premires cartes de la criminalit sont attribues aux travaux
dAndr-Michel Guerry (1802-1866) sur la statistique morale en
France (Guerry, 1833). Guerry a montr que les taux de criminalit
(dcomposs par dpartement et par types de criminalit : contre
la personne et contre le patrimoine) variaient fortement selon la
rgion gographique et galement selon les saisons. Ces travaux
sont considrs comme fondateurs des sciences sociales
modernes (Friendly, 2008).
Au dbut du XXe sicle, lcole de sociologie de Chicago, exploitera largement les cartes pour
mettre en vidence les relations socioculturelles et socio-conomiques de la criminalit, en
250
Annexe
1:
Dimensions
danalyse
et
visualisation
Un regain dintrt est observ en matire de cartographie du crime depuis les annes
nonante. Clarke relve que Crime mapping will become as much an essential tool of criminological research
as statistical analysis is at present (Clarke, 2004) p. 60. Des efforts particulirement importants en
En 1994, la police de New-York instaure une nouvelle approche managriale base sur
lanalyse des informations notamment prsentes sous forme de cartes, afin didentifier les
problmes et dfinir les rponses policires. La composante gographique est galement
exploite afin deffectuer du profilage gographique. Cest--dire de mettre en relation les
vnements criminels et les activits routinires des criminels et des victimes afin didentifier
notamment le lieu de rsidence des auteurs, des points de rencontre ou de passage (Paulsen
et al., 2010). La premire exploitation de cartes gographiques des fins de profilage, a
probablement t effectue dans laffaire du Yorkshire Ripper (1976-81) (Kind, 1987) (Kind,
1994) (Barclay, 2009).
La dfinition dun cadre conceptuel dcrivant la variable spatiale prsent ici est tir de
(Peuquet, 1984). Les donnes spatiales peuvent tre classifies selon quatre types principaux :
- Les points : une position unique est associe chaque observation
- Les lignes : la composante gographique est dfinie par un ensemble de positions
pouvant tre reprsentes par des lignes isoles (telles que des failles), des structures
en arbre (comme les rivires) ou des rseaux complexes (les routes)
- Les polygones : la composante gographique est dfinie par des positions formant un
ensemble ferm (des zones). Les polygones peuvent tre isols (ne partageant pas de
frontire avec dautres zones), adjacents ou imbriqus.
Analyse
spatiale
251
Une typologie de la variable spatiale (et des formes de visualisation spatiale) est galement
dfinie selon deux dimensions (MacEachren, 2004):
- La continuit spatiale dcrit la distribution du phnomne. Elle est continue lorsque le
phnomne est observ sur lensemble du territoire et discrte lorsquil a lieu des
endroits spars
- La dpendance spatiale dcrit le niveau de
variation spatiale du phnomne. Si le
phnomne possde une indpendance
spatiale, les observations peuvent varier
fortement entre deux lieux proches (la
distribution est abrupte). Les variations
spatiales sont faibles (lisses), si le
phnomne possde une forte dpendance
spatiale.
tir de (MacEachren, 1992) p. 17
La composante spatiale dune observation (dune trace) peut tre de diffrente nature (Reed &
Kocura, 2005) :
- Un point unique (comme un vnement)
- Un ensemble de points (comme un appel tlphonique caractris par la position de
lappelant et de lappel)
- Un chemin (tel le dplacement dun vhicule enregistr par une balise GPS)
- Une zone (telle la couverture dune antenne GSM).
252
Annexe
1:
Dimensions
danalyse
et
visualisation
Reprsentations spatiales
Cartes reprsentant chaque observation par un point (ou une forme). Une analyse
quantitative est gnralement difficile effectuer, en raison de la superposition des points.
Seule la distribution spatiale est observable.
Cartes exploitant laire des cercles (ou de formes) pour reprsenter une variable
quantitative. La problmatique de la superposition est attnue en exploitant la transparence.
Analyse
spatiale
253
Les cartes
lignes gradues
Cartes exploitant lpaisseur des lignes pour reprsenter une variable quantitative.
Cartes exploitant une chelle de niveau de gris ou de couleur des polygones pour
reprsenter une variables quantitatives. Les polygones sont gnralement dfinis en fonction
de limites administratives (communes, districts, pays, etc.).
Les cartes
isolignes/isoplthes
tir de http://upload.wikimedia.org/wikipedia/
commons/d/d1/Courbe_niveau.svg, dernier accs le 21.09.2010
Cartes utilisant des lignes de points dont la valeur associe est constante. Contrairement
aux cartes choropleth, les lignes ne dpendent pas de polygones prdfinis (telles des
frontires administratives).
254
Annexe
1:
Dimensions
danalyse
et
visualisation
Cartes de type raster dont la valeur de chaque maille de la grille est base sur un calcul de
densit (gnralement par densit de Kernel avec un estimateur gaussien).
Cartes de type choroplthe o la zone (les dimensions du plan) est proportionnelle une
variable quantitative, et non plus directement fixe selon la composante spatiale. Deux
variables quantitatives diffrentes peuvent donc tre reprsentes respectivement par une
chelle de niveaux de gris et par la taille des polygones.
Analyse
spatiale
255
tir de http://datavisualization.ch/tools/flow-map-layout,
dernier accs le 21.09.2010
Cartes et graphes juxtaposs. La position des nuds du graphe est dtermine par la
position spatiale de chaque observation.
A n n e x e
2
:
S c h m a s
d e
s c n a r i o s
Lexploitation de graphes pour reprsenter les informations dune enqute, se retrouve dj
dans les travaux de John Henry Wigmore (1863-1943) qui pourraient tre bass sur les
diagrammes dvelopps par Richard Whately (1787-1863) publis en 182674 (Reed & Rowe,
2007) :
74
Illustration tire de http://timvangelder.com/page/5/?archives-list&archives-type=months, dernier accs le 31
janvier 2011.
257
Lun des aspects essentiels de la mthode de Wigmore rside dans lobjectif dexploitation de
ces reprsentations : raisonner de manire critique sur les informations (Bex et al., 2003). Le
graphique explicite le processus de raisonnement effectu pour aboutir une conclusion et
prendre une dcision (Goodwin & Fisher, 2000). Cette forme dexploitation des graphes est
initialement apprhende comme un support de raisonnement pour la prise de dcision lors
de la phase de jugement (afin dvaluer les diverses hypothses dfinies) (Tillers & Schum,
1991). Selon Tillers (2007), de telles reprsentations devraient faciliter lapprhension de la
logique baysienne pour le jury, les avocats et les tudiants en droits notamment. Il met
galement lhypothse que la visualisation peut aider amliorer nos limites cognitives et
expliciter les raisonnements formels effectus sur les traces. La reprsentation facilite lanalyse
des informations et lvaluation des hypothses, mais leur dveloppement reste du ressort de
ses utilisateurs (Bex et al., 2007). Un graphe nest toutefois pas uniquement un support
commode pour reprsenter des raisonnements complexes, mais une aide efficace lors de
llaboration dhypothses et pour faciliter les raisonnements (Tillers, 2007).
Dans les annes cinquante, deux approches complmentaires ont t dveloppes : les
diagrammes de Toulmin et les diagrammes de Beardsley (Reed & Rowe, 2007). Depuis les
annes nonante, plusieurs dveloppements parallles ont t effectus et diffrents logiciels
dvelopps pour reprsenter les raisonnements effectus sur la base des traces en regard de
258
Annexe
2
:
Schmas
de
scnarios
diffrents scnarios (Tillers & Schum, 1991) (Goodwin & Fisher, 2000) (Bex et al., 2003) (Reed &
Rowe, 2007).
De nouveaux outils sont dvelopps afin de reprsenter les informations dune enqute,
dexprimer les infrences effectues, de comparer les versions et les hypothses alternatives
possibles pour interprter les traces collectes (van den Braak, 2010). Van den Braak (2010)
dfinit un langage visuel formel bas notamment sur les travaux de Bex (2007), afin de
concevoir des reprsentations relationnelles explicitant dune part, des scnarios (par exemple
en regard dinformation testimoniales) et, dautre part, les relations entre les indices et ces
scnarios. Le langage intgre sous la forme de nuds : les informations descriptives des
cas (les informations circonstancielles, les tmoignages et les traces collectes), les hypothses
formules sur la base dobservations (physiques ou testimoniales) et les sources
dinformations (un rapport de police, un tmoignage, un constat, etc.). Les types dentits sont
distingus par la forme et la couleur des nuds. Les relations dcrivent les relations entre les
diffrents types de nuds.
Selon Van Den Braak (2010), le langage dfini sert de base la dcomposition des
informations denqute pour valuer les indices et comparer et valuer des scnarios
alternatifs explicatifs des informations collectes. Lensemble des informations est donc
dcompos sous la forme de scnarios sur lesquels sont intgres les infrences effectues sur
la base des informations collectes.
A n n e x e
3
:
V i s u a l i s a t i o n
t r i d i m e n s i o n n e l l e
It doesnt seem to matter whether we perform our tasks well or not; many of us like 3D visualizations anyway.
Interestingly, many of us do not like 3D by instinct. (Chen, 2006).
Les questions lies lusage et lefficacit de la troisime dimension sur une reprsentation
graphique font dbats. Les performances des reprsentations en trois dimensions varient en
fonction des tches impliques et des choix de reprsentation (Cockburn & McKenzie, 2004).
Une visualisation trois dimensions (3D) est une projection sur le plan de lenvironnement
tridimensionnel (Tavanti & Lind, 2001). Limage cre est une perspective ou une vue oblique
dun objet ou dune scne sur un espace deux dimensions. La perception de la troisime
dimension est produite par la perspective rsultant de langle de vision et de lusage de
repres visuels dcrivant la profondeur (tel un clairage produisant des ombres) (St John et al.,
2001).
T y p e s
d e
r e p r s e n t a t i o n
La classification des mthodes de reprsentation propose par (Stasko & Wehrli, 1993) est
utilise pour discuter leurs usages et efficacits :
260
Annexe
3
:
Visualisation
tridimensionnelle
Avantages
261
prfrence (subjective) pour les reprsentations trois dimensions (Cockburn & Mckenzie,
2000) (Cockburn & McKenzie, 2001). Les utilisateurs tendent prfrer la 3D pour
communiquer et pour mmoriser les informations (Aigner et al., 2007). Dautres tudes (voir
notamment (St John et al., 2001), (Teyseyre & Campo, 2009) et (Tory et al., 2006)) ont identifi
des avantages et des inconvnients spcifiques qui sont prsents dans les sections suivantes.
A v a n t a g e s
Description de formes : lavantage principal des visualisations 3D rside
dans son application pour reprsenter de formes tridimensionnelles.
Reconstruire un volume complexe sur la base de reprsentation
262
Annexe
3
:
Visualisation
tridimensionnelle
dynamiquement lintrieur dun graphe dans toutes les dimensions peut tre une cause
explicatrice des performances observes (Chen, 2006).
Toutefois, les relations entre les nuds et les positions des nuds ont t dfinies
alatoirement dans les conditions exprimentales de ces tudes. Les cas traits ne sont donc
pas vraiment reprsentatifs de situations relles o la structure des graphes et le
positionnement des nuds sont rarement alatoires. De plus, lutilisation dune telle
technique dans la pratique semble difficile en raison du matriel requis pour crer une
reprsentation stroscopique de haute rsolution. Finalement, linterface de navigation
(translation, rotation and zoom) et les algorithmes de placement (pour minimiser les
croisements de traits) sont galement des sources de difficults (Parker et al., 1998) (Teyseyre
& Campo, 2009).
Augmentation de lespace : les reprsentations 3D offrent un espace plus grand qui permet
daugmenter le nombre dinformations reprsentes dans une mme vue (Mullet, 1995). La
structure gnrale dune reprsentation devrait donc tre plus facilement perceptible, puisque
lensemble des donnes sont visualises dans un seul espace. Toutefois, la superposition
souvent invitable des lments reprsents sur une reprsentation 3D est en contradiction
avec cet argument.
F a i b l e s s e s
Occlusion (superposition) : des parties de la reprsentation peuvent tre caches par des
lments positionns au premier plan (voir lexemple des vues 2D adaptes). Cet effet est
partiellement maitrisable en ajoutant une interaction dynamique (offrant ainsi lutilisateur la
possibilit de varier les angles de vues) (Hubona et al., 1997).
Conclusion
263
Non-linarit : lespace reprsent sur une vue 3D est distordu de faon non linaire. Les
distances et les angles sont donc galement distordus.
Reprsentation des textes : les polices ncessaires pour atteindre le mme degr de lisibilit
que sur une reprsentation 2D, doivent tre plus grandes sur une reprsentation 3D (Card et
al., 1999).
Finalement, les ressources de calculs ncessaires pour produire une reprsentation 3D sont
plus importantes et linterface ncessaire est gnralement plus complexe concevoir et
utiliser (Teyseyre & Campo, 2009).
C o n c l u s i o n
Les reprsentations en trois dimensions offrent des solutions efficaces pour la reprsentation
de scnes, dobjets et de la topographie. En matire de reprsentation de donnes abstraites,
lapport de la troisime dimension nest pas clairement tabli. Les reprsentations en deux
dimensions offrent de meilleures performances pour analyser en prcisment des donnes et
comparer des distances notamment. De plus, une interface gnralement plus complexe est
requise pour faciliter la navigation dans la vue.
Pour conclure ce rapide survol de la littrature sur le sujet, il semble que deux avis divergents
existent en matire de reprsentation 3D. Dune part, certains chercheurs, notamment
influence par les travaux dEdward Tufte, pensent que les reprsentations 2D sont suffisantes.
Lusage de la troisime dimension pour augmenter une impression subjective desthtisme ne
devrait pas tre prconis au dtriment de lefficacit et de la simplicit dune reprsentation.
Si les informations reprsenter peuvent ltre par le biais dune reprsentation deux
264
Annexe
3
:
Visualisation
tridimensionnelle
A n n e x e
4
:
E v a l u a t i o n s
p r l i m i n a i r e s
R e p r s e n t a t i o n
d u n
s c n a r i o
s i m p l e
Lensemble des solutions sont prsentes dans les tableaux des pages suivantes. Afin de
faciliter la comparaison et la lecture des schmas, ils ont t recrs de faon uniforme.
Structures
singulires
(tudiants)
Reprsentations
effectues
par
des
analystes
2x (Type A) 2x (Type D)
266
Annexe
4
:
Evaluations
prliminaires
Type A Type B
4x
4x
2x
2x
2x
Reprsentation
dun
scnario
simple
267
Type C Type D
3x
2x
3x
3x
268
Annexe
4
:
Evaluations
prliminaires
R e p r s e n t a t i o n d u n e v e n t e
Type A
Type B
Autres
Reprsentation
dune
affaire
complexe
269
R e p r s e n t a t i o n
d u n e
a f f a i r e
c o m p l e x e
Nombre
dentit
et
de
types
dentit
exploits
:
Enquteurs
(n
=
40)
7
40
60
6
50
y
=
1.4808x
Nombre
d'endt
5
30
R
=
0.84218
40
4
30
20
3
20
2
10
10
1
0
0
0
0
10
20
30
40
1
6
11
16
21
26
31
Nombre
de
types
d'endt
Sans
la
valeur
extrme
de
35
types:
Moyenne
de
17
+/-
4
types, Mdiane
17, Etendue
de
8
26
Spcialistes
(n
=
7)
4
50
6
y
=
1.6832x
40
R
=
0.79274
Nombre
d'endt
3
30
4
2
20
1
2
10
0
0
0
0
5
10
15
20
25
1
6
11
16
21
26
31
Nombre
de
types
d'endt
Moyenne
de
15
+/-
5
types, Mdiane
14, Etendue
de
7
21
Etudiants
MAS
(n
=
10)
5
10
60
4
8
y
=
1.8622x
Nomre
d'endt
40
R
=
0.73975
3
6
2
4
20
1
2
0
0
0
0
5
10
15
20
25
30
1
6
11
16
21
Nombre
de
type
d'endt
Moyenne
de
16
+/-
5
types, Mdiane
15, Etendue
de
9
25
En
regroupant
les
trois
populations,
la
rgression
linaire
est
Y=1.5663X,
R2
=
0.7277
270
Annexe
4
:
Evaluations
prliminaires
0
50
100
0
10
20
0
20
40
Mobile
Phone
39
Mobile
Phone
7
Male
9
Male
38
Male
6
Policeman
38
Anonymous
8
Pistol
31
Anonymous
7
Mobile
Phone
7
Hotel
36
Telephone
5
Pistol
7
Anonymous
25
Pistol
4
Policeman
7
DNA
32
DNA
4
Telephone
7
Telephone
36
Acpon
2
DNA
9
Incident
12
Male
Police
2
Fingerprint
7
Car
23
France
2
SIM
Card
4
Fugipve
23
Document
4
Telephone
Tap
3
Telephone
Tap
17
Date
&
Time
1
Car
7
Hospital
19
Car
4
Organisapon
5
Fingerprint
18
Government
3
Subscriber
10
Document
4
Body
15
Case
2
Bullet
3
Place
13
Enpty
1
Query
2
Law
Enforcement
13
Place
1
Notebook
1
Document
14
Bullet
3
Hospital
6
Bullet
10
Hotel
3
Hotel
4
Government
11
Deceased
Male
3
Town
1
Assassinapon
11
Incident
3
Ambulance
3
France
8
Telephone
Tap
1
Revolver
2
Car
(Rental)
10
Building
1
House
4
Alias
9
Claim
2
Organisapon
7
Body
4
House
2
Incident
2
Building
7
Switzerland
1
Arson
8
Government
2
Claim
8
Communicapon
1
Building
2
Professional
Male
5
Oce
1
Subscriber
3
SIM
Card
4
Alias
2
Arson
3
Case
4
Car
Bomb
2
Algeria
3
Bullet
Cases
7
Body
2
Deceased
Male
2
Iran
(Islamic
6
Date
1
Oce
2
Forensic
6
Iran
(Islamic
2
Iran
(Islamic
2
Deceased
Male
6
Fingerprint
2
Car
(Damaged)
6
Town
1
Forensic
2
Insurgent
4
Clan
1
Car
(Rental)
2
House
5
Telephone
1
Car
(Damaged)
2
Car
Bomb
5
Arson
1
Passport
1
Date
&
Time
4
Personne
/
1
Male
Figure
1
Sheri
4
Cabinet
1
Insurgent
1
Police
Car
4
Detonapon
1
Papent
4
Mosque
1
Query
1
Cannabis
1
Search
3
Assault
Weapon
1
Oce
3
Lieu
1
Flat
3
Car
(Rental)
1
Alias
1
Evidence
Collecpon
3
Laboratory
1
Workshop
1
Aqua
Square
3
Black
1
Telephone
1
Revolver
2
Fugipve
1
Surveillance
1
Laboratory
2
Algeria
1
Suisse
1
Detonapon
2
Flat
1
Place
1
Spy
2
Evidence
1
Meepng
1
Query
2
Machine
Gun
1
Mosque
2
Garage
2
Laboratory
Fribourg
1
1
Fribourg
2
France
1
Cheque
2
Flat
1
Berne
2
Adult
2
Dealer
1
Teal
Square
1
Bridge
1
Magnify
1
Berne
1
Guerrilla
1
Arrest
1
Date
1
Acpon
1
Zurich
1
Town
Telephone
Box
1
1
Surveillance
1
Red
1
Person
(Shaded
1
Oender
1
Number
Plate
1
Limousine
1
Hospital
Bed
1
Group
of
People
1
Green
1
Fraud
1
Explosion
1
Envelope
1
Criminal
1
Boy
1
Blue
1
Black
1
Assault
Weapon
1
APC
1
Ambulance
1
Algeria
1
Alert
1
Reprsentation
dune
affaire
complexe
271
A
----
B
905
(40)
A
----
B
124
(7)
A
----
B
254
(10)
A
--->
B
195
(37)
A
--->
B
43
(7)
A
--->
B
35
(5)
A
<-->
B
12
(7)
A
<-->
B
0
(0)
A
<-->
B
3
(1)
Trait
plein
1052
(40)
Trait
plein
153
(7)
Trait
plein
285
(10)
Trait
till
60
(25)
Trait
till
7
(4)
Trait
till
7
(3)
Simple
1005
(40)
Simple
160
(7)
Single
283
(10)
Multiple
97
(22)
Multiple
6
(2)
Multiple
9
(2)
Double
10
(5)
Double
1
(1)
272
Annexe
4
:
Evaluations
prliminaires
M o d i f i c a t i o n
d u
t y p e
d e
r e p r s e n t a t i o n
Ce dernier exemple ne porte pas sur la reprsentation relationnelle spcifiquement, mais sur
limpact des choix effectus en matire de visualisation (notamment le type de reprsentation)
sur lanalyse.
C o n t e x t e d v a l u a t i o n
1. Que constatez-vous ?
Formuler des hypothses sur lenvoi des emails et dcrivez en quoi la reprsentation
graphique ci-dessus vous permet de confirmer ou infirmer vos hypothses.
76
Lexprience a t ralise avec 57 tudiants de Master des Universits de Lausanne et dAix-Marseille.
Modification
du
type
de
reprsentation
273
Les trois reprsentations suivantes ont t testes (Les trois graphiques ont t prsents en
niveau de gris) :
1212
1200
1000
800
705
600
400 314
267 252 252
220 218 214 210 209 206 203 191 169
200 145 144 133 126 110 107 107 101 99
0
UNITED STATES
RUSSIAN FEDERATION
MEXICO
UNITED KINGDOM
THAILAND
BRAZIL
ITALY
INDIA
ARGENTINA
AUSTRALIA
SPAIN
KOREA REPUBLIC OF
CHINA
CHILE
TURKEY
NETHERLANDS
COLOMBIA
PERU
POLAND
FRANCE
URUGUAY
GERMANY
Autres
274
Annexe
4
:
Evaluations
prliminaires
O b j e c t i f s d e l v a l u a t i o n
Lobjectif principal de cette valuation est de prsenter par un exemple, limpact des choix
effectus en termes de reprsentation de linformation sur lanalyse de donnes. La
mthodologie dvaluation consiste poser une question ouverte pour obtenir des rsultats
en termes de comprhension77. Chacune des reprsentations propose un point de vue
diffrent sur les donnes. La carte permet danalyser la distribution spatiale dans son
ensemble. Lhistogramme permet une comparaison de la prvalence par pays. Le diagramme
circulaire permet de comparer la proportion denvois pour chaque pays en regard du nombre
total (pourcentage).
77
Cf. Procdures dvaluation, page 64
Modification
du
type
de
reprsentation
275
R s u l t a t s
Histogramme
Circulaire
Carte
Total
Observations
effectues
Niveau
de
lecture
global
5
14
10
29
La
rpartition
gographique
est
trs
grande
4
(23.5)
2
(10.5)
5
(23.8)
11
(19.3)
Plusieurs
continents
1
(5.3)
3
(14.3)
4
(7.0)
La
distribution
est
relativement
uniforme/homogne
5
(26.3)
5
(8.8)
Certaine
rgularit
pour
les
autres
pays
(hors
USA)
6
(31.6)
6
(10.5)
Certaine
rgularit
pour
les
autres
pays
(hors
USA
et
Turquie)
1
(4.8)
1
(1.8)
La
rpartition
gographique
n'est
pas
uniforme
1
(5.9)
1
(1.8)
Trop
de
pays
reprsents
1
(4.8)
1
(1.8)
Niveau
de
lecture
intermdiaire
47
5
3
55
Beaucoup
d'envois
depuis
lEurope
16
(94.1)
16
(28.1)
Peu
d'envoi
depuis
l'Afrique
13
(76.5)
2
(10.5)
15
(26.3)
Beaucoup
d'envois
depuis
lAmrique
du
Sud
9
(52.9)
9
(15.8)
Beaucoup
d'envois
depuis
lAsie
6
(35.3)
6
(10.5)
7
pays
dAmrique
Latine
et
7
pays
europens
1
(5.3)
1
(1.8)
Envois
principalement
depuis
les
pays
industrialiss
3
(17.6)
2
(10.5)
5
(8.8)
Envois
principalement
de
l'hmisphre
nord
1
(4.8)
1
(1.8)
Principalement
de
pays
o
la
contrefaon
est
en
vente
"libre"
1
(4.8)
1
(1.8)
Une
grande
partie
des
mails
provient
de
8
pays
1
(4.8)
1
(1.8)
Niveau
de
lecture
lmentaire
16
38
18
72
Beaucoup
d'envois
depuis
les
Etats-Unis
13
(76.5)
17
(89.5)
5
(23.8)
35
(61.4)
Une
grande
partie
des
mails
provient
de
pays
inconnus
11
(57.9)
3
(14.3)
14
(24.6)
Une
colonne
un
label
"?"
(absence
dinformation)
6
(31.6)
2
(9.5)
8
(14.0)
Peu
d'envoi
depuis
la
Chine
1
(5.9)
2
(10.5)
3
(5.3)
Peu
d'envoi
depuis
L'Australie
2
(10.5)
2
(3.5)
Peu
d'envoi
depuis
Le
Canada
1
(5.9)
1
(1.8)
Peu
d'envoi
depuis
La
Russie
1
(5.9)
1
(1.8)
Les
spams
proviennent
principalement
de
2
pays
(20%
et
12%)
3
(14.3)
3
(5.3)
Beaucoup
d'envois
depuis
Chine
(sans
certitude)
1
(4.8)
1
(1.8)
Beaucoup
d'envois
depuis
Chine
(produit
beaucoup
de
contrefaon)
1
(4.8)
1
(1.8)
20%
des
envois
proviennent
d'un
pays,
peut-tre
la
chine
1
(4.8)
1
(1.8)
20%
des
envois
proviennent
d'un
pays,
on
ne
peut
pas
dire
lequel
1
(4.8)
1
(1.8)
La
Chine
a
la
plus
grande
proportion
de
spams,
suivi
des
USA
1
(4.8)
1
(1.8)
68
57
31
156
Total
78
Les constatations dont le sens est jug similaire sont regroupes, mme si la formulation varie suivant les
tudiants.
276
Annexe
4
:
Evaluations
prliminaires
1. Le nombre total de constatations est deux fois moins important lorsque le graphique
circulaire est prsent.
2. Au niveau de lecture global, 58% des tudiants, ayant reu lhistogramme, constatent
que la distribution est relativement uniforme.
Cette observation est probablement engendre par lagrgation de lensemble des pays dont
le taux de prvalence est infrieur 2%. Dix-huit tudiants (13 pour lhistogramme et 5 pour le
diagramme circulaire) ont dclar souhaiter connatre les dtails de la catgorie Autres .
Dans le cadre de cette analyse, le niveau intermdiaire se dfinit par les observations portant
sur un groupe de pays. Sur les diagrammes, les pays sont tris en fonction du nombre de
courriels envoys. Un classement par zone gographique (par exemple par continent), aurait
pu faciliter une telle lecture du schma (trois tudiants ayant reu lhistogramme ont fait cette
observation).
4. Sur les diagrammes, des observations sont releves sur la forme et non sur le contenu.
Le fait que des pays sont regroups dans une catgorie unique est relev sur les diagrammes.
Ce choix de regroupement est inappropri pour dix-huit tudiants qui ont crit avoir besoin
de ces informations pour sexprimer. Lattention se focalise donc sur un choix de
reprsentation. Huit tudiants ont galement mis en avant la prsence de la catgorie ? et
un tudiant dclare que trop de pays sont reprsents.
Modification
du
type
de
reprsentation
277
La catgorie Autres est reprsente par un niveau de gris similaire la catgorie Chine .
Huit tudiants font lobservation que cette catgorie (dont la proportion est la plus grande) est
un pays. Quatre dentre eux mettent lhypothse quil sagit de la Chine. Des commentaires
crits par ces tudiants, il ressort que cette hypothse vient du fait que la Chine est selon eux
le principal producteur de contrefaons.
D i s c u s s i o n
Globalement, les tudiants ont relev de manire trs pertinente que chacun de ces
graphiques offre des possibilits danalyse limites. Sur la carte, il a t relev quil manque
une indication sur la variable quantitative reprsente (prvalence, ratio, etc.). La couleur a t
trs largement plbiscite par les lecteurs du diagramme circulaire, dont la plupart na pas
souhait sexprimer sur les donnes reprsentes. Sur lhistogramme, lagrgation des
donnes en une catgorie Autres a t releve et juge problmatique pour lanalyse. Un
nombre important dtudiants a galement soulign la ncessit de pondrer les rsultats en
fonction soit de la population des pays, soit du nombre dordinateurs disposant dune
connexion Internet.
A n n e x e
5
:
E v a l u a t i o n
d e
l a
r e p r s e n t a t i o n
d e
r e l a t i o n s
I n f l u e n c e
d e s
v a r i a b l e s
l i e s
a u x
p a r t i c i p a n t s
N i v e a u d e f o r m a t i o n
Influence
des
variables
lies
aux
participants
279
E x p r i e n c e p r o f e s s i o n n e l l e
A g e
280
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
C o u r s d a n a l y s e C r i m i n e l l e
S c h m a s
Rsultats
dtaills
281
R s u l t a t s
d t a i l l s
Question 1 : Le schma ci-dessous reprsente un trafic. Cliquer sur les personnes qui peuvent
avoir t des intermdiaires entre les deux personnes en rouge.
N = 113
N = 128
+1.6% +2.2%
+22.3% +0.6%
+6.2%
Lensemble des rponses incorrectes ne sont pas reprsentes sur les schmas, lexception
des deux erreurs faites par plus de 2% des participants (identiques sur les deux versions du
schma).
282
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100
75.0
80
60.2
60
Pourcentage de
participants 40
19.5
20
8.8
7.8
10.2
3.5
2.7
1.6
5.3
5.5
0
0
1
2
3
4
5
Nombre de rponses fausses
100
81.3
80
71.7
60
Pourcentage de
participants 40
22.1
14.8
20
2.7
0.8
0.8
0.9
1.6
0.9
0.8
0.9
0.9
0
0
1
2
3
4
5
6
8
Rsultats
dtaills
283
284
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
Question 2 : Le schma ci-dessous reprsente le mme trafic. Cliquer sur la personne qui vous
semble avoir vendu bien plus qu'elle n'a achet.
N = 110
N = 123
-15.5%
+16.2%
Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 0,32 0,47 0,05 0,23 0,41 0 1
2 123 0,48 0,50 0,05 0,39 0,57 0 1
F (1,231) = 6.412, p = 0.012 diffrence significative, corrlation de Pearson = 0.164
Augmentation du taux de rponse correcte de 16.2%
Rsultats
dtaills
285
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fausses
10
Schma
2:
Rponses
fausses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
Temps
de
rponse
en
secondes
286
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
Question 3 : Cliquer sur tous les ronds rouges lis directement et indirectement au carr bleu.
N = 101
Rsultats
dtaills
287
Nombre de rponses correctes
100%
80%
64%
62%
60%
Pourcentage de
participants 40%
11%
10%
11%
20%
2%
10%
2%
1%
2%
4%
6%
5%
7%
1%
1%
1%
0%
0
1
2
3
4
5
6
7
8
9
10
11
12
13
Nombre de rponses fausses
80%
60%
Pourcentage de
participants 40%
20%
7%
5%
1%
1%
0%
0
1
2
3
Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 131 12 2 0,2 11 12 3 13
2 101 12 2 0,2 11 12 3 13
F (1, 230) = 0.145, p = 0.703 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 131 0,1 ,4 0,03 0,03 0,15 0 3
2 101 0,1 ,3 0,03 0,01 0,13 0 2
F (1, 230) = 0.257, p = 0.613 pas de diffrence significative
288
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100
Pourcentage
des
pardcipants
90
80
70
60
50
Schma
1:
Rponses
compltes
et
correctes
40
Schma
2:
Rponses
compltes
et
correctes
30
Schma
1:
Rponses
fausses
et/ou
incompltes
20
Schma
2:
Rponses
fausses
et/ou
incompltes
10
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
Rsultats
dtaills
289
Question 4 : Cliquer sur le rond rouge ayant le plus de liens directs avec des carrs noirs.
N = 101
+8.9%
Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 127
0,77
0,42
0,037
0,70
0,85
0
1
2 101
0,86
0,35
0,035
0,79
0,93
0
1
F (1,226) = 2.973, p = 0.086 effet tendanciel, corrlation de Pearson = 0.114
Augmentation du taux de rponse correcte de 8.9%
290
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fauses
10
Schma
2:
Rponses
fauses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
Rsultats
dtaills
291
Question 5 : Cliquer sur tous les tlphones bleus ayant eu des communications avec le
tlphone orange ET le tlphone vert.
N = 107
292
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100%
70%
80%
63%
60%
Pourcentage de
40%
34%
participants 28%
20%
1%
2%
3%
0%
0
1
2
3
Nombre de rponses fausses
100%
90%
86%
80%
60%
Pourcentage de
participants 40%
20%
3%
1%
2%
2%
2%
2%
2%
2%
1%
4%
2%
2%
1%
0%
0
1
2
3
4
5
6
7
8
Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110
2,7
0,5
0,05
2,6
2,8
1
3
2 107
2,6
0,6
0,06
2,5
2,7
0
3
F (1,215) = 1.854, p = 0.175 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110
0,4
1,5
0,15
0,2
0,7
0
8
2 107
0,6
1,6
0,16
0,3
0,9
0
7
F (1,215) = 0.444, p = 0.506 pas de diffrence significative
Rsultats
dtaills
293
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
compltes
et
correctes
30
Schma
2:
Rponses
compltes
et
correctes
20
Schma
1:
Rponses
fausses
et/ou
incompltes
10
Schma
2:
Rponses
fausses
et/ou
incompltes
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
294
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
N = 103
Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110
0,23
0,42
0,04
0,15
0,31
0
1
2 103
0,17
0,37
0,04
0,09
0,24
0
1
F (1,211) = 1.297, p = 0.256 pas de diffrence significative
Rsultats
dtaills
295
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fausses
10
Schma
2:
Rponses
fausses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
Temps
de
rponse
en
secondes
296
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
Question 7 : Cliquer sur le tlphone qui est en relation avec le plus grand nombre de
tlphones.
N = 101
+13.4%
Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 107
0,76
0,43
0,04
0,67
0,84
0
1
2 101
0,89
0,31
0,03
0,83
0,95
0
1
F (1,206) = 6.526, p = 0.011 diffrence significative, corrlation de Pearson = 0.175
Augmentation du taux de rponse complte et correcte de 13.4%
Rsultats
dtaills
297
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fausses
10
Schma
2:
Rponses
fausses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
298
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
Question 8 : Cliquer sur le membre du groupe criminel qui est li au plus grand nombre
d'individus en vert.
N = 87
Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 112
0,90
0,30
0,03
0,85
0,96
0
1
2 87
0,80
0,40
0,04
0,72
0,89
0
1
F (1,197) = 3.861, p = 0.051 diffrence significative, corrlation de Pearson = -0.139
Rsultats
dtaills
299
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
correctes
30
Schma
2:
Rponses
correctes
20
Schma
1:
Rponses
fausses
10
Schma
2:
Rponses
fausses
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
Tests statistiques sur le temps de rponse
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 101
57
50
5
48
67
5
336
2 70
58
36
4
49
67
8
191
F (1, 169) = 0.005, p = 0.942 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1
11
112
99
30
45
179
23
307
2
17
77
43
10
55
99
2
143
F (1, 26) = 1.648, p = 0.211 pas de diffrence significative
300
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
Ce schma reprsente les relations d'un groupe criminel constitu des quatre individus en
rouge. Il s'agit du mme schma que prcdemment.
Question 9 : Cliquer sur les individus (vert et rouge) qui semblent avoir eu une activit en
Espagne.
Positions des clics : aires proportionnelles au pourcentage de participants
N = 110
N = 92
-30%
+12% +14%
- 25%
+7%
+6%
Rsultats
dtaills
301
100%
80%
60%
Pourcentage de 35%
30%
36%
participants 40%
26%
14%
23%
20%
12%
12%
4%
1%
1%
1%
1%
1%
2%
0%
0
1
2
3
4
5
6
7
8
Nombre de rponses fausses
100%
80%
68%
66%
60%
Pourcentage de
participants 40%
32%
20%
20%
4%
1%
2%
1%
2%
1%
1%
1%
0%
0
1
2
3
4
5
6
7
8
9
10
11
12
Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110
6,6
1,2
0,1
6,4
6,8
2
8
2 92
6,6
1,7
0,2
6,2
6,9
0
8
F (1,200) = 0.000, p = 0.984 pas de diffrence significative
302
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
compltes
et
correctes
30
Schma
2:
Rponses
compltes
et
correctes
20
Schma
1:
Rponses
fausses
et/ou
incompltes
10
Schma
2:
Rponses
fausses
et/ou
incompltes
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
Temps
de
rponse
en
secondes
Tests statistiques sur le temps de rponse
Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 19
40
20
5
30
50
20
96
2 19
56
22
5
45
67
27
98
F (1, 36) = 5.490, p = 0.025 diffrence significative, corrlation de Pearson = -0.364
Temps de rponse correcte moyen 28.6% plus court avec le schma 1
Rsultats
dtaills
303
Question 10 : Cliquer sur les 3 groupes lis avec le plus grand nombre de photocopieurs.
Positions des clics : aires proportionnelles au pourcentage de participants
N = 102
N = 92
+1%
+3.5%
+13.5%
304
Annexe
5
:
Evaluation
de
la
reprsentation
de
relations
100%
80%
66%
53%
60%
Pourcentage de
participants 40%
25%
16%
13%
13%
20%
8%
7%
0%
0
1
2
3
Nombre de rponses fausses
100%
75%
80%
56%
60%
Pourcentage de
participants 40%
25%
13%
20%
11%
8%
6%
7%
0%
0
1
2
3
Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 102
2,2
1,1
0,1
1,9
2,4
0
3
2 92
2,3
1,1
0,1
2,1
2,6
0
3
F (1,192) = 1.300, p = 0.256 pas de diffrence significative
Rsultats
dtaills
305
100
90
Pourcentage
des
pardcipants
80
70
60
50
40
Schma
1:
Rponses
compltes
et
correctes
30
Schma
2:
Rponses
compltes
et
correctes
20
Schma
1:
Rponses
fausses
et/ou
incompltes
10
Schma
2:
Rponses
fausses
et/ou
incompltes
0
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
160
170
180
190
200
210
220
230
240
250
260
270
280
290
300
Temps
de
rponse
en
secondes