Sunteți pe pagina 1din 318

Unicentre

CH-1015 Lausanne
http://serval.unil.ch

Year : 2011

Mthodes de visualisation en analyse criminelle: approche


gnrale de conception des schmas relationnels et
dveloppement d'un catalogue de patterns

Quentin Rossy

Quentin Rossy, 2011, Mthodes de visualisation en analyse criminelle: approche gnrale


de conception des schmas relationnels et dveloppement d'un catalogue de patterns

Originally published at : Thesis, University of Lausanne

Posted at the University of Lausanne Open Archive.


http://serval.unil.ch

Droits dauteur
L'Universit de Lausanne attire expressment l'attention des utilisateurs sur le fait que tous les
documents publis dans l'Archive SERVAL sont protgs par le droit d'auteur, conformment la
loi fdrale sur le droit d'auteur et les droits voisins (LDA). A ce titre, il est indispensable d'obtenir
le consentement pralable de l'auteur et/ou de lditeur avant toute utilisation d'une oeuvre ou
d'une partie d'une oeuvre ne relevant pas d'une utilisation des fins personnelles au sens de la
LDA (art. 19, al. 1 lettre a). A dfaut, tout contrevenant s'expose aux sanctions prvues par cette
loi. Nous dclinons toute responsabilit en la matire.

Copyright
The University of Lausanne expressly draws the attention of users to the fact that all documents
published in the SERVAL Archive are protected by copyright in accordance with federal law on
copyright and similar rights (LDA). Accordingly it is indispensable to obtain prior consent from the
author and/or publisher before any use of a work or part of a work for purposes other than
personal use within the meaning of LDA (art. 19, para. 1 letter a). Failure to do so will expose
offenders to the sanctions laid down by this law. We accept no liability in this respect.


Facult de Droit et des Sciences Criminelles
Ecole des Sciences Criminelles



Mthodes de visualisation en analyse criminelle: approche
gnrale de conception des schmas relationnels et
dveloppement dun catalogue de patterns

THSE DE DOCTORAT


prsente la
Facult de Droit et des Sciences Criminelles
de lUniversit de Lausanne

pour lobtention du grade de
Docteur s Sciences en science forensique
par

Quentin Rossy



Directeur de thse
Prof. Olivier Ribaux






LAUSANNE
2011

Srie criminalistique LII


ISBN : 2-940098-56-5
i

R E M E R C I E M E N T S

Cette recherche a t mene lEcole des Sciences Criminelles de lUniversit de Lausanne


sous la direction du Professeur Olivier Ribaux. Le jury tait compos du Docteur Olivier
Guniat, commandant de la police cantonale jurassienne, de Monsieur Christian Tourni,
Expert national dtach, administrateur la Direction gnrale Affaires intrieures,
Commission europenne et du Docteur Andrew David Barclay, Forensic Consultant et Senior
lecturer la Robert Gordon University, Aberdeen et professeur honoraire lUniversit de Hull.
Je remercie lensemble du jury de lintrt quils ont port mes travaux, de leurs
encouragements et de leurs trs prcieux conseils et corrections.

Leffort dintrospection effectu lors de la rdaction de la thse, ma fait raliser quelle point
le titre de cette recherche contient un mot cl : relationnel . Au del du caractre centrale
de lanalyse dite relationnelle en analyse criminelle, si je ne devais retenir qu'une seule chose,
cest que l'intrt principal de ce travail rside bien dans les relations quil ma permi et me
permet de crer. Jespre vivement quil moffrira lopportunit den raliser de nombreuses
autres.

Je remercie les personnes qui mont soutenu, conseill et aid tout au long de la thse, ainsi
que lcole et les organes de police qui mont offert des cadres de travail ouverts aux
initiatives de recherche et dveloppement. Un grand merci notamment Pierre Margot,
directeur de lEcole des Sciences Criminelles et Olivier Guniat, chef de la police judiciaire
lors de mon activit la police neuchteloise. Je tiens exprimer ma vive gratitude Olivier
Ribaux, directeur de thse, pour la confiance quil ma tmoign tout au long de mes activits
de recherche et denseignement, pour ces trs prcieux conseils et pistes de rflexion et sa
passion communicative.


ii

Une pense particulire pour tous les collgues avec qui jai partag de nombreuses
discussions et qui mont transmis un peu de leur savoir. Jaurais aim les citer tous, jai une
pense pour chacun deux:
- Les collgues de la police neuchteloise et tout particulirement Jean-Claude Voirol
qui ma fait dcouvrir lanalyse de la dlinquance srielle.
- Les collgues des polices de suisse romande, du CICOP et les analystes criminels, plus
particulirement Julien Cartier et Sbastien Capt.
- Les collgues de lESC et en particulier tous les membres du groupe analyse criminelle,
dont Stphane Birrer, pour son soutien ds mes dbuts en tant quassistant et pour
tout les grands moments pass lors du dveloppement de PICAR. Sylvain Ioset et
Thibault Genessay, pour leur soutien permanent et les trs nombreuses discussions sur
diffrents aspects de cette recherche.

Vous avez nourri mon travail et ma curiosit, merci.

A ma famille,
A mes parents,
A ma femme,

Mille merci.


iii

S U M M A R Y

Police work and criminal investigation require taking many decisions: i.e.choosing which traces
should be analysed and placing under surveillance or detention a suspect are decisions that
are made daily by the actors of the legal system. These decisions need to weigh competing
interests based on the analysis of available information. It is the role of crime analysis to put
into perspective collected information to make it intelligible to decision makers. The use of
visualisations is particularly recommended to support the analysis and communication of such
information by highlighting the essential features.

Link charts are used in criminal investigations in order to facilitate the processing of large-
scale investigation data. The relevant elements of the inquiry are represented in the form of
diagrams describing the relationships between events and entities featuring in the
investigation (such as people, objects and traces). For instance, traditional uses of those graph-
like techniques are: the representation of criminal networks, smuggling of goods, chronologies
of events, as well as the visualisation of telephone records and financial data. In this context,
visualisations are used for many objectives, such as analysing the traces and the information
gathered, evaluating a cold case, helping along the categorization of a particular offence,
facilitating the transmission and receipt of a case or supporting an argument at the Courts
trial.

Common practice includes simple software tools that produce powerful and often elegant
visualisations. However their use raises important difficulties. This research suggests that there
are astonishing disparities in the use of these techniques. Reasoning and perception biases
can be introduced, sometimes leading to wrong decisions with serious consequences. This
observation reveals the need to consolidate available methods.


iv

To highlight these difficulties, evaluations were conducted with practitioners and students. An
empirical picture of the manifold ways in designing and interpretating visualisations has been
established. The impact of this variety on decision-making is also discussed. The nature and
variety of concepts to be represented, the absence of an emerging consensus on how to
represent data, the diversity of visual solutions, the constraints imposed by tools and the
absence of a clear formalization of the visual language, are all supposed causes of the
observed difficulties.

Over the past two decades, several lines of development have been proposed to deal with
these problems, such as improving automated graph building tools, exploitation of social
network analysis, automation of the identification and extraction of entities in unstructured
text and the definition of formal languages. This research suggests a parallel approach based
on an appropriate use of graph structures and visual properties to optimize readability based
on analysis objectives and nature of the information to be represented.

Solutions were sought in several areas. General recommendations from various research
communities related to visualisation were gathered to provide a general approach for the
design of link charts. In addition, the development of a best practices catalogue formalized as
patterns was initiated. Each pattern describes a particular solution to a recurring analysis
question, such as the analysis series of burglaries. Finally, the impact on tools of the proposed
methodology is discussed in light of the limitations they impose. A multi-dimensional
visualisation software prototype was developed.

On the whole, this research highlights the difficulties encountered in designing link charts that
support inquiries and proposes methodological and technical innovations useful for practice
and teaching.

R E S U M E

Le travail policier et lenqute judiciaire ncessitent de prendre de nombreuses dcisions :


choisir quelle trace analyser, mettre sous surveillance ou en dtention un suspect, sont autant
de dcisions qui sont prises quotidiennement par les acteurs du systme judiciaire. Ces
dcisions font lobjet de peses dintrts qui se fondent sur lanalyse de linformation
accessible. Cest le rle de lanalyse criminelle de mettre en perspective linformation collige
pour la rendre intelligible aux dcideurs comptents. Lusage de reprsentations graphiques
est notamment recommand pour soutenir lanalyse et la communication de ces informations.

Des techniques de visualisation relationnelle sont notamment exploites dans les enqutes
judiciaires afin de faciliter le traitement daffaires denvergure. Les lments pertinents de
lenqute sont reprsents sous la forme de schmas dcrivant les relations entre les
vnements et les entits dintrts (tel que des personnes, des objets et des traces). Les
exploitations classiques de ces techniques qui sapparentent des graphes, sont par exemple :
la reprsentation de rseaux criminels, de trafics de marchandises, de chronologies
dvnements, ainsi que la visualisation de relations tlphoniques et financires. Dans ce
contexte, la visualisation soutient un nombre importants dobjectifs, tels quanalyser les traces
et les informations collectes, valuer a posteriori une investigation, aider qualifier les
infractions, faciliter lapprhension dun dossier, voire soutenir une argumentation lors du
procs.

La pratique intgre des outils logiciels simples qui produisent des graphiques lgants et
souvent percutants. Leur utilisation semble nanmoins soulever des difficults. Cette recherche
tend montrer quil existe des disparits tonnantes lors de lexploitation de ces techniques.
Des biais de raisonnement et de perception peuvent tre induits, allant jusqu provoquer des


vi

dcisions aux consquences parfois dsastreuses. Ce constat rvle la ncessit de consolider
les mthodes pratiques.

Pour mettre en vidence ces difficults, des valuations ont t effectues avec des praticiens
et des tudiants. Elles ont permis dtablir une image empirique de ltendue des variations de
conception et dinterprtation des reprsentations, ainsi que de leurs impacts sur la prise de
dcision. La nature et la diversit des concepts reprsenter, labsence dun consensus
mergeant sur la manire de reprsenter les donnes, la diversit des solutions visuelles
envisageables, les contraintes imposes par les outils exploits et labsence dune
formalisation claire du langage, sont autant de causes supposes des difficults.

Au cours des vingt dernires annes, plusieurs axes de dveloppement ont t proposs pour
traiter les difficults observes, tels que lamlioration des automatismes facilitant la
conception dune reprsentation, lexploitation des techniques de rseaux sociaux,
lautomatisation de lidentification et de lextraction des entits dans du texte non-structur et
la dfinition de langages formels. Cette recherche propose une approche parallle fonde sur
une exploitation adapte de structures de graphe et de proprits visuelles pour optimiser la
reprsentation en fonction des objectifs dfinis et de la nature des informations reprsenter.

Des solutions ont t recherches selon plusieurs axes. Des recommandations gnrales,
issues de diverses communauts de recherche lies la visualisation, ont t recherches afin
de proposer une dmarche gnrale de conception des schmas relationnels. Par ailleurs, le
dveloppement dun catalogue de bonnes pratiques formalises sous la forme de patterns de
visualisation a t amorc. Chaque pattern dcrit une solution particulire pour un problme
danalyse rcurrent, tel que lanalyse dune srie de cambriolages. Finalement, limpact sur les
outils de la mthodologie propose est discut en regard des limites quils imposent. Un
prototype de visualisation multidimensionnel a t labor.

Cette recherche met en vidence les difficults rencontres lors de lexploitation de


reprsentations graphiques pour soutenir le processus de lenqute judiciaire et propose des
lments de mthode et des innovations techniques utiles tant pour lenseignement de la
discipline que pour sa pratique.


vii

TABLE DES MATIRES

INTRODUCTION 1

Contexte 1
Problmatique 2
Structure de la thse 2

PARTIE I : CONTEXTE ET PROBLEMATIQUE 6

ANALYSE CRIMINELLE ET VISUALISATION 7


Processus de lanalyse criminelle 9
Rles de la visualisation dans le processus 15
Renseignement et formes danalyse 20
Analyse, profil et pattern 26
Analyse selon le type de donnes 29
Dimensions danalyse et formes de visualisation 30
Dimensions danalyse 33
Formes de visualisation 34
Analyse et visualisation relationnelle 36
Recommandations et standards 45
Conclusion 47
EXPLOITATIONS POUR LENQUETE JUDICIAIRE 48
Enqute 48
Processus de lenqute et objectifs danalyse 48
Intgration de lanalyse criminelle oprationnelle 52
Jugement 55
Objectifs danalyse 55
Contraintes imposes sur les visualisations 56
Conclusion 58
MTHODES DVALUATION DE VISUALISATIONS 59
Critres dvaluation 61
Procdures dvaluation 63
EVALUATIONS PRELIMINAIRES 65
Disparits de reprsentation 65
Reprsentation dun scnario simple 65
Reprsentation dune vente 68
Reprsentation dune affaire complexe 69
Discussion 72
Impact sur lanalyse et la communication 73
Reprsentation dune affaire complexe 73
Reprsentation dun trafic de marchandises 75
Reprsentation de sries de cambriolage 77
Reprsentation dun cas dabus sexuel 80


viii

SYNTHESE 83
Constat 83
Consolidation des mthodes 87
Dlimitation du cadre 87
Objectifs 88
Mthodologie 88

PARTIE II : CONTRIBUTION AUX MTHODES DE CONCEPTION DES SCHMAS RELATIONNELS 90

PROCESSUS DE CONCEPTION DUN SCHEMA RELATIONNEL 91


Description du langage visuel 94
Proprits du plan 94
Composants dun graphe 96
Attributs graphiques 97
Typologie de relations 100
Evaluation de la reprsentation de relations 104
Mthode 105
Description de lchantillon 107
Rsultats 108
Tableau de synthse 119
Discussion gnrale sur les rsultats 119
Discussion sur la mthode dvaluation 120
Elments de mthode 122
Identification de la dimension dominante 122
Elaboration du modle relationnel 125
Simplifications 127
Constance et dfinition de conventions 135
Ordonnancement des composants 137
Rsum de la mthode propose 141
PATTERNS DE VISUALISATION RELATIONNELLE 142
Analyser une srie dvnements 143
Reprsentation des liens forensiques 148
Traces de semelles et motifs 150
Traces biologiques et profil ADN 153
Saisies de stupfiant et classes chimiques 155
Relations avec des vhicules 159
Relations spatio-temporelles 162
Slectionner des traces analyser 165
Analyser des transactions 169
Communications tlphoniques 172
Transactions financires 182
Ventes de marchandises 189
IMPACT SUR LA CONCEPTION DOUTILS 193
Problmatique 193
Processus de visualisation 195
Modification dynamique de la structure du graphe 199
Intgration des dimensions danalyse 201
Prototype de visualisation multidimensionnelle 201


ix

DISCUSSION GENERALE 207

Rsultats empiriques 207


Mthodes dvaluation 208
Apports sur un plan mthodologique 209
Perspectives 211

CONCLUSION 215

BIBLIOGRAPHIE 217

ANNEXES 232

ANNEXE 1: DIMENSIONS DANALYSE ET VISUALISATION 233


Analyse quantitative 233
Analyse temporelle 239
Analyse spatiale 249
ANNEXE 2 : SCHEMAS DE SCENARIOS 256

ANNEXE 3 : VISUALISATION TRIDIMENSIONNELLE 259


Types de reprsentation 259
Avantages 261
Faiblesses 262
Conclusion 263
ANNEXE 4 : EVALUATIONS PRELIMINAIRES 265
Reprsentation dun scnario simple 265
Reprsentation dune vente 268
Reprsentation dune affaire complexe 269
Modification du type de reprsentation 272
ANNEXE 5 : EVALUATION DE LA REPRESENTATION DE RELATIONS 278
Influence des variables lies aux participants 278
Rsultats dtaills 281

I N T R O D U C T I O N

C o n t e x t e
Les services de police (au niveau local, national et international) ont de plus en plus recours
des modles de prises de dcisions oprationnelles et stratgiques fondes sur lexploitation
de produits de lanalyse de donnes. Parmi les problmatiques majeures actuelles, la mise en
place de structures danalyse charges de traiter la masse dinformations recueillies et la
dfinition de mthodologies de travail efficientes sont des questions permanentes. De
nombreuses formes de reprsentations graphiques sont exploites dans ce cadre pour
produire et communiquer les renseignements utiles la prise de dcision.

De nombreuses polices travers le monde et tout particulirement aux Etats-Unis ont investi
des moyens importants pour produire des systmes de visualisation cartographique de la
criminalit. Ces systmes permettent dobtenir rapidement une image claire et facile daccs
de problmes criminels souvent complexes. Par ailleurs, des logiciels de visualisation ont
galement t intgrs dans les enqutes judiciaires afin de faciliter le traitement daffaires
denvergure. Les lments pertinents de lenqute sont reprsents sous la forme de schmas
dcrivant les relations entre les vnements et les entits dintrts (tel que des personnes, des
socits, des vhicules et des traces). Les exploitations classiques de ces techniques sont, par
exemple : la reprsentation de rseaux criminels, de trafics de marchandises, de modes
opratoires complexes, de chronologies, ainsi que la visualisation de relations tlphoniques
et financires.


2 Introduction

Les nouvelles technologies apportent des solutions techniques de plus en plus varies. Mais
cette apparente simplicit dlaboration de produits graphiques lgants et souvent
percutants semble toutefois cacher un nombre important de problmes mthodologiques et
pratiques.

P r o b l m a t i q u e
Le travail policier et lenqute judiciaire ncessitent de prendre de nombreuses dcisions : une
visite domiciliaire, une mise sous surveillance ou une mise en dtention dun suspect, sont
autant de dcisions qui sont prises quotidiennement par les acteurs du systme judiciaire. Ces
dcisions font lobjet de peses dintrts qui se fondent sur lanalyse de linformation
accessible. Cest le rle de lanalyse criminelle de mettre en perspective cette information pour
la rendre intelligible aux dcideurs comptents. Lusage de reprsentations graphiques est
notamment recommand pour soutenir lanalyse et la communication des informations. Bien
que lanalyse criminelle propose une mthode gnrale et harmonise, la mise en uvre
pratique de la mthode semble poser de nombreuses difficults lors de la production de telles
reprsentations. Cette recherche tend montrer quil existe de relles difficults, puis proposer
des solutions mthodologiques et techniques. Les questions abordes sont : quel est le
contexte dexploitation de la visualisation en analyse criminelle, quels sont ses rles, quelles
sont les formes de reprsentation exploites et quels sont les problmes rencontrs lors de
leurs utilisations?

S t r u c t u r e d e l a t h s e

P r e m i r e p a r t i e

La premire partie dcrit le contexte gnral dexploitation de la visualisation en analyse


criminelle et plus particulirement son usage dans lenqute judiciaire dont sont issus les cas
traits et les donnes analyses. Des exemples et des valuations prliminaires sont prsents
afin dillustrer les difficults observes et tenter den identifier les causes.

La mthode de travail connue sous le nom de cycle du renseignement est brivement


prsente dans le premier chapitre afin de dcrire les rles de la visualisation dans la
mthode. La deuxime section du premier chapitre prsente les formes danalyse dfinies dans


Structure de la thse 3

la littrature. Elles dcomposent lanalyse criminelle en fonction dobjectifs dexploitation


spcifiques. Les manuels danalyse criminelle relvent que certaines formes de visualisation
sont plus adaptes pour certaines formes danalyse (tel que suggr dans le guide sur
lanalyse criminelle dInterpol (Interpol, 1997) ou, plus localement, par le manuel danalyse
criminelle oprationnelle de la police fdrale suisse (Fedpol, 2010)). Par exemple, un schma
dvnement est gnralement produit lors dune analyse de cas et des schmas de flux lors
dune analyse de donnes financires. De nombreuses formes ont t dfinies, mais la
mthode dfinie est gnrale et les techniques exploites semblent galement tre exploites
de faon transversale. La troisime section prsente une dcomposition base sur la dfinition
de quatre dimensions danalyse principale : temporelle, spatiale, relationnelle et quantitative.
Bien que cette classification regroupe et simplifie un ensemble de questionnements
complexes, elle permet de classifier les visualisations et dorienter le choix dune ou plusieurs
dentre elles. Les diffrentes formes de reprsentation exploites dans le domaine sont donc
classifies et prsentes selon ces quatre dimensions. La dimension relationnelle et plus
particulirement ces formes de reprsentations propres a t choisie comme sujet dtude. En
effet, lexploitation des schmas relationnels qui permettent de visualiser les relations entre
des entits dintrts (des vnements, des personnes, des socits, etc.), a fait l'objet dun
nombre limit de recherches dans le domaine de lanalyse criminelle (Regali, 1999) (Xiang et
al., 2005) (Chen et al., 2005), alors que leur usage sest rapidement rependu depuis une
vingtaine danne. Finalement, les recommandations dfinies dans les manuels de lanalyse
criminelle qui portent sur la conception des schmas relationnels sont prsentes.

Le deuxime chapitre dcrit le contexte de lenqute judiciaire dont sont issus les exemples
analyss dans cette thse. Les objectifs attendus en matire de visualisation sont dcrits ainsi
que les besoins des acteurs du processus en regard de la visualisation ; quils en soient les
crateurs ou les destinataires. Bien que la problmatique traite dans cette thse se base sur
ltude de cas issus de linvestigation criminelle, les problmes identifis et lapproche
envisage pour les traiter semblent toutefois avoir une utilit plus globale.

Il est souponn que les pratiques de conception des schmas relationnels sont disparates et
que les visualisations produites sont plus ou moins efficaces. Le troisime chapitre dfinit la
notion defficacit, les indicateurs permettant de la mesurer et les mthodologies existantes
pour lvaluer.

Les difficults dlaboration de reprsentations sont prsentes dans le quatrime chapitre qui
rsume des valuations prliminaires effectues et des exemples de cas. En premier lieu, la


4 Introduction

disparit des solutions graphiques labores pour une mme situation par diffrentes
personnes est observe. Deux illustrations portant sur des cas simples sont prsentes
(reprsentation dune seule phrase). La troisime illustration expose les schmas relationnels
produits partir dune mme affaire, par un ensemble denquteurs, dtudiants et danalystes
criminels. Il est alors constat quil ne semble pas exister de consensus mergeant en matire
de reprsentation relationnelle des informations. Ces disparits ont-elles un impact important
sur lanalyse et la communication des informations ? Des exemples dexploitation au cours du
processus denqute et du jugement sont prsents afin dillustrer limpact des choix effectus
pour analyser, synthtiser et communiquer les informations daffaires complexes.

S e c o n d e p a r t i e

Les contributions prsentes dans la deuxime partie de cette thse sont divises en trois
chapitres. Le premier chapitre est consacr la prsentation dlments gnraux de mthode
formaliss dune part sur les travaux de recherches issus de la littrature en matire de
visualisation et dautre part sur des observations effectues lors du traitement de situations
rcurrentes. Une formalisation du processus de conception dun graphe est propose afin
dexpliciter, pour chaque tape, les causes supposes des difficults observes lors des
valuations prliminaires. La dmarche propose repose sur une dfinition plus prcise du
langage visuel exploitable pour concevoir un schma. Une typologie de relations est propose
afin de guider les choix de conception. Celles-ci ont t compares empiriquement afin
dtudier limpact du changement de structure sur lefficacit des graphes. La dernire section
du premier chapitre vise prsenter les recommandations gnrales identifies. Elles sont
intgres dans une bauche de dmarche gnrale guidant la conception des schmas.

Les recommandations et les lments de mthode formaliss dans le premier chapitre ont
notamment t dfinis en regard de situations rcurrentes identifies au cours denqutes. Le
second chapitre prsente les bonnes pratiques proposes pour reprsenter ces situations : tel
que le traitement de sries de cambriolages ou lanalyse de donnes tlphoniques par
exemple. La dmarche est ainsi explicite par des exemples concrets. Lobjectif est damorcer
le dveloppement dun catalogue de bonnes pratiques. Il ne saurait tre dmontr que les
solutions proposes sont les meilleures possible. Elles ont toutefois montr une certaine
efficacit qui est discute pour chaque cas.

Le troisime chapitre sintresse limpact des recommandations mthodologiques identifies


sur les outils de visualisation. Ceux-ci imposent parfois leurs propres standards et les


Structure de la thse 5

possibilits sont videmment cantonnes aux fonctionnalits offertes. Ils offrent gnralement
des solutions gnriques, alors que les problmes rsoudre sont souvent spcifiques. Ils ne
favorisent pas toujours les bons choix de reprsentation en regard des questions danalyse.
Afin dexpliciter les difficults lies lexploitation des logiciels, le processus de visualisation
est dcrit dun point de vue technique. Une sparation ncessaire est identifie entre le
modle des donnes rcoltes et le modle ncessaire pour produire une vue. Le
dveloppement de mcanismes permettant dune part de faire communiquer ces modles et
dautre part de modifier dynamiquement la structure des graphes est propos comme une
solution ncessaire pour que les techniques soutiennent plus efficacement les raisonnements
effectus en cours danalyse. Finalement, le dveloppement de techniques de reprsentation
intgrant lensemble des dimensions danalyse est certainement lun des dfis majeurs de ces
dix dernires annes dans le domaine. En effet, cette problmatique est identifie depuis le
dbut des annes deux-mille et de nombreux outils sont dvelopps dans cette perspective
intgratrice facilitant lanalyse globale des donnes. Un prototype de visualisation
multidimensionnelle a t amorc dans le cadre de cette thse. Il est prsent en fin de
chapitre.

The power of the unaided mind is highly overrated. Without external aids, memory,
thought, and reasoning are all constrained. But human intelligence is highly flexible and
adaptive, superb at inventing procedures and objects that overcome its own limits. The real
powers come from devising external aids that enhance cognitive abilities. How have we
increased memory, thought, and reasoning? By the invention of external aids: It is things
that make us smart. (Norman, 1993, p.43)

P A R T I E I : C O N T E X T E E T
P R O B L E M A T I Q U E

Diverses formes de reprsentation sont exploites dans de nombreux domaines pour faciliter
lapprhension de grandes quantits de donnes, afin de dtecter des tendances ou des
anomalies qui sont alors rendues visuellement explicites (Ware, 2004). De nombreuses
recherches ont t entreprises sur le sujet depuis les annes soixante qui tendent formaliser
les principes et les mthodes de la visualisation de linformation. Dans une recherche sur la
visualisation, lanalyse criminelle ne saurait tre considre autrement quen tant
quapplication spcifique de certaines formes de reprsentation. Lanalyste criminel, quant
lui, ne peut quapprhender la visualisation comme une technique particulire, certainement
utile, voire ncessaire, lui facilitant laccomplissement de certaines tches. Il reconnait que le
fruit de son travail est souvent transmis grce une reprsentation visuelle. Lanalyse
criminelle semble en effet avoir russi son intgration dans le domaine de la scurit grce
notamment un usage particulirement efficace de reprsentations graphiques. Bien quelle
couvre un processus bien plus large et complexe, Il faut admettre que les produits de
renseignement transmis sous la forme de reprsentations graphiques faonnent limage de la
discipline. Lanalyse criminelle nest de fait pas la seule discipline sur laquelle la visualisation a
un impact important. Certains auteurs prtendent que lessor des techniques de
reprsentation de linformation est lun des facteurs responsables du dveloppement de
toutes les sciences modernes (Crosby, 1997) (Friendly, 2008). Cette recherche aborde
lexploitation des reprsentations graphiques dans la perspective de lanalyse criminelle, tout
en intgrant des principes et des recommandations formalises dans des travaux lies la
visualisation afin de mieux comprendre les difficults rencontres et consolider les mthodes
pratiques.

A n a l y s e c r i m i n e l l e e t v i s u a l i s a t i o n
Les termes danalyse ou de renseignement criminel(le) sont parfois utiliss comme synonyme
ou du moins de faon interchangeable. Dans le cadre de cette thse, ces termes seront utiliss
pour distinguer une mthode (analyse criminelle) du produit de lanalyse et de la fonction
(renseignement criminel).

Lanalyse criminelle est considre en tant que mthode systmatique exploitant notamment
des techniques de la gestion de linformation afin de dtecter, mmoriser et reprsenter des
relations1. Lanalyse criminelle dcrit un processus gnral qui par une exploitation structure
des informations aide grer les informations accessibles afin den matriser les flux et de
garder la vue densemble, cherche structurer les raisonnements et en particulier en
minimiser les biais et finalement met en perspective les informations pour les prsenter aux
dcideurs. La visualisation fait partie des moyens exploits au cours du processus pour
analyser les informations collectes et communiquer les renseignements produits.

Le renseignement se dfinit comme le produit de lanalyse criminelle mais galement comme


une fonction. En tant que produit, le renseignement se distingue des notions de donne,
dinformation et de connaissance. Le vocabulaire utilis suit le modle DIKI de Ratcliffe (2009) :


1
Lanalyse criminelle consiste en la recherche et la mise en vidence mthodiques de relations - dune part entre
les donnes de la criminalit elles-mmes et, dautre part entre des donnes de la criminalit et dautres donnes
significatives possibles - des fins de pratiques judiciaires et policires. (Interpol, 1997)
Lanalyse stratgique est lensemble des mthodes et des techniques d'analyse qui essayent de manire
scientifique, de dcrire, d'valuer et d'expliquer la problmatique de scurit policire, en mettant en vidence des
relations entre d'une part les diffrents aspects de ces problmes et d'autre part des donnes contextuelles.
(dfinition de lanalyse stratgique par la police fdrale belge, http://www.polfed-
fedpol.be/org/djb_environnement/djb_envir11_fr.php, dernier accs le 12.11.2010).


8 Analyse criminelle et visualisation

data, information, knowledge et intelligence. Bien que les dfinitions de ces termes soient
sujettes discussion et quil nexiste pas de consensus gnral, les distinguer permet de
caractriser des tats dans le processus de lanalyse criminelle. En effet, les informations sont
en permanence en mouvement et elles se modifient. La forme et le support de communication
des donnes peuvent varier. Une donne est considre comme le matriau brut, initialement
rcolt, dont la signification na pas t tablie (Brodeur, 2005a). Elle devient une information
lorsque sa pertinence a t value en fonction des objectifs de lanalyse. Une information est
gnralement structure et reprsente pour tre analyse puis communique. Une
connaissance est le fruit de linterprtation de linformation en fonction de la question
danalyse. Un renseignement intgre une notion dutilit pour laction de scurit implique
(Brodeur, 2005a). Il sert de base la prise de dcision et la rsolution de la problmatique. Il
doit intgrer une recommandation, une ide qui permet dagir. Le renseignement se dfinit
alors comme une information signifiante, raisonne et interprte dans un contexte particulier,
utile la prise de dcision.

En tant que fonction, le renseignement se dfinit comme la fonction danalyse des


informations afin de soutenir les missions de rpression, de prvention et de gestion de crise
et durgence (PCSCO, 2002) (Cusson, 2008). En effet, la ncessit de disposer dinformations
values et interprtes en temps rel a t identifie depuis plusieurs dcennies, notamment
en raison de la masse et de la complexit des donnes intgrer et analyser. La mise en
place dune tape intermdiaire entre les collecteurs de donnes et les dcideurs a conduit
la dfinition de la fonction de renseignement (UNODC, 2002).

Bien que dans une certaine mesure, tous les acteurs de la scurit peuvent produire du
renseignement. Le service de renseignement se distingue des autres fonctions de scurit,
puisquil na, en principe, pas dautres missions que danalyser et de communiquer. Lagent de
renseignement apporte une vision globale et synthtique dun problme de scurit en
suivant une dmarche analytique (dmarche de lanalyse criminelle ou processus du
renseignement). Le renseignement est une fonction de suivi permanent et mthodique qui
contribue au passage dune stratgie daction policire ractive vers un modle plus proactif
guid par le renseignement. Les analyses produites peuvent servir de base la prise de
dcision et guider des choix stratgiques ( long terme) ou oprationnels ( court terme). Le
renseignement peut se dcomposer soit selon des types dobjectifs, comme lanalyse de
phnomnes criminels, soit en fonction de la nature des informations analyses, comme le
renseignement financier par exemple.


Processus de lanalyse criminelle 9

P r o c e s s u s d e l a n a l y s e c r i m i n e l l e
Le processus de lanalyse criminelle est prsent ici afin dexpliciter les rles de la visualisation
dans la dmarche. Lanalyse criminelle est gnralement dcrite en tant que dmarche
systmatique et analytique (Atkin, 2000) (Boba, 2009) (Bruce, 2009) (Paulsen et al., 2010). Le
terme danalyse signifie la dcomposition dun ensemble en ses constituants afin de permettre
ltude et linterprtation des informations (Atkin, 2000). Dimportance gale, la synthse
quant elle vise regrouper un ensemble dlments afin daboutir une nouvelle
information (Peterson, 1998). Lanalyse criminelle est parfois dfinie comme la mise en
vidence mthodique de relations (Interpol, 1997), telles que des similitudes, des rgularits
ou des correspondances. La dtection dune relation sous-entend la fois une capacit
dcomposer les informations en entits (tels que des vnements et des personnes) entre
lesquels des relations sont recherches et la ncessit de reconstruire une connaissance
globale sur laquelle se base des dcisions. Lanalyse criminelle couvre donc un ensemble de
mthodes et de techniques exploites dans un processus commun afin daccomplir un
ensemble danalyses et de synthses. Le caractre systmatique de lanalyse criminelle rside
dans sa dmarche, fonde sur un ensemble organis de mthodes et de principes qui tiennent
en partie du domaine de la gestion de linformation.

Le processus systmatique de lanalyse criminelle est connu sous le nom de cycle du


renseignement (ou processus du renseignement). Ce processus est dcompos en tapes
souvent considres comme successives : planification, acquisition, valuation, intgration (ou
traitement), analyse, communication, action et rvaluation (Atkin, 2000) (Peterson et al.,
2000). Il est dusage de parler du cycle du renseignement en raison de sa nature itrative
(Innes et al., 2005). Divers modles ont t dfinis pour expliciter et reprsenter ce processus.
Les diverses formalisations du processus nintgrent pas formellement une tape de
visualisation de linformation. Elle est gnralement considre comme une technique
exploite lors des tapes danalyse et de communication. Atkin (2000) relve dailleurs que ce
formalisme ne dcrit pas les mthodes permettant datteindre les objectifs de chaque tape.
Le schma prsent ci-dessous ne vise pas la description du processus dans toute sa
complexit. Son objectif est de situer la place de la visualisation dans le processus. Il est
inspir du modle dcrit par Peter Pirolli et Stuart Card sous le terme de Sensemaking loop
(Pirolli & Card, 2005), en incluant la terminologie exploite dans cette thse.


10 Analyse criminelle et visualisation

Gestion de linformation

Acquisition Intgration Reprsentation

Rechercher et
Slectionner
Problme

Dcomposer et
Structurer
Donnes Agrger
acquises Filtrer
Calculer
Visualiser
Analyse criminelle

Informations
intgres

Informations
reprsentes

Raisonner et
Interprter

Rvaluer Connaissance

Recommander
Communiquer

Problme Renseignement
Agir
Figure 1 Processus de lanalyse criminelle


Processus de lanalyse criminelle 11

Ce schma est structur de la manire suivante :

Quatre tats reprsentent les donnes acquises, les informations intgres, les informations
reprsentes et la connaissance.
Cinq cycles sont reprsents pour dcrire des tapes du processus : le cycle dacquisition,
dintgration, de reprsentation, de raisonnement et de rvaluation.
Cinq tapes agrges qui dcrivent le processus linaire simplifi dlaboration du
renseignement.

Le processus est itratif. Il englobe un ensemble de sous-processus reprsents par des cycles
sur le schma. Des techniques spcifiques sont exploites pour accomplir les tches de
chacune de ces tapes. Le processus est dcompos en sous-systmes devant sintgrer dans
une architecture globale soutenant le processus de lanalyse criminelle. Toutefois, le processus
nen reste pas moins continu. Lune des difficults majeures de la transposition technologique
de ce processus est la formalisation des mcanismes de communication entre les sous-
systmes dvelopps. Les brves descriptions des tapes, prsentes ci-dessous, soulignent
certaines problmatiques fondamentales du processus.

Lacquisition est une tape cruciale du processus. Elle se base sur des choix et la dfinition de
priorits souvent imposes par le contexte (tels que les moyens disposition ou lurgence de
la situation). La variabilit des supports sur lesquels linformation est transmise
(principalement textuels, visuels et auditifs) et la diversit des formats posent de nombreux
problmes dacquisition. Le format des donnes de transactions bancaires ou de
communications tlphoniques rcoltes lors dune enqute par exemple, varie en fonction
des prestataires de service et sont parfois transmises sous la forme papier. Une mauvaise
valuation2 des besoins, de la pertinence et de la fiabilit des donnes rcoltes peut
engendrer des complications et une propagation des erreurs dans tout le continuum de
lanalyse. Laccessibilit des donnes doit galement tre rgle lors de cette tape du
processus. Loptimisation du processus de collecte peut faire lobjet dune analyse complte et
constitue un objectif de renseignement en soi (Ribaux et al., 2010).

Lintgration se caractrise par sa position centrale dans le processus de gestion de


linformation. Elle dcrit le processus de mmorisation qui comprend des tapes de
dcomposition des donnes (danalyses) et de structuration (de synthses). Les informations
sont gnralement structures sous la forme dentits, telles que des vnements, des

2
Lvaluation peut galement tre considre comme une tape danalyse entre lacquisition et lintgration.


12 Analyse criminelle et visualisation

personnes, des traces. Lintgration prsuppose la capacit transposer des donnes dans une
mmoire commune en termes dencodage, de formatage et de structuration. Les mcanismes
dalimentation, dinterrogation et de modification de la mmoire constituent les ponts entre
les processus dacquisition et de reprsentation dcrite ci-dessous. Lintgration est ltape
globale visant la prennisation des informations afin deffectuer une analyse permanente. La
mise en commun et le suivi du flux dinformations rcoltes au cours dune enqute ou plus
globalement dun phnomne criminel, font partie des tches principales de lanalyste
criminel.

La reprsentation regroupe les processus mis en uvre pour rendre linformation


perceptible. La reprsentation peut prendre diverses formes statiques : textuelle, image,
graphique et symbolique. Les formes dynamiques de types olfactives, auditives et de limage
anime sont rarement exploites dans le processus de lanalyse criminelle. La reprsentation
prsuppose en principe un encodage statique et textuel de linformation : une information
intgre (au sens du processus).

Ce travail de recherche se focalise sur lexploitation de visualisations. Le terme de visualisation


est utilis comme synonyme de reprsentation3 graphique. Parmi les auteurs qui se sont
intresss de manire gnrale aux visualisations, Jacques Bertin est considr comme lun des
prcurseurs de la smiologie graphique. La notion de reprsentation graphique dcrite ici est
tire de lun de ses ouvrages sur le sujet : smiologie graphique : les diagrammes - les rseaux
les cartes (Bertin 2005, premire dition en 1967).

La reprsentation graphique fait partie des systmes de signes que lhomme a


construits pour retenir, comprendre et communiquer les observations qui lui sont
ncessaires. (Bertin, 2005)

Le terme de signe est dfini comme la runion dun signifiant et dun signifi. Le signifiant est
la partie perceptible du signe (une image, un symbole, un mot, etc.). Le signifi est le concept
mental immatriel associ au signe. Par exemple, peut signifier flche. Trois rles de la
reprsentation sont dfinis par Bertin. Ils sont discuts en dtail dans la section suivante.
Lobservation est un concept gnral englobant les notions dinformation et de connaissance.


3
Une distinction entre les termes visualisation et reprsentation est prsente dans la section processus de
visualisation du chapitre Impact sur la conception doutils de la deuxime partie, page 195. Ces deux termes
sont toutefois utiliss comme synonymes afin dviter des rptitions trop lourdes.


Processus de lanalyse criminelle 13

Linformation est observe ; regarde avec attention. La connaissance est une observation
dans le sens o elle est le rsultat de lexamen minutieux dune information pour la
comprendre. En analyse criminelle, la visualisation de linformation pourrait se dcrire comme
la reprsentation dobservations. La notion de ncessit introduite par Bertin peut
probablement sinterprter de diverses manires. Elle semble englober les notions dintgrit
et defficacit qui sont discutes plus loin. Bertin souligne le fait que les observations
reprsentes doivent tre utiles et requises pour atteindre un objectif dfini.

La visualisation implique un certain degr de simplification et de rduction du problme


analys en regard dune ou plusieurs dimensions particulires dfinies par lobjectif danalyse
(Innes et al., 2005). La simplicit de la reprsentation est gnralement le rsultat de la
comprhension du problme trait par lanalyste (Peterson et al., 2000). Seuls les lments
pertinents et ncessaires pour analyser le problme sont reprsents. La conception dune
reprsentation implique donc non seulement une habilit produire un modle visuel
efficace, mais galement une capacit dvaluer quels sont les lments pertinents et de les
distinguer de ceux pouvant tre omis. Le processus, par nature itratif, ncessite gnralement
de nombreux tests avant daboutir une ou plusieurs reprsentations utiles lanalyse. Par
ailleurs, la nature volutive des problmes traits pose de srieuses difficults de
reprsentation. Celle-ci dcrit gnralement une situation un moment prcis (Innes et al.,
2005).

A ce stade du processus, un virage cl sopre : la transformation dune information en


connaissance. Lanalyste criminel effectue ce quil est courant dappeler son analyse bien que
cette terminologie engendre une confusion entre ltape et le processus global. En fait,
lanalyste raisonne sur la base des informations et les interprte pour leur donner un sens,
infrer une explication, chercher des causes possibles aux effets quil observe. Les informations
pralablement dcomposes en entits dintrts sont examines et compares afin de
reconstruire une vue globale du problme trait afin damliorer sa comprhension et
formuler des hypothses. Diverses thories sont alors exploites. Elles relvent de domaines
varis, tels que la forensique, la criminologie et linvestigation judiciaire. Par exemple, un
analyste criminel cherche dtecter des relations entre des cas, car il se base sur un ensemble
de thories criminologiques ayant montr une certaine constance dans le mode opratoire
des auteurs. Lanalyste cherche dtecter cette rgularit dans les informations quil traite. Il
exploite alors les rsultats du forensicien qui a relev des traces, les donnes circonstancielles
du cas (date, heure, lieu, cible, etc.), ainsi que les informations issues de lenqute
(signalement, butin, etc.).


14 Analyse criminelle et visualisation

La visualisation est exploite lors de cette tape du processus afin de faciliter les
raisonnements. Des cartes sont exploites pour dtecter des zones gographiques touches
par un phnomne criminel ou pour suivre lactivit dun auteur particulier. Des schmas
relationnels (reprsentation de rseaux) sont produits pour comprendre la structure dune
organisation criminelle, pour obtenir une vue densemble sur un trafic de marchandises ou
pour dcomposer une mode opratoire complexe. Des reprsentations temporelles sont
produites pour analyser la squence dune infraction particulire ou pour dtecter une
augmentation anormale dun phnomne criminel. Diverses formes de reprsentation sont
donc exploites en analyse criminelle pour analyser les informations collectes selon divers
axes qui rejoignent le questionnement Quintilien : qui, quoi, o, avec quels moyens,
pourquoi, comment et quand ? . Les reprsentations cartographiques et les schmas
relationnels sont les principales techniques exploites en analyse criminelle (Innes et al., 2005).
Les schmas relationnels permettent notamment davoir une vue densemble sur les relations
entre les suspects, leurs activits, les moyens utiliss et les cibles.

Finalement, le renseignement se distingue de la connaissance en tant que produit de


lanalyse criminelle dans la mesure o il intgre une recommandation (Ratcliffe, 2008). Un
renseignement vise la rsolution ou au moins lattnuation dun problme. Il peut intgrer une
proposition daction (Atkin, 2000). Le renseignement est un outil de la prise de dcision
bas sur lanalyse des informations (dans son sens large, englobant lensemble du processus
dcrit). La visualisation des informations peut galement jouer un rle important en matire
de communication entre les producteurs et les destinataires du renseignement. En effet,
lanalyste nest gnralement pas celui qui prend les dcisions. Il doit donc communiquer les
rsultats de son analyse. La reprsentation graphique peut alors jouer un rle pour faciliter
lapprhension des rsultats et faciliter lintgration des renseignements dans la prise de
dcision. Il faut cependant relever que les produits de renseignement transmis sont souvent
perus comme des reprsentations prcises et objectives du problme, alors quils sont en fait
souvent des descriptions synthtiques et simplificatrices (Innes et al., 2005). Lusage de
reprsentation peut renforcer limpression dobjectivit (Innes et al., 2005), confrer une plus
grande crdibilit aux rsultats prsents (Keim & Ward, 2007), voire concentrer lattention sur
les aspects du problme spcifiquement reprsents (Kelly, 1990). Une reprsentation
graphique peut donc influencer fortement lapprhension dun problme et la prise de
dcision. Lorsque la visualisation est inadapte, peu efficace ou biaise, les consquences
peuvent tre dramatiques. Prendre des dcisions ncessite une reprsentation adapte des
informations. Une bonne reprsentation aide mettre en vidence des connaissances sur les
mcanismes, les processus, la dynamique et les causes de problme trait (Tufte, 2005).


Processus de lanalyse criminelle 15

La visualisation est donc exploite lors des phases de raisonnement (danalyse) et de


communication. Il faut toutefois noter quelle peut galement tre utilise lors de lintgration.
En effet, bien que le processus formel de conception dune reprsentation graphique passe
par lintgration des informations dans un format adapt (une ou plusieurs tables), certains
outils4 exploitent la visualisation lors de ltape de structuration des donnes. Lobjectif de ces
logiciels est de simplifier le travail de lanalyste en englobant lensemble des processus
dintgration et de reprsentation en une seule tape. La facilit dutilisation de ces outils est
remarquable. Toutefois, ils engendrent des problmes importants. La structuration et la
reprsentation des informations sont dynamiques. Un mme type dinformation peut tre
intgr et reprsent de diverses manires, ce qui pose des problmes de recherche, de
cohrence et de lisibilit. Une telle approche bien quutile en terme defficacit (rapidit
dintgration et de reprsentation), ne rsout pas les problmatiques identifies dans cette
thse.

R l e s d e l a v i s u a l i s a t i o n d a n s l e p r o c e s s u s

Les mthodes de visualisation sont exploites dans de nombreux domaines et concentrent


diverses communauts de recherche. Les rles de la visualisation formaliss et dtaills par ces
travaux sont brivement prsents afin de complter et prciser les rles de la visualisation
dans le processus de lanalyse criminelle.

La visualisation est lun des supports externes dvelopps par lhomme pour augmenter ses
capacits cognitives (Norman, 1993) (Scaife & Rogers, 1996). Elle sert de mmoire et de
support de raisonnement, au mme titre que tous les autres supports (texte, bande son, etc.).
Lune des raisons pour lesquelles les reprsentations graphiques sont si utiles, est que
lhumain prouve des difficults traiter mentalement des problmes complexes. Les
reprsentations graphiques facilitent la rsolution de problmes en offrant une mmoire
vive externe (une mmoire court terme permettant de stocker linformation pendant un
raisonnement). Par exemple, des visualisations peuvent tre exploites au cours dune enqute
pour regrouper et synthtiser lensemble des informations collectes. Lenquteur peut ainsi
se remmorer rapidement les lments pertinents aprs une absence ou lorsquil doit prparer
une sance. Au tribunal, une reprsentation peut galement tre exploite pour regrouper en
un seul document un ensemble de donnes, souvent stockes dans une masse importante de


4
Voir notamment le logiciel TextChart de la socit i2 : http://www.i2group.com/us/products--services/analysis-
product-line/textchart (dernier accs le 26 aot 2010)


16 Analyse criminelle et visualisation

rapports, procs-verbaux, etc. La visualisation sert alors de support commode vitant les
efforts de mmorisation et facilitant la vue densemble (Bertin, 2005).

En effet, la visualisation est particulirement efficace par rapport une prsentation textuelle,
pour diverses raisons. Dans un texte, les informations sont disperses sur plusieurs pages, ce
qui rend la vision globale des donnes difficile. Linformation est structure squentiellement
plutt que simultanment (en parallle), rendant difficile la comparaison de plusieurs
variables. Une reprsentation visuelle est en revanche perue selon des processus parallles,
qui facilitent la vue densemble (Ware, 2004) (Atzenbeck et al., 2009a). Une reprsentation
adquate facilite la comparaison, la dtection de diffrences, lidentification de rgularits et
de tendances, ainsi que la dtection danomalies (Miles & Huberman, 1994) (Scaife & Rogers,
1996). Elle peut donc avoir un rle cl lors de ltape danalyse.

Comme dj mentionn, il est gnralement reconnu que la visualisation peut tre exploite
pour raisonner et communiquer (Card et al., 1999) (Chen et al., 2008). Certains auteurs font la
distinction entre lanalyse et lexploration des donnes. Lanalyse est considre comme
lvaluation dhypothses identifies, alors que lexploration vise la gnration dhypothses et
la recherche de connaissances sans ide a priori. Les termes danalyse exploratoire et danalyse
confirmatoire sont galement employs (Anselin & Getis, 1992). La visualisation est exploite
dans de nombreux domaines de connaissances o ces deux objectifs gnraux sont reconnus.

Lexploration visuelle des donnes sintgre donc dans le processus de gnration


dhypothses. Elle facilite lapprhension, la mise en perspective et la comprhension des
informations collectes afin de dvelopper les hypothses. Leur vrification peut galement
sappuyer sur des reprsentations, mais galement sur des techniques de la statistique, de la
reconnaissance de forme, ou de lapprentissage automatique (Keim & Ward, 2007). La
visualisation prsente cependant divers avantages par rapport aux techniques danalyse
automatises ; elle permet une exploration de donnes non-homognes, elle est souvent
intuitive et ne ncessite pas la comprhension dalgorithmes mathmatiques ou statistiques
complexes, elle produit une vue densemble qualitative sur les donnes et elle permet une
analyse rapide (Keim & Ward, 2007).

A des fins de communication, il sagira de dfinir quelles informations doivent tre


slectionnes et quelle est la manire la plus adapte de les reprsenter pour le lecteur. Les
choix effectus vont gnralement dpendre du contexte de la communication. Un graphique
nest en principe pas le mme dans un article scientifique imprim (o il est expliqu et


Processus de lanalyse criminelle 17

discut), quun graphique prsent quelques secondes au journal tlvis. Le public, son
attention, ses intrts, le moyen de communication et le temps de lecture disponible sont
autant de paramtres influenant le choix dune mthode de visualisation dans un objectif de
communication efficace (produire leffet voulu). En effet, la visualisation offre des perspectives
de communication trs intressantes dans le domaine de la rhtorique et, notamment,
lorsquil sagit de convaincre (de la qualit dun produit, de la pertinence dun propos, etc.). En
se basant sur des effets de perception connus, la visualisation peut tre exploite afin de
tronquer ou modifier la ralit des informations reprsentes. Des effets de design peuvent
galement tre exploits afin daccroitre une certaine attractivit, notamment lorsque la
visualisation est exploite des fins mdiatiques, politiques ou commerciales.

Dans son exploitation policire et judiciaire, la visualisation doit toutefois tre intgre. Elle ne
doit pas biaiser linformation initiale. En effet, les dcisions prises sur la base de visualisations,
peuvent avoir un impact important (notamment au niveau judiciaire) ou engendrer des cots
non ngligeables en termes de ressources et de temps (par exemple, lorsquil sagit de mettre
sur pied des oprations policires ou des mesures de prvention). Les reprsentations
graphiques se doivent donc dtre efficaces et intgres (Tufte, 2001). Elles doivent faciliter la
communication et plus particulirement lapprhension des renseignements en reprsentant la
ralit des informations sans ajouter des biais.

Globalement, la visualisation peut donc tre exploite pour quatre objectifs :

Mmoriser: afin d'effectuer des comparaisons, la visualisation permet de faciliter la


mmorisation en regroupant un grand nombre de donnes dans l'espace visuel. Un objectif
de synthtisation des informations peut galement tre atteint laide de reprsentations.

Explorer: l'analyse exploratoire regroupe l'ensemble des tches de recherche et


d'identification de rgularits ou danomalies particulires dans un ensemble de donnes.
Lobjectif est de dcouvrir de nouvelles connaissances.

Confirmer: l'analyse confirmatoire vise tester les hypothses dfinies. Elle sert de base la
prise de dcision. Lobjectif est de dtecter les lments confirmant ou non les hypothses
labores.

Communiquer: afin de transmettre une connaissance pour faciliter la comprhension d'une


problmatique ou communiquer un message, convaincre.


18 Analyse criminelle et visualisation

Le tableau prsent ci-contre couvre une grande proportion des objectifs tels quils ont pu
tre formaliss dans la littrature. Cette classification distingue les objectifs cognitifs attendus
et les manires de les atteindre par le biais de processus interactifs. Une telle formalisation
permet, notamment, de dfinir des protocoles d'valuation. En effet, les visualisations peuvent
ainsi tre testes en fonction de leurs possibilits, avantages et faiblesses pour la rsolution
dun objectif particulier. Bien que les types d'interactivits puissent tre varis est classifis de
manires plus ou moins hirarchises, le formalisme des niveaux de lecture5 propos par
Bertin (2005) a t choisi pour les classifier.

En conclusion, les rles de la visualisation dcrits dans cette section sont gnriques et
indpendants du problme reprsent et du contexte dexploitation. La section suivante
rsume les diverses formes danalyse dfinies dans la littrature afin de prsenter les diffrents
contextes dexploitation possible de la visualisation des fins de renseignement.


5
Alors quil y a autant de types de questions que de composantes (temporelle, spatiale, etc.) dans une information,
trois niveaux de lecture sont possibles : le niveau lmentaire de questionnement qui porte sur un lment
particulier ( quel moment? quel date?), le niveau intermdiaire qui porte sur un groupe dlments (pour une telle
zone, dans une telle priode que sest-il pass?) et le niveau global qui porte sur lensemble des lments analyss
(quelle est lvolution gnrale?).


Processus de lanalyse criminelle 19

Regrouper des donnes fragmentaires


Mmoriser Rsumer un ensemble dinformations

Identifier des relations, corrlations


Identifier des tendances
Effectuer des comparaisons
Explorer
Effectuer des prdictions
Objectifs
cognitifs Dcouvrir des anomalies
Dcouvrir des erreurs
Dtecter des donnes manquantes
Evaluer les incertitudes

Tester des hypothses


Confirmer
Prendre des dcisions

Communiquer Transmettre une connaissance

Zoomer: sur les lments d'intrt


Slectionner: un lment, un groupe
Niveaux de lecture Identifier: un lment, un groupe
Localiser: un lment, un groupe
Elmentaire Dtailler: informations complmentaires
Intermdiaire Extraire: sur des critres de recherche
Distinguer: des groupes
Processus Filtrer: les lments exclure
interactifs Trier: repartir sans filtrer
Grouper: classification et clustering

Scanner: vue d'ensemble des donnes


Global Calculer: des valeurs drives,
agrgations et dnombrements.

Figure 2 Classification des objectifs dexploitation de la visualisation


Classification synthtisant les formalisations de: (Bertin, 2005), (Wehrend & Lewis, 1990), (Shneiderman, 1996),
(Tweedie, 1997), (Pfitzner et al., 2003), (Amar et al., 2005), (Senator, 2005) et (Lee et al., 2006).


20 Analyse criminelle et visualisation

R e n s e i g n e m e n t e t f o r m e s d a n a l y s e
Le renseignement peut se dcomposer selon diverses perspectives. Dune part, en fonction de
la finalit de lanalyse, telle que la comprhension dun phnomne criminel afin de mettre en
uvre des mesures de luttes ou dvelopper de stratgies de prvention. Dautre part, en
regard des informations analyses comme lanalyse financire ou lanalyse de donnes de
facturation tlphonique par exemple. Diverses formes danalyse ont ainsi t dfinies dans la
littrature et reprises dans les manuels et modles nationaux. Les produits de renseignement
labors sont souvent accompagns de reprsentations graphiques adaptes pour rpondre
lobjectif danalyse et dfinies en fonction de la nature des donnes traites.

Certaines formes de visualisation apparaissent a priori plus adaptes pour certaines formes
danalyse (tel que suggr dans le guide sur lanalyse criminelle dInterpol (Interpol, 1997)). A
titre dexemple, lanalyse dun phnomne criminel est souvent accompagne dune carte
gographique reprsentant ltendue du phnomne. Lanalyse dun rseau criminel seffectue
galement en exploitant une reprsentation des relations et des rles des protagonistes. Afin
de discuter cette hypothse, les classifications dfinies en analyse criminelle sont prsentes. Il
est globalement admis que le renseignement peut se dcomposer en deux formes
principales :

Le renseignement stratgique fournit une vision long terme de l'volution d'un problme
de scurit. Les valuations stratgiques doivent permettre d'valuer les risques, prvoir
l'volution venir du problme et dfinir des stratgies et des priorits de lutte (en terme de
prvention et de rpression) (NCIS, 2000) (NCPE, 2005). Elles permettent galement
l'identification de lacunes combler en matire de renseignement. En effet, lanalyse aboutit
parfois la conclusion quil manque des informations, que les processus et fonctionnements
organisationnels sont inadapts et quil est ncessaire de repenser laction de renseignement.

Le renseignement oprationnel vise la rsolution dobjectifs prcis, gnralement court


terme, afin de dfinir des actions spcifiques (comme la mise en place de surveillance, ou
larrestation dun suspect). Les valuations oprationnelles proposent par l'identification de
problmes mergeants, des mesures pour prvenir, perturber ou empcher des activits
criminelles (NCIS, 2000) (NCPE, 2005). De telles valuations ncessitent un suivi permanent des
problmes et visent la dfinition doprations de police par exemple. Le renseignement
stratgique se base notamment sur le renseignement oprationnel, mais dans une vision
long terme.


Renseignement et formes danalyse 21

Lanalyse criminelle a galement t intgre dans la fonction de rpression au niveau de


linvestigation criminelle (de lenqute judiciaire). Le renseignement judiciaire peut se dfinir
comme l'ensemble des informations recueillies, dans un cadre juridique dtermin, par les units et services
investis d'une mission de police judiciaire, ayant fait l'objet d'un processus labor dont le but est de concourir la
rsolution des enqutes ainsi qu'au dmantlement des quipes de dlinquants et des rseaux relevant de la
criminalit organise (Carillo, 2010). En effet, la dmarche de lanalyse criminelle et les

techniques exploites ont rapidement t identifies comme efficaces et utiles pour traiter les
affaires dites complexes. Lanalyse criminelle ntant que peu ou pas du tout enseigne aux
enquteurs, le mtier danalyste criminel oprationnel sest dvelopp en tant que fonction de
soutien linvestigation criminelle. Cette dnomination engendre de la confusion entre le rle
de soutien lenqute et la fonction de renseignement criminel oprationnel. Le terme
danalyse criminelle tactique est parfois utilis pour faire cette distinction. Toutefois, il est
exploit par certains auteurs et dans certains pays pour dcrire la fonction de renseignement
oprationnel ou le soutien lenqute judiciaire.

Bien que le processus de lenqute vise la rsolution de cas et la prsentation des preuves
des fins judiciaires, les informations collectes par lenquteur, notamment lors des auditions,
sont exploitables pour des objectifs plus globaux de comprhension de lactivit criminelle. A
titre dexemples, des lments informatifs sur la structure et lorganisation des groupes
criminels, sur les motivations et les processus de recel sont des informations prcieuses des
fins de renseignement oprationnel, voire stratgique.

Le renseignement forensique couvre la fonction danalyse de la trace matrielle dans un


cadre plus large que linvestigation. En effet, lexploitation classique de la trace dans lenqute
judiciaire se base sur une squence dinfrences de base6 : lidentification, lindividualisation,
lassociation et la reconstruction (Inman & Rudin, 2001). La trace matrielle est principalement
tudie des fins judiciaires. Elle offre des perspectives de comprhension et de
reconstruction des activits criminelles, ainsi que dvaluation du degr dimplication des
suspects. La trace sintgre donc dans un processus de collecte, danalyse et dvaluation
visant minimiser les erreurs judiciaires. Le renseignement forensique tend le champ
dexploitation de la trace la dtection de relations en sappuyant sur le processus de lanalyse
criminelle et selon dautres structures dinfrences (Ribaux & Margot, 1999) (Ribaux et al.,
2003) (Ribaux et al., 2006): la classification par profilage, les comparaisons de sries et de cas
et la dtection de patterns (de tendances et de regroupements) notamment. Cette dmarche
conduit les services forensiques vers lintgration dune nouvelle fonction de renseignement.

6
Un processus permettant daboutir une conclusion partir dune observation (Kelly, 1990)


22 Analyse criminelle et visualisation

Ce changement de perspective est notamment observ en Angleterre depuis les annes


nonante. La contribution de la trace en termes de renseignement pour assister lenqute
judiciaire (notamment dans sa phase initiale) est ds lors considre comme principale
(Barclay, 2009). Cette vision tendue du rle de la trace implique des changements sur la
manire dapprhender la valeur informative des traces et, parfois, de modifier leur gestion et
leur analyse.

Ces quatre formes dexploitation de lanalyse criminelle ne dcrivent certainement pas de


faon exhaustive et prcise lensemble des fonctions de renseignement. La dcomposition
entre le niveau stratgique et le niveau oprationnel (tactique) est globalement reconnue
(Interpol, 1997) (NCIS, 2000) (GIWG, 2004) (Boba, 2009). Par contre, diverses approches de
classification plus fines de lanalyse criminelle ont t labores. Elles dcomposent lanalyse
en fonction de missions spcifiques. Un analyste seul ne saurait assumer lensemble des tches
qui ncessite de sappuyer sur la mthode de lanalyse criminelle. La diversit des modles
dfinis est certainement issue des diffrences de structures des organisations et des stratgies
de lutte. Divers modles ont donc t formaliss et sont probablement difficilement
transposables dune organisation lautre. Par ailleurs, les formes actuelles dcomposent
lanalyse par domaine de connaissances (comme lanalyse criminelle financire ou lanalyse de
communications tlphoniques).


Renseignement et formes danalyse 23

Lensemble de ces classifications sont issues de la littrature anglo-saxonne, lexception du


modle propos par Interpol qui est prsent en introduction (Interpol, 1997) :

Stratgique Oprationnel

Infraction Analyse de phnomne de Analyse de cas


criminalit
(exploitation dans linvestigation criminelle,
(nature, ampleur et dveloppement reconstruction du cas)
de la criminalit)
Analyse comparative de cas
(comparaison des cas, afin de les lier un
individu ou un groupe)
Auteur Analyse de profil gnral Analyse de profil spcifique
(identification de caractristiques (identifier les caractristiques du ou des auteurs
communes aux individus ayant dune infraction)
commis le mme type de cas)
Analyse de groupes dauteurs
(comprendre la structure, les rles dun groupe
criminel)
Mthode Analyse de mthode gnrale Analyse denqute
(valuation de la mthode de lutte, (valuation des tches accomplies au cours
en vue de lamliorer) dune enqute, afin de la faire progresser.
Identifier des problmes dans une enqute pour
ne pas les reproduire)

Les formes dfinies dans la littrature anglo-saxonne sont nombreuses et leur classification
hirarchise nest pas vidente. Elles se distinguent et se recoupent selon diverses dimensions.
Une reprsentation a t labore pour regrouper ces formes danalyses et les contextualiser.
Elles sont organises au sein de cinq types gnraux et positionnes en fonction des relations
quelles entretiennent entre elles. Ces relations ne sont pas explicites sur le schma, car elles
sont trop nombreuses et surchargeraient la reprsentation. Une brve description de chaque
forme danalyse est incluse.


24 Analyse criminelle et visualisation

(Bruce, 2009): Exploring Crime Analysis: Readings on Essential Skills


(Boba, 2009) : Crime Analysis and Crime Mapping
Crime analysis : tude du crime afin didentifier et analyser des patterns, des tendances et des problmes
Crime Intelligence analysis : tude des criminels et des structures criminelles
Criminal Investigative analysis : cration de profils physiques, comportementaux et psychologiques
Police Operations analysis : tudes des stratgies organisationnelles internes de la police
Administrative analysis : prsentation dtudes des fins administratives, politiques et de communication

Continuum de lanalyse criminelle : de loprationnel au stratgique
de lecture
Guide Crime analysis

Certaines formes sont Analyse de cas
Temporal analysis
reprises dans plusieurs
Crime Series

ouvrages, ou implicitement Flow analysis When events occurs, how long they last,
their frequency and regularity
dcrites. Pour simplifier la A crime pattern where there are reasons
Event-Flow analysis to believe that same p erson o r persons
reprsentation, une seule
committed the crimes

rfrence est indique (par la Sequence o f events in a criminal activity
Geographic

couleur). distribution analysis
Analyse comparative
Suspect Identification de cas

Lobjectif est de montrer que Geographic analysis
Attempt to identify and locate the
les variabilits
dcrites par suspect
To predict, disturb and disrupt criminal
ces formes danalyse Target/Victim Profile activity

couvrent plusieurs Case Matching
analysis
dimensions.
Link arrested people to other offences
Types of persons, structures, vehicles


La position des formes
Crime Intelligence analysis
Criminal Investigative

danalyses sur le plan nest
analysis Activity-Flow analysis Bank-Record analysis
pas rigoureuse. Elle soutient
Modus operandi
la contextualisation des Investigative analysis Commodity-flow a.
termes. Content analysis
Physical, behavioral and psychological Financial analysis
profile of suspect
Communication a.
Pattern detection and identification to

Target Profile analysis Oral and written communication discover a criminal activity

Describe he criminal, criminal activity,


lifestyle, associations, risks to target him


Analyse de profil Police Operations analysis

spcifique
Operations analysis
Geographic profiling Case analysis
Needs and U ses of internal ressources
Prioritize suspect investigations based on
the geographic distribution of serial crimes
Analyse denqute
Visual-Investigative a.
Criminal Business
Steps taken in the course o f an
Profile investigation
How criminal work and choose victims
Renseignement et formes danalyse 25

(Gottlieb et al., 1994) : Crime analysis: From first report to final arrest
(Interpol, 1997) : Guide sur l'analyse criminelle
(NCIS, 2000) : The National Intelligence Model (NIM)
(Peterson et al., 2000) : Intelligence 2000: Revising the Basic Elements; A Guide for
Intelligence Professionals
(IALEIA, 2004): Law Enforcement Analytic Standards (reprend les dfinitions du NIM
compltes par dautres formes danalyses)
(Paulsen et al., 2010): Tactical Crime Analysis: Research and Investigation


Crime Patterns Forecasting Future Forecasting and


Similar offenses in a defined geographic Crime Occurences Prediction

area: specific recurring modus and
geographic concentration patterns
Predictions attempt to foretell events,
forecasting perform strategic estimations
Analyse de
phnomne de la Forecasting
criminalit
Demographic & Social
trend analysis

Crime Pattern Analysis


Impacts of demographic changes and
social factors on criminality
Series identification, trend analysis, hot


spot analysis and general profile analysis


Market Profiles Risk analysis Statistical analysis

Survey of criminal market around a
particular commodity
Assess the scale o f risks

Review of n umerical data to summarize


Association analysis
Indicator analysis
Analyse de profil
Network analysis
gnral Review of p ast criminal activity to


Significance of links and roles
develop models to prevention purpose


Criminal Business
Analyse
de groupe Profiles
dauteurs
Operations, techniques, victims, etc.



Administrative


Operational Results analysis Analyse de mthode
Intelligence
gnrale
assessment
Evaluate effectiveness of activities analysis

Real time evaluation of all incoming Administrative
data to set priorities analysis
Resource Allocation Departmental
and Budgeting Planning activities

Nice to know stuff

26 Analyse criminelle et visualisation

A n a l y s e , p r o f i l e t p a t t e r n

Un vocabulaire rcurrent se dgage des formes de lanalyse criminelle. En effet, les termes de
profil et de pattern sont largement utiliss pour dcrire ce qui semble tre des produits de
lanalyse. Les deux notions sont discutes ici afin de clarifier la manire dont elles seront
utilises dans cette thse. Par ailleurs, la reconstruction dun profil et la dtection de patterns
sont des tches rcurrentes de lanalyse criminelle qui peuvent tre facilites par lutilisation
de reprsentation graphiques. Cet aspect est brivement introduit en fin de section.

En analyse criminelle, le terme de pattern est gnralement utilis pour dcrire un ensemble
de cas. Le terme de profil quant lui est principalement exploit pour dcrire un auteur ou un
groupe dauteurs. Ces nuances terminologiques apparaissent comme le rsultat de la
dcomposition du domaine en deux communauts : les analystes du crime et les analystes du
criminel. De manire plus gnrale, ces deux termes dcrivent toutefois des concepts
diffrents. Le terme de pattern a notamment un double sens quil sagira de ne pas confondre.
Un pattern dcrit un schma rcurrent ou une structure particulire. Il sera toutefois
galement utilis dans cette thse pour dcrire une solution adapte pour un problme
rcurrent de conception7 (en loccurrence, pour llaboration dune reprsentation graphique
utile pour un problme danalyse rcurrent).

Un profil peut se dfinir comme la description dun ensemble de similitudes observes entre
des personnes ou des objets. Il peut tre utilis pour identifier ou reprsenter un individu ou
un groupe (Ribaux, 2008). En matire danalyse comparative de cas, un profil dcrit un
ensemble dvnements pouvant tre de deux types : les sries et les groupes (Ribaux, 1997).
Une srie dcrit un regroupement de cas dont les similitudes permettent dinfrer un auteur
ou un groupe dauteurs commun, voire une cause commune en matire de scurit (par
exemple, dans le cas de lanalyse dune srie dincendies) (Ribaux & Margot, 2008). La notion
de groupe est plus gnrale. Un groupe est un sous-ensemble de cas partageant certaines
similitudes (spatio-temporelle, mode opratoire, cible, butin, etc.). Un profil peut tre
spcifique une dimension danalyse ou en inclure plusieurs (profil gographique ou profil
spatio-temporel par exemple). Lorsque lanalyse porte sur un auteur ou un groupe dauteurs,
le profil dcrit un ensemble de traits caractristiques de lauteur ou de son activit : profils
psychologiques, gographiques, etc. Dans le domaine forensique, un profil chimique ou
physique reprsente un ensemble de composs ou de caractristiques identifis et quantifis.
Il apparat que dans tous ces usages, le profil est le rsultat dun processus de reconstruction.

7
Cf. Patterns de visualisation relationnelle, page 144.


Renseignement et formes danalyse 27

Les lments constitutifs du profil sont slectionns et valus selon leur pouvoir
discriminatoire (leur capacit distinguer). Ils dfinissent la spcificit du profil.

Un pattern dcrit un schma rcurrent ou une structure particulire. En criminologie, la


thorie des patterns (Brantingham & Brantingham, 1993) dcrit les rgularits des activits
criminelles : les crimes sont regroups en pattern, les dcisions prises par les criminels suivent
des patterns, et des patterns dcrivent des processus mis en uvre pour commettre les
crimes. La thorie des patterns fait partie dun ensemble de thories regroupes dans le
domaine de la criminologie environnementale. La thorie des choix rationnels (le criminel
raisonne en fonction des cots et des bnfices engendrs par la commission du crime afin
deffectuer ces choix) et la thorie des activits routinires (le crime sintgre dans les activits
habituelles de lauteur et de la victime) en font partie galement (Felson & Clarke, 1998).
Comme soulign prcdemment, ces thories criminologiques ont un impact important sur
lanalyse criminelle. Si les crimes et les criminels suivent des schmas rcurrents, il doit tre
possible de les dtecter, formaliser et reprsenter. Ces patterns pouvant alors servir de base
pour le dveloppement dvaluations oprationnelles ou stratgiques. En matire danalyse du
crime, un pattern dcrit un ensemble de cas partageant des caractristiques communes, telles
que le type de dlit, le mode opratoire, le type de cible, une mme zone gographique, etc.

Dans le processus danalyse, un pattern peut tre dtect ou tre exploit comme infrence
lorsquil a t formalis (Senator, 2005). Dun point de vue cognitif, un pattern dcrit une
connaissance a priori exploite pour interprter et catgoriser de nouvelles observations
(Mennis et al., 2000). Lanalyste infre quune observation fait partie dun pattern lorsquil
observe des caractristiques constitutives de la dfinition du pattern. Un pattern est donc une
construction, un ensemble de relations quil est ncessaire de dtecter. Une relation est le
rsultat de lobservation dune correspondance, dune similarit ou dune rgularit
particulire par exemple. Le processus danalyse englobe le processus de dtection de pattern
et la comparaison dune nouvelle information avec un pattern connu. Tel que dcrit
prcdemment dans la section Rles de la visualisation dans le processus , les termes
danalyse exploratoire (ou analyse base sur les donnes) et danalyse confirmatoire (ou
analyse base sur un modle) sont parfois utiliss pour dcrire ces deux processus (Anselin &
Getis, 1992).

Les notions de profil, de pattern et de relations sont donc fortement lies. Un profil se
distingue toutefois dun pattern par sa complexit intrinsque et sa valeur informationnelle. Il
peut dcrire un ensemble de relations et de concepts varis. Le profil dcrit un groupe dont la


28 Analyse criminelle et visualisation

spcificit est suffisante pour tre pertinente en termes danalyse de la criminalit. Lobjectif
est dobtenir la meilleure reprsentation possible du groupe dfini. La construction dun profil
est une infrence en elle-mme (Ribaux & Margot, 1999), mais sa spcificit peut galement
conduire infrer lidentit. Cest le cas, par exemple, dun ensemble de loci formant un profil
ADN. Dans cette thse, lorsque le niveau de spcificit dun profil permet dinfrer une source
commune ou un type de source commun, le terme de relation est utilis (p. ex. les relations
ADN, les relations selon le motif de trace de semelles, etc.). Le terme de pattern est exploit
dans son sens de description dune certaine forme de rgularit.

Diverses formes de reprsentation peuvent tre exploites pour reprsenter des profils, des
patterns ou des relations8. Par exemple, les diagrammes coordonnes parallles (prsents
dans lannexe un) ont t invents spcifiquement pour lanalyse globale dun ensemble de
variables (comme le temps, le lieu, le type de cible, etc.) pour identifier des profils particuliers.
La description gnrale dun mode opratoire ou le profil dune activit criminelle particulire
peuvent tre reprsents par des schmas dactivits. Par ailleurs, des rgularits spatiales
peuvent tre dtectes en exploitant des cartes. Lors de la reprsentation de transactions
financires par un schma de flux, des mcanismes financiers rcurrents (des patterns)
peuvent tre dtects. Finalement, les relations identifies entre les membres dun rseau
criminel sont gnralement reprsentes au moyen dun schma relationnel qui facilite la
comprhension de la structure du rseau et la formulation dhypothses sur les rles de
chaque protagoniste. Des formes de visualisation particulire peuvent donc tre exploites
pour reprsenter des relations particulires, pour dtecter des patterns, voire des profils.

Objectif danalyse Produit de renseignement Visualisation

Dfini Guide le choix

Lobjectif danalyse dfini le type de produits de renseignement labor. Celui-ci guide le


choix dune ou plusieurs formes de reprsentation adaptes. La visualisation en tant que telle
ne saurait tre considre comme le produit de lanalyse, mais en est certainement une partie
centrale sur laquelle peuvent se baser les dcisions.


8
Les diffrents types de reprsentation sont prsents dans la section suivante et dans lannexe un.


Renseignement et formes danalyse 29

A n a l y s e s e l o n l e t y p e d e d o n n e s

Lobjectif danalyse est intimement li la nature du problme abord. Les formes danalyse se
dcomposent dailleurs en fonction du type de donnes trait. Lensemble des modles
classifient lanalyse selon quelle traite des infractions, des personnes ou des mthodes.
Lanalyse des mthodes (analyse denqute, doprations) ne traite pas directement de
lactivit criminelle, mais de la rponse policire. Cette forme danalyse traite des questions
lies lallocation et lefficience des ressources, afin dvaluer et dfinir de nouvelles stratgies
organisationnelles ou de nouvelles mesures policire (Bruce, 2009). En tant quobjet de
renseignement, la mthode policire ne fait pas partie de lanalyse de la criminalit.

La dcomposition de lanalyse criminelle selon quelle porte sur les cas ou sur les auteurs a t
largement discute dans la littrature (Ratcliffe, 2008) (Bruce, 2009). Il ressort de ces
discussions que les comptences et processus de ces deux formes gnrales se rejoignent. Les
diffrences se situent au niveau des objectifs et des missions danalyse. Les structures
policires et les stratgies daction de scurit mises en uvre influencent notamment la
dfinition de ceux-ci. Aux Etats-Unis, The Crime Analyst tudie les vnements criminels
afin de dtecter des patterns permettant de dfinir des stratgies de prvention et des
mesures de suppression ou de perturbation de la criminalit. The Criminal Intelligence
Analyst tudie les organisations criminelles afin de soutenir le processus de linvestigation
criminelle (Bruce, 2009). Cette dcomposition reflte un choix stratgique national important.
Linvestigation criminelle est choisie comme mesure de lutte prioritaire lors de crimes graves.
Alors que les rponses policires face aux dlits sriels lis aux infractions contre le patrimoine
sont prventives ou axes sur la rsolution de problmes : Local crime analysis identifies the location
of crime problems, criminal targets and vulnerable victims to prevent and reduce crime, while investigative analysis
assists with solving and the prosecution of offenders by providing information for presentation at court (Cope,

2003). Lanalyse criminelle sintgre donc dans un contexte complexe qui a influenc la
dfinition des formes danalyse. Comme en tmoigne le diagramme prsent prcdemment,
limage globale actuelle de ces diffrentes formes est difficilement structurable.

Dautres formes danalyse sont dfinies selon la nature des problmes de scurit traits. Cest
le cas par exemple, de lanalyse financire criminelle : L'analyse Financire Criminelle (AFC) est un
ensemble de mthodes techniques et d'outils appliqus l'investigation conomique et financire. Elle consiste
principalement l'exploration, l'analyse et l'exploitation de donnes, d'origines et de nature diffrentes, destine
donner une reprsentation spatio-temporelle, des liens existant et de rapprochement entre des entits et des
faits. (AGIS, 2004) En suivant ce modle, il serait alors possible de dfinir dautres types

danalyse, tels que lanalyse criminelle des dlits contre le patrimoine, de la criminalit


30 Analyse criminelle et visualisation

organise, des dlits contre lintgrit corporelle, ou encore lanalyse criminelle de trafics de
stupfiants. Toutes ces formes danalyse ont une ralit, mais une telle dcomposition ne
semble pas adquate pour classifier les mthodes exploites. En effet, les mthodes et
techniques ne se diffrencient pas forcment en fonction du sujet trait. Des formes de
reprsentation particulires sont effectivement plus utiles pour certains problmes spcifiques.
A titre dexemples, un schma de flux permet de reprsenter un trafic de stupfiants et un
schma dvnements est exploit pour reprsenter une srie de cambriolage. Une telle
classification est utile afin de structurer des connaissances particulires lies la dmarche et
lexploitation des techniques pour des situations danalyses spcifiques. Toutefois, il est
reconnu que ces formes danalyse ne permettent pas de classifier les mthodes et techniques
de lanalyse criminelle de manire globale (Bruce, 2009). En effet, les mthodes de traitement,
de gestion et de reprsentation des informations sont exploites de faon transversale. Un
schma relationnel peut notamment tre utilis pour reprsenter les relations existantes entre
des vnements, mais galement pour reprsenter un rseau criminel. Une classification plus
globale des formes danalyse est ncessaire afin de guider les choix effectuer en matire de
visualisation.

D i m e n s i o n s d a n a l y s e e t f o r m e s d e
v i s u a l i s a t i o n
Lobjectif de cette section est de proposer une dcomposition des formes danalyse utile pour
slectionner une mthode de visualisation adapte en vue de rsoudre les questions poses.
Certains auteurs suggrent que le choix dun graphique est essentiellement dtermin par la
nature des donnes et parfois par lobjectif de la prsentation (Pattyn & Dickens, 2001).
Lapproche dcrite ici, quant elle, part dune dcomposition de lobjectif danalyse selon une
ou plusieurs dimensions dominantes pour dterminer le type de reprsentation concevoir.
Dans le domaine de lanalyse criminelle, la dfinition des dimensions danalyse est visiblement
une tche difficile :

Event visualization can be defined as the visual representation of spatial, temporal and other dimensions of
events... Events involving more than one dimension frequently occur because humans often handle multiple event
dimensions concurrently with their various senses. These events require powerful visualization capabilities to
display various dimensions (e.g., space, time, person, event aggregation). (Chung et al., 2005)


Dimensions danalyse et formes de visualisation 31

Typical crime data will have either a geographical nature, and/or contain a large number of features, and/or
involve networks of offenders. Types of technologies relevant to these different aspects are: geocoded data, large
feature sets, offender networks. (Oatley et al., 2006)

Il est intressant de noter que les analystes spcialiss dans lanalyse de rseaux criminels ne
dfinissent pas le temps comme une dimension dominante (le modle de lIALEIA (Peterson et
al., 2000) ne dcrit pas formellement de temporal analysis). La notion de dominance semble
tre une des cls de dcomposition. Une dimension est juge comme dominante si elle
impose les plus fortes contraintes sur lanalyse (Mennis et al., 2000). Par exemple, si lanalyse
porte sur la distribution gographique dun phnomne criminel pour une priode donne, la
dimension spatiale est la dimension dominante (ou principale). En effet, dans cet exemple, le
temps est invariant (une seule priode). En revanche, si la question porte sur la chronologie
des vnements, le temps devient alors la dimension dominante.

Globalement, deux dimensions sont dcrites de manire rcurrente et semblent dominantes :


la composante temporelle et la composante spatiale. Ces deux dimensions ne sont toutefois
pas suffisantes pour dcrire lensemble des questionnements impliqus lors de lanalyse de
donnes de criminalit. Une troisime dimension principale est dfinie : la composante
relationnelle. De manire gnrale, ces trois dimensions danalyse semblent tre pertinentes et
fondamentales pour traiter et interprter les phnomnes de criminalit (Oatley et al., 2005)
(Ribaux, 2008). Bien quune relation puisse tre de nature temporelle ou spatiale, il est
ncessaire de dfinir une dimension au sein de laquelle dautres formes de relations se
distinguent. Adrienko et Adrienko dfinissent cette troisime dimension sous le terme de
population : un groupe dentits pouvant tre de diverses natures (Andrienko & Andrienko,
2005). Dautres auteurs parlent dune dimension thmatique complmentaire aux dimensions
temporelle et spatiale (Mennis et al., 2000) ou dune dimension smantique (Pelekis et al.,
2004), iconique (MacEachren, 2004), voire en catgories (Fredrikson et al., 1999). Elle dcrit un
ensemble dobservations mesurables constitutives dune entit (Mennis et al., 2000). La
notion dentit est rcurrente dans lensemble des dfinitions de cette dimension. Cette
dcomposition en trois dimensions est dailleurs galement utilise pour dcrire la manire
dont lhumain mmorise les connaissances selon trois structures : savoir-quoi, savoir-quand,
savoir-o (Mennis et al., 2000).

Dfinir formellement la dimension relationnelle nest pas une tche facile. Afin de tenter de
lexpliciter pour le domaine de lanalyse criminelle, les diffrents types de rgularits dtectes
dans cette dimension sont dcrits. Rachelle Boba dfinit sept types de patterns principaux


32 Analyse criminelle et visualisation

(Boba, 2009): la srie9, le spree (ensemble de cas perptrs sur une priode trs courte par
un individu ou un groupe spcifique ; plus spcifique quune srie qui peut durer sur une
priode plus ou moins longue), la multi-victimisation (dun mme individu ou dun ensemble
de victimes partageant des caractristiques communes), la rcidive (auteur ou groupe
dauteurs), le Hot spot (point chaud : lieu spcifique ou rgion peu tendue o un nombre
inhabituel de cas est observ sur une courte priode), la Hot target (types de lieu, de cible
frquemment touchs) et le Hot product (type de bien frquemment cibl par un type de
criminalit). Les formes de rgularits formalises ne sont pas mutuellement exclusives et elles
intgrent plusieurs dimensions (notamment les dimensions spatiales et temporelles). Les
rgularits sont galement recherches parmi les attributs des auteurs, des cibles (victimes et
objets) et des lieux (pas seulement au niveau de leurs positionnements gographiques, mais
galement de leurs spcificits). Cette dcomposition rejoint le formalisme du problem
analysis triangle 10 (Felson & Clarke, 1998) (Eck, 2003).

La dimension relationnelle pourrait se dfinir comme


intgrant les variabilits observes et analyses entre le
problme (lactivit criminelle / lvnement), lauteur, la
r

Lie
teu

cible (personne ou objet) et le lieu. Cette dimension ne


Au

Problme couvre pas lanalyse des distributions temporelles et


spatiales, mais les relations observes entre les diffrentes
Cible
caractristiques de ces quatre entits gnriques.

Une quatrime dimension dominante semble ncessaire pour classifier les mthodes de
visualisation de manire efficace en regard des types de questionnements : la composante
quantitative. En effet, de nombreuses questions sont du type : quel est le nombre de . Sil
fallait illustrer graphiquement ce propos, il ne serait pas ncessaire de chercher une
visualisation de type relationnelle, spatiale ou temporelle. Un nombre important de
visualisation a t spcifiquement dvelopp pour lanalyse quantitative. Il est vrai que le
dnombrement est trs frquemment mis en regard dune dimension complmentaire : quel
est le nombre de cas par rgion, quel est lvolution temporelle du nombre de victime, etc.
Dans ces cas, se pose invitablement la question de la dominance : quelle est la dimension
principale ? Mais les questions de type combien sont nanmoins frquentes et impliquent
des reprsentations propres.


9
Cf. Analyse, profil et pattern, page 26
10
http://www.popcenter.org/about/?p=triangle, dernier accs le 7 septembre 2010


Dimensions danalyse et formes de visualisation 33

D i m e n s i o n s d a n a l y s e

Les questions danalyse semblent pouvoir se dcomposer selon quatre dimensions principales.
Cest--dire quatre composantes dans lesquelles la variabilit est observe et qui sont
rcurrentes dans les questions danalyse.

La dimension temporelle couvre les questions lies lanalyse dune distribution


temporelle. Le temps est la composante principale de lanalyse. Les rponses aux questions
poses doivent se chercher dans la variabilit temporelle : quand, sur quelles priodes,
quelle frquence, selon quelle rgularit temporelle, etc.

La dimension spatiale couvre les questions lies lanalyse dune distribution gographique.
Lespace est la composante principale de lanalyse. Les rponses aux questions poses
doivent se chercher dans la variabilit spatiale : o, dans quelle rgion, selon quel parcours,
quelle tendue gographique, etc.

La dimension relationnelle couvre les questions lies lanalyse des relations entre les
entits pertinentes, telles que les vnements, les personnes, les objets et les traces. La
relation est la composante principale de lanalyse. Les rponses aux questions poses doivent
se chercher dans la variabilit relationnelle : qui, quoi, entre qui, entre quoi, avec quoi, etc.

La dimension quantitative couvre les questions lies au dnombrement. Le nombre est la


composante principale de lanalyse. Les rponses aux questions poses doivent se chercher
dans la variabilit quantitative : combien de, selon quelle proportion, etc.

Pour chaque dimension, des reprsentations spcifiques sont exploites. Cette dcomposition
selon quatre formes de questionnement principales permet de classifier et tudier les diverses
formes de reprsentation exploitables en analyse criminelle. En effet, les formes de
reprsentation classifies dans les recherches sur la visualisation rejoignent ces dimensions.
Elles sont prsentes dans la section suivante.


34 Analyse criminelle et visualisation

F o r m e s d e v i s u a l i s a t i o n

Selon Bertin (2005), on ne saurait analyser un systme de signes sans le dlimiter strictement :
la graphique recouvre lunivers des rseaux, celui des diagrammes, et lunivers des
cartes.

Cette dlimitation stricte exclut de la reprsentation graphique les critures musicales,


verbales et mathmatiques, ainsi que la symbolique et limage anime. Il apparat inutile et
certainement difficile dexpliciter les dfinitions smiologiques de ces formes. Celles-ci
distinguent ces trois types de reprsentation en fonction des possibilits dexprimer les
relations entre les lments des variables reprsentes sur le plan. Des dfinitions plus simples
sont prsentes :

- Les cartes regroupent lensemble des reprsentations dites cartographiques, cest--dire


dont les dimensions du support sont exploites pour reprsenter les dimensions de la
localisation. En analyse criminelle, les cartes sont videmment exploites pour effectuer
des analyses spatiales.

- Les diagrammes forment un ensemble de visualisations communment appel des


graphiques , tels que les diagrammes en barres (histogrammes), en camembert
(diagramme circulaire sectoris) et les nuages de points (diagramme de dispersion).
Les diagrammes sont utiliss la fois pour effectuer des analyses quantitative et des
analyses temporelles.

- Les rseaux sont des constructions bases sur la reprsentation de sommets relis par des
artes. Selon Bertin (explicitation libre de la dfinition), une visualisation est un rseau
lorsque tous les lments dune des dimensions reprsentes sur le plan peuvent tre en
relation. Ils offrent donc une libert dexpressivit, pour une dimension donne,
suprieure aux autres formes de graphique. Ils font lobjet dtudes approfondies
subsquentes aux travaux de Bertin. En analyse criminelle, il est dusage de parler de
schmas relationnels lorsque des rseaux sont labors pour effectuer des analyses dans
la dimension relationnelle.

Cette classification tripartite des mthodes de visualisation propose par Bertin (2005) est la
seule taxonomie trouve dans la littrature qui est uniquement base sur la reprsentation
graphique et qui permet une classification simple. En effet, les autres classifications (voir


Dimensions danalyse et formes de visualisation 35

notamment (Lohse et al., 1994), (Card & Mackinlay, 1997) et (Card et al., 1999)) dcrivent des
classes en fonction de la nature des donnes, des tches accomplir, ou proposent des sous-
catgories de la taxonomie de Bertin. Les icnes et les images sont parfois galement
considres comme des mthodes de visualisation (Lohse et al., 1994).

Effectuer un inventaire exhaustif des mthodes de visualisation est d'envergure


encyclopdique (comme en tmoigne louvrage de Harris (Harris, 2000)). La diversit et le
nombre de mthodes de visualisation existantes complique considrablement le processus de
classification. A titre d'exemple, les sites Internet rpertoris ci-dessous, illustrent l'tendue
(invitablement incomplte) des possibilits et diverses approches de classification:

http://www.math.yorku.ca/SCS/Gallery/ (Gallery Data Visualization) 11


"The Gallery of Data Visualization" regroupe un ensemble de visualisations lies l'analyse
statistique. Les reprsentations sont prsentes historiquement et selon une valuation
critique de leurs performances (essentiellement base sur les travaux de Tufte (2001)).

http://otal.umd.edu/olive/ (Olive Visualization)


Le projet OLIVE "On-line Library of Information Visualization Environments" regroupe des
produits, des projets de recherche, des citations et des vidos, selon une classification base
sur le type de donnes visualises (Shneiderman, 1996): donnes temporelles, uni-, bi- et
tridimensionnelles, multidimensionnelles, arbres et rseaux. Le site a t dvelopp, en 1997,
par une classe du professeur Schneiderman, de l'universit du Maryland.

http://www.wikiviz.org/wiki/Techniques (Wikiviz)
Wiki cr et maintenu par Riccardo Mazza, professeur l'Institute of Innovative Technologies
at the University of Applied Sciences of Southern Switzerland. Les reprsentations sont
classifies en sept catgories: donnes uni-, bi- et tri-varies, donnes multi-varies, donnes
temporelles, donnes spatiales, donnes hirarchiques, rseaux et donnes textuelles.

http://www.visual-literacy.org/periodic_table/periodic_table.html (Periodic Table Visu)


Lengler et Eppler proposent une classification complexe et dense des mthodes de
visualisation en exploitant une analogie avec le tableau priodique des lments, dvelopp
dans le domaine de la chimie (Lengler & Eppler, 2007). Une lecture interactive sur le site web


11
URL : mots-cls Google (premier rsultat), (Derniers accs pour lensemble des sites, le 01 septembre 2009)


36 Analyse criminelle et visualisation

permet de dcouvrir des exemples pour chaque catgorie. Alors que les dtails de cette
taxonomie ne seront pas discuts ici, il est intressant de relever l'objectif dfini pour ce
projet. Les auteurs proposent une taxonomie permettant au lecteur d'identifier rapidement
une mthode adapte pour une tche particulire dans un domaine d'activit dfini (le
management). Cette taxonomie, principalement axe sur la mtaphore graphique employe,
combine des classifications lies la nature des donnes et aux tches effectuer.

http://manyeyes.alphaworks.ibm.com/manyeyes/ (Many Eyes)


Le projet Many Eyes, dvelopp par le Collaborative User Experience research group dIBM,
offre une interface en ligne de cration et de partage de visualisations. Des types de
visualisations sont classifis dans six catgories principales dfinissant des types de tches :
voir les relations entre des donnes, comparer des ensembles, suivre des tendances
temporelles, analyser des portions, analyser du texte et tudier lensemble des donnes.

Cette thse se focalise sur les reprsentations de lanalyse relationnelle. Elle est prsente dans
la section suivante. Les dimensions temporelle, spatiale et quantitative et leurs formes de
reprsentations respectives sont prsentes dans lannexe un.

A n a l y s e e t v i s u a l i s a t i o n r e l a t i o n n e l l e
Lanalyse relationnelle est centrale en analyse criminelle. Elle consiste en la dtection, la
compilation et linterprtation des informations afin didentifier la prsence de relations entre
des entits dintrts (p. ex. des personnes, des vnements, des vhicules, des socits, etc.)
(Harper & Harris, 1975) (Schroeder et al., 2007) (Heuer & Pherson, 2010). Elles permettent de
rechercher et de poser des propositions telles que, quelle est la source de cette trace, qui a
tlphon avec qui, etc. Lorsque beaucoup de relations sont en jeu dans une affaire, il devient
videmment utile de les visualiser. Alors que certains auteurs dfinissent lanalyse relationnelle
comme le processus didentification et dextraction des entits et relations au sein des
donnes collectes (Pottenger et al., 2007), le terme danalyse relationnelle est gnralement
exploit en analyse criminelle pour dcrire lexploitation de reprsentations relationnelles
des fins danalyse. Le terme de visualisation relationnelle semble plus adapt dans ce sens.

Le processus danalyse relationnelle prsume la capacit didentifier les entits pertinentes.


Des lments de la ralit entre lesquels lanalyste cherche identifier et comprendre les
relations. Une entit se dfinit comme une chose possdant une existence distincte et


Analyse et visualisation relationnelle 37

identifiable12 (littralement Chen dfinit lentit comme une chose pouvant tre distinctement
identifie) (Chen, 1976). Les entits sont regroupes par type dans des classes, telles que les
personnes, les traces, les moyens de communications, etc. Les termes de type et classe seront
utiliss comme synonyme. Un type dcrit le prdicat est un . Par exemple John Doe est
une entit de la classe personnes .

Ltape didentification des entits constitue lune des tapes les plus accaparantes du
processus de lanalyse relationnelle. Un domaine de connaissances est notamment souvent
dcrit comme un ensemble de relations entre des entits quil a t possible de nommer. La
notion dentit nomme (Named entity) fait rfrence ltape de raisonnement utilise pour
dfinir la relation entre une observation (une valeur, un objet) et son type (sa catgorie, sa
classe). Cette tape concentre un nombre important de recherches et defforts afin dextraire
des entits nommes au sein de donnes textuelles non structures (Mennis et al., 2000) (Chen
et al., 2003) (Kolda et al., 2004) (Schroeder et al., 2007) et (Pottenger et al., 2007).

En matire danalyse criminelle, lanalyse relationnelle est trs souvent dcrite comme lanalyse
de relations entre des entits nommes :

Link analysis: this type of diagram displays the associations between different entities, which may be a person,
vehicle, organisation, telephone number etc. It will also show the flow of commodities such as money or
property. (Adderley & Musgrove, 2001) p.106

Link analysis puts information about the relationships among entities individuals, organizations, locations and
so on into a graphic format and context that will clarify relationships and aid in inference development. (UNODC,
2002) p.29

There are four types of searches available to the user: person, vehicle, incident and location. The system can
automatically identify relationships among Person, Organization, Location, Vehicle, and Incident and Crime
type. (Chen et al., 2003) p.30

Link analysis by visualizing associations between entities and events. Typically, the entities of interest include:
places, organisations, facilities, individuals, components, documents, money, weapons, vehicles, drugs.
(Mena, 2003) p.80

In crime analysis, it is often useful to identify the relationships among different entities such as people, vehicles,
addresses, organizations, etc. (Xiang et al., 2005) p.70

Link diagrams, showing the connections between people, places, events, and things, are invaluable tools in these
domains. (Senator, 2005) p.80

Relational data about world-wide terrorist events is available, as well as ontologies describing the organization of
this data. (Barthlemy et al., 2005) p.97

Through link analysis, investigators draw, lay out, and link people, facts, locations, events, objects, and data in
hopes of discovering key trends, patterns, and insights. (Wong et al., 2006) p.67

In law enforcement, intelligence analysts often refer to nodes and links in a criminal network as entities and
relationships. The entities may be criminals, organisations, vehicles, weapons or bank accounts. The
relationships between the entities specify how these entities are associated together. (Oatley et al., 2006) p.66


12
http://www.merriam-webster.com/dictionary/entity, dernier accs le 4 avril 2001


38 Analyse criminelle et visualisation


We developed a model for organizing local data into a network of annotated relationships between people,
vehicles, and locations. (Marshall et al., 2008) p.14

We already applied Jigsaw to explore connections between people, places, and organizations in the Bible. (Stasko
et al., 2008) p.127

Using such tools it is possible to extract entities (such as people, places, dates, and organizations) from the
evidence and relate them to each other through time lines or other relation schemes. These tools thus provide the
analysts with a visual overview of the case at hand and the connections between various types of entities. (van den
Braak, 2010) p.5

The essence of a criminal investigation, therefore, may be summarised as the study of actual and potential time
dependent relationships between people, organisations, objects, places and events that may be associated with
criminal activity in order to model and reason about possible patterns of activity. (Maller, 1996) p. 94

La reprsentation de la dmarche de lanalyse relationnelle prsente dans (Maller, 1996) p. 96


est par ailleurs trs vocatrice:

people

places
ce
ur
so
Documents


source
reports links vehicles
etc.
so
u rce

cases

Stored information and events


registration details Intelligence model

De cette revue bibliographique, il ressort que des types dentits sont gnralement dcrits. Ils
correspondent aux types dentits sur lesquels portent les investigations : des vnements, des
personnes, des socits, des objets, des vhicules, des lieux, des traces, etc. Il est trs
intressant de relever que la description de types de relations est plus gnrale. A lexception
des relations de types spatio-temporelles, aucun autre type de relation nest clairement dfini.
La diversit de la nature des relations pose alors la question de la dfinition de types
gnriques. Une dmarche de classification en diffrents types de relation ne pourrait-elle pas
aider dfinir la manire de les reprsenter ?


Analyse et visualisation relationnelle 39

Par ailleurs, les schmas relationnels exploits visent rpondre des problmes danalyse.
Ces questionnements sont souvent exprims au travers dexemples spcifiques :

- Quelles sont les relations existantes ou absentes entre les individus ? (Harper & Harris, 1975) (Schroeder et
al., 2007)
- Qui est la personne centrale dune organisation ? (Harper & Harris, 1975) (Sparrow, 1991) (UNODC, 2002)
(Mena, 2003)
- Quelle est la frquence des relations ? (UNODC, 2002)
- Quelles sont les relations entre les identits des individus (les alias) ? (Sparrow, 1991) (UNODC, 2002)
(Mena, 2003)
- Quelle est la structure hirarchie dun groupe criminel ? (Harper & Harris, 1975) (UNODC, 2002) (Senator,
2005) (Xu & Chen, 2005)
- Quelles sont les personnes les plus importantes dun trafic (dont la suppression limpact le plus
perturbant sur le rseau) ? (Sparrow, 1991) (UNODC, 2002) (Mena, 2003)
- Quel est le rle de chaque individu dans lorganisation ? (Sparrow, 1991) (UNODC, 2002) (Xu & Chen,
2005)
- Quel individu fait office de pont entre les membres de lorganisation ? (UNODC, 2002)
- Quel est le chemin (ensemble de relations indirectes) entre deux individus ? (Schroeder et al., 2007)
- Existe-t-il des sous-rseaux dans un rseau complexe ? (Mena, 2003) (Xu & Chen, 2005)
- Quels sont les relations entre les sous-rseaux ? (Xu & Chen, 2005)
- Existe-t-il des relations ou des entits caches ? (Mena, 2003)
- Quels sont les rles des individus pour chaque vnement ? (Senator, 2005) (Schroeder et al., 2007)
- Quelles sont les cooccurrences dvnements entre des individus ? (Schroeder et al., 2007)
- Quelles sont les rgularits ou les anomalies observes dans un flux financier ? (Sparrow, 1991)
- Quelles sont les communications tlphoniques les plus pertinentes et utiles surveiller ? (Sparrow, 1991)
(UNODC, 2002)
- Quelles sont les relations de causalit entre les observations ? (Bex et al., 2003)
- Quels patterns relationnels sont observables et en quoi permettent-ils de comprendre un comportement
particulier ? (UNODC, 2002)

Cette liste, videmment non exhaustive, illustre la complexit et la diversit des


questionnements possibles dans la dimension relationnelle. Des cadres conceptuels semblent
avoir t plus clairement formaliss pour dcrire les dimensions temporelles et spatiales13que
pour dcrire la composante relationnelle.

Une terminologie riche existe pour dcrire les reprsentations associes lanalyse
relationnelle. On parle parfois dun schma relationnel, dun rseau, dun arbre, dun
diagramme ou dun graphique relationnel, ou encore dune carte smantique ou conceptuelle.
Ces formes de reprsentation sont modlises en mathmatiques par la thorie des graphes
qui remonterait aux travaux de Leonhard Euler en 173514. Un graphe est une reprsentation
abstraite dun ensemble dobjets (des sommets), dont certaines paires sont relies par des
liens (des artes). La dimension mathmatique nest pas aborde dans cette thse qui traite
uniquement de la dimension visuelle des graphes. En mathmatique, les artes dun graphe ne
peuvent relier que deux sommets. Dun point de vue purement visuel, cette limitation nest pas
forcment souhaitable. Les schmas tudis dans cette recherche sont donc parfois des


13
Cf. Annexe 1: Dimensions danalyse et visualisation, page 233
14
http://www.math.dartmouth.edu/~euler/pages/E053.html, dernier accs le 16 aot 2010


40 Analyse criminelle et visualisation

hypergraphes (graphes o les artes peuvent lier plusieurs nuds), au sens mathmatique.
Dans le cadre de cette thse, nous assimilerons les schmas relationnels des rseaux ou
des graphes.

La visualisation relationnelle est lexploitation de graphes pour visualiser un ensemble


htrogne dentits, de relations et dattributs classs par types. Cette dfinition rejoint la
dfinition des graphes smantiques ou conceptuels (Kolda et al., 2004) (Barthlemy et al.,
2005) (Wong et al., 2006) et des rseaux/graphes complexes (Newman, 2003).

Klerks dcompose les formes de visualisation relationnelle exploites en analyse criminelle


selon trois gnrations de techniques (Klerks & Smeets, 2001) : the manual approach, the
Graph-based approach et the Social Network approach.

Lapproche manuelle initie la fin des annes soixante aux Etats-Unis par le programme
Anacapa (http://www.anacapasciences.com/, dernier accs le 13 septembre 2010) (Harper &
Harris, 1975) et dcrit par Morris dans son livre The Crime Analysis Charting (Morris, 1986)
se base sur la cration dune matrice reprsentant les relations entre les personnes qui
apparaissent dans laffaire. Un schma relationnel est ensuite produit sur la base de cette
matrice. Lapproche manuelle est encore utilise, mais les graphes sont produits en utilisant
des logiciels spcialiss qui permettent dtendre les attributs graphiques exploitables (icnes,
couleurs, paisseur des
traits, etc.). Initialement, la
mthode reposait sur une
reprsentation simplifie
de cercles (les personnes),
de traits (les relations) et
de cadres (les groupes :
organisations criminelles et
entreprises) (Harper &
Harris, 1975) (Sparrow,
1991).

tir de (Harper & Harris, 1975)

Harper et Harris (1975) rfrencent des exploitations antrieures de schmas relationnels dans
le domaine de lingnierie o ils sont notamment utiliss pour reprsenter des processus de


Analyse et visualisation relationnelle 41

fabrication. En fait, lexploitation de graphes pour reprsenter les informations dune enqute,
se retrouve dj dans les travaux de John Henry Wigmore (1863-1943) (Wigmore, 1913). La
mthode de Wigmore appele argument diagram et un rsum des travaux rcents bass
sur sa mthode sont prsents dans lannexe deux.

La seconde gnration de techniques est base sur lutilisation de logiciels. Par le biais dun
filtre dimportation, les donnes structures sous la forme de tableaux sont visualises par des
graphes. Certains auteurs relvent le fait que ces approches se basent sur les capacits des
utilisateurs identifier les entits et les relations et quelles ne permettent pas de rsoudre le
problme de la surcharge dinformations (Schroeder et al., 2007). De plus, il est observ
lusage que la conception de telle reprsentation ncessite beaucoup de temps (Innes et al.,
2005). En effet, les visualisations relationnelles semblent bien fonctionner lorsque le nombre
dobservations (vnements, personnes, etc.) reprsentes est limit (Mena, 2003). Des
approches parallles ont t dveloppes pour analyser et reprsenter des graphes de
grandes tailles, comme lamlioration des algorithmes de placement des nuds, le
dveloppement de nouvelles mthodes dinteractions (en matire dinterface) et lexploitation
de reprsentations en trois dimensions. Laxe de cette recherche est diffrent et ces aspects du
domaine ne seront pas abords plus en dtails. Les reprsentations en trois dimensions ont
t exclues pour des raisons qui sont dtailles en annexe15. Selon Klerks (2001) ces outils
noffrent que peu de perspectives en termes danalyse et il prconise lexploitation des rseaux
sociaux en tant quapproche de troisime gnration.

Lapproche des rseaux sociaux dvelopps dans le domaine de la sociologie se base sur la
combinaison de la visualisation par les graphes afin de reprsenter les relations entre des
personnes et le calcul de mesures mathmatiques. Ces mesures, associes aux entits des
graphes, dcrivent notamment la centralit dune entit au sein du rseau ou limportance
relative de chaque entit dans le rseau. Ltude de lapplication des rseaux sociaux en
analyse criminelle est un domaine mergeant depuis une vingtaine dannes notamment en
matire de criminalit organise (Sparrow, 1991) (Klerks & Smeets, 2001) (Chen et al., 2005)
(Xu & Chen, 2005). Ces mesures mathmatiques sont exploites afin de pallier les difficults
rencontres pour analyser des rseaux complexes et particulirement lorsque la taille des
graphes ne permet plus une analyse visuelle suffisante. Cet aspect du domaine nest pas
abord dans cette thse. En effet, cette recherche porte sur les aspects visuels de la
reprsentation.


15
Cf. Annexe 3 : Visualisation tridimensionnelle, page 259


42 Analyse criminelle et visualisation

En matire danalyse criminelle, plusieurs types de reprsentation relationnelle sont exploits :

Les schmas
relationnels
(forme gnrique)

Schmas reprsentant les relations entre des entits personnes, vnements, traces, objets,
lieux afin de clarifier les relations, faciliter les raisonnements et faciliter la communication.

Les schmas de
flux

Schmas reprsentant les flux de marchandises, financiers ou tlphoniques (par des flches)
entre les entits personnes, comptes et tlphones reprsentes par les sommets.

Les schmas
dactivit

Schma reprsentant le droulement dune activit criminelle particulire. Lactivit est


dcompose en tapes reprsentes par les nuds. Les flches reprsentent les relations et la
squence des tapes.


Analyse et visualisation relationnelle 43

Les formes de reprsentation ci-dessous sont des adaptations des schmas relationnels qui
intgrent la composante temporelle. Ces formes de reprsentation sont probablement issues
de visualisations dveloppes dans les annes cinquante : les diagrammes de PERT et CPM16.

Les schmas
dvnements

Schmas reprsentant la squence et les relations des vnements qui sont positionns
chronologiquement. Une brve description des vnements est incluse pour chaque nud.
Les liens reprsentent les relations entre les vnements et dautres entits (personnes, traces,
vhicules, etc.).

Les schmas
chronologiques

Ces schmas sont identiques aux schmas dvnements, mais les entits lies (personnes,
traces, vhicules, etc.) ne sont pas reprsentes. Lobjectif est de prsenter une squence
dvnements prcis sur le mme modle que les schmas dactivits, en intgrant la
dimension temporelle. Les flches et les positions des nuds dfinissent la squence.


16
Cf. Annexe 1: Dimensions danalyse et visualisation Analyse temporelle, page 246


44 Analyse criminelle et visualisation

Les schmas de
flux
temporels

Schmas bass sur une dfinition des types de nud et de lien identique aux schmas de flux.
Le temps est reprsent sur laxe horizontal.

Sur un graph, la dimension quantitative est gnralement reprsente selon deux variables
visuelles principales : lpaisseur des liens et la taille
des entits (ex. paisseur des arcs proportionnelle au
nombre de relations ou une variable quantitative,
taille des cercles proportionnelle au nombre dautres
sommets lis).

Des formes de reprsentation relationnelle intgrant la dimension spatiale ne sont pas dfinies
dans les manuels du domaine. Pourtant, de telles reprsentations sont exploites depuis le
milieu du dix-neuvime sicle17. Labsence de ces reprsentations dans les manuels
professionnels peut probablement sexpliquer par labsence doutils informatiques permettant
leur laboration de manire facile ou automatise.


17
Cf. Annexe 1: Dimensions danalyse et visualisation - Analyse spatiale, page 255


Analyse et visualisation relationnelle 45

R e c o m m a n d a t i o n s e t s t a n d a r d s

Diverses recommandations ont t dfinies en matire de visualisation relationnelle, dans le


domaine de lanalyse criminelle. Les premires dfinitions se retrouvent dans les travaux de
Harper et Harris (1975) et de Morris (1986). Les recommandations ci-dessous sont issues de la
littrature et des manuels de bonnes pratiques de lanalyse criminelle. Il est important de
relever que les recommandations trouves dans les sources ouvertes sont relativement rares et
seul un nombre limit de manuels professionnels du domaine a pu tre consult.

E n t i t s

- Les symboles doivent tre simples et comprhensibles. Les symboles ne doivent pas
prter confusion et ne doivent pas tre interprts de faon trop littrale. (Interpol,
1997) (Fedpol, 2010)

L i e n s

- Trois types de liens sont ncessaires : lien fort (sr), faible (incertain) et aucun lien
(Harper & Harris, 1975)
- Reprsenter les liens confirms par une ligne pleine et les liens non confirms par une
ligne de pointills. (Harper & Harris, 1975) (Morris, 1986) (Interpol, 1997) (UNODC,
2002) (Mena, 2003) (Fedpol, 2010)
- Les relations non qualifies (sans label) portent confusion. (Fedpol, 2010)
- Limiter lusage des liens directionnels la reprsentation de flux dargent ou de
marchandises et les appels tlphoniques. (Fedpol, 2010)

C a d r e s

- Les organisations sont reprsentes par des cadres. (Harper & Harris, 1975) (Morris,
1986) (Morris, 1986) (Interpol, 1997) (UNODC, 2002) (Mena, 2003) (Mowbray, 2009)
(Fedpol, 2010)
- Lutilisation de cadres pour reprsenter des entreprises est possible, mais quand le
nombre de personnes et dentreprises est grand, il est recommand dutiliser des
icnes. (Mena, 2003) (Fedpol, 2010)
- Les cadres peuvent tre utiliss pour reprsenter des pays, dans ce cas il est
recommand de positionner les cadres en fonction de la position gographique des
pays. (Fedpol, 2010)


46 Analyse criminelle et visualisation

C o u l e u r s

- Exploiter la couleur pour diffrencier des types de liens et dentits. (Interpol, 1997)
(Senator, 2005) (Fedpol, 2010)
- Toujours utiliser la mme couleur pour certains processus dans un mme graphique.
(Fedpol, 2010)
- Lutilisation des couleurs et des icnes est libre. Une convention doit tre utilise au
sein dune mme agence. (Mowbray, 2009)

S t r u c t u r e

- Lier les entits impliques lvnement concern (c.--d. exploiter lvnement


comme entit centrale pour reprsenter les relations). (Fedpol, 2010)
- Eviter les croisements de traits. (Sparrow, 1991) (Mena, 2003) (Mowbray, 2009)
- Maximiser lorthogonalit. (Mowbray, 2009) (Fedpol, 2010)
- La proximit des personnes reprsentes sur un schma doit tre proportionnelle
leur proximit dans le rseau. (Sparrow, 1991)
- Une personne centrale sur un schma implique quelle est centrale dans lorganisation.
Il faut faire attention au biais de positionnement : une personne peut tre centrale
parce que cest la personne sur laquelle le plus dinformations est disponible. (Sparrow,
1991)

A u t r e s

- Afficher la source de linformation pour retrouver le document initial. (Morris, 1986)


(UNODC, 2002) (Fedpol, 2010)
- Reprsenter lensemble des informations. (UNODC, 2002) (Fedpol, 2010)
- Accompagner les produits danalyse dun rapport crit. (UNODC, 2002)
- Un schma doit tre clair, simple, pur et concis. (UNODC, 2002)
- Les reprsentations doivent tre prcises et correctes. Les informations charge et
dcharge doivent tre incluses. (IALEIA, 2004)

Ces recommandations dcrivent des lments mthodologiques et des conseils bass sur la
pratique. Le niveau de gnralit des recommandations est variable. En outre, aucun des
ouvrages ne prsente ces recommandations dans un cadre clairement formalis, mais plutt
sous la forme de listes.


Conclusion 47

C o n c l u s i o n
Le processus systmatique de lanalyse criminelle nintgre pas formellement une tape de
visualisation de linformation. La dcomposition en cinq tapes prsente (acquisition,
intgration, reprsentation, analyse et communication) permet de clarifier les rles de la
visualisation dans la mthode: (1) faciliter la mmorisation en regroupant de faon synthtique
et simplifie les informations pertinentes, (2) soutenir le processus dexploration des
informations et faciliter la dcouverte de nouvelles connaissances, (3) soutenir le processus de
validation des hypothses par la dtection des lments les confirmant ou non, (4) faciliter la
communication et lapprhension par les dcideurs comptents du renseignement produit.

Les reprsentations graphiques forment certainement une partie centrale du produit de


renseignement. Dfini par lobjectif danalyse, il guide le choix dune ou plusieurs formes de
reprsentation adaptes. Celui-ci semble par ailleurs tre intimement li la nature du
problme abord. Les modles classifient notamment lanalyse selon quelle traite des dlits,
des personnes ou des mthodes. Certains manuels de bonnes pratiques soutiennent que le
choix dune visualisation peut tre effectu en regard des formes danalyse. Celles-ci sont
cependant dfinies de faon disparate et il est relev que les mthodes se rejoignent. Une
dcomposition des questions danalyse est propose afin de faciliter la slection dune
mthode de visualisation adapte. Lapproche retenue dcompose lobjectif danalyse selon
une ou plusieurs dimensions dominantes pour dterminer le type de reprsentation
concevoir: (1) la dimension quantitative, (2) la dimension temporelle, (3) la dimension spatiale,
(4) la dimension relationnelle qui couvre les questions lies lanalyse des relations entre les
entits pertinentes, telles que les vnements, les personnes, les objets et les traces. Cette
dcomposition permet de classifier les types de reprsentation et par hypothse facilite le
choix dune forme adapte pour rpondre la question pose.

Les schmas relationnels exploits dans les enqutes judiciaires ont t choisis comme sujet
dtude pour les raisons suivantes. Premirement, les questions danalyse sont souvent
exprimes au travers dexemples spcifiques, alors que des cadres conceptuels ont t plus
clairement formaliss pour dcrire les autres dimensions. Deuximement, la diversit de la
nature des entits et des relations investigues lors de lenqute pose la question de la
dfinition de types gnriques. Une dmarche de classification en diffrents types de relation
ne pourrait-elle pas aider dfinir la manire de les reprsenter ? Finalement, les
recommandations dfinies dans la littrature et les manuels de bonnes pratiques ne sont pas
intgres dans une dmarche de conception des schmas relationnels clairement formalise.

The purpose of analytical displays of evidence is to assist thinking. Consequently, in


constructing displays of evidence, the first question is, What are the thinking tasks that
these displays are supposed to serve? Edward Tufte dans (Zachry & Thralls, 2004, p. 450)

E x p l o i t a t i o n s p o u r l e n q u t e
j u d i c i a i r e
Lobjectif de ce chapitre est de dcrire le contexte dexploitation de la visualisation dune part
pour lenqute judiciaire et dautre part pour le jugement. Les objectifs danalyse qui guident
le choix dune visualisation et les contraintes imposes par ce contexte sur la reprsentation
de linformation sont explicits.

Le terme danalyse criminelle oprationnelle (ACO) se dfinit, en Suisse, par son champ
dapplication dans le processus denqute et de jugement (Fedpol, 2010). Les tapes du
processus judicaire impliquent diffrents acteurs dont les besoins sont variables. La
visualisation est donc exploite de diverses manires selon les objectifs dfinis par les
participants du processus judiciaire. Kind relve que les produits du renseignement doivent
tre labors daprs les choix et besoins des destinataires (Kind, 1990). Une reprsentation
graphique peut notamment tre exploite afin de regrouper les informations dune
investigation, de faciliter la communication au sein dune quipe denquteurs ou comme
support lors dune plaidoirie au tribunal (Marshall et al., 2008).

E n q u t e

P r o c e s s u s d e l e n q u t e e t o b j e c t i f s
d a n a l y s e

Kind dcompose lenqute criminelle en trois chapitres distincts: le problme de trouver ,


la dcision daccuser et le problme de prouver (Kind, 1994). Le premier chapitre
consiste analyser les donnes de lvnement pour comprendre son droulement, identifier,
localiser et arrter un ou plusieurs suspects. Suite larrestation dun suspect, lenqute entre


Enqute 49

dans un processus de structuration des indices, afin dtablir un dossier qui sera transmis au
tribunal. Finalement, lenqute se termine par la mise en accusation du prvenu et lvaluation
de sa culpabilit qui aboutit son jugement. Brodeur dcompose lenqute initie par la
constatation dune infraction selon un processus qui rejoint le paradigme de Kind (Brodeur,
2005b). Il dfinit lenqute didentification comme premire partie du processus dont lobjectif
est didentifier lauteur du crime . Lenqute de localisation subsquente vise larrestation
du suspect. Finalement la structuration et la prsentation de la preuve (ou plutt des indices)
visent la mise en accusation et la condamnation. Simms et Petersen (Simms & Petersen, 1991)
dcomposent le processus denqute en trois tapes : la dtection dinfractions ou de
suspects, la reconstruction des circonstances de lactivit et la rsolution du problme en
reliant le(s) suspect(s) lactivit. Lenqute peut en effet tre initie sur la base dinformations
sur un suspect (Simms & Petersen, 1991) (Atkin, 1998) (Brodeur, 2005b), par exemple,
lorsquun informateur fournit des renseignements sur une possible activit dlictueuse en
matire de stupfiants dun individu ou lorsquune socit est suspecte dune activit illgale.
Dans ces situations, lobjectif initial de lenqute nest pas didentifier un suspect, mais bien de
lier un suspect une activit.

Identification Structuration Evaluation


Condamnation

Lier un suspect Mettre en Juger


une activit accusation

Figure 3 Processus de lenqute judiciaire


Lors de la premire phase, le raisonnement est principalement inductif (ou plus prcisment
abductif) (Harper & Harris, 1975) (Kind, 1987) (Kind, 1994). Lenquteur recherche les causes
des effets quil observe. Selon Atkin (1998), la premire question qui devrait tre formule,
lorsquune enqute dbute sur un cas, est quelles sont les conditions qui peuvent expliquer
la commission du crime ? ; pourquoi maintenant et ici, pourquoi cette cible et pourquoi
cette manire de procder en se plaant dans la perspective des choix de lauteur et des
raisons sous-jacentes ses choix. La dmarche dinvestigation suit le questionnement


50 Exploitations pour lenqute judiciaire

Quintilien. Lorsque lenqute dmarre par un suspect, les questionnements sont par exemple :
quelles relations le suspect entretient-il avec dautres individus et quels sont les activits
imputables. Lobjectif premier de lenqute est de relier un suspect une activit (Atkin, 1998).
Pour atteindre cet objectif, lenquteur raisonne galement par analogie en valuant un
nouveau cas en regard de cas prcdemment connus et traits (Ribaux & Margot, 2003). Un
bon enquteur construit son exprience en se basant sur ses expriences quotidiennes et sur
le sens commun (Kind, 1987) (Kind, 1994). Il cherche comprendre et reconstruire lactivit
passe en variant le plus possible les points de vue sur les informations quil collecte (Kind,
1992). Il cherche identifier et comprendre les relations existantes entre des vnements, des
personnes, des vhicules et des socits. Maintenir une vision holistique des informations
collectes en regroupant les diverses sources dinformation constitue lun des principes
essentiels la base du processus de lanalyse criminelle (Aepli et al., 2011). Des
reprsentations graphiques peuvent alors tre conues pour regrouper lensemble des
informations collectes et mettre en vidence des relations afin de reconstruire et comprendre
une activit criminelle.

Lors de la phase initiale de lenqute, une ou plusieurs pistes peuvent tre privilgies au
dtriment dhypothses alternatives. En effet, les limitations des capacits cognitives humaines
conduisent mettre en uvre des stratgies de simplification afin de prendre des dcisions
(Heuer, 1999). Des biais tels que leffet tunnel, de confirmation (renforcement) et de la pense
de groupe peuvent conduire un groupe denquteurs se focaliser sur une hypothse
particulire et influencer la collecte et lanalyse des informations pour la confirmer. Lanalyste
criminel apporte une mthode de travail qui vise minimiser ces biais. En effet, ltape
danalyse survient volontairement tardivement dans le processus (aprs les tapes
dacquisition, dintgration et de reprsentation) afin de minimiser les hypothses htives et
pour baser les raisonnements sur lensemble des informations (Aepli et al., 2011).

Identification Structuration Evaluation

Abductif
Dductif Raisonnements

Hypothtico-dductif

Figure 4 Formes de raisonnement au fil de lenqute

Dans la phase de structuration, le raisonnement est essentiellement hypothtico-dductif


(Kind, 1994) (Ribaux et al., 2003). Lenquteur confronte et value les informations collectes
en regard des hypothses formules. Lobjectif consiste confirmer ou vacuer des pistes


Enqute 51

denqute, voire den dtecter dautres (Carillo, 2010). Dans les premires phases denqutes,
le nombre de pistes et dhypothses formules pour identifier les causes des effets observs
sont plus nombreuses quen fin de processus. Ces rflexions conduisent dcider des mesures
prendre pour tester ces hypothses, telles que la mise sous surveillance dun individu,
laudition de tmoins, lanalyse dune trace, voir lapprhension ou larrestation dun suspect.
Chacune de ces mesures des consquences importantes (en particulier les mesures de
contraintes). Elles ncessitent des changes permanents entre enquteurs, forensiciens,
analystes criminels et magistrats. La visualisation peut alors tre exploite pour structurer les
lments pertinents pour la prise de dcision et faciliter la communication entre les acteurs du
processus. Un schma relationnel peut par exemple mettre en perspective les traces
matrielles collectes en fonction des lieux de prlvement et des rsultats danalyse afin de
choisir sur quelles traces des analyses complmentaires vont tre entreprises. Un schma
reprsentant les communications tlphoniques effectues par un suspect peut conduire la
dtection dun numro sur lequel des contrles pourraient tre effectus (de lidentification de
son dtenteur la mise sous coute par exemple).

En fin denqute le raisonnement et principalement dductif. Les indices collects sont valus
en regard des hypothses retenues. Lacceptation des risques derreur diminue galement au
fil du processus, pour aboutir une valuation au-del de tout doute raisonnable de la
culpabilit lors du jugement (Brodeur, 2005b).

Identification Structuration Evaluation

Hypothses
Dngation des risques Risques

Figure 5 Acceptation des risques au fil de lenqute

Les visualisations produites au cours de lenqute doivent donc soutenir ces formes de
raisonnement et aider rduire les risques derreur. En raison de limpact des dcisions prises
en cours denqute, lanalyse effectue se doit dtre la plus objective possible. Les
reprsentations graphiques exploites doivent donc tre de qualit. Elles doivent faciliter
lanalyse et elles doivent tre intgres par rapport aux donnes collectes. Idalement, aucun
biais ne doit tre engendr par leur utilisation.


52 Exploitations pour lenqute judiciaire

I n t g r a t i o n d e l a n a l y s e c r i m i n e l l e
o p r a t i o n n e l l e

Au cours de ce processus, lenquteur est confront toutes les problmatiques de la gestion


dinformations. Lanalyse criminelle couvre donc un ensemble de mthodes et de techniques
indispensables pour tout enquteur. Elle est un moyen de linvestigation, au mme titre que la
surveillance, laudition ou lcoute tlphonique (Peterson, 1998). Deux approches parallles
dintgration de lanalyse criminelle dans lenqute judiciaire sont mises en uvre :
lintgration danalystes criminels spcialiss au sein des quipes denqute et une approche
de formation des enquteurs.

Intgr
Spcialiste

ACO Autonome

Enquteur

Figure 6 Intgration de l'analyse criminelle dans l'enqute

L a n a l y s t e c r i m i n e l s p c i a l i s t e

La premire approche consiste considrer lanalyse criminelle comme une discipline part
entire. Des spcialistes viennent ainsi soutenir les enquteurs. Lanalyste peut alors tre
intgr directement dans lquipe denqute ou travailler de manire autonome sur le cas.

Lorsque que celui-ci travaille de faon autonome, il est charg dlaborer des scnarios
alternatifs non identifis. Il value les indices afin de dtecter de nouvelles pistes denqute ou
didentifier des informations manquantes. Il aboutit la prsentation des indices afin
dapporter de nouvelles connaissances utiles prise de dcisions, telle que prendre des
nouvelles mesures denqute. Le processus de travail de lanalyste se dcompose alors en trois
tapes : la reconstruction, lvaluation et la communication de scnarios pouvant expliquer
lactivit criminelle observe. Des schmas de scnarios18 peuvent notamment tre exploits
pour confronter diverses versions et confronter les indices collects (van den Braak, 2010).
Lanalyste criminel prend, dans une certaine mesure, un rle dvaluateur. Il traite


18
Cf. Annexe 2 : Schmas de scnarios, page 256


Enqute 53

gnralement laffaire a posteriori et joue le rle de lavocat du diable . Il est cens apporter
un regard neuf en suivant une dmarche adapte, afin didentifier des lacunes dans lenqute
et apporter de nouvelles hypothses. Une telle dmarche dintgration de lanalyste criminel
dans lenqute judicaire induit toutefois un nombre important de frustrations ; tant pour
lenquteur qui voit son travail valu, que pour lanalyste qui a le sentiment darriver aprs
la bataille . En effet, un tel processus dvaluation est gnralement effectu sur des affaires
complexes, ayant impliqu un nombre important de mesures denqute. Le temps ncessaire
la lecture des informations collectes, leurs intgrations dans un systme de gestion, voire la
cration de visualisations facilitant lanalyse, est gnralement long. Les renseignements
produits par lanalyste peuvent alors perdre en validit dans la mesure o de nouveaux actes
denqutes ne sont plus forcment possibles.

Une autre approche consiste intgrer lanalyste criminel directement au cours de lenqute.
Lanalyste endosse alors un rle de soutien linvestigation. Lanalyste offre ses comptences
en matire de traitement, de gestion et de visualisation des informations au service des
enquteurs. Intgr, ds les phases initiales de lenqute, lanalyste peut entreprendre
llaboration de divers produits (tableaux, banque de donnes, reprsentations graphiques,
etc.) pour soutenir les tches des enquteurs et linvestigation dans son ensemble (Peterson,
1998). Les analystes engags dans les services de police sont souvent des employs civils ne
disposant pas dune formation policire (Peterson, 1998). Lanalyste civil bien que disposant
des comptences en matire de gestion de linformation, ne possde parfois pas lexprience
ou la formation suffisante pour assimiler tous les tenants et aboutissants de linvestigation
criminelle. Lanalyste doit alors accepter limage de navet quil gnre. Une certaine
incomprhension, voire des problmes de communication peuvent donc survenir entre
lanalyste et lenquteur. Ces difficults peuvent galement tre renforces par un sentiment
de ne pas appartenir la mme communaut (civile ou policire). Les visualisations produites
par lanalyste peuvent galement gnrer un sentiment de frustration chez lenquteur. En
effet, une reprsentation synthtique et efficace peut tre apprcie et mise en valeur, au
dtriment de lensemble des tches accomplies lors de linvestigation. La visualisation, de par
sa nature rendre explicite et comprhensible les informations, cache souvent lensemble dun
processus complexe. Globalement, il faut constater que le processus dintgration de lanalyste
criminel dans linvestigation nest pas trivial (Peterson, 1998). Selon Atkin (1998), la
collaboration entre analyste et enquteur sur une mme affaire reste un compromis idal.
Lexprience de lenquteur base sur les cas prcdemment traits contrebalance le regard
externe objectif (dans le sens o il est absent de connaissances a priori) de lanalyste.


54 Exploitations pour lenqute judiciaire

L e n q u t e u r a n a l y s t e

En raison de la diversit des problmes traiter et des connaissances spcifiques requises


pour les traiter, une approche dintgration de lanalyse criminelle dans lenqute judiciaire
consiste former des enquteurs aux mthodes et techniques de lanalyse criminelle.

La formation denquteur soulve toutefois un certain nombre de problmes. Les enquteurs


forms au domaine de lanalyse criminelle acquirent notamment un savoir-faire en matire
de visualisation. Par contre, les problmatiques de traitements et de gestion de linformation
sont gnralement survoles lors de ces formations, en raison de la difficult de prise en main
des outils. Ceux-ci sont alors considrs comme du ressort du spcialiste en analyse criminelle.
A contrario, la prise en main des outils de visualisation semble tre plus facile et leur matrise
(du moins au niveau des fonctionnalits de base) est acquise par les enquteurs qui peuvent
ainsi les exploiter dans leurs pratiques.

Pourtant, il nexiste leur actuelle que peu de documentations et de recommandations lies


lexploitation de ces outils dans lenqute judicaire (voir chapitre Recommandations et
standards ). La matrise technique de loutil peut tre acquise en suivant un manuel (ou un
cours), mais lexploitation efficiente des formes de visualisation pour rsoudre les problmes
rencontrs dans lenqute reste du ressort de lexprience et des capacits dimagination de
lanalyste enquteur. De plus, alors que les principes mthodologiques fondamentaux de
lanalyse sont indpendants du domaine trait, lexploitation des formes de visualisation
semble largement influence par le problme spcifique. Les questions qui se posent au cours
des enqutes varient suivant la nature des infractions et les donnes exploites ne sont pas les
mmes. Il semble donc a priori difficile de dgager des principes dexploitation de la
visualisation universellement exploitables dans lenqute judiciaire. Toutefois, certaines tches
sont rcurrentes comme la comparaison des dclarations de tmoins ou de prvenus ou
lanalyse de communications tlphoniques. Certains problmes criminels spcifiques
surviennent galement de faon rgulire, tels que la commission de plusieurs cambriolages
par un auteur ou un groupe dauteur ou le dveloppement dun rseau de ventes de
stupfiants. Certaines situations danalyse tant rcurrentes, des formes de reprsentation
adaptes pour chacune delles peuvent par hypothse certainement tre dfinies.


Jugement 55

J u g e m e n t
Pendant trs longtemps, lanalyse criminelle est reste trs prudente dans ses relations
directes avec les magistrats. Ceux-ci sont nanmoins de plus en plus demandeur. Ce
mouvement rcent tend le champ dapplication de lanalyse criminelle et pose des questions
nouvelles. Les produits de renseignement labors en cours denqute peuvent en effet se voir
intgrer comme pices du dossier, au risque de voir de nouvelles difficults apparatre. A titre
dexemple, lors de la phase initiale de lenqute, des hypothses formules sur limplication de
suspects peuvent avoir t intgre sur des schmas de travail. Alors mme que ces pistes
denqute peuvent tre cartes en fin denqute, la prsence de ces hypothses dans le
dossier peut mettre en difficult lanalyste lors du jugement. Une rticence persiste donc sur
lintgration des produits de lanalyse dans le dossier de justice. Celle-ci semble nanmoins se
justifier pour plusieurs raisons dcrites dans cette section. Les contraintes imposes par le
contexte judiciaire sur lutilisation de reprsentations graphiques sont galement dcrites.

O b j e c t i f s d a n a l y s e

Lobjectif de lenqute judiciaire est daboutir au jugement. En consquence, le travail de


lanalyste soutient galement le processus de la poursuite judiciaire (Peterson, 1998). Dans une
large mesure, les objectifs et les problmatiques de lenqute rejoignent ceux de la poursuite
pnale. Toutefois en regard de lapport tendu de lanalyse criminelle, celle-ci se caractrise
par certains objectifs spcifiques.

Le magistrat souhaitera qualifier les infractions en regard des lois. Il sagira donc de connatre
les lments pertinents et ncessaires pour cette tche, afin de les inclure dans les produits de
lanalyse. Par exemple, le prix de vente est un lment capital afin destimer si un acheteur
pouvait raisonnablement se douter quil faisait lacquisition dune contrefaon ou du butin
dun vol. Dans les phases initiales de lenqute, une telle question ne sera certainement pas
juge primordiale pour reconstruire la structure dun trafic (en identifiant ses protagonistes et
en valuant leurs rles respectifs, par exemple). Un analyste nest ni un juriste, ni un enquteur.
Il na donc pas ncessairement les connaissances suffisantes (ou la sensibilit) pour identifier
lensemble des paramtres dimportance pour la rsolution dune affaire. Dans la situation
prcite, limportance du prix est certainement vidente. Toutefois, les paramtres
dimportance pour une qualification pnale ne sont pas forcment vidents matriser. Ces
dimensions doivent donc tre discutes et explicites ds lintgration dun analyste dans
linvestigation criminelle. Il est du ressort de lanalyste de sassurer quil a bien compris les


56 Exploitations pour lenqute judiciaire

objectifs et les dimensions dimportance pour la poursuite pnale. Ces dimensions tant, du
point de vue du magistrat instructeur et de lenquteur, certainement des vidences.

Du point de vue du procureur et des avocats, lanalyse criminelle est souvent perue comme
une mthode de linvestigation (Peterson, 1998). Toutefois, les produits de lanalyse et plus
particulirement les reprsentations graphiques peuvent galement tre exploits lors du
jugement. En effet, la visualisation peut jouer un rle important en facilitant la comprhension
dune affaire dite complexe. Morris relve (1993) quune affaire juge complexe lors de
linvestigation sera certainement presque impossible apprhender lors du jugement
(notamment par le jury). Il souligne alors limportance dexploiter des reprsentations
graphiques pour soutenir lenqute, mais galement faciliter la comprhension du dossier.

C o n t r a i n t e s i m p o s e s s u r l e s v i s u a l i s a t i o n s

Au tribunal, les reprsentations graphiques servent galement de support rhtorique. La


visualisation peut tre exploite pour faciliter la communication dun argument et augmenter
limpact motionnel dun propos (Feigenson & Sherwin, 2007). Les effets rhtoriques
engendrs par la visualisation devraient tre vits ou au moins contrls, afin que la ralit
des informations prsentes ne soit pas dtourne pour soutenir une interprtation fallacieuse
des faits.

En droit amricain (Joseph, 2006), les schmas (croquis), diagrammes, et graphes qui sont
impartiaux et pertinents sont admissibles. Ils servent faciliter la comprhension des
questions traites par la cour. La recevabilit est apprcie par la cour. Ils sont rejets en cas
dabus avr. Les reprsentations visuelles sont classifies en deux catgories : les
reprsentations but illustratif (ne sont pas recevables en tant que preuve, mais utilises des
fins pdagogiques et de comprhension, leur usage est la discrtion de la cour) et les
reprsentations recevables en tant qulment de preuve de fond (substantive evidence).
Visant tablir un fait, elles doivent satisfaire les critres de recevabilit.

Les reprsentations illustratives peuvent tre utilises par tout tmoin afin dillustrer, de
clarifier et de visualiser son tmoignage. A des fins illustratives, une reprsentation ne doit pas
forcment tre exacte dans ces moindres dtails. Des croquis sont notamment exploitables
pour autant quils facilitent la comprhension du propos par le jury. Le juge peut dcider de
refuser une reprsentation si elle engendre de la confusion, quelle induit en erreur ou que les
lments reprsents sont trop simples (la rendant ainsi superflue et inutile). Mme si la


Jugement 57

reprsentation nest pas recevable en tant que preuve (par exemple lorsque les sources
dinformations reprsentes ne sont pas suffisamment documentes), elle peut tre prsente
des fins illustratives dans la mesure o une explication initiale est effectue (sur la nature des
donnes reprsentes et lusage illustratif, de comprhension).

Lusage de reprsentations graphiques en tant que preuve est dfini dans la Federal Rule of
Evidence 1006 : The contents of voluminous writings, recordings, or photographs which cannot conveniently
be examined in court may be presented in the form of a chart, summary, or calculation, the originals, or duplicates,
shall be made available for examination or copying, or both, by the other parties at reasonable time and place. The
court may order that they be produced in court.

Pour tre recevable en tant que preuve :


- une reprsentation doit tre impartiale et prcise. Des imprcisions mineures ne sont
toutefois pas suffisantes pour rejeter une reprsentation graphique comme preuve,
mais elles doivent tre documentes et expliques
- les informations initiales (sur lesquelles la visualisation est produite) doivent tre
accessibles
- les informations initiales doivent tre recevables. Il sagit dune condition sine qua non
- les informations initiales doivent tre volumineuses (c.--d. quelles ne peuvent tre
convenablement examines en tant que telles).

Les reprsentations dont lexactitude et la prcision sont juges insuffisantes ou qui prtent
confusion peuvent tre rejetes. Labsence de donnes volumineuses sous-jacentes la
reprsentation est rarement un critre accept pour rejeter une reprsentation (Joseph, 2006).
De plus, il est possible dexploiter des reprsentations rsumant les faits. Dans des affaires
complexes, la tendance est clairement daccepter ce genre de reprsentations (Joseph, 2006).
Des reprsentations rsumant uniquement les lments charge (ou dcharge) peuvent
mme tre utilises pour autant quelles ne soient pas prsentes comme rsumant
lensemble des lments de preuve. Les conditions dadmissibilit de ces reprsentations
simplificatrices (de synthse) sont dfinies en regard de la Federal Rule of Evidence 611(a)19 : la
dure du procs, la complexit de laffaire, et la confusion engendres par un nombre


19
The court shall exercise reasonable control over the mode and order of interrogating witnesses and presenting
evidence so as to:
1. make the interrogation and presentation effective for the ascertainment of the truth,
2. avoid needless consumption of time, and
3. protect witnesses from harassment or undue embarrassment.


58 Exploitations pour lenqute judiciaire

important dinformations (Joseph, 2006). Le jury doit galement tre inform sur la manire
dapprhender le schma.

Des dangers dexploitation de reprsentations simplificatrices sont galement


identifis (Joseph, 2006):
- la reprsentation peut tre considre comme une preuve additionnelle en tant que
telle, corroborative de la vrit des informations reprsentes. Ce problme peut tre
minimis en documentant clairement la reprsentation et en expliquant la manire de
lapprhender
- elle peut tre exploite comme moyen subtil dintroduire une preuve non recevable.
Ladmissibilit des sources dinformations doit donc tre value
- la reprsentation peut inclure des argumentaires, des jugements et des conclusions
orients. La distinction dune visualisation reprsentant des preuves factuelles ou des
argumentations nest pas vidente. La rgle gnrale est toutefois quune
reprsentation devrait rester factuelle et exempte dhypothses ou de jugements.

C o n c l u s i o n
En regard du processus judiciaire, la visualisation peut tre exploite pour soutenir un nombre
importants dobjectifs, tels quanalyser des informations collectes au cours de lenqute,
valuer a posteriori une investigation, aider qualifier les infractions, faciliter lapprhension
dun dossier et soutenir une argumentation lors du procs. Lexploitation des graphes pour
valuer les hypothses alternatives formules en cours denqute et lors du procs fait lobjet
de recherches spcifiques qui ont abouti la formalisation de langages graphiques spcifiques
facilitant la comparaison de scnarios. En amont, ils sont galement utiliss pour soutenir
lanalyse des donnes collectes et le dveloppement dhypothses.

Bien que les observations effectues soutiennent probablement dans une certaine mesure
lensemble de ces objectifs, les problmes analyss et les gnralisations proposes se basent
en quasi-totalit sur des exemples rels dutilisation de la visualisation au cours de lenqute
judiciaire. Les problmes abords et les solutions proposes traitent principalement dune
exploitation au cours de lenqute pour faciliter lanalyse des informations collectes. Dans
une large mesure, les problmes investigus portent plus particulirement sur lanalyse des
traces. Lusage des schmas relationnels est notamment tudi dans une perspective de
renseignement forensique.

M t h o d e s d v a l u a t i o n d e
v i s u a l i s a t i o n s
Notre premier objectif est dvaluer quelques pratiques en matire de visualisation. Nous
souponnons que ces pratiques sont disparates et que les schmas produits sont plus ou
moins bons . Que veut dire plus ou moins bons dans ce contexte ? Les critres qui
permettent de dfinir et dvaluer la qualit dune reprsentation doivent tre dcrits. Par
ailleurs, les mthodes dvaluation empiriques dveloppes pour valuer des visualisations
sont galement prsentes.

Lorsquune reprsentation est exploite pour raisonner sur des informations, elle se doit dtre
intgre : elle doit reprsenter la ralit des informations sous-jacentes sans ajouter des biais
visuels qui peuvent fausser les observations. Par exemple, lorsque des informations
quantitatives sont reprsentes par des diffrences de tailles (de barres, de symboles ou
dicnes), celles-ci doivent tre proportionnelles aux variations observes au sein des donnes.
Une visualisation est intgre lorsquelle est claire, dtaille, documente et quelle nengendre
pas dambigut (Tufte, 2001). Bertin souligne limportance du caractre monosmique de la
graphique en tant que condition sine qua non de lintgrit :

Un systme est monosmique quand la connaissance de la signification de chaque signe


prcde lobservation de lassemblage des signes. (Bertin, 2005)


60 Mthodes dvaluation de visualisations

La signification de chaque signe doit tre dfinie lavance. Chaque signifiant de la


graphique ne peut reprsenter quun signifi au sein dune reprsentation particulire. Par
exemple, un cadre peut tre dfini en tant que reprsentation visuelle dun groupe :

Groupe A Groupe B

La graphique se distingue des autres systmes polysmiques de la reprsentation visuelle qui


offrent une richesse interprtative dite artistique (telle la peinture ou limage figurative). Le
caractre monosmique de la graphique en fait un systme dit rationnel (Bertin, 2005). Cest-
-dire sur lequel il est possible de raisonner. La signification du signe tant dfinie, elle nest
pas sujette de multiples interprtations. Le processus de perception dun graphique se
traduit alors par la question : tant donn la signification de ces lments, quelles sont les relations
qui stablissent entre eux ? (Bertin, 2005). Les reprsentations graphiques se basent donc sur
des conventions prcises dfinissant la manire de les construire et les interprter. Elles
constituent la syntaxe et la smantique du langage (Mackinlay, 1986).

Un systme monosmique peut engendrer une connotation. Un ensemble de signes peut


tre peru comme un nouveau signe. Celui-ci peut parfois tre interprt de plusieurs
manires. Le systme est donc strictement rationnel, lorsque les structures engendres par la
combinaison des signes sont galement monosmiques. Par exemple, la reprsentation dun
groupe peut faire apparatre des relations de hirarchie entre eux :


Critres dvaluation 61

Mackinlay dfinit le critre dexpressivit: un ensemble de faits est bien exprim dans un langage
visuel si les phrases (c.--d. les lments de reprsentation) du langage expriment la totalit des faits et
uniquement les faits contenus dans les donnes (traduction libre) (Mackinlay, 1986). Cette notion
dexpressivit rejoint les notions dintgrit dfinie par Tufte (2001) et de rationalit dfinie
par Bertin (2005). En analyse criminelle, la monosmie dune reprsentation est capitale. En
effet, une mauvaise interprtation peut avoir des consquences importantes, notamment lors
du jugement. Une reprsentation qui engendre un biais de perception, qui induit des
ambiguts ou qui peut tre interprte de plus manire ne satisfait pas le critre
dexpressivit. Celle-ci est alors considre comme moins bonne quune reprsentation
respectant ce principe. Plusieurs reprsentations intgres peuvent toutefois tre produites
pour reprsenter une mme situation. Quels sont alors les critres permettant de comparer et
valuer leurs qualits ?

C r i t r e s d v a l u a t i o n
Au-del de la monosmie si une reprsentation est intgre, son efficacit nest pas pour
autant dmontre. Pour certains, lefficacit est atteinte lorsque la visualisation produit leffet
attendu ou lorsquelle permet de persuader (Besson, 2004). Cette vision est probablement
pertinente dans les domaines artistiques et certainement pour une exploitation rhtorique de
la visualisation (journalisme, publicit, etc.). Elle nest toutefois pas adapte pour dcrire ce
que lon attend dune reprsentation graphique des fins danalyse. En effet, privilgier
lefficacit en termes deffet de persuasion peut tre au dtriment de la condition sine qua non
dintgrit.

Une visualisation est plus efficace quune autre, si les informations transmises sont plus
facilement perues. Lefficacit est donc notamment dpendante des capacits du lecteur
(Mackinlay, 1986). Lefficacit se dfinit alors ainsi :

Si, pour obtenir une rponse correcte et complte une question donne et toutes choses
gales, une construction requiert un temps de perception plus court quune autre
construction, on dira quelle est plus efficace pour cette question. (Bertin, 2005)

Bertin relve galement que la graphique est un outil rationnel et efficace lorsque les
proprits de la perception visuelle sont pleinement employes (Bertin, 2005). Cette observation


62 Mthodes dvaluation de visualisations

de Bertin a conduit de nombreuses valuations de lefficacit de chacune des variables


graphiques (tel que les dimensions du plan, la couleur, la forme, la taille, etc.).

Cette dfinition permet de dfinir clairement les indicateurs comparer pour valuer
lefficacit dune reprsentation : lexactitude et la compltude de la rponse, ainsi que le
temps ncessaire pour y rpondre. Le nombre total de rponses correctes pour une tche
particulire est un indice de lefficacit. Combin au temps de rponse, il permet dvaluer
lefficience (Chen & Yu, 2000) (Xu & Chen, 2005).

Ces mesures de performance sont communment exploites. Elles permettent de quantifier
limpact dun choix de visualisation (p. ex. par le nombre derreurs), mais les raisons des
diffrences observes ne sont pas pour autant toujours explicites. Dautres indicateurs
peuvent tre exploits de faon complmentaire (Huang et al., 2008) :
- Les questionnaires : des indicateurs dmographiques complmentaires sont relevs
(ge, sexe, niveau de formation, etc.). Des indicateurs subjectifs peuvent galement
tre mesurs : tel le niveau de satisfaction ou la prfrence pour raliser la tche.
- Le suivi du regard (eye tracking) : laide de camras, le processus cognitif est dtaill
en enregistrant les mouvements oculaires. Lobjectif est de comprendre comment le
lecteur parcourt le schma.
- Leffort mental : le lecteur doit valuer la reprsentation en utilisant une chelle
verbale. Une chelle neuf niveaux (1. effort mental trs trs faible 9. effort mental
extrmement lev) est propose par Paas (Paas et al., 2003) (Tuovinen & Paas, 2004).

Lutilisation complmentaire de ces indicateurs peut faciliter linterprtation des rsultats. En


effet, il est frquent que lexactitude des rsultats soit proportionnelle au temps de rponse,
alors quune reprsentation sera juge plus efficace si lexactitude est haute et le temps de
rponse faible (North, 2006) (Huang et al., 2008). Lexactitude et le temps de rponse restent
nanmoins les indicateurs defficacit les plus utiliss. Les niveaux de satisfaction ou deffort,
mesurs laide dchelles nominales, peuvent tre exploits de faon complmentaire, mais
ne permettent pas de gnraliser les rsultats. Leurs validits internes ne sont en effet pas
dmontres et ils peuvent tre corrls au temps de rponse notamment (Tuovinen & Paas,
2004) (Chung et al., 2005).


Procdures dvaluation 63

P r o c d u r e s d v a l u a t i o n
En se basant sur une tude mene sur une cinquantaine dvaluations empiriques, Plaisant
classifie quatre procdures distinctes (Plaisant, 2004) :
- les exprimentations contrles comparant des transpositions graphiques : par
exemple, la couleur est-elle plus efficace que la forme pour encoder une variable
quantitative ?
- les exprimentations contrles comparant des formes de reprsentation : lobjectif de
ces valuations consiste comparer plusieurs types de reprsentations diffrents (un
histogramme, un diagramme circulaire, etc.) et dvaluer leur efficacit pour accomplir
des tches particulires (comparer des valeurs quantitatives, retrouver une information,
comparer des proportions, etc.)
- les valuations de lutilisabilit (ou de lergonomie) : les solutions dveloppes sont
testes par des utilisateurs qui fournissent un feedback sur les problmes rencontrs et
les amliorations apporter
- les tudes de cas : lobjectif consiste exploiter la solution dans une situation relle,
dans un environnement oprationnel. Les possibilits dexploitation pour rsoudre des
problmes rels sont alors illustres (afin de montrer la faisabilit et lutilit). Induire
des principes gnraux sur la base dtudes de cas ncessite toutefois un nombre
important dexploitations dans des contextes varis.

Une autre approche consiste poser des questions ouvertes, ncessitant danalyser le
problme pos en fonction de connaissances spcifiques lies au domaine (valuation base
sur la comprhension / insight-based evaluation). Le lecteur interprte ainsi la visualisation
selon ses propres choix et les exprime librement. Une telle dmarche engendre des difficults
pour catgoriser les rsultats, mais offre une perspective dvaluation de la comprhension de
la reprsentation et de son impact sur les raisonnements (North, 2006) (Carpendale, 2008).

Chen et Yu dfinissent les conditions quune exprimentation empirique en matire de


visualisation doit satisfaire (Chen & Yu, 2000) :
- les conditions dexprimentation doivent tre standardises et clairement dcrites
- les proprits visuelles values doivent tre clairement dcrites
- les tches cognitives testes doivent tre standardises et clairement dfinies
- une variable dpendante de lexactitude ou de lefficience doit tre utilise
- le compte rendu des rsultats doit tre dtaill et inclure un test statistique.


64 Mthodes dvaluation de visualisations

Des taxonomies de tches valuer sont proposes par (Ghoniem et al., 2005), (Shneiderman
& Aris, 2006) et (Lee et al., 2006) pour valuer des graphes. La lisibilit de la reprsentation est
value en fonction des performances de recherche de linformation:
- tches lies aux caractristiques des sommets : estimer le nombre total de sommets,
identifier le sommet li au plus grand (ou petit) nombre de sommets, retrouver un
sommet particulier partir de son label
- tches lies aux caractristiques des liens : estimer le nombre total de liens, retrouver
un voisin commun entre plusieurs sommets, trouver lexistence dun chemin entre deux
sommets, identifier le chemin le plus court, retrouver les sommets lis par un type
spcifique de lien, retrouver le sommet central
- tches lies aux caractristiques des sous-graphes : retrouver un sous-graphe
particulier, retrouver les sommets lis un sommet ou un groupe de sommets,
retrouver des groupes de sommets fortement relis (des cliques).

Par analogie, les schmas relationnels labors en analyse criminelle peuvent tre valus par
des tches similaires. Sur un schma reprsentant des communications tlphoniques, il est
frquent de chercher identifier des numros en relations avec des numros spcifiques
(retrouver un voisin commun entre plusieurs sommets). Lors de lanalyse dun trafic de
marchandise, la dtection des intermdiaires entre deux individus particuliers est galement
une question rcurrente afin de comprendre la structure dun rseau (trouver lexistence dun
chemin entre deux sommets). Lefficacit dune visualisation est donc value pour des tches
spcifiques et ne saurait tre dmontre globalement.

Finalement, il est important de souligner quil ny a jamais de meilleure solution. Une


reprsentation est plus ou moins adquate en fonction de ce qui est attendu. Les indicateurs
mentionns peuvent constituer des indices defficacit, mais son valuation est toujours
relative ; la solution est compare une visualisation de rfrence. Cest par la distance cette
reprsentation talon que la qualit de la reprsentation est estime. Le choix de celle-ci est
donc primordial. Il sagit de rpondre la question compar quoi ? et de dfinir en quoi
une telle comparaison a du sens. La reprsentation de rfrence est gnralement la solution
la plus utilise dans la pratique et/ou celle tant reconnue comme la plus efficace pour
reprsenter la situation analyse. Les reprsentations doivent par ailleurs contenir la mme
information et les diffrences values doivent tre contrles. Modifier simultanment
plusieurs variables visuelles, telles que la couleur et la position, empche didentifier
clairement les causes des effets observs.

E v a l u a t i o n s p r l i m i n a i r e s
Tel que relev prcdemment, nous souponnons que les visualisations produites dans la
pratique de lanalyse criminelle oprationnelle sont disparates. Des valuations prliminaires
ont t effectues avec des praticiens et des tudiants afin de tester cette hypothse.

D i s p a r i t s d e r e p r s e n t a t i o n
Les trois exemples ci-dessous illustrent la variabilit observe lorsquil est demand
diffrentes personnes de produire des reprsentations relationnelles. Les deux premiers
exemples se basent sur la reprsentation dune information sommaire (une phrase), afin de
montrer la variabilit dans des situations simples. Le troisime exemple est tir dun exercice
de reprsentation bas sur une affaire complte. Lobjectif est de montrer laide dindicateur
objectifs (nombre dentits, de liens, structures des schmas, etc.) ltendue des variations
observes sur une affaire relle. Limpact des choix de reprsentation sur lanalyse et la
communication est discut dans la section suivante.

R e p r s e n t a t i o n d u n s c n a r i o s i m p l e

Lors dun examen thorique sur lanalyse criminelle oprationnelle, une des questions poses
consiste dessiner un schma relationnel partir du scnario suivant :

Dessinez un schma relationnel qui reprsente cette situation :

Ve 16.02.07, Lausanne, rue de bourg, un individu a menac


une dame avec une arme blanche .


66 Evaluations prliminaires

La situation expose est volontairement succincte et simple, pour permettre ltudiant de


proposer une solution en quelques minutes. Dans le cadre de lexamen, lobjectif consiste
valuer la capacit de ltudiant identifier les entits prsentes dans un texte et leurs
relations. Cette question dexamen est galement utilise lors dexamens oraux pour discuter
des rles de la reprsentation relationnelle en regard de diffrents objectifs danalyses. Cet
exemple dexercice est prsent ici, afin de montrer la variabilit des reprsentations cres
sur la base dune seule phrase.

Pour cette illustration, soixante rsultats dtudiants ont t tudis. La question a galement
t pose six analystes (six collgues travaillant comme analyste criminel oprationnel, au
sein dune police).

Sur les 66 participants, il a t relev 48 schmas diffrents pour reprsenter la mme phrase
constitue de six informations : un auteur (individu), une victime (dame), une arme (arme
blanche), un vnement (menace), une date (16.02.07), un lieu (Lausanne, rue de bourg).

Les schmas ont t regroups en quatre catgories (Type A D) dfinies selon quatre
structures gnrales de reprsentation :

Nombre de
Type Structure gnrale
participants

A 16


B 8
(dont 2 sans lentit
victime)


C
16




D
17
(dont 4 sans lentit
couteau)


Disparits de reprsentation 67

Ces quatre structures ont t identifies en comparant les 48 solutions (lensemble des
reprsentations peuvent tre consultes dans lannexe quatre). Elles dcrivent quatre manires
rcurrentes de reprsenter linformation. Dix schmas ne sont pas classs parmi ces quatre
formes, car leurs structures sont singulires. Les plus grandes variations sont observes au
niveau de lintgration de linformation temporelle et du lieu. Globalement, les informations
sont reprsentes de quatre faon diffrentes : en tant quentit (une icne), un attribut (un
texte li une icne ou un lien), un lien (un trait entre deux icnes), un cadre (entourant un
ensemble dicnes et de liens).

Le tableau ci-dessous rsume la prvalence des choix effectus :



Reprsentation
Information Entit Attribut Lien Cadre Total
Auteur 64 1 65
Victime 62 2 64
Arme 54 9 63
Evnement 31
18 49
Date 27
28 3 58
Lieu 19 27 5 51

Alors que lauteur, la victime et larme sont gnralement identifis comme des entits,
lvnement nest reprsent comme une entit que trente et une fois. Dix-huit personnes ont
reprsent lvnement comme une relation (principalement entre lauteur et la victime).

Dun point de vue de la reprsentation des relations, il est intressant de noter quaucun
participant na trac de lien entre plus de deux entits. Dix-huit personnes ont utilis des
flches et un tudiant a utilis une double-flche. La flche est gnralement exploite pour
dcrire le sens du lien entre lauteur et la victime. Dans cet exemple, la flche met en vidence
le rle des personnes.

Les informations spatio-temporelles sont principalement reprsentes comme des entits ou


des attributs. En tant quattribut, la date et le lieu sont des caractristiques de lvnement.
Sept tudiants ont reprsent la date et/ou le lieu sur une autre entit (auteur, victime et/ou
arme).


68 Evaluations prliminaires

R e p r s e n t a t i o n d u n e v e n t e

Lors dun cours sur la visualisation de donnes, les participants doivent crer un schma
relationnel reprsentant une vente :

Dessinez un schma relationnel qui reprsente cette situation :

Monsieur A vend n exemplaires de lobjet X monsieur B, pour le prix de Y CHF .

Sur les 10 participants, cinq schmas diffrents ont t produits pour reprsenter la mme
phrase constitue de cinq informations : deux individus, un vnement, un ensemble dobjet,
un prix. Les schmas ont t regroups en deux catgories (Type A B) dfinies selon deux
structures gnrales de reprsentation. Les trois autres schmas ont des structures
diffrentes20:

Type Structure gnrale Nombre



A 4


B 3

Les seules informations qui sont reprsentes de faon analogue sur lensemble des schmas
sont les individus qui sont reprsents par des entits. A noter que dans lexemple prcdent,
la quasi-totalit des participants a galement reprsent les deux individus (lauteur et la
victime). Deux personnes nont pas reprsent la victime et deux autres nont reprsent que
lvnement. A noter que dans cet exemple aucun participant na identifi la vente (un
vnement) comme une entit. Ces deux exemples illustrent que mme pour un scnario
simple (une seule phrase) de nombreuses variations sont observes entre les diffrents
participants. Lexemple suivant vise quantifier ltendue des variations pour reprsenter un
scnario plus complexe issu dune affaire relle.


20
Cf. Annexe 4 : Evaluations prliminaires - Reprsentation dune vente, page 268


Disparits de reprsentation 69

R e p r s e n t a t i o n d u n e a f f a i r e c o m p l e x e

Lors de formations de base lanalyse criminelle oprationnelle21 pour des enquteurs de


police judiciaire, un exercice de visualisation relationnelle est soumis aux participants.
Lobjectif de lexercice consiste reprsenter par un schma relationnel, les informations
contenues dans un rapport de deux pages (contenant environ neuf cent mots).

Les schmas produits par quarante enquteurs ont t compars. Lexercice a galement t
soumis dix tudiants de Master professionnel22 et sept spcialistes ayant une exprience
sur la conception de schmas.

Lensemble des cinquante-sept schmas produits nest pas annex. Seuls des tableaux
rcapitulatifs sont prsents (voir notamment lannexe quatre). Les indicateurs de variabilits
analyss sont : les nombres totaux dentits et de liens reprsents et les types dentits et de
liens exploits.

N o m b r e d e n t i t s

Enquteurs Etudiants MAS Spcialistes % des parpcipants


Nombre de Pourcentage
pardcipants (courbe cumuladve)
10 100
9 90
8 80
7 70
6 60
5 50
4 40
3 30
2 20
1 10
0 0
0 5 10 15 20 25 30 35 40 45 50
Nombre d'endts



21
Formation Analyse Criminelle Oprationnelle niveau I organis par linstitut suisse de police et lcole des
sciences criminelles.
22
Master of Advanced Studies en lutte contre la criminalit conomique de linstitut de lutte contre la
criminalit conomique de la haute cole ARC de Neuchtel.


70 Evaluations prliminaires

N o m b r e d e l i e n s

Enquteurs Etudiants MAS Spcialistes % des parpcipants

Nombre de Pourcentage
pardcipants (courbe cumuladve)

10 100
9 90
8 80
7 70
6 60
5 50
4 40
3 30
2 20
1 10
0 0
0 5 10 15 20 25 30 35 40 45 50 55 60 65
Nombre de liens

Alors que lensemble des participants a reu la mme consigne et les mmes donnes
reprsenter, les nombres dentits et de liens exploits varient considrablement (de 13 52
entits et de 10 66 liens). Les variations sont importantes indpendamment du fait que le
schma a t produit par des personnes ayant lhabitude ou non de produire de telles
reprsentations. La principale raison de cette variabilit semble tre une diffrence de
perception sur lusage du schma. Pour certains, lobjectif consiste reprsenter lensemble
des informations utiles afin de les regrouper dans un schma unique. Alors que pour dautres
lobjectif dun tel schma est de synthtiser les informations de la manire la plus simple et la
plus claire possible.


Disparits de reprsentation 71

T y p e s d e n t i t

Pourcentage dutilisation des types dentit Variation du nombre


dutilisation

Etudiants MAS

Spcialistes
Enquteurs
Enquteurs Etudiants MAS Spcialistes

Pourcentage de
pardcpants
100 Tlphone
3-6 1-11 4-8
90 2-12 3-20
Personne 4-11
80 Lieu 1-9 1-10 1-5
70 Voiture 0-3 1-3 0-1
60
Police 0-5 0-3 0-4
50
Trace 0-5 0-6 0-5
40
Arme 0-4 0-6 0-3
30
Evnement 0-9 0-4 1-5
20
Document 0-1 0-7 0-2
10
0 Affaire 0-3 0-1 0-3
0-4 0-3 0-7
Personne

Groupe
Lieu
Voiture
Police
Trace
Arme
Evnement

Aaire
Drapeau
Explosion

Quespon

Autre
Tlphone

Document

Couleur

Drapeau
Explosion 0-2 0-2 0-1
Couleur 0-3 0 0-1
Types d'endt
Question 0-3 0-4 0-1
Groupe 0-2 0-0 0-1

Autre 0-2 0-2 0-3

Le programme utilis offre la possibilit de dfinir des types dentits caractriss par des
icnes spcifiques (tels que ceux prsents dans les exemples prcdents). Les graphiques ci-
dessus regroupent les diffrents types en catgories gnriques qui sont dfinis dun point de
vue smantique. Par exemple, les icnes homme , femme , inconnu , etc. sont
regroups dans la catgorie personne . Des tableaux, prsentant le nombre dutilisation de
chaque type spcifique, sont prsents en annexe. Il faut noter quaucun type (c.--d. aucune
icne) na t exploit par lensemble des participants. Au niveau des catgories dicnes, seuls
les tlphones, les personnes et les lieux ont t utiliss par tous les participants. Il est
intressant de noter que tous les spcialistes ont galement exploit des icnes reprsentant
des vnements, alors que trente pourcent des enquteurs et quarante pourcent des tudiants
MAS nont pas exploit ce type dentit. Par ailleurs, seuls trente pourcent des spcialistes ont
reprsent des icnes de type police . Finalement, le nombre dutilisation de chaque type
dentit varie galement fortement entre les participants (cf. tableau ci-dessus). Alors que
laffaire reprsente est identique, certains participants nont exploit, par exemple, que deux
icnes de personnes et dautres vingt. De plus, alors que le rapport ne fait mention que de
quatre numros de tlphone, de une onze icnes de tlphones sont exploites.


72 Evaluations prliminaires

T y p e s d e l i e n s

Les dtails des types de lien utiliss sont prsents en annexe. Globalement, quarante types
diffrents ont t exploits et aucun na t utilis par lensemble des participants. Il faut
relever que les types sont prdfinis par le programme utilis (un seul participant a dfini des
types personnaliss). Pour chaque type de lien une couleur peut tre choisie, le programme ne
dfinit pas dattributs spcifiques en fonction du type de lien. La seule raison visuelle
dexploitation des types est de faire varier la couleur des liens.

Vingt-neuf participants ont galement utilis des cadres pour reprsenter des relations entre
les entits. Les cadres sont exploits pour dcrire diffrents types de relations : des relations
gographiques ou spatio-temporelles (15x), des groupes dentits (groupe de personnes, de
tlphones, etc.) (13x), des vnements (5x) et la source des informations (6x). A noter
galement que huit des participants ont reprsent des liens entre des cadres et dautres
entits (pour exprimer une relation commune avec lensemble des entits prsentes dans le
cadre).

D i s c u s s i o n

Lors de la conception dun schma relationnel, de nombreux choix doivent tre effectus pour
transposer linformation contenue dans du texte sous la forme dun graphe. Comment
dcomposer les informations en entits et relations, quelles sont les entits pertinentes,
comment reprsenter les relations, quels sont les attributs des entits et des relations, sont
autant de questions qui sont rpondues de manire varie suivant les concepteurs. Mme
lorsque linformation initiale est succincte, les variations observes sont importantes. Il ne
semble pas exister de consensus mergeant. Les choix de reprsentation et les objectifs sont
multiples.

Dans le cadre de ces trois exemples, aucun objectif spcifique na t impos aux participants.
Il sagit peut-tre dune des causes expliquant les variations observes, mais alors cela
signifierait aussi une grande disparit de perception sur lutilit dune telle visualisation. Pour
certains, le schma doit reprsenter lensemble des informations de manire dtaille afin
dexploiter la reprsentation comme une mmoire de travail, pour dautres, dcomposer
linformation peut servir identifier des lacunes ou des erreurs de raisonnement. Finalement,
la visualisation peut galement tre exploite pour synthtiser les lments pertinents afin de
faciliter la communication dune affaire complexe.


Impact sur lanalyse et la communication 73

I m p a c t s u r l a n a l y s e e t l a
c o m m u n i c a t i o n
Certains choix de visualisation sont-ils plus adapts que dautres ? Quel est limpact de ces
choix sur lanalyse et la communication ? Cette section prsente les observations effectues
sur le dernier exemple, ainsi que sur des exemples dexploitation de la visualisation dans le
cadre denqutes, afin de prsenter limpact de ces choix sur lanalyse et la communication.

R e p r s e n t a t i o n d u n e a f f a i r e c o m p l e x e

Dans la section prcdente, des indicateurs objectifs ont t utiliss afin de prsenter
ltendue de la variabilit observe lors de la cration dun schma relationnel. Certaines
portions particulires de laffaire et les reprsentations produites sont reprises ici afin
dillustrer limpact des choix sur lanalyse et la communication des informations.

Des ambiguts de reprsentation ont t observes sur quarante-trois schmas (75% des
schmas). Ces ambiguts peuvent tre classifies en deux catgories. Dune part, lorsquune
entit nest pas identifie et reprsente comme telle, une dmultiplication de liens peu clairs
est observe (situation observe sur vingt-neuf schmas). Dautre part, des liens mal
positionns peuvent engendrer des difficults de comprhension. Un lien mal plac est un lien
qui aurait d tre trac avec une autre entit pour minimiser lambigut (situation observe
sur trente-cinq schmas). Les portions de schmas ci-dessous illustrent cette problmatique :

Une quittance de location de vhicule a galement t dcouverte dans la chambre elle concernait un vhicule ...
provenant de la firme la personne ayant rempli et sign la quittance est un certain

La quittance nest pas identifie comme une entit, les relations entre la chambre, le loueur et la voiture ne sont
pas claires et peuvent porter confusion.


74 Evaluations prliminaires

2 personnes se prsentrent devant les agents. Alors que ceux-ci les enjoignaient de prsenter leurs papiers, ils
ouvrirent immdiatement le feu sur les gendarmes au moyen darmes de poing. Les gendarmes ripostrent et lun
des 2 individus fut touch

Lvnement (la fussillade) nest pas identifi comme une entit. Les liens tracs entre les entits ne sont donc pas
explicitement ratachs un vnement particulier : lensemble des coups de feu fait-il rfrence plusieurs
vnements, les utilisations des armes ont-elles t faites au mme moment, etc.

Le lien mme personne devrait tre li linconnu

Le lien nest pas clair (lien avec des individus)

Le rapport dit que lindividu est un activiste (le lien ne devrait


donc pas tre avec le corps)

La trace biologique et la trace digitale devraient tre lies avec le


lieu et la personne, mais pas entre elles.

Le lien devrait tre avec le lieu et la trace ADN (le rapport ne dit
pas que les individus sont les sources de la trace).

Dautre part, huit des schmas contiennent des liens errons (des relations qui ne sont pas
dcrites dans le texte). Cinq participants ont reprsent par plusieurs entits une mme
personne. Ce qui a pour consquence de ne pas observer visuellement lensemble des
informations en lien avec cette personne. Cinq participants nont pas diffrenci visuellement
les hypothses des faits. Finalement, quarante-quatre participants (77% des schmas) nont
pas reprsent une incertitude lie lidentit dune des personnes impliques dans laffaire.
En effet, alors quil existe une convention pour reprsenter lincertitude sur les liens (traits-
tills), aucun standard nest dfini pour les entits.

D i s c u s s i o n

Globalement, une mauvaise dfinition des entits et des relations peut engendrer des
ambiguts sur la reprsentation. Les erreurs observes sont probablement lies au fait que le
concepteur dun schma connait bien laffaire quil reprsente. Le schma produit est


Impact sur lanalyse et la communication 75

certainement clair ces yeux. Pourtant pour un lecteur externe qui na pas connaissances des
informations initiales, certains choix de reprsentation peuvent tre sujets interprtation et
conduire une mauvaise comprhension de laffaire.

R e p r s e n t a t i o n d u n t r a f i c d e m a r c h a n d i s e s

Lexemple prsent ici est tir dune affaire relle qui porte sur un trafic important dobjets
vols. Il est prsent afin dillustrer limpact des choix effectus en matire de reprsentation
sur lutilisabilit des schmas. En effet, le schma ci-dessous a t effectu en se basant sur
une structure relationnelle labore en suivant des recommandations gnrales dfinies dans
les manuels de lanalyse criminelle23 : reprsenter lensemble des informations et lier les
entits concernes lors de lvnement (la vente). Dans le
cadre de cette analyse, lensemble des informations a t
intgr dans une banque de donnes relationnelle structure
autour dune table centrale contenant les vnements.

Lobjectif du schma est de reprsenter lensemble des informations issues de dclarations des
personnes impliques dans laffaire, afin de comparer la fois les versions dune mme
personne et les versions de plusieurs personnes pour un mme vnement.

Chaque cadre contient lensemble des informations issues des dclarations dune personne
entendue par les services de police. Les entits ont t positionnes afin de faciliter le plus


23
Cf. Recommandations et standards, page 45


76 Evaluations prliminaires

possible la comparaison des dclarations (notamment en positionnant les entits objets


(cercles blancs) dcrivant des produits similaires la mme position sur laxe vertical). Ce
schma a t prsent aux enquteurs en charge de laffaire. Au vue de sa complexit, il na
pas suscit un intrt particulier et na jamais t exploit par ceux-ci pour analyser les
informations disposition (notamment lors de la prparation dauditions ou lcriture de
rapports).

Par la suite, le schma a t restructur en modifiant la reprsentation de la vente. Celle-ci a


t reprsente par un trait dirig entre lacheteur et le vendeur. Les informations sur les
objets vendus, les prix et les sources dinformation (les
rfrences aux procs-verbaux dauditions) ont t
reprsentes sous la forme dattributs.

Le schma final ainsi produit est le suivant :

En plus du changement de structure, les dclarations portant sur une mme vente (ou un
ensemble de ventes) ont t regroupes. Par mme vente, il est entendu une vente entre deux
individus particuliers. Les dclarations sont rprsentes par des attributs sur les liens. Ce
schma visiblement plus efficace que le prcdent offre une image claire de la structure
globale du trafic. Il permet galement de comparer visuellement les quantits de produits


Impact sur lanalyse et la communication 77

vendus qui sont reprsentes par lpaisseur des relations. Plusieurs schmas ont t produits
sur ce modle et exploits dans lenqute. Malheureusement, il nont pu tre utiliss qu la fin
de lenqute lors de la mise en accusation par le magistrat instructeur. En effet, les outils
exploits pour produire ces schmas (la banque de donnes et loutil de visualisation) ne
permettent pas deffectuer dynamiquement un tel changement.

D i s c u s s i o n

Cet exemple, illustre deux problmes principaux. Premirement, les choix effectus pour
dfinir la structure et les attributs visuels exploits (par exemple, lpaisseur des liens) dun
schma relationnel peuvent avoir un impact considrable sur la lisibilit et le potentiel
dexploitation de la reprsentation. Des rgles rutilisables peuvent-elles dfinies afin de
guider ces choix ? Le schma prsent semble tout au moins constituer une solution plus
efficace pour analyser cette situation particulire. Les trafics de marchandise tant des
problmes rccurents, la solution prsente est certainement exploitable pour le traitement
daffaires analogues.

Deuximement, il est ncessaire de disposer de mcanismes permettant de modifier


dynamiquement une reprsentation. La structure visuelle exploite initialement a t impose
par la structure relationnelle de la banque de donnes sous-jacente. En effet, les outils
noffrent gnralement pas la possiblit daggrger des donnes (regrouper les dclarations
portant sur une mme vente) ou la possibilit de transformer la structure de la reprsentation
(par exemple en transformant une entit en lien). Cet exemple illustre limpact des limites
imposes par les outils : loutil ne guide pas lutilisateur vers une solution adapte pour son
problme et il noffre que peu de possibilits pour modifier dynamiquement une structure de
graphe (notamment lorsque les choix initiaux savrent inadapts).

R e p r s e n t a t i o n d e s r i e s d e c a m b r i o l a g e

Des schmas relationnels sont galement souvent exploits dans le cadre denqutes sur des
sries de cambriolages. Les relations dtectes entre les diffrents cas de la srie (cas lis par
des traces, lis spatio-temporellement, lis par des vhicules, etc.) sont visualises afin de
synthtiser lensemble des informations et ainsi faciliter la comprhension globale de la srie,
tout en offrant la possibilit den questionner les parties.

Les deux exemples prsents ci-dessous sont des cas rels dexploitation en cours denqute.
Le premier schma a t reu par un enquteur de la police judiciaire qui souhaitait savoir sil


78 Evaluations prliminaires

tait possible de le rendre plus explicite. Le second schma a t restructur, car lenquteur
layant produit le jugeait difficile comprendre. En effet, lorsque le nombre dinformations
reprsenter augmente, conserver la lisibilit dun schma nest pas une tche vidente.

Schma initial

Schma restructur
mercredi 19th mars 2008 20--31st mars 2008 10--15th avril 2008 15--20th avril 2008 mercredi 23rd avril 2008 jeudi 24th avril 2008
12:00 18:00 00:00 06:00 21st 18:00 25th 1st 5th 10th 12th 13th 14th 15th 16th 17th 04:30 06:00 12:00 18th 12:00 19th 20th 21st 00:00 07:00 12:00 18:00 00:00 06:00 12:00

ADN mlange (PCN23...)

Plusieurs cas sur BE

Standard CAT

Video surveillance

ADN 2 (PCN23...)
Suspect ?

Trace CAT

Plusieurs cas sur VD

Traces ADIDAS

Boudry
Adresse
Boudeviliers
VPE Service industr.
19-20.03.2008 2030-0630 VPE Services Techniques
VPE Entreprise
11.04.2008 0200-0300 ADN mlange (PCN23...)
16-17.04.2008 2345-0700

Tent. VPE station d'essence


automate billets
vole 17.04.2008 0301
Vol dans un vhicule
VPE Entreprise
19-20.03.2008 1700-0800
16-17.04.2008 2345-0700 Dcouverte vhicule
Cernier
17-19.04.08 0800-0945

vol

lis

Plusieurs cas sur BL VPE


Eptingen/BL Vol plaque
Parking Peseux Ordinateur
vol de vhicule
11.04.2008 1500-1545
26-27.03.2008

vole retrouv
voles

Subaru Legacy bleue


Impact sur lanalyse et la communication 79

Schma initial
Semelle
E20/l
Semelle
3 vnements E20/l
Semelle
sur canton de
E20/l Cas 12
Berne
BE Saint-Blaise
Uetendorf Semelle 30.05.2005
07.04.2005 E20/l ADIDAS Semelle E20/l
Semelle E20/l Cas 14 E20/l Empreintes digitales
Peseux Semelle Semelle
Semelle
14.09.2005 E20/l Semelle E20/l
E20/l
E20/l

Cas 9 Cas 10 Cas 11 BE


Par ADN ou Couvet Brienz
Travers Saint-Blaise
empreinte 16.05.2005 22.06.2005
Identifi 10.05.2005 20.05.2005
Semelles E20/l & J10/o Semelles E20/l, J10/o et autres Semelles E20/l & J10/o ADN
Empreintes digitales
Identifi

Semelle Semelle
Semelle J01/o J10/o
J10/o
Cas 13 Lien ADN
4 vnements
Fleurier
sur canton de
13.06.2005
Berne
Semelles D21/h & E20/l
Identifi par ADN
empreinte digitale Empreintes digitales

NIKE Shox
J10/o Semelle
Semelle Semelle D21/h
C/q J10/o
Cas 1 Lien ADN
Marque inconnue Fleurier
C/q 15.04.2005 Lieu
Semelles C/q & autre (E10/b) Semelle
ADN G20/f Cas XX
Natel Cas 8 Travers
Empreintes digitales Travers 22.06.2005
12.05.2005 ADN Marque inconnue
Semelles G20/f & J10/o et autre Semelles autres D21/h Semelle
Cas 2 2 vnements
D21/h
Fleurier sur canton de Semelle
15.04.2005 Berne (Kniz et Marque inconnue D21/h
Biglen) G20/f Semelle
E10/c
Semelle Cas 15 et 16
Mis en cause G20/f Marin-Epagnier
par xxx
Semelle 08.04.2005
Identifi Cas 17 D21/h Semelles D21/h & J22/2b
par ADN Neuchtel ADN
Cas 4
20.04.2005
Fleurier
Logement Semelle Semelles D21/h & autres
Mis en cause 24.04.2005
G20/f MEMPHIS
par xxx Semelle G20/f
E10/c

Etablissement public
Semelle
D21/h
?Identifi
par Evnement VD
Btiment divers semelle? hors canton Leysin
Mis en cause 31.05.2005
par xxx Cas 5 24.04.2005 Cas 7 Semelle D21/h
Fleurier Fleurier Fleurier Semelle
24.04.2005 24.04.2005 D21/h
Magasin-kiosque
Semelle G20/f

Cas 3
Evnement
Fleurier Cas 6 BE
25.03.2005 Fleurier Gmligen
Link Link
Semelle autre 24.04.2005 27.05.2005
ADN Semelle D21/h
Link

Empreinte digitale Link


Cas XX Identifi
Neuchtel Contrle routier par ADN
28.04.2005 29.12.2005
Identifi par Neuchtel
Semelles autres
Natel empreinte digitale
Empreintes digitales Cas XX Cas XX
St-Aubin Couvet
Lien
17.11.2005 06.09.2005
ADN ADN
Empreintes digitales

Schma restructur
25--31st mars 2005 1--10th avril 2005 20--25th avril 2005 25--30th avril 2005 mai 2005 juin 2005 juillet--septembre 2005
18:00 00:00 06:00 26th 1st 5th 8th 10th 17th 20th 23rd 24th 25th 26th 27th 28th 1st 9th11th 12th 15th 17th 12:00 20th 25th 29th 31st 1st 5th 10th 15th 12:00 20th 1st aot septembre octobre 10th 18:00

Cas 15 et 16 Cas 17 BE VD
Marin-Epagnier Neuchtel Marque inconnue Gmligen Leysin
D21/h
08.04.2005 22.04.2005 27.05.2005 31.05.2005
(ADN et trace J22/2b) (et autres traces de semelles)

Cas 13 Lien ADN BE


Fleurier Brienz
13.06.2005 22.06.2005
(ADN et Empreintes digitales)

3 vnements BE Cas 12 Cas 14


sur canton de Commerce Saint-Blaise Peseux
Berne Uetendorf 30.05.2005 14.09.2005
ADIDAS
07.04.2005 (Empreintes digitales)
E20/l

Cas 9 Cas 10 Cas 11


Travers Couvet Saint-Blaise
10.05.2005 16.05.2005 20.05.2005
(Empreintes digitales) (et autres traces de semelles)

Fleurier

Mis en cause Mis en cause NIKE Shox


par xxx par xxx J10/o ligne
Cas 3 Cas 4
Fleurier Fleurier NIKE Shox
J10/o
25.03.2005 24.04.2005
(Semelle autre)
Mis en cause
par xxx

Lieu

Cas 5
Fleurier
24.04.2005 Cas 8
Travers
Identifi par Cas 1 12.05.2005
empreinte digitale Fleurier Marque inconnue MEMPHIS
(et autre trace de semelles)
15.04.2005 G20/f E10/c
(Semelles: E10/b et C/q)
(ADN et Empreintes digitales)
Cas 7
Fleurier
24.04.2005

Lien ADN Natel


Par ADN ou
empreinte Cas 6
Fleurier
24.04.2005
Cas XX 2 vnements Cas XX Cas XX Cas XX Cas XX
Neuchtel sur canton de Berne Appartenance incertaine Colombier Travers Couvet St-Aubin
4 vnements 2 vnements Cas 2 28.04.2005 23.12.2005 22.06.2005 06.09.2005 17.11.2005
sur canton de Berne sur canton de Berne Fleurier (Semelles autres et Empreintes digitales) (ADN et Semelles autres) (ADN et Empreintes digitales) (ADN)
(Kniz et Biglen) 15.04.2005

Butin son
domicile
Identifi par Identifi Identifi
empreinte digitale par ADN par ADN
Logement
Contrle routier
29.12.2005
Btiment divers Neuchtel

Etablissement public

Magasin-kiosque
AaBbYyZz AaBbYyZz
??? ???

Lien tabli Lien de lieu


80 Evaluations prliminaires

Les schmas restructurs sont plus faciles apprhender et ont rpondu aux attentes des
enquteurs. Plusieurs amliorations ont t apportes. Sur le premier, la structure globale a
t revisite. Sur le second, le placement des entits a t optimis.

D i s c u s s i o n

Alors que les deux schmas initiaux sont trs diffrents, les deux solutions proposes sont trs
similaires. En effet, les deux affaires portent sur les mmes types dinformation et lobjectif
danalyse est similaire : reconstruire et dcrire une srie. Les deux schmas produits sont des
schmas dvnements24. Est-il alors possible de formaliser une solution adapte pour cette
situation rcurrente ?

R e p r s e n t a t i o n d u n c a s d a b u s s e x u e l

La visualisation peut galement tre exploite au tribunal pour faciliter la communication dun
argument et accroitre limpact motionnel dun propos (Feigenson & Sherwin, 2007). Les effets
psychologiques et rhtoriques engendrs par la visualisation devraient tre vits ou au moins
contrls, afin que la ralit des informations prsentes ne soit pas dtourne pour soutenir


24
Cf. Analyse et visualisation relationnelle, page 43


Impact sur lanalyse et la communication 81

une interprtation fallacieuse des faits. Lexemple de visualisation ci-dessous, a t labor la


fin dune enqute pour faciliter lapprhension du dossier par les parties et le tribunal. Laffaire
porte sur la mise en accusation dun htelier ayant abus sexuellement de certaines de ces
employes. Au cours des cinq annes sur lesquels portent lenqute, une trentaine demploys
a travaill dans lhtel et les dclarations sont nombreuses. Lobjectif de la visualisation est de
rsumer les informations sur les svices subis par les victimes, ainsi que de montrer les
priodes dactivits des employs afin de comparer les diffrences de dures entre les
employs victimes et les employs non victimes.

Il sagit dun schma chronologique o chaque employ est reprsent par une ligne
horizontale (icne de personne : rouge pour les femmes et bleu pour les hommes), les dates
de dbut et fin dactivits sont reprsentes par des icnes relies par une ligne horizontale
qui dcrit donc la priode dactivit. Des informations textuelles sont ajoutes sur chaque
ligne. Celles-ci rsument les dclarations des employs concernant les svices subis (ou
labsence de svices). Le graphique est divis en deux parties distinctes sur laxe vertical : en
haut, les employs ayant dclar avoir subis des actes dordre sexuel et en bas, les employs
non victimes.


82 Evaluations prliminaires

Une telle affaire a une dimension motionnelle relativement importante, notamment au


regard du nombre de victimes. De plus, la dimension temporelle a galement un impact sur
linterprtation de la gravit des infractions. Ce schma a t prsent au tribunal. Il a
galement t utilis lors de cours, comme exemple dexploitation de la visualisation sur des
affaires de murs. Il illustre, la possibilit de synthtiser de faon simple un nombre important
dinformations et la manire de faciliter la comparaison de priodes. Toutefois, il induit
galement une interprtation implicite fallacieuse des priodes reprsentes par les lignes
horizontales. En effet, la longueur des lignes semble a priori reprsenter la priode pendant
laquelle lemploy a subi les actes incrimins. Ce qui nest absolument pas le cas, puisque les
dates choisies sont celles de dbut et de fin dactivit. Deux des victimes reprsentes sur le
schma ont travaill sur une priode de plusieurs annes, ce qui induit lhypothse quelles ont
subi plus longtemps des agressions sexuelles, ce qui nest pas forcment le cas. Lexploitation
de cet exemple dans le cadre de cours a t compltement revue, suite un lapsus, effectu
inconsciemment par lauteur, sur la signification des priodes. En effet, cet exemple illustre un
biais induit par la reprsentation. Bien que la visualisation a t construite de faon intgre par
rapport aux donnes initiales (la chronologie est respecte, lensemble des informations a t
inclus, les informations sont tries de faon logique et documente), une mauvaise
interprtation reste possible. La signification induite par une visualisation peut donc dpasser
la ralit des informations reprsentes (Feigenson & Sherwin, 2007).

Il semble a priori relativement difficile de se prvaloir dun tels biais. Une discussion plus
labore sur les objectifs attendus de la visualisation (pourquoi est-il relevant de comparer les
priodes dactivits entre victimes et non victimes ?), ainsi quune discussion avec des lecteurs
sur la manire dont ils interprtent le schma auraient peut-tre permis de dtecter ce biais.
Cet exemple, illustre limportance de deux tapes importantes du processus de visualisation :
la dfinition et lvaluation des objectifs de lanalyse ou des observations communiquer et
lvaluation du produit de renseignement labor.

S y n t h s e

C o n s t a t

C o n t e x t e d e x p l o i t a t i o n

Les dcisions prises dans le cadre de lenqute judiciaire sur la base de visualisations, peuvent
avoir un impact important (notamment au niveau du jugement) ou engendrer des cots
importants en terme de ressources et de temps (par exemple, lorsquil sagit de mettre sur
pied des oprations policires ou des mesures de prvention). La visualisation est exploite
pour soutenir diverses dcisions qui peuvent galement avoir un impact sur la rsolution du
cas, voire la condamnation dun prvenu. Les reprsentations graphiques se doivent donc
dtre intgres. Elles doivent faciliter lanalyse et lapprhension des renseignements en
reprsentant la ralit des informations sans ajouter des biais. Les choix effectus pour
produire des reprsentations se doivent donc dtre guids afin de concevoir des produits de
renseignement efficients.

La visualisation peut tre exploite pour soutenir un nombre importants dobjectifs ; tels
quanalyser des informations collectes au cours de lenqute, valuer a posteriori une
investigation, aider qualifier les infractions, faciliter lapprhension dun dossier et soutenir
une argumentation lors du procs. Il nest a priori pas certain quune forme de visualisation
particulire puisse rpondre lensemble des attentes des diffrents acteurs du processus. Les
objectifs et les contraintes voluent au cours de lenqute. Les reprsentations exploites
peuvent donc varier au fil du processus.


84 Synthse

N a t u r e d e s c o n c e p t s r e p r s e n t e r

La diversit des concepts reprsenter dans le cadre de lenqute criminelle est certainement
lune des causes des difficults observes. Dune part le domaine du discours (lensemble des
entits nommes) nest certainement pas universellement dfinissable. Une enqute financire
porte sur des concepts tels que des comptes et des transactions. En matire de stupfiants, les
investigations portent sur des saisies, des chantillons, etc. Chaque champ dinvestigation
implique des raisonnements bass sur des concepts souvent spcifiques. Bien que certains
concepts puissent tre formaliss de manire apparemment gnrique (comme les
vnements, les personnes, les objets et les traces), il nest absolument pas certain quil existe
des manires gnriques de reprsenter les informations. En outre, le domaine du discours
change en fonction de lvolution des problmes traits. Une structure dfinie un moment
prcis dune affaire peut se voir bouleverse par larrive de nouvelles informations.

Au cours du processus, diverses hypothses sont mises et il est capital de pouvoir rattacher
lensemble des informations reprsentes aux informations collectes et leurs sources. Les
diffrents types de sources doivent tre clairement identifiables (tels que les traces physiques
et les tmoignages), afin de permettre lvaluation de la fiabilit des informations. Les
informations sont souvent imprcises, voire incertaines. Il est donc ncessaire de pouvoir
exprimer visuellement lincertitude. Les hypothses doivent galement tre clairement
distinguables des informations factuelles et testimoniales.

La gestion de la ngation est, par ailleurs, une question ouverte en termes de reprsentation.
Comment reprsenter par exemple le fait quun individu est inconnu des services de police ou
reprsenter le fait quun individu nie avoir particip un vnement particulier. Ne pas
reprsenter la ngation engendre une confusion avec labsence dinformation. Selon Bertin
(2005), labsence de signe signifie labsence dinformation. La ngation doit donc tre
reprsente sur un graphe. Toutefois tracer un lien entre deux entits est gnralement
interprt comme la prsence dune association et non de la ngation. Visuellement la
premire impression est donc fausse. Des conventions doivent donc tre dfinies pour
exprimer la ngation et la distinguer de labsence dinformation.

V a r i a b i l i t d e s r e p r s e n t a t i o n s

Les exemples prsents mettent en vidence une problmatique fondamentale de la


reprsentation relationnelle des informations : il nexiste pas de consensus gnral pour
reprsenter les informations sur un graphe. Suivant les perceptions, une mme information


Constat 85

peut tre reprsente sous la forme dune entit, dun lien, dun cadre ou dun attribut. La
transformation dune information textuelle en reprsentation relationnelle ne semble en effet
pas tre une tche triviale. Les graphes offrent une libert dexpression trs grande. Tous les
lments reprsents peuvent tre en relation (dfinition smiologie dun graphe) et le
nombre de degrs de libert disponibles est considrable. En dautres termes, de nombreuses
variables visuelles sont exploitables pour encoder une information. De plus, il nexiste que peu
de recommandations et de rgles sur la manire de les exploiter (cest le cas notamment de la
position des sommets sur le plan, de leur couleur, de leur forme). Le constat est dautant plus
proccupant en regard de limpact de ces choix de reprsentation sur lanalyse et la
communication du renseignement.

B i a i s d i n t e r p r t a t i o n e n g e n d r s p a r l a
r e p r s e n t a t i o n

Diffrents biais peuvent tre engendrs par un usage inadapt de reprsentations graphiques.
Ces biais peuvent tre issus dun mauvais usage de la visualisation (par son crateur) ou dune
mauvaise lecture (par son destinataire). Lors de la cration dune reprsentation des biais
peuvent tre ajouts intentionnellement ou non. Lors de la lecture des biais peuvent avoir de
nombreux effets : engendrer de la confusion, une mauvaise interprtation, distraire, faciliter la
manipulation, voire limiter la rflexion (Bresciani & Eppler, 2008). En regard du contexte
dexploitation, de tels biais doivent tre vits. Lajout intentionnel de biais ne sera pas discut
dans cette thse. Par contre le fait quune reprsentation engendre des ambiguts lors de sa
lecture, ou quelle puisse mener des erreurs de raisonnements sont considrs comme des
critres fondamentaux dvaluation et de comparaison des solutions tudies : le critre
dintgrit. La transposition dun discours crit sur un graphe prsuppose que le langage
visuel offre la possibilit dexprimer les concepts de faon cohrente. Les possibilits offertes
pour reprsenter les informations sont multiples et les choix effectus influencent dune part
lintgrit de la reprsentation (le graphique reprsente-il toujours la ralit des informations
sous-jacentes), mais galement la facilit dapprhension de la reprsentation.

I m p o r t a n c e d e l e f f i c a c i t d e l a
r e p r s e n t a t i o n

Lefficacit dune reprsentation graphique nest pas dfinie dans labsolu, mais toujours en
regard dune autre forme de visualisation. Une reprsentation est juge plus efficace si le
temps de lecture ncessaire pour rpondre une question danalyse de faon correcte et
complte est plus court quen exploitant une autre forme de reprsentation. Loptimisation de
lefficacit des reprsentations relationnelles est ncessaire afin dassurer quelles soient


86 Synthse

utilisables. En effet, la complexit et la quantit dinformations reprsentes impliquent


gnralement doptimiser la manire de les reprsenter afin de pouvoir les analyser. Une
reprsentation peu efficace dans le sens o elle ne permet pas une analyse rapide et fiable des
informations ne remplit certainement pas son rle. Lefficacit est donc un critre
dapplicabilit important qui ne sauraient tre nglig et qui peut tre value selon des
critres objectifs : lexactitude, la compltude et le temps de rponse pour une question
danalyse dtermine.

V i d e m t h o d o l o g i q u e

Alors que lutilisation des techniques de visualisation est recommande en analyse criminelle
afin danalyser et de communiquer les informations collectes, les manuels et la littrature du
domaine noffrent que peu de recommandations en la matire. Des types gnriques de
schmas relationnels sont dfinis et quelques recommandations gnrales sont proposes25.
Les outils de visualisations disponibles donnent limpression de sintgrer de faon
harmonieuse dans une mthode standardise. Pourtant, il ne semble pas exister lheure
actuelle une dmarche clairement formalise guidant les choix effectuer. Le processus de
raisonnement exploit pour transposer une information sur un graphe nest pas formalis. Le
langage visuel nest que partiellement dcrit. Finalement, les avantages et limites des
proprits visuelles exploitables sur un graphe ne sont pas clairement dcrits et valus.
Llaboration de telles reprsentations reste, dans une large mesure, base sur des
connaissances tacites lies lexprience, la capacit de se remmorer des solutions ayant
dmontr leur efficacit et transposer leur usage de nouvelles situations (tel que prsent
dans lexemple de la reprsentation dun trafic de marchandises).

L i m i t e s i m p o s e s p a r l e s o u t i l s

Les outils exploits pour produire les visualisations limitent galement les choix. La graphique
offre thoriquement un ventail de possibilits uniquement limit par limagination.
Cependant, lavnement de linformatique bien quayant facilit lautomatisation de la
production des reprsentations a galement conduit un appauvrissement des possibilits
qui sont maintenant dlimites par les fonctionnalits proposes par les outils. Les
informations sont intgres dans un nombre restreint de structures visuelles (par exemple, une
icne, un texte, un cadre, un lien), alors que les structures visuelles devraient raisonnablement
tre adaptes en regard de la nature des informations reprsenter. Par ailleurs, afin de
pouvoir grer lvolution des objectifs danalyse au cours dune enqute et la diversit des


25
Cf. Recommandations et standards, page 45


Consolidation des mthodes 87

concepts reprsenter, les outils devraient offrir des possibilits dadaptation dynamique des
formes de reprsentation (notamment au niveau de la structure des graphes, des possibilits
de slection et de faire varier les niveaux dagrgation). Les outils actuellement exploits
large chelle semblent stre imposs en raison de leurs simplicits dutilisation. Toutefois le
traitement de linformation et les formes de raisonnements mis en uvre pour rsoudre une
affaire criminelle nen restent pas moins complexes. Les outils devraient tre dvelopps en
regard des raisonnements impliqus et permettre une souplesse de reprsentation ncessaire
lors de lanalyse dun cas.

C o n s o l i d a t i o n d e s m t h o d e s

D l i m i t a t i o n d u c a d r e

Quatre dimensions danalyse ont t dfinies afin de classifier les mthodes de visualisation en
regard des objectifs danalyse : les dimensions relationnelle, temporelle, spatiale et
quantitative. Chaque dimension est constitutive dune forme danalyse et des reprsentations
propres sont exploites pour chacune delles. Cette thse se focalise sur les reprsentations de
lanalyse relationnelle.

De plus, lensemble des reprsentations graphiques traites dans cette recherche sont
produites dans un espace deux dimensions. Il faut relever que de nombreuses recherches
ont t effectues en matire de visualisation trois dimensions. Lannexe trois rsume les
tudes ayant valu et dcrit les avantages et faiblesses de la visualisation trois dimensions.
Les raisons lies au contexte dexploitation de la visualisation en analyse criminelle qui ont
motiv le choix de focaliser cette tude sur les reprsentations deux dimensions sont
galement explicites en annexe. Par ailleurs, lintgration de la dimension temporelle par
lusage de reprsentations dynamiques nest pas tudie en dtails. Les limites des outils
exploits pour produire des graphes sont toutefois discutes (notamment en regard de la
ncessit de pouvoir dynamiquement modifier la structure dun graphe).


88 Synthse

O b j e c t i f s

1. Identifier des lments de mthode susceptibles daboutir la ralisation de schmas


efficaces et les structurer dans une dmarche dcrivant leur processus de conception.
2. Trouver dans la pratique des situations rcurrentes qui peuvent faire appel des
visualisations typiques.
3. Initier une dmarche base sur llaboration dun dictionnaire de patterns qui
dcrivent des solutions typiques pour les situations rcurrentes identifies.
4. Evaluer limpact sur les outils des lments de mthodes identifis.

M t h o d o l o g i e

Les mthodes et les recommandations gnrales provenant de travaux sur la visualisation en


tant que domaine indpendant de ces champs dapplication (par exemple les travaux de
Bertin, Tufte, Ware, etc.) ont t recherches et intgres dans une bauche de dmarche
dcrivant le processus de conception dun schma relationnel en analyse criminelle. Les
rsultats de la recherche sont volontairement prsents du gnral au particulier afin
dillustrer la manire dont les observations gnrales sintgrent dans les bonnes pratiques et
de quelle manire les outils devraient intgrer les lments de mthode proposs. La
recherche a cependant galement t effectue de manire empirique partir des situations
rcurrentes tudies. Des similitudes ont t recherches au niveau du processus de
conception dun graphe et sur les formes de reprsentation elles-mmes.

Il faut dailleurs relever que cette recherche a t initie suite au traitement du cas prsent
comme exemple de reprsentation dun trafic de marchandises26. En effet, le changement de
structure opr sur le graphe a t effectu en relevant une analogie avec la reprsentation de
donnes dappels tlphoniques. La solution retenue ayant montre une certaine efficacit
lusage, Il a t dcid de rpertorier des cas dutilisation de la visualisation, afin dinitier le
dveloppement dun catalogue de situations rcurrentes et leurs reprsentations propres.
Cette approche vise la formalisation de bonnes pratiques lies lusage de reprsentation des
informations rgulirement traites dans lenqute judiciaire (telles que les donnes de
tlphonie, les donnes financires et les traces physiques) en fonction dobjectifs spcifiques.
Des formes de visualisations adaptes pour chaque situation sont ainsi dcrites. Lide ici nest
pas formaliser des meilleures pratiques , mais des pratiques ayant prouv lusage une
certaine efficacit.


26
Cf. Reprsentation dun trafic de marchandises, page 75


Consolidation des mthodes 89

Finalement, lors de ltude des cas et la ralisation des schmas relationnels, des limites
imposs par les outils et des difficults techniques ont t identifies. La mthode dcrite dans
le premier chapitre et les exemples prsents dans le second reposent notamment sur les
possibilits offertes par les outils. Alors que les outils devraient sintgrer et soutenir la
dmarche danalyse, ils crent parfois des ruptures dans le processus de raisonnement et
imposent des contraintes lies aux fonctionnalits offertes. Limpact sur les outils des lments
de mthodes formaliss est donc discut. Un prototype de visualisation intgrant plusieurs
des dimensions danalyse a par ailleurs t labor.

Les thories et recommandations issues des travaux sur la visualisation ont t intgres tant
au niveau de la mthode, des bonnes pratiques et de la discussion sur les outils.

P A R T I E I I : C O N T R I B U T I O N A U X
M T H O D E S D E C O N C E P T I O N D E S
S C H M A S R E L A T I O N N E L S

P r o c e s s u s d e c o n c e p t i o n d u n
s c h m a r e l a t i o n n e l
Toute communication graphique se base sur lutilisation de conventions entre le rdacteur et
le lecteur. Elles dterminent la manire dont les messages sont produits et interprts. En
matire de reprsentations graphiques, les conventions dfinissent notamment le lien entre
les composants visuels et leurs significations propres (Mackinlay, 1986). La signification du
signe est dfinie lavance dans un systme monosmique27. Par exemple, une flche peut
reprsenter le signifi direction ou sur un graphe relation dirige :

Un systme de signe est donc dfini par un ensemble de conventions. Toutefois, lors de la
production dun graphe, le signe flche est gnralement exploit pour
reprsenter une autre information que direction ou flche ou relation dirige . Par
exemple, les schmas de flux labors en analyse criminelle exploitent ce signe pour dcrire
une communication tlphonique, une transaction bancaire, voire une vente. Un signe
adapt doit tre choisi pour chaque information reprsenter. Le processus nest cependant
pas direct ; une tape de raisonnement intermdiaire est ncessaire. Pour chaque
information, un signifi (pour lequel un signifiant est dfini) est choisi: communication
tlphonique (relation dirige), vente (relation dirige), amis (relation non dirige), etc.

Pour un systme monosmique donn, le passage du signifi au signifiant (le signe visible)
est dfini par le langage visuel. En effet, si une vente est identifie comme une relation
dirige, lutilisation de la flche comme signifiant est dfini par le systme de signe utilis.
Toutefois, diffrents systmes de signe peuvent tre exploits. Par exemple, une entreprise
(information) peut tre considre comme un groupe (signifi) qui peut tre reprsent de
diverses manires (signifiants):


27
Cf. Mthodes dvaluation de visualisations, page 59


92 Processus de conception dun schma relationnel

(un cadre) (un sommet) (un lien multiple)


Le processus de cration dun schma relationnel peut donc se modliser ainsi :

Systme de signes

Information Signifi Signifiant

Figure 7 Processus de conception dun graphe


Ce formalisme ne dcrit pas le processus gnral de production dune reprsentation
graphique. Il permet toutefois de dcomposer les tapes de raisonnements effectues pour
produire un schma et distinguer des causes possibles expliquant certaines des difficults
observes (la diversit des manires de reprsenter la mme information, les ambiguts et
les erreurs de lecture) :

1. Le systme de signes doit permettre de reprsenter lensemble des types


dinformations analyser.

Lune des lacunes identifies en analyse criminelle est labsence dune dfinition formelle du
langage visuel exploit sur les graphes. Une syntaxe uniforme et correcte est ncessaire afin
de produire un graphe prservant la smantique des concepts et des relations reprsents
(Reed & Kocura, 2005).

La dmarche entreprise dans cette recherche, nambitionne pas de concevoir un langage


formel complet. La grande diversit des situations rencontres lors des enqutes et la nature
volutive des problmes criminels ou de scurit remettent en question la possibilit de
dfinir un langage exhaustif. Lidentification de certains types dinformations gnriques
rgulirement investigus dans les enqutes (p. ex. des transactions, des vnements et des
groupes de personnes ou de dlits) restent nanmoins possible et utile pour tendre vers une
formalisation plus prcise du langage. De la littrature il ressort que des types dentits sont


Consolidation des mthodes 93

gnralement dfinis et forment le domaine du discours28, mais rarement des types de


relations. La nature de ces relations, le degr de confiance et la fiabilit de ces relations ne
sont que rarement dfinis et dcrit par le langage (Amar & Stasko, 2005).

Hypothse : une classification des types de relations mettre en vidence entre les
objets analyser est ncessaire.

La dmarche propose consiste identifier des types de relations gnriques et dcrire leurs
proprits. Puis de proposer et valuer une manire efficace de les reprsenter. Comme en
tmoigne les valuations prliminaires effectues, choisir une manire efficace de
reprsenter les relations semble tre une tche importante du processus.

2. Le systme de signe doit tre clairement dfini. Pour chaque signifiant, le signifi doit
tre pralablement dfini afin de pouvoir tre interprter et viter les ambiguts.

Hypothse : le langage visuel peut tre dfini en regard des types de relation
identifis.

Dans la mesure o des types de relations gnriques peuvent tre formaliss, le langage
visuel devrait tre dfini en regard de cette typologie. Pour chaque type, un signe est dfini
afin de constituer un langage commun monosmique. La signification des signes ainsi
clairement dfinie, le raisonnement ncessaire pour produire un graphe est simplifi. Si le
langage dfinit par exemple le cadre comme signe pour reprsenter un groupe, choisir un
signe adapt pour reprsenter une entreprise revient dterminer si celle-ci est un groupe.
Les types de relations doivent donc tre clairement dfinis et distinguables.

3. Les composants graphiques et les proprits visuelles exploitables pour reprsenter


les informations sont multiples. Il convient de dfinir pour chaque signifi quel est le
signifiant le plus adapt.

Hypothse : pour chaque type de relation, un signifiant adapt peut tre dfini en
fonction des critres dintgrit et defficacit.


28
Cf. Analyse et visualisation relationnelle, page 38


94 Processus de conception dun schma relationnel

Ltape finale du processus consiste dfinir un signifiant adapt pour chaque type de
relation. Choisir une manire efficace et intgre de reprsenter les relations est certainement
lune des tapes cl du processus pour assurer la qualit de la reprsentation (Senator, 2005).
Le choix peut tre intuitif, mais il peut aussi se baser sur une valuation de lefficacit relative
de chaque signifiant selon des critres objectifs29.

Afin de prsenter les recherches et les valuations effectues pour tester les hypothses
prsentes ci-dessus, ce chapitre est structur en trois parties. Premirement, le langage
visuel exploit pour reprsenter des informations sur un graphe est dcrit. Les proprits
visuelles utilisables pour reprsenter des relations sont prsentes et une typologie de
relations est propose. Afin de faciliter la description de cette classification, les dfinitions
smantiques des types de relations sont prsentes avec leur reprsentation propre. Une
valuation empirique de lefficacit de certaines des formes de reprsentation proposes a
t entreprise. Les rsultats sont prsents et discuts. Finalement la dernire partie
regroupe les lments de mthode formaliss. Ils sont prsents en suivant le processus de
conception dun graphe.

D e s c r i p t i o n d u l a n g a g e v i s u e l

P r o p r i t s d u p l a n

Les composants du langage visuel sintgrent dans le plan selon des structures visuelles qui
peuvent en elles-mmes possder une signification. Selon la thorie de la Gestalt (thorie de
la forme, du pattern), une structure perue par un positionnement non alatoire des
composants sur le plan, induit un message souvent implicite et automatique (Card et al.,
1999) (Chang et al., 2002) (Ware, 2004).

Certains principes de la Gestalt sont trs connus : tel le postulat que le tout est diffrent de la
somme de ses parties et celui que le tout est peru avant les parties qui le composent. Ce
dernier principe semble tre caus par la morphologie de lil humain. Nous percevons les
informations selon deux mcanismes distincts (lis la diffrence entre les rcepteurs de la
rtine et de la fova). Premirement, l'aspect global est peru, puis nous avons la capacit de
focaliser notre attention sur un lment plus prcis. La perception globale et immdiate,
alors que la focalisation est contrle. Une visualisation est donc perue den un premier

29
Cf. Critres dvaluation, page 61


Description du langage visuel 95

temps dans sa globalit, puis ces composants sont lus en dtails (Ware, 2004). De plus, une
partie dun tout, nest pas perue de la mme manire, si elle est reprsente seule ou dans
un ensemble. Le contexte global, notamment la mise en place sur le plan des composants,
est un aspect important du langage visuel. En effet, les positions relatives des entits sur le
plan permettent dexprimer des relations (par exemple, de distinguer des groupes de
personnes ou de dcrire une chronologie dvnements).

La Gestalt dcrit des mcanismes de perception affectant linterprtation smantique des


formes. De nombreuses lois ont t dfinies. Seules celles ayant un impact sur la
reprsentation par un graphe des informations sont rsumes ci-dessous. Elles dcoulent du
principe gnral de prgnance : un ensemble de composants tend tre peru comme une
forme globale rgulire, symtrique et stable. Une reprsentation est facile comprendre si
sa structure est simple.

Loi de proximit : des composants placs proximit, ont


tendance tre perus comme un groupe.

Loi de continuit : des composants sont perus comme un groupe


lorsquils semblent former un prolongement.

Loi de fermeture : des composants distincts peuvent tre perus


comme une forme rgulire ferme. Le cerveau a tendance grouper
des composants sarrangeant en une forme ouverte et remplit les
vides.

Loi de la symtrie : des composants symtriques tendent tre


perus comme un ensemble.

Ces lois explicitent comment les positions relatives des composants gnrent des structures.
Celles-ci peuvent tre exploites afin de reprsenter des groupes dentits, voire des
relations. En matire danalyse criminelle, la position sur le plan des composants est parfois
exploite pour reprsenter une certaine proximit. Par exemple lors de la reprsentation dun
rseau, la proximit de deux individus sur un graphe est reprsentative de leur proximit
dans le rseau. Une position centrale sur le graphique peut galement exprimer une position
centrale dans le rseau (Sparrow, 1991). Ce dernier point est toutefois sujet interprtation.


96 Processus de conception dun schma relationnel

En effet, la centralit dune personne sur un graphe peut galement tre lie au fait que le
nombre de donnes rcoltes sur cette personne est simplement plus grand (notamment
lorsque lenqute a dmarre partir delle). De manire gnrale, les entits positionnes au
centre dun schma sont perues plus rapidement que celles places en priphrie (Eppler &
Aeschimann, 2009). Il convient donc de positionner les informations de faon adapte pour
ne pas mettre en valeur involontairement des entits positionnes au centre dun schma.

Le positionnement des entits sur le plan peut galement influencer linterprtation des
relations et la dtection de sous-groupes indpendamment de la prsence relle de relations
traces par des traits entre les entits (McGrath et al., 1997). Des entits positionnes
proximits peuvent tre considre comme lie uniquement sur la base de leur placement.
En effet, la position sur le plan des composants constitue lune des variables visuelles la plus
efficace pour encoder des relations entre les entits (Mackinlay, 1986). Par exemple une
relation temporelle peut tre reprsente par un alignement des composants sur laxe
horizontal en fonction du temps30.

C o m p o s a n t s d u n g r a p h e

Selon Bertin (2005) toute reprsentation graphique est constitue de trois implantations
fondamentales : le point, la ligne et la zone. La tche qui rend visible un point peut varier de
taille, valeur, grain, couleur, orientation et forme. En matire de visualisation relationnelle par
un graphe, les composants lmentaires du langage visuel rejoignent les implantations
dfinies par Bertin :
Le nud (ou sommet) qui reprsente un point du plan. Le nud est
gnralement exploit pour reprsenter une entit.

Larte (ou arc) qui reprsente une ligne entre des nuds. Larte est
gnralement exploite pour reprsenter une relation entre deux
nuds.

Le cadre qui reprsente une zone dlimite par un trait englobant


des nuds. Un cadre est gnralement exploit pour reprsenter un
groupe : une relation entre un ensemble dentit.


30
Cf. Annexe 1: Dimensions danalyse et visualisation - Analyse temporelle, page 239


Description du langage visuel 97

Lune des lois de la Gestalt dcrit lutilisation combine de ces signes (Palmer & Rock, 1994)
(Ware, 2004):


Loi de connectivit : connecter des composants par un trait ou un

cadre permet de reprsenter des relations entre des entits. La
perception de la connectivit prvaut en principe sur la perception
de la proximit ou de la similarit (prsente ci-dessous).

Des informations peuvent galement tre reprsentes sous la forme de texte sur
un graphe. Le texte peut tre inclus de deux manires: sous la forme
dun label (ou tiquette) directement sur lun des composants
Label
graphiques et sous la forme dune annotation (description,
commentaire).
Une annotation
permettant dinclure
un commentaire ou
une description.
A t t r i b u t s g r a p h i q u e s

La Gestalt dfinit galement une loi indpendante du placement :

Loi de similarit : des composants similaires sont perus comme des


groupes. La similarit est produites par un usage commun dun ou
plusieurs attributs graphiques (forme, couleur, taille, etc.)

La loi de similarit est induite par un usage contrl des variables graphiques appeles
variables retiennes par Bertin (2005) (p. ex. taille, valeur, grain, couleur, orientation et forme).
Lefficacit de ces variables pour encoder une information a t largement tudie dans la
littrature depuis les travaux de Bertin (Mackinlay, 1986). En effet, certaines variables sont
plus efficaces pour encoder des donnes quantitatives, nominatives ou ordinales (Bertin,
2005)31.

31
Une composante est nominale lorsque ses catgories ne s'ordonnent pas de faon universelle (par exemple, les
zones gographiques qui sont notamment classables par ordre alphabtique, par superficies ou en fonction du
nombre d'habitants), une composante est ordonne lorsque ses catgories s'ordonnent d'une seule manire
universelle (par exemple, le choix d'une cuisson de viande: bleu, saignant, point, cuit, trs cuit), finalement une
composante est dite quantitative lorsqu'elle a comme objet de prciser une variation de distance entre deux
catgories (le systme mtrique, le temps, etc.).


98 Processus de conception dun schma relationnel

Les tableaux ci-dessous rsument les principales variables exploites sur un graphe en regard
du type dinformation quelles permettent de reprsenter efficacement (inspir de (Mackinlay,
1986), p. 125, (Ware, 2004), p. 214 et (Ware, 2008), p. 63-64):

A t t r i b u t s d e s n u d s

Variable Type de
Description
graphique donnes
Licne est gnralement exploite pour reprsenter le type
Licne ou la
Nominale dentit (p. ex. une personne, un vhicule, etc.). Licne
forme
permet de dcrire le prdicat est un .
La couleur permet galement de distinguer des types. La
Nominale
La couleur couleur peut tre exploite pour encoder des variables
ou ordinale
ordinales.
La taille de lentit peut tre exploite pour reprsenter une
La taille Quantitative
variable quantitative (p. ex. le nombre dentits lies).

A t t r i b u t s d e s a r t e s e t d e s c a d r e s

Variable Type de
Description
graphique donnes
La couleur permet de reprsenter des types de relation en
Nominale
La couleur fonction de leur nature : relations familiales, relations
ou ordinale
tlphoniques, financires, etc.
Lpaisseur des artes peut encoder une variable quantitative
(comme le nombre de relations par exemple). Les variations
Lpaisseur Quantitative dpaisseur des liens sont plus facilement comparables que
les variations de taille des nuds (variation sur une seule
dimension pour les artes).
Le style de trait (continu, trait-till, etc.) est exploit pour
dcrit la fiabilit de la relation. La convention est que le trait-
Nominale
Le style till dcrit des relations incertaines et le trait continu des
ou ordinale
relations srs32. Dautres types de style peuvent galement
tre exploits pour distinguer des types de relation.

Les variables rtiniennes comme la couleur ou le style peuvent tre exploites pour
distinguer des types de dentits et de relations et pour exprimer la fiabilit des relations


32
Cf. Recommandations et standards, page 45


99

notamment. Elles doivent faire lobjet dune convention entre le lecteur et le concepteur de la
reprsentation (par exemple par le biais dune lgende). Les variables retiennes sont donc
gnralement exploites pour reprsenter les types dentits et de relations. Elles servent
visualiser des classes, dcrire les relations est un et est du type .

I m p o r t a n c e d e l a c o u l e u r

La couleur est la variable graphique la plus pr-


attentive. En effet, une variation de couleur est
perue plus rapidement et facilement que les
variations des autres proprits graphiques (telles
que la forme, la taille ou la texture). Il faut toutefois
noter que la couleur peut gnralement tre
exploite pour encoder entre six et douze catgories diffrentes. Au-del, la perception des
variations nest plus pr-attentive (Ware, 2004) (Ware, 2008). La couleur rouge tant la plus
pr-attentive, il est recommand de lutiliser pour mettre en avant le type dinformations le
plus important pour la question danalyse. Les travaux de recherches menes sur la couleur
et son exploitation pour reprsenter linformation sont nombreux. Ils ne sont pas discuts en
dtails ici. Il faut cependant relever que lutilisation dune variation de couleur ou de
contraste pour reprsenter une variable quantitative nest pas un choix adapt. En effet, la
perception peut tre fausse en fonction des couleurs environnantes (Ware, 2008).

Les barres verticales sont de couleur identique


100 Processus de conception dun schma relationnel

T y p o l o g i e d e r e l a t i o n s
Les formes syntaxiques dcrites dans cette section dcrivent des manires de combiner et
disposer les composants graphiques afin de former une structure visuelle associe une
catgorie particulire de relation.

- Le lien : une relation entre deux entits. Elle reprsente le prdicat est li . Elle est
dfinie par son type (par exemple, une relation familiale, professionnelle, etc). Par
dfinition, le lien ne dcrit pas une relation entre plusieurs entits (visuellement un lien
est reprsent par une arte, un trait entre deux entits).

- Le lien dirig : une relation avec un sens entre une entit source et une entit cible. Par
exemple, les relations de filiation ont un sens. Le rle dune entit dans la relation dcrit
la fonction quelle occupe. Par exemple pre et fils sont des rles dune relation
de filiation. Dautres types de relation ont galement un sens : les relations de causalit
et les relations dfinissant un ordre ou une squence, telle que les relations
chronologiques. Une relation peut donc tre dirige ou non.

- Le lien bidirectionnel : une relation qui se ralise dans les deux sens. Par exemple un
change de biens entre deux individus est une relation commerciale double sens. Alors
que la causalit est une relation directionnelle, linfluence par exemple peut tre
bidirectionnelle (deux personnes ou deux groupes dindividus peuvent sinfluencer
mutuellement).


Typologie de relations 101

Certaines relations existent entre plus de deux entits ; telle que lappartenance une famille
qui est une relation entre plusieurs individus. Afin de distinguer les relations entre deux
entits des relations entre plusieurs entits, les notions de groupe, densemble et de lien
multiple sont dfinies :

- Le groupe : un ensemble dentits formant un tout. Il regroupe des entits partageant


une ou plusieurs caractristiques communes et il possde gnralement un identifiant
propre (le nom de famille par exemple). Un groupe dcrit le prdicat est compos
de . Deux types de groupe sont distinguables: homogne et htrogne. Un groupe
homogne dcrit une relation entre des entits dun mme type (une famille qui lie des
personnes, un lot qui lie plusieurs produits du mme type). Un groupe htrogne
rassemble plusieurs entits dont les types peuvent varier. Afin de diffrencier ces deux
types de groupes, le terme densemble est propos.

- Lensemble : un groupe dentits dun mme type. Des reprsentations graphiques


spcifiques sont dfinies pour distinguer le groupe de lensemble.

- Le lien multiple : une relation entre plusieurs entits de diffrents types. Alors quun
groupe possde un identifiant, la relation multiple nen possde pas. Par exemple, lors
de contrle de vhicules, un lien multiple existe entre lvnement, le vhicule et la
plaque. Cet exemple est prsent sous la forme dun pattern dans le chapitre suivant.
Visuellement, il nest pas possible de reprsenter les relations entre les vnements, les
vhicules et les plaques par des liens simples sans engendrer de lambigut. Un signe
spcifique est ncessaire.

Le tableau ci-contre rsume lensemble des signes formaliss pour dcrire ces relations. Ces
catgories gnriques ont t dfinies en regard des cas traits et analyss qui sont
prsents dans le chapitre suivant. Le systme de signe est ainsi clairement dfini (pour
chaque signifiant le signifi est dcrit). Il est important de relever que le langage visuel dfini
est une extension du langage propos par les logiciels actuellement utiliss dans la pratique.
En effet, les signes dcrivant le lien bidirectionnel, le lien multiple et lensemble ne sont pas
disponibles dans loutil principalement exploit en analyse criminel33.


33
Analysts Notebook 8 de la socit i2, http://i2.co.uk, dernier accs le 12.01.2011


102 Processus de conception dun schma relationnel

Signifiant Signifi Description Exemples


Une chose possdant une Un vnement, une
personne, une trace,
Lentit existence distincte et
un objet, etc.
identifiable
Une relation
Une relation entre deux matrimoniale, le rle
Le lien
entits34 dune personne pour
un vnement, etc.
Une relation
Un lien dirig est une relation tlphonique entre
contenant un sens, dcrivant deux numros, une
Le lien dirig
une squence ou une relation transaction entre des
comptes, une relation
de causalit
pre-fils, etc.

Un lien bidirectionnel Un change de biens


entre des personnes,
Le lien reprsente un change ou un
un ensemble de
bidirectionnel ensemble de relations
communications ou
bidirectionnelles de transactions, etc.
Une relation entre un
Un lien multiple reprsente vnement, un
Le lien
une relation entre plus de vhicule et une
multiple plaque lors dune
deux entits
contrle, etc.

Une socit qui

Un cadre peut tre utilis emploie des


personnes, une zone
pour reprsenter un groupe
Le groupe gographique
ou une caractristique
commune entre
commune plusieurs entits plusieurs
vnements, etc.

Un ensemble dcrit un Un lot dobjets, une


srie de
groupe dentits du mme
cambriolages, un
type. Les accolades
Lensemble groupe dindividus,
permettent de faire la etc.
distinction entre une entit
unique et un ensemble

34
Un concept peut tre reprsent par un lien lorsquil est li deux autres entits (et uniquement deux). La
possibilit de reprsenter un concept par un lien ou une entit est discute et value dans lvaluation prsente
dans la section suivante et dans les exemples prsents dans le chapitre suivant.


Typologie de relations 103

Les variables graphiques et le positionnement peut galement tre exploit pour reprsenter
des relations :

Signifiant Signifi Description Exemples


Distinguer des
Les variables rtiniennes sont
vnements, des
gnralement exploites pour
personnes, des
dcrire des types dentits ou objets, etc.
Icne, couleur, forme,
Le type et de relations dfinis selon
etc.
des classes gnrales ou Distinguer des profils
ADN: profil partiel,
distinguer des concepts par
complet, de mlange,
leurs caractristiques etc.
Les rles et la
Le positionnement sur le plan hirarchie dune
organisation
des composants peut tre
criminelle, etc.
Positionnement La proximit reprsentatif de la proximit
des entits. Il peut galement Une squence
dcrire une squence. temporelle

Ce langage nest certainement pas exhaustif et pourrait tre dvelopp en fonction de


nouveaux problmes reprsenter. La dmarche propose ici consiste dfinir le langage en
fonction de la nature des informations reprsenter et non en fonction des possibilits
offertes par les outils. La dmarche tend vers une formalisation plus claire du langage afin de
faciliter la conception des graphes et minimiser les risques dambigit lors de son
utilisation. Le niveau dabstraction est volontairement gnral et simple afin de lexploiter le
plus facilement possible, sans contraindre et complexifier son utilisation par des dfinitions
rigides. Il est mis en uvre et explicit par les exemples prsents dans le chapitre suivant.

D i s c u s s i o n s u r l u t i l i s a t i o n d u l a n g a g e

Slectionner un signe adapt pour reprsenter un concept (sous la forme dune entit ou
dun type de relation) nest pas trivial. Par exemple, le fait dtre maris dcrit une relation
entre deux personnes. Pourtant, le mariage peut tre considr comme une entit (un
vnement). Une information peut, de plus, tre reprsente sous la forme dun attribut
dune entit ou comme une entit lie. La localisation dun vnement peut, par exemple,
tre reprsente pour chaque cas en tant quattribut (visuellement reprsent sous la forme


104 Processus de conception dun schma relationnel

dun texte, ou dune icne par exemple). Les vnements survenus dans un mme lieu seront
alors visuellement dtects selon le principe de similarit. Il est toutefois galement possible
de reprsenter les lieux par des entits distinctes relies aux vnements. Dans ce cas les
relations de localisation sont perues selon le principe de connectivit qui prvaut sur la
perception de la similarit. Selon Chen (1976) et (Barthlemy et al., 2005), il sagit en fait de
choix guids par lobjectif danalyse qui dfinit limportance des paramtres et des relations
reprsenter.

Une approche gnrale consiste dcomposer lensemble des informations en entits


lmentaires, puis reprsenter chacune delle par un type de nud particulier. Les relations
sont ensuite traces entre les concepts par des artes. Cependant, une telle dmarche nest
pas toujours adapte35. En effet, des simplifications et des amliorations doivent tre
ralises pour exploiter pleinement les avantages de la reprsentation. De tels changements
de structure graphique peuvent tre des simplifications, telles quen agrgeant les donnes.
Cest le cas notamment lors de la reprsentation dun ensemble de communications
tlphoniques ou la totalit des appels peuvent tre regroups sous la forme dune relation
bidirectionnelle dont lpaisseur est proportionnelle au nombre de communications. Un
changement de structure visuelle peut nanmoins galement amliorer la lisibilit sans tre
au dtriment de la compltude (p. ex. dans le cas de ventes). Limpact de ces choix a t
valu pour montrer quil existe des diffrences de perception et defficacit entre les
diverses formes de reprsentation des relations.

E v a l u a t i o n d e l a r e p r s e n t a t i o n d e
r e l a t i o n s
Les choix effectus pour reprsenter les relations entre les entits dintrts pour une
question danalyse peuvent avoir un impact import sur la lisibilit et lutilisabilit des
reprsentations. En effet, une reprsentation perue comme complexe ou difficile lire ne
remplit certainement pas son rle de soutien aux processus danalyse et de communication
des informations. Lobjectif de cette valuation est de comparer par des indicateurs
quantitatifs objectifs, plusieurs structures de graphe tablies laide de la typologie de
relations propose.


35
Par exemple, o une vente reprsente par une entit engendre une structure inadapte rendant le schma
difficile lire (cf. Reprsentation dun trafic de marchandises, page 75).


Evaluation de la reprsentation de relations 105

M t h o d e

C o n d i t i o n s d e x p r i m e n t a t i o n

Lvaluation a t effectue au moyen dun sondage en ligne. Pour chaque question, les
participants rpondent en cliquant directement sur les graphes. Le questionnaire est envoy
par courriel aux participants qui sont libres dy rpondre au moment de leur choix. Il est
demand aux participants de remplir le questionnaire sans interruption. Afin de tester que
chaque participant bien compris le fonctionnement du questionnaire, une question
prliminaire est pose (cliquer sur des sommets de couleurs en fonction de leurs liens avec
dautres sommets).

Pour chaque question, deux reprsentations diffrentes sont testes. Le graphe affich pour
chaque participant et slectionn alatoirement. Les participants ne sont pas au courant que
les comparaisons sont effectues entre deux schmas pour chaque question et non entre les
questions. Lordre des questions est identique pour tous les participants. La question et les
donnes reprsentes sont identiques pour chaque paire de schma. La mthodologie
dvaluation a t dveloppe pour comparer les diffrences de perception entre deux
manires de reprsenter les mmes informations. Les schmas exploits sont inspirs ou
directement issus de cas rels. Les donnes ont t simplifies et rendues anonymes.

Un pr-test a t effectu avec une vingtaine de participants. Lors de celui-ci, il a t observ


que rpondre certaines questions danalyse relles sur une reprsentation de laffaire
ncessite un temps important (entre dix et quinze minutes environ). En effet, les participants
doivent comprendre le problme pos, ainsi que la nature des entits et des relations
reprsents. Cest pourquoi certaines questions ont t simplifies en remplaant les types
dentits par des formes et des couleurs.

P r o p r i t s v i s u e l l e s v a l u e s

Lvaluation porte sur la comparaison de plusieurs structures de graphe tablies laide de la


typologie de relations prsentes prcdemment36. Pour lensemble des comparaisons, les
positions des entits, leurs formes, couleurs et tailles sont invariants. Seule la structure des
graphes est modifie. Les formes de reprsentations suivantes sont values: le lien
directionnel (questions 1 et 2), le lien (questions 3, 4 et 10), le lien bidirectionnel (questions 5
7), le groupe : questions 8 et 9.

36
Cf. Typologie de relations, page 102


106 Processus de conception dun schma relationnel

T c h e s c o g n i t i v e s t e s t e s

Pour chaque type de relation test au moins deux questions diffrentes ont t poses, afin
de comparer les rsultats pour des questions diffrentes. Les questions ont t choisies en
fonction des exemples et recommandations dfinies dans la littrature37.
- Question 1 et 5 : trouver les chemins possibles entre deux sommets dtermins
(cliquer sur les sommets intermdiaires)
- Question 2, 6 et 10 : trouver un ou plusieurs sommet(s) en fonction des valeurs dun
attribut sur les liens
- Question 3 et 9 : trouver les sommets lis un sommet dtermin
- Question 4 et 7, 8 : trouver le sommet avec le plus de liens directs.

V a r i a b l e s d p e n d a n t e s

Pour chaque question, le temps de rponse total et les positions des clics souris ont t
relevs. Les clics corrects ont t dtermins en fonction de leurs positions avec une marge
derreur variable suivant les schmas (gnralement de lordre de 10 20 pixels). Certaines
questions (2, 4, 6, 7 et 8) portent sur lidentification dun sommet particulier, dans ces cas,
seule lexactitude est mesure. Pour lensemble des autres questions, plusieurs sommets
doivent tre identifis, la compltude est donc prise en compte dans lvaluation.

S c h m a s d e r f r e n c e s

Lvaluation de lefficacit est toujours relative38. Le choix de la reprsentation de rfrence


influence donc fortement les rsultats de lvaluation. Pour chaque comparaison une
reprsentation des concepts dcomposs en entits a t choisie comme rfrence. Par
exemple, pour lvaluation de lefficacit de la reprsentation de relations diriges, des
ventes ont t reprsentes par des entits entre les personnes et sous la forme de liens
dirigs. Par contre pour valuer les liens bidirectionnels, la comparaison a t effectue avec
un graphe contenant des paires de liens directionnels. Cette forme de reprsentation tant
celle principalement exploite pour reprsenter notamment des appels tlphoniques ou des
transactions financires.


37
Cf. Procdures dvaluation, page 64
38
Cf. Procdures dvaluation, page 64


Evaluation de la reprsentation de relations 107

D e s c r i p t i o n d e l c h a n t i l l o n

Le sondage a t transmis par des listes de diffusion (nombre de participants = 243) :


- Employs ESC : 106 personnes, taux de participation de 47%
- Etudiants ESC : 448 personnes, taux de participation de 19%
- Employs de la police neuchteloise : 507 personnes, taux de participation de 20%

Participants N % Formation N %
Etudiants 84 35 Apprentissage, CFC 55 23
Policiers 101 42 Formation professionnelle (matrise, brevet) 46 19
Employs ESC 33 14 Maturit (gymnasiale ou professionnelle) 9 4
Les deux 17 7 Universit, EPF, Haute cole spcialise 125 51
Autres 8 3 Autre diplme 8 3

Sexe N % Cours danalyse criminelle N %


Homme 131 54 Je n'ai jamais suivi de cours 114 47
Femme 112 46 J'ai dj suivi un cours thorique 76 31
J'ai dj suivi un cours thorique et pratique 53 22
Age N %
16-25 88 36 Schmas N %
26-35 80 33 Je ne sais pas ce qu'est un schma relationnel 60 25
36-45 53 22 J'ai dj vu un schma relationnel 122 50
46-55 15 6 J'ai dj fait un ou plusieurs schma(s) relationnel(s) 61 25
56-65 7 3

Linfluence de ces paramtres a t teste globalement sur lensemble du questionnaire en


comparant le temps de rponse global et le nombre total de rponses correctes. Des
diffrences significatives ont t observes (les rsultats sont prsents dans lannexe cinq) :
- le niveau de formation et lge ont une influence significative sur le nombre de
rponses correctes et le temps de rponse total
- le fait davoir suivi un cours danalyse criminelle et davoir dj vu ou fait un schma
relationnel influence le nombre de rponses correctes.

Il faut noter que lobjectif de lvaluation nest pas de tester ces paramtres, mais de tester
limpact dun changement de reprsentation. Les versions des schmas ont donc t
attribues alatoirement aux participants. Aucune diffrence significative na t observe
entre les distributions de ces paramtres pour chaque version des schmas (cet aspect a t
test un test non paramtrique). Ces paramtres nexpliquent donc pas les diffrences
observes lors de cette valuation.


108 Processus de conception dun schma relationnel

R s u l t a t s

Les visualisations exploites pour lvaluation, le dtail des rsultats et des tests statistiques
effectus sont prsents dans lannexe cinq.

R e p r s e n t a t i o n d e l i e n s d i r i g s

Structure 1 Structure 2

Lobjectif ici est de comparer la reprsentation de ventes sous la forme dune entit (lie aux
personnes et lobjet vendu) et sous la forme dun lien directionnel. Cette valuation a t
effectue sur la base du cas rel prsent dans la premire partie39.

Question 1 : Cliquer sur les personnes qui peuvent avoir t des intermdiaires entre les deux
personnes en rouge.
Question 2 : Cliquer sur la personne qui vous semble avoir vendu bien plus qu'elle n'a achet.

Pour la question une, une augmentation de 14.8% de rponses correctes et compltes est
observe avec la structure 2 (F (1,239) = 5.08, p = 0.025). Aucune diffrence significative, na
t observe sur le temps de rponse entre les deux structures. Les schmas ci-dessous
contiennent les positions des clics effectus par les participants (les chiffres affichs
correspondent au pourcentage de participants).


39
Cf. Reprsentation dun trafic de marchandises, page 75


Evaluation de la reprsentation de relations 109

N = 113


Les deux intermdiaires du centre en bas, ont t slectionns par moins de participants
(une diminution denviron vingt pourcents). Certains participants peuvent avoir mal compris
la question et navoir slectionns quune squence dintermdiaires possible. Cet effet est
par contre beaucoup moins marqu pour la seconde structure. Seul lintermdiaire du bas a
t slectionn moins que les autres. Les schmas ayant t transmis alatoirement aux
participants cette observation tend rfuter lhypothse dune mauvaise comprhension. La
diffrence pourrait tre issue de la surcharge dinformation (nombre dentits) sur le premier
graphe. Le positionnement des entits semblent nanmoins avoir un impact. Il est
galement intressant de relever que les personnes directement lies aux personnes
reprsentes en rouges sont plus souvent identifies (sur les deux schmas).

N = 128

+1.6% +2.2%

+22.3% +0.6%

+6.2%


110 Processus de conception dun schma relationnel

Globalement, cette structure est donc plus efficace pour rpondre la question. La position
des entits semble tre une variable importante au niveau de la perception et pourrait
expliquer les diffrences au sein dun mme schma.

Pour la question deux, une augmentation de 16.2% de rponses correctes est observe avec
la structure 2 (F (1,231) = 6.412, p = 0.012). Les schmas ci-dessous contiennent les positions
des clics effectus par les participants (les chiffres affichs correspondent au pourcentage de
participants).

N = 110

N = 123

-15.5%

+16.2%


Evaluation de la reprsentation de relations 111

La rponse correcte est lindividu de droite qui a t slectionn par 48% des participants
pour la structure deux (augmentation du taux de rponse correcte de 16.2%). Pour les deux
schmas, environ 20% des participants ont slectionn lindividu de gauche qui selon les
informations reprsentes na pas achet de marchandise (dans le cadre de laffaire, il sagit
en fait de lindividu ayant commis les vols). Le nombre derreurs est par contre
significativement diminu pour lindividu du centre. En effet, bien quil a le plus de clients, le
nombre total de marchandises vendu et environ gal au nombre achet (respectivement
entre 77 et 89 vendues, contre 60 70 achetes).

Le temps de rponse moyen pour les rponses correctes est plus court de 28.2% pour la
structure 2 (F (1,92) = 8.947, p = 0.0036). Il passe de 89 +/- 67 secondes 58 +/- 35
secondes. Pour les rponses incorrectes le temps de rponse est similaire entre les deux
schmas. Pour le premier schma, le temps de rponse pour les rponses incorrectes et
40.4% plus court que pour les rponses correctes (F (1,108) = 12.731, p = 0.00054). Il
correspond au temps de rponse observ pour le deuxime schma. Alors que pour la
deuxime structure, les temps de rponses ne sont pas significativement diffrents entre les
rponses correctes et fausses.

100
90
Pourcentage des pardcipants

80
70
60
50
40 Schma 1: Rponses correctes
30 Schma 2: Rponses correctes
20 Schma 1: Rponses fausses
10 Schma 2: Rponses fausses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300
Temps de rponse en secondes

Il semble donc que la comparaison des quantits de marchandises vendues et achetes est
plus difficile avec la premire structure. Leffort de lecture ncessaire pour compter et
comparer les proportions semble plus important avec la premire structure, en regard du
temps de rponse.


112 Processus de conception dun schma relationnel

R e p r s e n t a t i o n d u n e e n t i t s o u s l a f o r m e
d u n l i e n

Structure 1 Structure 2

Lobjectif est de comparer la reprsentation dun concept sous la forme dune entit ou sous
la forme dun lien. Par exemple, dans le cadre de la reprsentation des relations entre des
saisies de stupfiants40. Les chantillons peuvent tre soit reprsents comme une entit (lie
une entit saisie et une entit classe chimique ) ou comme un lien (entre les deux
mmes entits). Lexemple utilis pour les questions trois et quatre est tir dune affaire
relle. Les entits reprsentant les saisies ont t remplaces par des carrs noirs, les
chantillons par des losanges gris et les classes chimiques par des ronds rouges.

Question 3 : Cliquer sur tous les ronds rouges lis directement et indirectement au carr
bleu.
Question 4 : Cliquer sur le rond rouge ayant le plus de liens directs avec des carrs noirs.

Pour la question trois, aucune diffrence signification na t observe au niveau de


lexactitude, de la compltude et du temps de rponse.

Pour la question quatre, une augmentation de 8.9% de rponses correctes est observe avec
la structure 2 (F (1,226) = 2.973, p = 0.086). Le temps de rponse moyen pour les rponses
correctes est galement plus court de 27.3% avec la structure 2 (F (1, 183) = 8.739, p =
0.0035). Il passe de 69 +/- 51 secondes 50 +/- 31 secondes. Pour la question quatre,


40
Cf. Saisies de stupfiant et classes chimiques, page 155


Evaluation de la reprsentation de relations 113

lexactitude est donc augmente et le temps de rponse diminu lorsque la structure 2 est
prsente. La structure deux est donc plus efficace que la structure 1 pour cette question.

Ce changement de structure a galement t test lors de la dernire question du test avec


un autre exemple. Les relations dtectes sur la base de lanalyse chimique des encres de
photocopieurs sont reprsentes. Trois types dentits sont reprsentes : les photocopieurs
(losanges verts, structure 1), les marques des photocopieurs (carrs rouges) et les groupes
dfinis sur la base de lanalyse des encres (ronds bleus). Un photocopieur ne pouvant tre li
qu une seule marque et un seul groupe, il peut tre reprsent par un lien (structure 2).
Sur les schmas, lensemble des photocopieurs lis une mme marque et un mme
groupe ont t regroups. Le nombre de photocopieurs est reprsent sous la forme dun
texte et par lpaisseur des relations.

Question 10 : Cliquer sur les 3 groupes lis avec le plus grand nombre de photocopieurs.

Cette question a t estime plus difficile par les participants (information transmise la fin
du questionnaire). En effet, la question porte sur lidentification de sommets lis aux
photocopieurs. Ceux-ci sont reprsents, sur le premier graphique, par des losanges et par
des liens sur le deuxime schma. Il ntait donc pas possible de formuler une question
identique pour les deux schmas en se basant uniquement sur la reprsentation (par
exemple, en demandant de cliquer sur les ronds bleus lis au plus grand nombre de losanges
verts). Les participants ont donc d effectuer tout le processus dcrit prcdemment :
comprendre la problmatique et identifier les types dentit et de relations, puis comprendre
limplantation visuelle de chaque concept. Le temps de rponse est donc globalement plus
long.

Aucune diffrence significative na t observe sur le taux de rponses compltes et


correctes, par contre le taux de rponses fausses diminue lgrement : moyenne de 0.75
rponses fausses pour la structure 1 et de 0.47 pour la structure 2 (F (1,192) = 4.132, p =
0.043). Le temps de rponse passe de 136 +/- 83 secondes 114 +/- 64 secondes avec la


114 Processus de conception dun schma relationnel

structure 2 (F (1, 113) = 2.557, p = 0.113). Lamlioration nest donc pas certaine, mais un
effet tendanciel est observ.

Lamlioration de lisibilit est donc lgre pour ce changement de structure. Seule la


question quatre a montr une amlioration en termes dexactitude et du temps de rponse.
Cet effet est probablement d la diminution du nombre dentits sur le schma. Il faut
noter que les positions des sommets nont pas t modifies entre les schmas compars.
Alors quune diminution du nombre dentits permet gnralement de rduire la taille du
schma est doptimiser les positions des sommets. Les schmas compars sont donc trs
similaires et il nest pas tonnant que les diffrences soient tendancielles. Une augmentation
de 8.9% de rponses correctes et un temps moyen diminu de 27.3% ont malgr tout t
observs pour la question quatre.

R e p r s e n t a t i o n d e l i e n s b i d i r e c t i o n n e l s

Structure 1 Structure 2

Dans le cadre de la reprsentation de communications tlphoniques ou de transactions


bancaires par exemple, des transactions sont souvent observs dans les deux sens entre les
entits (des tlphones ou des comptes). Ces transactions peuvent tre reprsentes par une
paire de flches ou par un lien unique avec une double flche. Lexemple exploit est
galement tir dune affaire relle o les communications tlphoniques entre les principaux
protagonistes de laffaire ont t reprsentes par un schma de flux.

Question 5 : Cliquer sur tous les tlphones bleus ayant eu des communications avec le
tlphone orange ET le tlphone vert.


Evaluation de la reprsentation de relations 115

Question 6 : Cliquer sur le tlphone ayant reu le plus d'appels.


Question 7 : Cliquer sur le tlphone qui est en relation avec le plus grand nombre de
tlphones.

Pour les questions cinq et six, aucune diffrence significative na t observe au niveau de
lexactitude et de la compltude entre les deux structures. Il faut relever que pour la question
six, le nombre de rponses correctes est faible pour les deux schmas : 22.7 % des
participants pour la structure 1 et 16.5% pour la structure 2. La diffrence nest cependant
pas statistiquement significative (F (1,211) = 1.297, p = 0.256). De plus, le temps de rponse
est 50% plus rapide pour les rponses fausses, indpendamment du type de schma.

Les schmas sont donc peu efficaces pour rpondre cette question. En fait, la question
porte sur le nombre dappels total reu. La dimension dominante est donc la dimension
quantitative. Lutilisation dun schma relationnel pour rpondre une question de ce type
ne semble pas un choix adapt. Pour rpondre la question, il est ncessaire de faire la
somme des valeurs inscrites sur les relations. Un histogramme prsentant le total des appels
reus par numro est certainement une solution beaucoup plus adapte pour ce type de
question. Le choix du type de reprsentation en fonction de la question danalyse et discut
plus loin.

Pour la question sept par contre, le taux de rponses correctes augmente de 13.4% pour la
structure 2 (F (1, 206) = 6.526, p = 0.011). Le temps de rponse moyen pour les rponses
correctes est galement plus court de 14.7% avec la structure 2 (F (1, 169) = 3.674, p =
0.0057). Il passe de 37 +/- 20 secondes 31 +/- 16 secondes. Cette dernire est donc plus
efficace pour rpondre cette question. Le nombre de traits ncessaires pour reprsenter
lensemble des relations est diminu. Cette amlioration de la lisibilit du schma peut
expliquer laugmentation de lefficacit. Il faut toutefois relever quaucun effet na t
observ pour la question cinq.


116 Processus de conception dun schma relationnel

R e p r s e n t a t i o n d e g r o u p e s d e n t i t s s o u s l a
f o r m e d u n c a d r e

Structure 1 Structure 2


Il est gnralement dusage de reprsenter des groupes dentits (par exemple des
personnes travaillant dans une mme entreprise ou des cas perptrs dans une mme zone
gographique) par un cadre contenant les entits lis41. Lobjectif de cette question consiste
comparer la reprsentation dun groupe par un cadre ou par une entit lie aux membres
du groupe. Pour cette comparaison, les positions des entits ont d tre modifies pour
effectuer le changement de structure, afin de conserver une lisibilit correcte des schmas. Le
schma prsent est issu dune affaire relle portant sur les activits dun groupe de suspects
de brigandages agissant au niveau international.

Question 8 : Cliquer sur le membre du groupe criminel qui est li au plus grand nombre
d'individus en vert.
Question 9 : Cliquer sur les individus (vert et rouge) qui semblent avoir eu une activit en
Espagne.

Pour la question huit, le taux de rponses correctes augmente de 9.7% pour la structure 2 (F
(1, 197) = 3.861, p = 0.051). Aucune diffrence significative nest observe pour le temps de
rponse.


41
Cf. Recommandations et standards, page 45


Evaluation de la reprsentation de relations 117

Pour la question neuf, aucune diffrence nest observe au niveau du taux de rponses
compltes et correctes. Le temps de rponse pour les rponses compltes et correctes
diminue de 28.6% pour la structure 1 (F (1, 36) = 5.490, p = 0.025). Il passe de 56 +/- 22
secondes 40 +/- 20 secondes.

Il est trs intressant les rsultats en dtails pour chaque schma (les aires sont
proportionnelles au pourcentage de participants):

N = 110

Ces entits ont t slectionnes m oins souvent (-6% des participants pour les
deux entits de gauche et -14% des participants pour lentit centrale), par
dans les mmes cadres. Les croisements de
rapport aux autres entits prsentes
tre la cause de cet effet.
traits avec dautres cadres semblent


Cette tendance est galement observe pour lindividu de droite (53% des
participants lont slectionn). Il faut relever quil nest pas dans le cadre
reprsentant le brigandage commis en Espagne. De plus, le lien trac en trait-till
peut avoir un effet (en raison de la convention dutilisation du trait-till pour
exprimer un lien incertain).


118 Processus de conception dun schma relationnel

N = 92

-30%

+12% +14%

- 25%

+7%
+6%

Globalement, toutes ces entits ont t Ces deux entits ont t slectionnes
slectionnes plus souvent par rapport moins souvent par rapport la structure 2.
la structure 2. Le positionnement plus loign de ces
entits est certainement la raison de cette
diminution.

Leffet positif observ pour le groupe dentits de gauche et donc contrebalanc par leffet
ngatif de lloignement des deux entits de droite. Le positionnement peut expliquer
globalement pourquoi aucune diffrence significative nest observe entre les deux
structures pour cette question. Cet effet, illustre bien la complexit de la comparaison de
deux reprsentations graphiques. En effet, plusieurs variables visuelles peuvent avoir un
impact simultan sur la perception (comme ici la structure du graphe et les positions des
entits). Cest pourquoi, pour lensemble des autres questions les positions, les couleurs, les
tailles et les icnes nont pas t modifies entre les schmas. Pour cet exemple, conserver
les positions ntait pas possible.

Cet exemple, a t ralis afin de montrer limpact sur la lisibilit de lutilisation de cadres
pour reprsenter deux types de relations. Pour la structure une, les cadres reprsentent des
relations spatiales entre les activits des protagonistes qui sont reprsentes par des entits.
Pour la structure deux, les cadres reprsentent les activits elles-mmes qui entourent les


Evaluation de la reprsentation de relations 119

personnes impliques. Globalement, la structure une est plus lisible que la structure deux.
Lorsque les activits sont reprsentes par des cadres, des croisements de traits sont
invitables si des individus ont particip plusieurs vnements. Ces croisements de traits
(de cadres) diminuent la lisibilit du schma (dans le cadre de cette valuation, une
diminution de 6 14% de clics est observe pour les entits lies plusieurs activits). Cet
effet nest pas observ lorsque les vnements sont reprsents par des entits lies par des
artes aux individus. Le temps de rponse est galement plus court pour cette structure de
graphe. Lutilisation de cadres est donc possible pour exprimer des relations entre des
entits, mais lorsque les cadres se croisent, lefficacit du schma diminue.

T a b l e a u d e s y n t h s e

Nombre de rponses correctes et compltes


Q1: +14.8% F(1,239) = 5.08, p = 0.025
Ventes Q2: +16.2% F(1,231) = 6.412, p = 0.012

Q1: Non significatif


Traces Q2: +8.9% F(1,226) = 2.973, p = 0.086

Q1 et Q2: Non significatif


Tlphonie Q3: +13.4% F(1,206) = 6.526, p = 0.011

Evnements Q1: +9.7% F(1,197) = 3.861, p = 0.051


Q2: Non significatif

Temps de rponse (rponses correctes)


Q1: Non significatif
Ventes Q2: -28.2% F(1,92) = 8.947, p = 0.0036

Q1: Non significatif


Traces Q2: -27.3% F(1,183) = 8.839, p = 0.0035

Q1 et Q2: Non significatif


Tlphonie Q3: -14.7% F(1,169) = 3.674, p = 0.0057

Q1: Non significatif


Evnements Q2: -28.6% F(1,36) = 5.490, p = 0.025

D i s c u s s i o n g n r a l e s u r l e s r s u l t a t s

Globalement des diffrences significatives ont t observes au niveau de lexactitude, de la


compltude et du temps de rponse en fonction de la manire de reprsenter les relations
entre des entits dintrts, pour des questions spcifiques. Bien que les informations
reprsentes soient les mmes entre les schmas et quaucune des formes de reprsentation
ne biaisent les informations, des diffrences dexactitudes sont observes. Initialement, il
tait plutt attendu dobserver des diffrences sur le temps de rponses, mais peu sur


120 Processus de conception dun schma relationnel

lexactitude. Les reprsentations ont t cres pour chaque structure de faon pouvoir
rpondre au mieux aux questions. En effet, ces schmas ont t conus et exploits dans le
cadre daffaires relles42 (en loccurrence les solutions les moins efficaces). Ils ont t crs
avec lintention de faciliter lanalyse et la communication. Les schmas de rfrence nont
donc pas t produits pour dmontrer lefficacit des solutions proposes. Les comparaisons
effectues semblent donc intgres et confirment globalement limportance des choix de
reprsentation.

Par ailleurs, le temps de rponse est gnralement plus court pour les rponses fausses ou
incompltes que pour les rponses correctes et compltes. Lexactitude semble globalement
corrle au temps de rponse (telle que releve dans la littrature43). Une hypothse possible
est que si pour une question donne, leffort ncessaire pour y rpondre parait trop
important, les participants choisissent une rponse plus rapidement sans vrifier en dtails
lexactitude de la rponse. Il faut toutefois noter que pour la premire question leffet est
invers avec le schma deux (le temps de rponse moyen pour les rponses correctes et
compltes est plus court). Cest galement le cas pour la question huit avec les deux
schmas. Globalement, il ressort galement des rsultats que :
1. Diminuer le nombre dentits sur un graphe au profit dune reprsentation par des
liens augmente la lisibilit.
2. Les positions relatives des entits entre elles jouent un rle important au niveau de la
perception dun graphe.
3. Lutilisation de cadres pour reprsenter des relations diminue la lisibilit lorsque les
cadres se croisent.

Il est finalement intressant de souligner quaucun rsultat contradictoire na t observ.


Mme si pour certaines questions spcifiques, aucune diffrence significative na t
dmontre. Lorsque des diffrences defficacit ont t observes pour plusieurs questions,
elles sont toujours en faveur de la mme structure.

D i s c u s s i o n s u r l a m t h o d e d v a l u a t i o n

Pour chaque comparaison effectue, les conditions dexprimentations taient similaires.


Toutefois lenvironnement de chaque participant ntait pas contrl, puisque le sondage a
t envoy lectroniquement aux participants qui ont effectu le sondage librement. Pour

42
A lexception de lexemple sur les photocopieurs qui est tir dune recherche.
43
Cf. Critres dvaluation, page 62


Evaluation de la reprsentation de relations 121

chaque comparaison une centaine de personnes ont rpondu aux questions pour chaque
schma. Les schmas ayant t attribus alatoirement, les diffrences de niveau de
formation, dge, de connaissances en matire danalyse criminelle et dexprience sur la
lecture et la conception de schmas nexpliquent pas les diffrences observes.

Il faut relever encore que les conditions de lexprimentation effectue ne correspondent pas
aux conditions relles dexploitation des schmas. Au cours dune enqute, les schmas sont
exploits par des enquteurs motivs par la rsolution des cas traits et qui exploitent ces
schmas dans un contexte diffrent et avec dautres motivations que rpondre correctement
des questions spcifiques. Les schmas sont exploits globalement pour mieux
comprendre lensemble des informations et souvent pour rpondre de multiples questions
sur diffrents aspects dune affaire. Les diffrences defficacit observes en termes
dexactitude pourraient donc tre plus faibles dans un contexte rel. Il faut toutefois relever
que ces exemples se basent sur des cas rels o il a t parfois ncessaire deffectuer des
modifications de structures, la demande des enquteurs, pour que les reprsentations
soient exploitables. En effet, limpression de lisibilit initiale dun schma est trs importante
pour quil soit utilis. Si un schma semble compliqu ou confus, il ne suscite gnralement
que peu dintrt.

Cette valuation se base sur des indicateurs quantitatifs pour mesurer les diffrences
defficacit. Ce choix a t effectu pour confirmer par des indicateurs objectifs, les tudes de
cas prsents dans le chapitre Evaluations prliminaires et pour valuer limpact des choix
de reprsentation. Au vu des diffrences dexactitudes observes, une valuation qualitative
complmentaire aurait t utile pour valider les hypothses formules pour expliquer les
diffrences. En effet, il aurait t souhaitable de demander aux participants ayant commis des
erreurs ou rpondu partiellement, dexpliquer les raisons de leurs choix. Une telle dmarche
ncessite toutefois de dvelopper un systme de validation des rponses en temps rels. Le
systme utilis pour rpondre aux questions en cliquant directement sur les images a t
spcifiquement dvelopp pour ce sondage. Inclure un systme automatique de contrle des
rponses ncessite donc des dveloppements techniques complmentaires. Il faut toutefois
souligner que lobjectif de cette valuation tait de montrer que choisir une manire adapte
de reprsenter les informations en fonction de la nature des relations accrot objectivement
la lisibilit du schma. La mthodologie dvaluation dveloppe a rpondu lobjectif.


122 Processus de conception dun schma relationnel

E l m e n t s d e m t h o d e
Dans les sections prcdentes, le processus de conception dun graphe et le langage visuel
ont t explicits. Des structures syntaxiques ont t formalises pour reprsenter des types
de relations gnriques. Certaines de ces structures ont t compares et leur efficacit a t
value pour reprsenter certains types de relations spcifiques. Lhypothse que la manire
de reprsenter les relations sur un graphe influence la perception et lefficacit de la
reprsentation a pu tre confirme pour diffrentes structures et diffrentes questions
spcifiques.

Les diffrents lments de mthode identifis sur la base des cas traits, des valuations
effectues et issus de la littrature sont prsents dans cette section. Une bauche de
dmarche gnrale exploitable pour concevoir un schma relationnel, en analyse criminelle,
est propose.

I d e n t i f i c a t i o n d e l a d i m e n s i o n d o m i n a n t e

Le nombre de visualisations existantes pour analyser des informations est considrable.


Choisir quelle forme de reprsentation est la plus adapte pour rsoudre un problme
spcifique nest pas une tche triviale. La dcomposition prsente dans la premire partie44
permet une classification des mthodes, utile pour guider ce choix. En effet, les mthodes de
visualisation peuvent tre classifies en regard des quatre dimensions dfinies : quantitative,
temporelle, spatiale et relationnelle.

La premire tape de la mthode propose consiste donc identifier quelle est la dimension
dominante en regard de la question danalyse pose. Dans le cadre de lvaluation prsente
dans le chapitre prcdent, lune des questions poses aux participants tait : Cliquer sur le
tlphone ayant reu le plus d'appels . Le schma relationnel propos pour rpondre la
question nest certainement pas le choix le plus adapt pour rpondre cette question. En
effet, pour les deux schmas proposs, moins de vingt-cinq pourcent des participants ont
russi y rpondre correctement.


44
Cf. Dimensions danalyse, page 33


Elments de mthode 123

La question porte sur la dimension quantitative. Un histogramme par exemple aurait t un


choix certainement plus adapt :

Appels reus

Tlphone 1
Tlphone 2
Tlphone 3
Tlphone 4
Tlphone 5

0 50 100 150 200 250 300 350 400

Lors de la dcomposition dune question danalyse en fonction de ces quatre dimensions, il


nest pas rare que celle-ci porte sur plusieurs dimensions en mme temps. Dans ce cas, il
convient alors didentifier quelle dimension est dominante. Par exemple, lors de lanalyse de
donnes de facturation tlphonique, les questions suivantes peuvent se poser :
- Question 1 : quelle est la frquence des contacts entre un groupe dindividus ?
- Question 2 : quelles sont les personnes en contacts sur certaines priodes dfinies ?

Ces deux questions portent la fois sur la dimension relationnelle (les contacts entre des
individus) et sur la dimension temporelle (la frquence / des priodes temporelles dfinies).
Ces deux questions ncessitent pourtant deux formes de reprsentation diffrentes pour y
rpondre :

Question 1 Question 2

Priode 1
temps Priode 2

Pour la premire question, la dimension temporelle est dominante. Un schma de flux


temporel est donc exploit. Alors que pour la deuxime question, un schma de flux
relationnel est utilis, car la dimension relationnelle est dominante. En effet, pour cette


124 Processus de conception dun schma relationnel

question, la variabilit temporelle est limite quelques priodes dfinies (par exemple deux
sur le schma). De plus, la question porte sur lidentification de contacts lis un ou
plusieurs numros particuliers. Le degr de variabilit des informations analyses pour
chaque dimension permet dans ce cas, didentifier la dimension dominante : le nombre de
priodes est beaucoup plus restreint que le nombre de contacts. Par contre pour la premire
question, le nombre de contacts est limit (par exemple un nombre restreint de numros
dintrt) et lensemble des communications sont reprsentes temporellement afin de
visualiser globalement la frquence et le rythme des contacts.

Les schmas de flux temporel sont dailleurs


rarement exploits pour analyser des
communications entre un grand nombre de
numros, car le rsultat est trs souvent
difficile lire :


Limportance de lidentification de la dimension dominante a galement t mise en
vidence lors de lvaluation du changement de type de graphique pour analyser la
distribution gographique des envoyeurs de spams45. Dtecter des zones gographiques
plus fortement touches, implique de comparer le nombre de courriels envoy en fonction
de la distribution spatiale. La dimension spatiale est dominante. La carte permet donc
deffectuer visuellement une telle analyse de manire plus efficace. Lors de lvaluation, il a
t observ que le nombre dobservations effectues par les tudiants en se basant sur la
carte est environ dix fois suprieur quavec les graphiques pour le niveau de lecture
intermdiaire (qui correspond une lecture aux niveaux de rgions gographiques).

Dcomposer la question danalyse en regard des dimensions quantitative, temporelle,


spatiale et relationnelle afin didentifier la dimension dominante qui guide le choix dune
reprsentation efficace.

La slection dun type de reprsentation adapt a un impact important sur les possibilits
danalyse. La dcomposition propose en fonction des quatre dimensions danalyse, semble
tre un guide utile lors de ce choix. Cette proposition initiale est gnrale. Elle est
certainement utile lors de llaboration de toutes les formes de reprsentation. Les lments

45
Cf. Annexe 4 : Evaluations prliminaires - Modification du type de reprsentation, page 272


Elments de mthode 125

de mthode dcrits dans les sections suivantes concernent par contre uniquement la
dimension relationnelle. Des descriptions des formes de reprsentation exploitables pour
lanalyse quantitative, temporelle et spatiale en regard de diffrents objectifs danalyse sont
prsentes dans lannexe un.

E l a b o r a t i o n d u m o d l e r e l a t i o n n e l

La premire tape effectuer lors de la conception dun schma relationnel consiste dfinir
le modle relationnel du problme trait : une dcomposition sous la forme dentits (des
personnes, des vnements, des objets, des traces, etc.) et de leurs relations. Parce que le
modle dfini omet les lments non essentiels pour la question danalyse, il facilite le
traitement des informations en rduisant leur complexit. Labstraction dfinie par le modle
relationnel permet disoler les aspects importants pour la question danalyse. Il est donc par
nature incomplet et imprcis. Il ny a cependant pas un modle correct pour une
situation, uniquement des modles adquats ou non en fonction de lobjectif danalyse
(Rumbaugh et al., 1991).

Pour chaque entit les attributs dintrts doivent galement tre identifis. Par exemple,
dans le cadre de lanalyse dun trafic de marchandises, la date et le lieu des ventes, ainsi que
le prix et la quantit des produits vendus sont des lments gnralement pertinents pour
chaque transaction investigue. La dmarche gnrale recommande consiste faire
linventaire le plus exhaustif possible des entits pertinentes reprsenter, puis de tracer les
relations existantes entre celles-ci.

Identifier les informations pertinentes en fonction de la question danalyse et laborer un


modle relationnel dcomposant les concepts en entits, attributs et relations.

En effet, il est frquemment observ que des ambiguts de reprsentation sont issues dune
mauvaise identification dune entit. Dans le cadre de lexemple prsent dans le chapitre
Evaluations prliminaires de telles ambiguts sont observes sur un peu plus de
cinquante pourcent des schmas analyss46. Lors des formations de base sur la conception
de schmas relationnelles, il est trs souvent observ notamment que les vnements sont
apparemment les entits les plus difficiles identifier. Il sagit du moins du type dentit le
plus frquemment omis. De multiples liens sont alors tracs entre les entits impliques lors


46
Avec un total de cinquante-sept participants (cf. Reprsentation dune affaire complexe, page 73)


126 Processus de conception dun schma relationnel

de lvnement (comme des personnes, des vhicules ou des objets). Le schma sen trouve
alors beaucoup plus complexe, voire dans certains cas ambigu.

Une fois les entits dintrts identifis, leurs relations doivent tre dfinies. Par exemple, les
personnes sont gnralement relies aux vnements par des relations de type rle . Les
traces sont collectes sur des scnes de crimes, des objets ou des personnes. Lors de
lvaluation effectue, dans plus de soixante pourcent des schmas, certaines relations sont
mal positionnes par les participants.

Ceux deux types derreur semblent tre les causes principales des ambigits observes sur
des schmas relationnels. Il ressort globalement des valuations que la dcomposition dune
situation en entits et relations nest pas une tche vidente. En effet, dans les exemples
traits, aucune dcomposition mergeante nest observe. Cette tape du processus
ncessite donc un certain entrainement et une bonne comprhension de la notion dentit et
de limportance dune dcomposition adapte en regard des objectifs danalyse.

La nature des informations reprsentes doit galement tre comprise est matrise. Lors du
pr-test ralis lors de lvaluation de la section prcdente, des difficults de
comprhension ont t observes. Les schmas qui portaient sur des entits peu familires
des participants, telles que les saisies, les chantillons et les classes chimiques taient
visiblement plus difficiles comprendre. Les participants ont passs en moyenne une dizaine
de minutes de plus pour rpondre aux questions. Cette observation souligne limportance
dune dfinition claire des entits en jeu.

Un schma ncessite dtre accompagn dune lgende et dune explication guidant sa


lecture.


Elments de mthode 127

S i m p l i f i c a t i o n s

A readable sociogram is a good sociogram. (Moreno 1953)


Tracer limage la plus efficace, la plus simple possible. (Bertin, 1967/2005)

Il a t montr47 que les reprsentations qui sont visuellement les plus simples sont
gnralement les plus efficaces. Le nombre dentits et de liens est notamment un facteur de
complexit. Il est en effet reconnu que plus le nombre dentits est grand, plus le graphe est
difficile lire. Moreno (1953) recommande de construire des rseaux dune trentaine
dentits au maximum et de simplifier le schma si le nombre de sommets est trop
important. Dautres auteurs soutiennent galement que les graphes les plus efficaces sont de
petites tailles (de dix cinquante entits et entre vingt cent liens) (Shneiderman & Aris,
2006) (Teyseyre & Campo, 2009).

Optimiser la reprsentation pour la rendre la plus simple et la plus lisible possible en


rduisant le nombre dentits et de liens.

Simplifier le schma en reprsentant certains concepts par des cadres ou par des attributs
permet notamment de rduire le nombre dentits et de liens et ainsi daugmenter sa clart.
Lorsque deux choix de reprsentation sont possibles, il est recommand dexploiter la forme
la plus simple : celle offrant la meilleure lisibilit.

I d e n t i f i c a t i o n d e s e n t i t s p r i n c i p a l e s

Afin deffectuer des simplifications sur le schma, il est ncessaire didentifier quelles sont
les entits principales sur lesquelles porte la question danalyse et entre lesquelles des
relations doivent tre cherches et reprsentes, par exemple :
1. Si lobjectif danalyse consiste reconstruire une srie dvnements, la
reprsentation est labore afin de visualiser les relations entre les cas. Lvnement
est le type dentit principal. Lors de la reconstruction de la srie, il est notamment
ncessaire de dcider quels cas font partie de la srie en fonction des relations
dtectes, telles que des relations bases sur les traces ou la proximit
spatiotemporelle.


47
par les exemples prsents dans la premire partie (page 73 et suivantes) et lvaluation effectue sur la
reprsentation des relations (pages 104 et suivantes).


128 Processus de conception dun schma relationnel

2. Dans le cas de la reconstruction dun rseau criminel, les personnes sont les entits
principales entre lesquelles lenquteur cherche identifier et comprendre les
relations et les rles respectifs de chaque protagoniste.
3. Lors de lvaluation de la pertinence des traces, un schma relationnel peut tre
labor afin davoir une vue densemble des informations. La trace est lentit
principale. La dcision porte sur le choix des traces analyser en priorit.

Identifier les entits principales sur lesquelles portent la question danalyse et la prise de
dcision permet de guider les choix de simplification.

Cette tape de processus est importante, car elle permet de guider les choix de
reprsentation, notamment lorsque des simplifications de reprsentation sont ncessaires
pour augmenter la lisibilit. En principe, les concepts sur lesquels se base la prise de dcision
sont reprsents par des entits. Les simplifications sont en priorit effectues sur les entits
lies, telles que les socits qui peuvent tre reprsentes par des cadres pour exprimer des
relations professionnelles entre des individus sur le schma dun rseau criminel.

S i m p l i f i c a t i o n p a r s l e c t i o n

La premire stratgie de simplification mettre en uvre consiste ne reprsenter que ce


qui est pertinent et de sabstraire des lments inutiles. En fonction de la question danalyse,
il est possible didentifier les lments moins pertinents qui peuvent tre reprsents comme
des attributs. Ils peuvent galement tre retirs de la reprsentation, sils ne sont pas utiles
pour rpondre lobjectif danalyse.

Rduire le nombre dentits et de liens par slection. En fonction de lobjectif danalyse,


sabstraire des lments inutiles.

Bertin (2005) dcrit la conception dune reprsentation comme un processus logique de


simplification. Le schma doit tre simplifi par rduction afin daboutir un message clair et
efficace. Il souligne nanmoins limportance de conserver lensemble des relations
pertinentes pour la question danalyse.


Elments de mthode 129

Lexemple ci-dessous est tir dune affaire relle. Lobjectif tait de reprsenter la structure
dun trafic de stupfiants. Sur ce schma les informations ont t dcomposes en cinq types
entits principales : des personnes, des numros de tlphones, des arrestations et des
adresses. Les relations en rouge reprsentent des ventes de stupfiants. Les personnes sont
les entits principales. Leurs relations mutuelles et le rle de chaque individu dans le trafic
sont investigus.

Les relations tlphoniques entre les personnes ntant pas reprsentes, il nest pas utile de
reprsenter les numros de tlphone sous la forme dentits. En outre, lexception de deux
arrestations, tous les individus ont t arrts seul. La question de lutilit de reprsenter les
relations tablies sur la base des arrestations peut galement se poser. Finalement, la plupart
des informations sur les domiciles des personnes ne permettent pas de mettre en vidence
des relations. Il a donc t choisi de reprsenter ces informations sous la forme dattributs
plutt que sous la forme dentits. Le nombre global dentits est ainsi diminu rendant le
schma plus lisible.


130 Processus de conception dun schma relationnel

Globalement, il convient donc dtablir si reprsenter certains types dinformations par des
entits permet de mettre en vidence des relations utiles pour lanalyse. Dans le cas contraire
ces informations peuvent tre supprimes de la reprsentation ou reprsentes sous la
forme dattributs. Dautres simplifications peuvent tre apportes ce schma, elles sont
prsentes dans les sections suivantes.


Elments de mthode 131

M o d i f i c a t i o n d e l a s t r u c t u r e

Une fois lensemble des entits et des relations identifies, il convient de dfinir la manire
de reprsenter les relations entre les concepts en fonction des objectifs danalyse dfinis. En
effet, la reprsentation des informations dcomposes en entits lmentaires et en
lensemble de leurs relations ne constitue pas toujours une solution efficace. Tel quil a t
montr dans le cas de la reprsentation dun trafic de marchandise48, reprsenter les ventes
sous la forme dentits lies aux acheteurs, vendeurs et objets nest pas une solution adapte
lorsque le nombre de transactions est important. Un changement de structure est parfois
ncessaire pour pouvoir exploiter tout le potentiel de la reprsentation graphique. La
dmarche propose repose sur un usage adapt des formes de reprsentation des relations
dfinies : le lien, le lien dirig, le lien bidirectionnel, le lien multiple, le groupe, lensemble ou
le type.

Identifier les types de relation entre les entits principales et slectionner une forme de
reprsentation adapte pour chacun deux.

Afin dexpliciter la dmarche, les schmas relationnels produits pour reprsenter les liens
tablis entre des saisies de stupfiants par lanalyse chimique est prsent (deux chantillons
ont le mme profil chimique, lorsquils ont t dans la mme masse un moment du trafic
(Guniat & Esseiva, 2005))49. La reprsentation des relations entre les saisies se base sur trois
types dentits : les saisies, les chantillons et les classes chimiques. Pour chaque saisie, un ou
plusieurs chantillons sont prlevs des masses de stupfiant saisies, puis analyses par un
laboratoire. Pour chaque chantillon, une classe chimique est dtermine. Des relations avec
dautres saisies sont tablies avec les autres chantillons de la mme classe. Les saisies, les
chantillons et les classes chimiques sont des entits qui peuvent tre reprsentes comme
telles. Lexemple prsent est tir dune affaire relle.


48
Cf. Reprsentation dun trafic de marchandises, page 75
49
Cf. Saisies de stupfiant et classes chimiques, page 155


132 Processus de conception dun schma relationnel

19/01/03 17/06/03 08/01/04 22/05/03 01/11/02 18/06/03 14/10/03 15/10/04 19/08/02 02/08/02 11/04/02 04/08/01 20/06/04 01/01/05 26/02/03 27/07/03 08/10/03 30/01/04 05/09/02 15/01/03 13/02/03 31/07/01 11/12/01 21/08/01 13/05/01 25/01/04 16/09/02
Diepoldsau Milan Cavenago Paderno Dugnano Turin Felizzano Melegnano Munich Slovnie Slovenie Milan Milan Zurich Delmont France Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 5'000 g 35'000 g 19'600 g 1g 28'500 g 26'500 g 191'000 g 14'000 g 8'357 g 6'000 g 20'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
129-03.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 424-10.04 033-02.03 033-02.03 015-01.05 015-01.05 150-03.05 219-05.05 033-02.03 033-02.03 033-02.03 486-12.04 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05

95 g
6500 g 39 %
25 % 6500 g
7500 g 23500 g 9500 g 5000 g 35000 g 19600 g 1 g 0 g 191000 g 14000 g 6000 g
2000 g 25 % 4500 g 4500 g
4% 4% 4% 4% 4% 4% 1% 2000 g 6% 16 % 12 %
1000 g 7000 g 500 g 3000 g 0 g 22 % 0 g 82800 g 10500 g 32700 g 30000 g 69000 g 99600 g 30000 g 8800 g 9900 g
500 g 29 % 12 % 3% 3%
28 % 30 % 41 % 30 % 36 % 4% 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
25 %
2000 g
12 %

h009 h992 h007 h993 h008 h010 h003 h002 h999 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
1'000 g 500 g 11'107 g 500 g 3'465 g h005 h006 h001 5g 4'535 g 11'500 g 0g 9'500 g 2'030 g 4'505 g 5'125 g 82'800 g 10'500 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
heroine heroine heroine heroine heroine 112'060 g 178'826 g 8'205 g heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine morpine cocaine cocaine
heroine heroine heroine

60 g 5 g 1000 g 30 g 5 g
25 g 75 g 5000 g 125 g 5 g 1000 g 172 g 0 g 0 g 2000 g 0 g 0.1 g 3500 g 0.7 g 75 g 2.6 g
0.4 g 5 g 4080 g 8 g 7 g 7 g 415 g 20 g 10 g 20 g 2% 10 % 16 % 12 % 10 %
1% 8% 34 % 14 % 16 % 31 % 4% 10 % 10 % 8% 13 % 8% 14 % 14 % 16 % 25 %
7% 9% 10 % 10 % 10 % 13 % 22 % 19 % 21 % 16 %
1000 g 4000 g 30 g
12 % 39 % 15 %

01/04/03 23/04/01 27/06/03 10/06/99 13/07/04 24/06/99 25/03/03 08/06/99 22/06/99 14/07/04 12/11/04 19/04/01 02/12/02 12/09/03 14/07/04 10/12/04 23/04/01 03/04/01 19/07/04 29/04/04 10/06/04 26/06/04 07/06/04 22/05/01 09/12/04 29/01/04 15/03/04 21/06/01 30/10/03 11/03/03 07/04/04
Geneve Geneve Lausanne Geneve Lausanne Lancy Geneve Geneve Geneve Vernier Yverdon Grand-Saconnex St-Margrethen Geneve Grand-Saconnex Geneve Geneve Renens Onex Bad Reichenhall Vernier Geneve Vernier Vernier Meyrin Vernier Geneve Bellinzona Geneve Geneve Geneve Bellinzona
16 g 54 g 1'361 g 8g 7g 43 g 419 g 30 g 40 g 20 g 85 g 1'300 g 40'000 g 129 g 57 g 2'700 g 10 g 172 g 97 g 43'500 g 78 g 2'061 g 7'269 g 1'450 g 1'576 g 1'000 g 15'360 g 570 g 230 g 950 g 3g
154-05.03 164-05.01 194-06.03 286-06.99 305-07.04 313-06.99 137-05.03 283-06.99 310-06.99 317-07.04 477-11.04 305-09.01 185-03.05 311-10.03 319-07.04 508-12.04 165-05.01 105-04.01 368-09.04 306-07.04 281-06.04 367-09.04 278-06.04 189-06.01 047-02.05 069-02.04 124-03.04 242-07.01 386-11.03 136-05.03 162-04.04

5 g 6 g 50 g
9% 4% 25 g 3000 g 14 % 5 g 2043 g 2.7 g
10 g 8% 32 % 19 % 12 % 15 %
26 %

h886 h019
275 g 75 g
h012 h990 h889 h017 h884 h018 h020
heroine heroine
50 g 25 g 3'000 g 980 g 5g 2'063 g 23 g
heroine heroine heroine heroine heroine heroine heroine

270 g
8% 62 g 7.1 g 40 g 20 g 20 g
0 g 19 % 11 %
10 % 11 % 11 %
22 % 30 g 900 g
8% 11 %

27/08/02 10/12/04 07/05/99 12/03/02


Geneve Chavannes Geneve Lausanne
08/12/01 08/05/01
23/06/03 07/05/03 92 g 121 g 145 g 76 g
Geneve Thurgovie
386-11.02 508-12.05 260-06.99 086-03.02
Vandoeuvres Geneve 546 g 033-02.03
332 g 7g 011-01.02
213-07.03 211-07.03

La reprsentation peut cependant tre simplifie en reprsentant lchantillon sous la forme


dun lien entre la saisie et la classe chimique. En effet, un chantillon ne pouvant tre li qu
une seule saisie et une seule classe chimique, ce concept correspond la dfinition
graphique du lien50.

Diepoldsau Milan Cavenago Paderno Dugnano Munich Melegnano Felizzano Turin Slovnie Zurich Slovenie Milan Milan France Delmont Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 28'500 g 8'357 g 26'500 g 14'000 g 191'000 g 20'000 g 6'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g

6'500 g 4'500 g
25 % 4'500 g 3%
2'000 g
3%
2'000 g 0g 12 %
0g 6'000 g 0g 14'000 g 191'000 g 6'500 g 2'000 g 95 g 82'800 g 10'500 g 32'700 g 30'000 g 69'000 g 99'600 g 30'000 g 8'800 g 9'900 g
500 g 500 g 1'000 g 3'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 4%
7'000 g 29 % 22 % 6% 12 % 16 % 25 % 12 %
25 % 41 % 28 % 30 % 4% 4% 4% 4% 36 % 39 % 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
30 % 4% 4% 1%

h992 h993 h009 h008 h010 h001 h999 h002 h003 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
h007 1'000 g 3'465 g 5g 8'205 g 0g 11'500 g 4'535 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
11'107 g h005 h006
112'060 g 178'826 g

60 g 25 g
2% 1% 30 g 5g 1g 75 g
2'000 g 0g 3'500 g 0g 0g 172 g 30 g 1'000 g 4'000 g 3g
7g 4'080 g 20 g 20 g 415 g 5g 1'000 g 75 g 125 g 5'000 g 12 % 10 % 14 % 16 %
0g 5g 7g 8g 10 g 5g 0g 8% 8% 14 % 10 % 10 % 4% 15 % 12 % 39 % 25 %
7% 9% 10 % 13 % 10 % 10 % 21 % 19 % 16 % 22 % 10 % 31 % 16 % 8% 14 % 34 % 13 %

Bad Reichenhall Vernier Vernier Onex Renens Meyrin Vernier Geneve Geneve Bellinzona Geneve Geneve Bellinzona
Geneve Geneve Lausanne Lancy Geneve Lausanne Geneve Geneve Vernier Geneve Yverdon Geneve Geneve Grand-Saconnex Grand-Saconnex Geneve St-Margrethen Vernier Geneve 43'500 g 2'061 g 7'269 g 97 g 172 g 1'450 g 1'576 g 570 g 1'000 g 15'360 g 230 g 950 g 3g
16 g 54 g 7g 43 g 8g 1'361 g 40 g 30 g 20 g 419 g 85 g 10 g 121 g 57 g 1'300 g 129 g 40'000 g 78 g

25 g
8%
3'000 g 2'043 g
5g 6g 10 g 50 g 5g 3g
32 % 12 %
9% 4% 26 % 14 % 19 % 15 %

h886 h019 h012 h017 h884 h889 h018 h990 h020


50 g

1'000 g
16 %
270 g 62 g 7g 0g 40 g 900 g 30 g 20 g 20 g
8% 10 % 11 % 22 % 11 % 11 % 8% 19 % 11 %

Vandoeuvres Geneve Thurgovie Geneve Chavannes Geneve Geneve Lausanne


332 g 7g 546 g 121 g 92 g 145 g 76 g


Une telle modification de la structure du schma amliore sa lisibilit 51. La reprsentation des
relations entre les saisies de stupfiants fait lobjet dun pattern dtaill dans le chapitre
suivant.


50
Cf. Typologie de relations, page 102
51
Cf. Reprsentation dune entit sous la forme dun lien, page 112


Elments de mthode 133

Sur le schma du trafic de stupfiant prsent dans la section prcdente, les liens tablis sur
la base du domicile des personnes peuvent tre reprsentes en exploitant des cadres par
exemple.

Dautre part, des ensembles de personnes sont galement mis en vidence par lutilisation
des accolades (signifiant dfini pour reprsenter un groupe dentits dun mme type). En
effet, les quatre icnes de personnes en bas du schma reprsentaient, sur le schma initial,
des groupes de clients toxicomanes. Lusage des accolades permet deffectuer cette
distinction rapidement. Alors que sur le premier schma, la lecture du label des entits est
ncessaire pour faire cette distinction.


134 Processus de conception dun schma relationnel

S i m p l i f i c a t i o n p a r a g r g a t i o n

Lagrgation vise la rduction du nombre dinformations reprsent en regroupant les


lments (des entits ou des liens) en groupes : des agrgats (Andrienko & Andrienko, 2005).
Ceux-ci sont caractriss par des attributs calculs qui dcrivent lensemble, tels que le
nombre dentit ou le nombre de liens. Lutilisation dagrgats permet de simplifier la
reprsentation, mais elle engendre une perte dinformation sur les caractristiques
spcifiques de chacun des lments regroups. Varier le niveau dagrgation permet
nanmoins de changer la perspective et peut mettre en vidence des structures ou des
rgularits difficilement perceptibles au niveau lmentaire (des patterns).

Procder par agrgation afin de varier la perspective sur les informations et rduire le
nombre dinformations par regroupement

Le processus dagrgation est caractris par trois aspects principaux : la manire de


regrouper les informations en agrgats, leurs caractristiques et la manire de les visualiser
(Andrienko & Andrienko, 2005).

A titre dexemple, lors de la reprsentation de transactions financires, il nest pas rare de


devoir analyser un nombre important de transactions entre un nombre important de
comptes bancaires. Plusieurs stratgies dagrgation peuvent tre misent en uvre :
regrouper les comptes (les entits) par leur dtenteurs (une personne physique ou morale),
regrouper les transactions par types (retraits cash, versements, emprunts, etc.) ou par des
priodes temporelles, etc. Dans le cas de lagrgation des liens, diverses caractristiques du
groupe peuvent tre dfinies : leur nombre, la somme ou la moyenne des montants, la
priode temporelle totale, etc. Les caractristiques propres chaque transaction sont alors
supprimes au profit dune description globale du groupe. Finalement, des choix de
reprsentations doivent tre fait pour choisir quelle variable visuelle sera exploite pour
reprsenter les caractristiques du groupe, telle que lpaisseur du lien pour reprsenter le
nombre total de transactions :

C2 C2

C4 5 C4

4
3

C1 C3 1
C1 5 C3


Elments de mthode 135

C o n s t a n c e e t d f i n i t i o n d e c o n v e n t i o n s

Conserver une reprsentation constante de chaque type dinformations est recommand


pour prserver la cohrence du schma et pour en faciliter la lecture. Moreno (1953) relve :
For the comparison of two or more groups the sociograms must be constructed after the same
principle in order to be readable . Pour Bertin (2005), dans une image, un mme concept ne peut
avoir deux implantations diffrentes. Il souligne galement que toute variation visuelle apparait
comme significative . Ce principe de constance est important afin de faciliter la lecture des
schmas (Eppler & Aeschimann, 2009).

Dfinir des conventions de reprsentation : lensemble des informations dun mme type
doivent tre reprsents de faon similaire.

A titre dexemple, la couleur des liens peut tre exploite pour distinguer des types de
relations, tels que le bleu pour les relations familiales et le vert pour les relations
professionnels entre des personnes, etc. Si sur un mme schma ces couleurs sont galement
exploites pour reprsenter dautres types de relations, sa lecture est rendue plus difficile,
voire mme ambigu si les liens ne sont pas documents par des labels.

Des conventions doivent galement tre dfinies pour exprimer lincertitude, pour distinguer
les faits des hypothses et pour reprsenter la ngation (Atzenbeck et al., 2009b). Les choix
peuvent tre divers, mais ils doivent tre appliqus de manire constante et documents par
une lgende.

R e p r s e n t e r l i n c e r t i t u d e

Une convention existe pour distinguer des relations confirmes de relations incertaines. En
effet, lusage du trait-till semble globalement admis pour exprimer lincertitude.

Par contre, aucune convention nexiste pour exprimer lincertitude sur les nuds. Pourtant, il
nest pas rare que des informations descriptives des entits soient
incertaines (comme lidentit dune personne par exemple). De ces cas, il est
utile dexprimer visuellement cette incertitude. Le style de la police
dcriture peut tre utilis : par exemple, litalique.


136 Processus de conception dun schma relationnel

Dans le cadre de lenqute judiciaire, lincertitude est permanente, notamment lorsque les
informations reprsentes sont issues de dclarations de victimes, de tmoins ou de
prvenus. Lincertitude est alors reprsente en fonction de la source. Si celle-ci dclare avoir
des doutes, linformation est reprsente comme incertaine. Si par contre elle affirme un fait,
linformation est reprsente comme confirme. Il est donc important de reprsenter
galement la source de linformation pour en valuer la fiabilit.

D i s t i n g u e r l e s f a i t s d e s h y p o t h s e s

Les notions dincertitude et dhypothse sont trs proches. Il est toutefois utile de distinguer
les hypothses formules sur la base des donnes collectes de lincertitude ou des
hypothses faites par les sources dinformations. Par exemple, lanalyste peut faire
lhypothse dun lien entre une personne inconnue (lie une activit particulire) et un
suspect potentiel. Sur le second schma, lincertitude est issue du tmoignage :

Une hypothse tant par dfinition incertaine, la convention du trait-till est exploite. La
police de caractre est alors utilise pour distinguer lhypothse de lincertitude. Des points
dinterrogation peuvent galement tre ajouts pour renforcer la distinction.

R e p r s e n t e r l a n g a t i o n

Reprsenter la ngation sur un graphe nest a priori pas une difficult :

Dun point de vue visuel, toutefois, tracer un lien entre deux entits exprime la prsence
dune relation. Une lecture dtaille des labels des liens est alors ncessaire pour distinguer
la ngation. Sur un graphe de taille plus importante, ne pas distinguer visuellement la
ngation peut engendrer une perception visuelle fausse des relations. Distinguer
visuellement la ngation en exploitant la couleur, le style de trait, voire la police savre
ncessaire :


Elments de mthode 137

Il est donc important de dfinir trois conventions diffrentes pour distinguer ces dimensions.

O r d o n n a n c e m e n t d e s c o m p o s a n t s

Lorsque la structure du graphe est dfinie et simplifie par slection, par lexploitation de
reprsentations adaptes des relations ou par agrgation, le positionnement des entits peut
tre optimis afin daccrotre la lisibilit du schma. Des algorithmes automatiques ont t
dvelopps pour optimiser ce placement (cet aspect technique fait lobjet de nombreuses
recherches qui ne sont pas discutes dans cette thse).

Globalement loptimisation du positionnement se base sur deux principes gnraux :


1. Le placement doit minimiser le nombre de croisement de traits
2. Les nuds doivent tre positionns afin de rendre les traits des relations
orthogonaux ou parallles.

Lorigine exacte de ces recommandations est difficile tablir. En effet, de nombreux auteurs
ont discuts et valus ces recommandations sans toujours en citer une origine. Bertin (2005)
relevait dj quil est ncessaire de chercher la disposition qui offre le minimum de
croisements ou la figure la plus simple, tout en conservant les groupements, oppositions ou ordres
ventuels . Moreno (1953), dont les travaux semblent tre lorigine des rseaux sociaux,
recommande galement de minimiser les croisements de traits. Les travaux de recherches
mens sur limpact du placement des nuds sur la lisibilit dun graphe ont montr que
minimiser les croisements de traits amliore significativement la lisibilit. Lorthogonalit et
le paralllisme des relations semblent avoir par contre un impact plus faible. Lorthogonalit
et le paralllisme augmente toutefois lesthtisme du graphe et rend sa lecture plus agrable
et facile (Purchase, 2000).


138 Processus de conception dun schma relationnel

Lexemple ci-dessous illustre limpact du positionnement des entits sur la lisibilit et son
impact sur lutilisabilit du schma. Lexemple prsent est issu dune affaire relle. Il rsume
les nombreuses relations tlphoniques entre les protagonistes de laffaire. Quatre types
dentits sont reprsents : des personnes, des socits, des tlphones et des cartes SIM. Les
tlphones et les cartes SIM sont spars en deux types dentits, car certains individus ont
utilis plusieurs cartes dans un mme botier.

La premire observation faite au niveau du positionnement des nuds est lapparente


structure hirarchique. Il a donc t demand au crateur de la reprsentation si ce
positionnement tait voulu (par exemple, afin de reprsenter par le placement une structure
entre les individus ou mettre en avant certains protagonistes). Cette structure tait en fait
apparue au fil des tentatives effectues pour minimiser les croisements de traits et rendre le
schma plus lisible. Elle ntait pas particulirement souhaite. Ce concepteur ne trouvait pas
de solution efficace et avait perdu la matrise de son schma. Le schma ci-dessous a alors
t labor en optimisant le placement des entits.


Elments de mthode 139

Le schma final est visiblement plus clair et simple lire. Les modifications apportes se
basent sur les deux principes dcrits prcdemment (minimiser les croisements de traits et
maximiser lorthogonalit), mais galement sur un placement ordonn des nuds en
fonction de leurs types. En effet, les personnes, les botiers et les cartes SIM sont repartis sur
laxe vertical sur des lignes bien spares.

Par ailleurs, les couleurs des relations nont pas t modifies par rapport au schma initial.
Pourtant sur le schma final, les couleurs crent un effet souhait de couches qui permet de
distinguer plus facilement les relations et minimise limpact sur la lisibilit des croisements
de traits. Dans cet exemple, la couleur est dfinie en regard des personnes lies (une couleur
par personne ou groupe de personnes). Il est galement intressant de relev que lindividu
en haut au centre du schma est mis en vidence par rapport aux autres personnes. Cet effet
visuel est connu (Eppler & Aeschimann, 2009). Moreno (1953) relevait dj que la position
centrale en fait un groupe privilgi qui crase les autres groupes. Un ordonnancement
linaire des nuds peut nanmoins lgrement attnuer ce biais visuel (tel que dans
lexemple ci-dessus).

Un positionnement adapt des nuds est donc important pour accrotre la lisibilit dun
schma. Il peut galement tre exploit pour reprsenter des relations particulires entre les
entits. Reprsenter une chronologie dans le cas dun schma temporel ou sparer des
groupes de personnes lors de la reprsentation dun rseau sont des exemples dexploitation
du positionnement pour reprsenter des relations.


140 Processus de conception dun schma relationnel

Positionner les sommets sur le plan pour exprimer un type de relation particulier tel que la
chronologie et/ou en fonction des types dentits, tout en veillant minimiser les
croisements de traits et maximiser lorthogonalit afin daccroitre la lisibilit.

La lisibilit du schma reprsentant un trafic de stupfiant prcdemment prsent peut


galement tre amliore en optimisation les placements des entits en fonction de
limplication des protagonistes dans le rseau:

Les deux individus centraux sont les trafiquants sur lesquels lenqute cest focalise. Les
individus au-dessus sont les fournisseurs identifis et les personnes en dessous sont les
dealeurs auxquels ils ont vendu des stupfiants. Les entits en bas reprsentent des groupes
de clients. Le positionnement est donc dfini en fonction du rle des personnes afin de
reprsenter la structure du rseau.


Elments de mthode 141

R s u m d e l a m t h o d e p r o p o s e

1. Dfinir clairement le ou les objectif(s) de la reprsentation. Quelles sont les questions


auxquelles elle doit rpondre ?

2. Dcomposer la question danalyse en regard des dimensions quantitative, temporelle,


spatiale et relationnelle afin didentifier la dimension dominante qui guide le choix
dune reprsentation efficace.

3. Identifier les informations pertinentes en fonction de la question danalyse et laborer


un modle relationnel dcomposant les concepts en entits, attributs et relations. De
plus, le schma ncessite dtre accompagn dune lgende et dune explication qui
dfinit notamment les types dentits et de relations afin de guider sa lecture.

4. Optimiser la reprsentation pour la rendre la plus simple et la plus lisible possible en


rduisant le nombre dentits et de liens:

a. Identifier les entits sur lesquelles portent la question danalyse et la prise de


dcision permet de guider les choix de simplification. Les concepts sur
lesquels se base la prise de dcision sont en principe reprsents par des
entits.

b. Rduire le nombre dentits et de liens par slection. En fonction de lobjectif


danalyse, sabstraire des lments inutiles. Ceux-ci peuvent tre par exemple
reprsents comme des attributs ou retirs de la reprsentation.

c. Identifier les types de relation entre les entits principales et slectionner une
forme de reprsentation adapte pour chacun deux : le lien, le lien dirig, le
lien bidirectionnel, le lien multiple, le groupe, lensemble ou le type.

d. Procder par agrgation afin de varier la perspective sur les informations et


rduire le nombre dinformations par regroupement.

5. Dfinir des conventions de reprsentation : lensemble des informations dun mme


type doivent tre reprsents de faon similaire. Spcifier les conventions utilises
pour dcrire les types dentits et de liens, mais galement pour exprimer
lincertitude, pour distinguer les faits et les hypothses et pour reprsenter la
ngation.

6. Positionner les sommets sur le plan pour exprimer un type de relation particulier tel
que la chronologie et/ou en fonction des types dentits, tout en veillant minimiser
les croisements de traits et maximiser lorthogonalit afin daccroitre la lisibilit.

A pattern language is nothing more than a precise way of describing


someone's experience. (Alexander, 1979)

P a t t e r n s d e v i s u a l i s a t i o n
r e l a t i o n n e l l e
Les recommandations et les lments de mthode formaliss dans le chapitre prcdent sont
en partie issus de recherches empiriques et de principes issus de la littrature. Mais ils ont
galement t formaliss sur la base dobservations effectues au cours denqutes. Ce
chapitre prsente les bonnes pratiques identifies pour reprsenter certaines situations
rcurrentes traites dans le cadre denqutes judiciaires, telles que le traitement de sries de
cambriolages ou lanalyse de donnes tlphoniques. La dmarche est ainsi explicite par des
exemples concrets. Lobjectif est damorcer le dveloppement dun catalogue de bonnes
pratiques qui rpertorie des situations qui se rptent et des solutions qui sont appropries. Il
ne saurait tre dmontr que les solutions proposes sont les meilleures possible. Elles ont
toutefois montr une certaine efficacit lors de lanalyse des cas ou pour la communication
des rsultats denqute lors de la transmission de dossiers aux magistrats instructeurs.
Inventorier des formes de reprsentations adaptes pour des situations frquemment traites
devrait tre utile pour faciliter lchange de connaissances entre praticiens et galement en
matire denseignement.

Le terme de pattern est utilis pour dcrire ces bonnes pratiques. La notion de pattern est
issue des travaux de Christopher Alexander qui, dans les annes septante, a dvelopp des
solutions pour des problmes spcifiques de conception architecturale (Alexander, 1979). La
formalisation propose par Alexander a par la suite t reprise dans le domaine de la
conception logiciel o des patterns ont t dfinis pour dcrire des solutions spcifiques pour
des problmes de dveloppement informatique rcurrents (Gamma et al., 1995). Un pattern
peut se dfinir comme la description dune solution adapte pour un problme rcurrent de
conception. Dans le cadre de cette thse, les patterns formaliss dcrivent des solutions
efficaces pour reprsenter des situations rcurrentes. Chaque pattern est compos de quatre
parties : (1) une description du contexte dexploitation, (2) une description du ou des objectifs


Analyser une srie dvnements 143

danalyse, (3) une description des concepts reprsenter et (4) une description de la solution
graphique propose. Pour chaque pattern, au moins un exemple dexploitation est prsent et
les choix de reprsentation sont discuts. Seuls trois patterns ont t formaliss sur la base
des cas traits par lauteur et de discussions avec des praticiens : analyser une srie
dvnements, valuer la pertinence de traces et analyser des transactions. Lide de ce
chapitre est damorcer le dveloppement dun catalogue de patterns plus large.

A n a l y s e r u n e s r i e d v n e m e n t s

C o n t e x t e

De nombreuses enqutes portent sur le traitement de sries de dlits perptrs par des
auteurs dits prolifiques. Il nest pas rare, par exemple, que des cambrioleurs commettent de
nombreux cas. Savoir dtecter, reconstruire et analyser une srie dvnements offre de
nombreuses perspectives oprationnelles. Dtecter des rgularits spatio-temporelles pour la
mise en place de surveillances, confirmer lhypothse quun ensemble de cas a t commis par
le mme individu ou groupe dindividus des fins de poursuites judiciaires ou encore
identifier des modes opratoires mergeant des fins de prvention, sont autant de
renseignements qui dcoulent de lanalyse dune srie. Dans ce contexte, plusieurs formes de
visualisation peuvent tre exploites pour soutenir lanalyse : reprsenter les distributions
temporelles et spatiales par des diagrammes et des cartes52 ou reprsenter lensemble des
relations entre les cas sur des schmas dvnements53 afin notamment de tester lhypothse
de la srie. La conception de ce type de schmas est explicite dans ce pattern.

O b j e c t i f s d e l a r e p r s e n t a t i o n

Les schmas dvnements sont exploits au cours de lenqute pour reconstruire la srie et
faciliter sa vue densemble. En fin denqute, ces schmas servent galement faciliter
lapprhension du dossier par les acteurs du processus judiciaire.


52
Cf. Annexe 1: Dimensions danalyse et visualisation, page 233
53
Cf. Analyse et visualisation relationnelle, page 43


144 Patterns de visualisation relationnelle

C o n c e p t s r e p r s e n t e r

Diffrents types de relations entre les cas peuvent tre reprsents : les relations forensiques,
les liens spatio-temporelles, les liens avec des vhicules vols et retrouvs lors de la
commission des cas ou proximit ou des objets (tels que le butin des vols. Chaque type de
relation doit tre clairement distinguable et les incertitudes associes chaque lien (par
exemple, lorsque les traces sont partielles) doivent galement tre reprsentes afin de
pouvoir valuer la fiabilit des relations.

Les principaux types de liens sont dcrits dans les sections suivantes. La manire de
reprsenter chacun deux est prsente et discute dans des sections spares.

Traces de semelles et motif


Liens forensiques
Traces biologiques et profil ADN

Srie Liens avec des Stupfiants et classes chimiques


dvnements vhicules

Liens
spatiotemporels













Analyser une srie dvnements 145

E x e m p l e d e c a s

Lexemple
i 30th dcembre 2006 ci-dessous
31st dcembre 2006 intgre,lundi
au 1st
sein dune
janvier 2007mme affaire,
mardi 2ndlensemble
janvier 2007 desmercredi
types de3rd relations
janvier 2007 jeudi 4th janvie
12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00
frquemment observs lors de lanalyse dune srie de cambriolages.

Visuellement
reconnaissable Suspect ?
Sur lui lors
de l'arrestation

Profil ADN

Standard CAT { Plusieurs cas


}
sur BE
Video surveillance

Profil ADN

{ }
Motif CAT ?

Plusieurs cas
sur VD

Motif ADIDAS

Boudry
Boudeviliers
mme rue

VPE Profil de mlange


VPE Entreprise xx
VPE Ent. A 11.04.2008 0200-0300
16-17.04.2008 2345-0700
19-20.03.2008 2030-0630

Tent. VPE station d'essence


vole 17.04.2008 0301
Vol plaque
Vol dans un vhicule NE7XXXX Parking VPE Entreprise yy
19-20.03.2008 1700-0800 11.04.2008 1500-1545 16-17.04.2008 2345-0700 Dcouverte vhicule
17-19.04.08 0800-0945

vol

{ }
lis selon
enqute baloise retrouve
Plusieurs cas VPE garage
sur BL 26-27.03.2008 Ordinateur

retrouv
vole

voles Subaru Legacy bleue

NE9XXXX

Positionnement des vnements le long de laxe horizontal pour reprsenter


la chronologie (relations reprsentes selon le principe de proximit)


Reprsentation par un cadre des relations spatiotemporelles
(relations reprsentes selon le principe de connectivit)

Reprsentation du type dvnement par une icne (ou ici du canton, par exemple)
(relations reprsentes selon le principe de similarit)


146 Patterns de visualisation relationnelle

dcembre 2006 31st dcembre 2006 lundi 1st janvier 2007 mardi 2nd janvier 2007 mercredi 3rd janvier 2007 jeudi 4th janvier 2007
Distinction des types de relations par des couleurs
2:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00 00:00 06:00 12:00 18:00
(bleu : motif de semelle / rouge : profil adn)
(reprsentation des types selon le principe de similarit)
Reprsentation de lincertitude
ou des hypothses
(en exploitant des conventions)
Visuellement
reconnaissable Suspect ?
Sur lui lors
de l'arrestation

Profil ADN

Standard CAT { Plusieurs cas


}
sur BE
Video surveillance

Profil ADN

{ }
Motif CAT ?

Plusieurs cas
sur VD

Motif ADIDAS

Boudry
Boudeviliers
mme rue

VPE Profil de mlange


VPE Entreprise xx
VPE Ent. A 11.04.2008 0200-0300
16-17.04.2008 2345-0700
19-20.03.2008 2030-0630

Tent. VPE station d'essence


vole 17.04.2008 0301
Vol plaque
Vol dans un vhicule NE7XXXX Parking VPE Entreprise yy
19-20.03.2008 1700-0800 11.04.2008 1500-1545 16-17.04.2008 2345-0700 Dcouverte vhicule
17-19.04.08 0800-0945

vol

{ }
lis selon
enqute baloise retrouve
Plusieurs cas VPE garage
sur BL 26-27.03.2008 Ordinateur

retrouv
vole

voles Subaru Legacy bleue

NE9XXXX

Reprsentation de sous-groupes dvnements par des ensembles


(distinction avec les vnements uniques)

Les relations avec des vhicules et plaques sont reprsentes par des liens
multiples (relations reprsentes selon le principe de connectivit)


Analyser une srie dvnements 147

Sur ce schma, six types dentit sont reprsentes : des vnements, des personnes, des
profils (les motifs de semelles et les profils ADN), des vhicules, des plaques et des objets. Ces
types sont distingus par des icnes symbolisant les concepts (selon le principe de similarit).
Les traces sont visuellement reprsentes par des liens entre les vnements et les profils. Ce
choix de reprsentation est explicit dans les sections suivantes. La reprsentation est
volontairement simplifie (au niveau des labels des entits et des liens) afin de faciliter sa
lecture et mettre en vidence sa structure.

De tels schmas peuvent galement tre exploits pour reprsenter des sries plus
importantes, voire 20--31st
10--20th janvier 2009
mettre en vidence des1--5th
janvier 2009
relations
fvrier 2009
particulires
5--10th fvrier 2009
entre plusieurs sries.
10--15th fvrier 2009
Dans le
15--20th fvrier 2009
12th 14:00 13th 20th 08:00 29th 30th 12:00 21:00 22:00 1st 2nd 3rd 4th 5th 6th 8th 06:00 10th 12th 07:30 12:00 15th 18th 07:00 08:30 19th
cas prsent ci-dessous, un cas vaudois et un vhicule permettent de relier deux
sries initialement perues comme spares: une srie dtecte par des traces de semelles (en
vert) et une srie dtecte par un profil ADN (en bleu).

LU...
VD
Me 28.01.09,
00:30-05:30, VD
St-Prex/VD.
NOTTE
Ve 30.01.09,
16:15-21:15, VW Golf blanche vhc vol vhc retrouv
CHIGNOLE,
Genolier/VD.
Cambriolage
Villa.
SERA, vhc vol LU
VW TOURAN grise BL
Cambriolage Je 12.02.09, Ve 13.02.09,
28.01.2009 Villa. 02:00-05:00, Sissach/BL.
05:30:00 Kriens/LU. Dcouverte
30.01.2009
21:15:00 NOTTE vhicule
CHIGNOLE, Vol Voiture.
de vhicules 13.02.2009
SO
Lu 09.02.09,
SO... Voiture. 12:00:00
12.02.2009
01:00-05:00,
05:00:00
Oberbuchsiten/
VD SO. NOTTE
VD VD VD VD VD CHIGNOLE, Vol
Lu 12.01.09, Je 29.01.09, VD VD VD VD VD
Lu 12.01.09, Je 15.01.09, Me 28.01.09, Me 28.01.09, VD de vhicules
08:50-12:50, 08:10-17:10, 07:15-15:15, 00:00-05:00, 07:00-20:00, Ve 30.01.09, Ve 30.01.09, Sa 31 / Di Lu 02.02.09,
13:00-20:00, Ve 30.01.09, Sa 31.01.09, Voiture.
Mies/VD. Mies/VD. Tolochenaz/VD. St-Prex/VD. St-Prex/VD. 16:15-21:15, 16:30-21:30, 01.02.09, 02:00, SO1...
Gland/VD. 08:15-20:15, 15:40-22:40, 09.02.2009
GIORNO GIORNO GIORNO NOTTE SERA, Genolier/VD. Genolier/VD. 13:30-15:30, Chamby/VD.
SERA, Arzier/VD. Etoy/VD. SERA, 05:00:00
FINESTRA, PIATTO, FINESTRA, CHIGNOLE, Cambriolage SERA, SERA, Morges/VD. NOTTE
Cambriolage GIORNO Cambriolage
Cambriolage Cambriolage Cambriolage Cambriolage Appartement. Cambriolage Cambriolage Cambriolage CHIGNOLE,
Appartement. FINESTRA, Appartement.
Appartement. Villa. Villa. Villa. Villa. Appartement. Appartement. Cambriolage
28.01.2009 29.01.2009 Cambriolage 31.01.2009
12.01.2009 12.01.2009 15.01.2009 28.01.2009 20:00:00 30.01.2009 01.02.2009 Villa.
20:00:00 Villa. 30.01.2009 22:40:00
12:50:00 17:10:00 15:15:00 05:00:00 21:15:00 15:30:00 02.02.2009
30.01.2009 21:30:00
02:00:00
20:15:00

ID1... Alfa Romeo 156 2.5 V6 gris

vhc vol vhc retrouv


SO
Lu 09.02.09,
06:00,
Kestenholz/SO.
vhc retrouv
NOTTE
VD... CHIGNOLE,
Dcouverte VD
vhicule Ma 17.02.09,
Voiture. 01:00-05:00,
09.02.2009 Yens/VD.
NOTTE
vhc observ 06:00:00
CHIGNOLE,
Cambriolage
Villa.
17.02.2009
05:00:00

ZH
Ve 06.02.09,
BE Adlikon b. GE GE GE GE
Me 04.02.09, Regensdorf/ZH. Ma 17 / Me Ma 17 / Me Ma 17 / Me Ma 17 / Me
01:15, NOTTE 18.02.09, 18.02.09, 18.02.09, 18.02.09,
Hindelbank/BE. CHIGNOLE, VD 22:45-06:32, 23:00-07:00, 00:01-08:00, 23:30-09:00,
NOTTE Cambriolage Ma 17.02.09, Bellevue/GE. Bellevue/GE. Bellevue/GE. Bellevue/GE.
CHIGNOLE, Villa. 00:00-05:00, NOTTE Cambriolage
VD VD NOTTE NOTTE
VD VD Cambriolage 06.02.2009 Yens/VD. CHIGNOLE, Villa.
Ve 30.01.09, Ve 30.01.09, CHIGNOLE, CHIGNOLE,
Ve 30.01.09, Ve 30.01.09, Caf/restaurant 12:00:00 Cambriolage Cambriolage 18.02.2009
18:45-21:45, 22:45-23:45, Cambriolage Cambriolage
FR 20:25, 18:30-22:30, 04.02.2009 Villa. Villa. 07:00:00
FR Nyon/VD. Nyon/VD. Villa. Villa.
Nyon/VD. Nyon/VD. 01:15:00 17.02.2009 18.02.2009
Ve 30.01.09, Ve 30.01.09, SERA, SERA, 18.02.2009 18.02.2009
SERA, SERA, 05:00:00 06:32:00
02:24, 00:00-08:15, Cambriolage Cambriolage 08:00:00 09:00:00
Cambriolage Cambriolage
Estavayer-le-La Estavayer-le-La Appartement. Villa.
Appartement. Appartement.
c/FR. NOTTE c/FR. NOTTE 30.01.2009 30.01.2009
CHIGNOLE, 30.01.2009 30.01.2009
CHIGNOLE, 20:25:00 21:45:00 22:30:00 23:45:00
Tent. Tent. LU
Cambriolage BL ZH BL NW GE GE
Cambriolage AG AG AG Je 12.02.09, VD VD GE GE
Villa. Me 04 / Je Ve 06.02.09, Di 08.02.09, Je 12.02.09, Ma 17 / Me Ma 17 / Me
Villa. Ma 03 / Je Lu 09.02.09, Ma 10.02.09, Kriens/LU. Ma 17.02.09, Ma 17.02.09, Ma 17 / Me Ma 17 / Me
30.01.2009 05.02.09, Adlikon b. 17:30-20:30, 01:25, 18.02.09, 18.02.09,
30.01.2009 05.02.09, Stein AG/AG. Stetten AG/AG. NOTTE 01:00-05:00, 01:00-06:00, 18.02.09, 18.02.09,
02:24:00 23:15-05:45, Regensdorf/ZH. Arisdorf/BL. Hergiswil 00:01-06:40, 23:30-07:00,
08:15:00 Mellingen/AG. Cambriolage Cambriolage CHIGNOLE, Yens/VD. Yens/VD. 23:00-06:30, 23:30-08:30,
Diegten/BL. NOTTE NOTTE NW/NW. Bellevue/GE. Bellevue/GE.
NOTTE Villa. Villa. Cambriolage NOTTE NOTTE Bellevue/GE. Bellevue/GE.
NOTTE CHIGNOLE, CHIGNOLE, NOTTE NOTTE NOTTE
CHIGNOLE, 10.02.2009 Villa. CHIGNOLE, CHIGNOLE, NOTTE NOTTE
CHIGNOLE, Cambriolage Cambriolage 09.02.2009 CHIGNOLE, CHIGNOLE, CHIGNOLE,
Cambriolage 12:00:00 12.02.2009 Tent. Cambriolage CHIGNOLE, CHIGNOLE,
Cambriolage Villa. Villa. 12:00:00 Individu/vhc Cambriolage Cambriolage
Appartement. 12:00:00 Cambriolage Villa. Cambriolage Cambriolage
Villa. 06.02.2009 08.02.2009 suspect Villa. Villa.
05.02.2009 Villa. Villa. Villa.
05.02.2009 12:00:00 20:30:00 Voiture. 17.02.2009 18.02.2009 18.02.2009
12:00:00 17.02.2009 06:00:00 18.02.2009 18.02.2009
05:45:00 12.02.2009 06:40:00 07:00:00
05:00:00 06:30:00 08:30:00
01:25:00

ADN2...

ZH
Ve 06.02.09,
Adlikon b.
Regensdorf/ZH.
NOTTE
CHIGNOLE,
Cambriolage
Villa.
06.02.2009
12:00:00


148 Patterns de visualisation relationnelle

R e p r s e n t a t i o n d e s l i e n s f o r e n s i q u e s

La trace physique offre de nombreuses perspectives pour dtecter des relations entre des
vnements. De manire gnrale, diffrents types de liens peuvent tre tablis sur la base des
traces : un lien avec la source de la trace (une personne ou un objet), des liens vers plusieurs
sources (notamment lorsque la trace est partielle), voire des sources apparentes dans le cas
de lADN, ainsi que des liens tablis sur la base du type de source, comme le motif dune
semelle (Ribaux & Margot, 1999). Lensemble de ces relations se basent sur la dtection dune
correspondance de profils (un ensemble de caractristiques observes et mesures54). Par
exemple, un ensemble de minuties concordantes (le profil) est observ entre une trace digitale
releve sur une scne de crime et lempreinte dun suspect.

C o n c e p t s r e p r s e n t e r

Dans le cadre de lanalyse dune srie, il est ncessaire de pouvoir reprsenter pour chaque
trace :
- lendroit de prlvement de la trace (sur les lieux ou sur un objet) afin de pouvoir
valuer la pertinence de la trace par rapport lactivit
- le type de trace afin de connatre la nature de la relation
- lincertitude entre la trace et le profil sur la base duquel des relations sont tablies
- le type de relation entre le profil et la ou les sources possibles.

R e p r s e n t a t i o n d e s r e l a t i o n s

Chaque trace est prleve sur un lieu ou un objet particulier. Elle nest donc lie qu une seule
entit lieu ou objet. Dans la majeure partie des cas, la trace nest galement lie qu un seul
profil (des exceptions sont prsentes plus loin). En regard de la typologie des relations
dfinies55, la trace peut donc tre reprsente par un lien :


54
Cf. Analyse, profil et pattern, page 26
55
Cf. Typologie de relations, page 102


Analyser une srie dvnements 149

Modle A : la trace est lie son support. Ce


modle est utile lorsque pour un mme objet ou un
mme lieu plusieurs traces ont t releves. Les
relations spatiales (lieux de prlvement) sont alors
mises en vidence et reprsentes selon le principe
de connectivit.

Modle B : la trace est directement lie


lvnement. Selon lobjectif, il est possible de
sabstraire du support des fins de simplification. Le
lieu de prlvement est reprsent sous la forme
dun attribut de la trace (un texte sur le lien). Ce
modle est recommand lorsque chaque trace a t
prleve un endroit ou sur un support diffrent. Si plusieurs traces ont t prleves sur le
mme support, il est toutefois possible de conserver cette structure. En effet, les relations
spatiales entre les traces peuvent tre reprsentes laide de la couleur du texte.

Modle C : la trace est directement lie sa source


(une personne ou un objet) lorsque le profil
correspond une seule personne ou un seul objet.
Il nest cependant pas recommand de fusionner des
entits objets et personnes afin de ne pas cacher
lindirection. En effet, une trace de semelle peut lier
une chaussure lendroit du prlvement, mais certainement pas une personne. Le lien entre
la personne et la chaussure peut galement tre sujet discussion. Il est donc ncessaire de le
reprsenter pour ne pas minimiser une possible incertitude. Celle-ci peut alors tre
reprsente sur le lien entre lobjet et la personne.


150 Patterns de visualisation relationnelle

Lorsque la trace est reprsente sous la forme dun lien :

- la couleur du lien peut reprsenter le type de trace


- le style du lien permet dexprimer lincertitude de la relation (trait-till pour un profil
partiel, p. ex.)
- Par agrgation, plusieurs traces lies un mme vnement et un
mme profil peuvent tre regroupes sous la forme dun seul lien.
Lpaisseur du lien est alors tre exploite pour reprsenter le nombre
de traces. Une telle agrgation simplifie le schma en rduisant le
nombre de liens.

Dans les sections suivantes, la reprsentation de diffrents types de trace est dcrite. Certains
cas particuliers, o lutilisation de ce modle est discutable voire nest pas souhaitable, sont
galement prsents.

T r a c e s d e s e m e l l e s e t m o t i f s

Des traces de semelles sont rgulirement recherches et releves sur des scnes de crimes
afin de reconstituer des cheminements et comprendre lactivit, destimer le nombre de
personnes impliques, voire de guider la collecte dautres traces. En suisse plus
particulirement, ces traces sont recherches en routine sur des cas de cambriolages
notamment en raison de leur potentiel pour lier des cas. En effet, il nest pas rare que des
auteurs sriels conservent leurs chaussures sur des priodes plus ou moins importantes. Des
relations sont alors dtectes entre les cas sur la base des motifs de semelle et peuvent
contribuer dtecter des sries particulires (Girod et al., 2008). Lutilisation de
reprsentations spatiotemporelles facilite notamment la dtection de regroupements
inhabituels, signes dune possible activit srielle (Ribaux et al., 2003). Sur un schma
relationnel, ces relations sont misent en perspective avec lensemble des relations dtectes,
afin de tester lhypothse de la srie.


Analyser une srie dvnements 151

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s

Lorsque la qualit de la trace est suffisante, il est possible didentifier le motif correspondant
au dessin de la semelle. La trace peut alors tre reprsente par un lien, puisquelle ne peut
provenir que dun vnement et quune semelle na quun seul motif. Le lien tabli est groupal.
Il se base sur le type de trace. La comparaison des caractristiques acquises des traces peuvent
conduire en infrer une source. La relation est alors tablie avec la source (une chaussure)
(Girod et al., 2008). Dans ce cas de figure galement la trace peut tre reprsente par un lien.


152 Patterns de visualisation relationnelle

E x e m p l e d e c a s

Schma relationnel


Ce schma tir dune affaire relle reprsente les relations tablies sur la base de trois motifs
de traces de semelles. Deux sries supposes sur la base des motifs sont lies par un vhicule
vol lors dun cas en Valais et retrouv proximit dun cas Fribourg. Sur les cas vaudois un
troisime motif (en bleu) a galement t retrouv.

Schma temporel

La srie peut galement tre reprsente chronologiquement. Chaque cas est positionn sur
laxe horizontal en fonction de sa date. Les relations tablies sur la base du motif sont
reprsentes par des lignes horizontales lies aux cas.


Analyser une srie dvnements 153

T r a c e s b i o l o g i q u e s e t p r o f i l A D N

Les traces biologiques, telles que des traces de sang et de rsidus de peau, sont trs
largement exploites pour lier des cas sur la base du profil extrait de lADN. Contrairement aux
systmes automatiques exploits pour la gestion des traces digitales, les bases de donnes
stockant les profils ADN issus de traces permettent la dtection automatise de relations entre
cas (indpendamment de lidentification du profil). Deux traces biologiques sont lies lorsque
leurs profils sont concordants (sur la base de la comparaison des locus analyss).

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s


Une trace biologique ne peut tre lie qu un seul vnement. Par contre, il arrive parfois que
certaines traces contiennent plusieurs profils (par exemple lors de prlvements sur des
victimes ou lorsque plusieurs personnes ont touch un mme objet). Dans ce cas, la trace ne
saurait tre reprsente par un lien, puisquelle peut tre lie plusieurs profils. Trois solutions
graphiques sont alors exploitables :


154 Patterns de visualisation relationnelle

La premire solution a le dsavantage de ne pas mettre en vidence visuellement le fait quil


ne sagit du mme spcimen collect56. Elle a cependant lavantage de conserver un modle
de reprsentation constant pour toutes les traces. Le deuxime modle engendre une
dmultiplication du nombre dentits, notamment si lensemble des traces sont reprsentes
sous la forme dentits pour conserver un modle commun sur la globalit du schma. La
troisime solution permet de conserver une structure comparable par rapport aux traces lies
un seul profil tout en vitant de reprsenter la mme trace deux fois (par deux liens).

Des liens sont galement tablis sur la base de profils dits partiels issus de traces dont
lensemble des loci nont pas pu tre dtects. Des relations plus ou moins certaines peuvent
donc tre tablies en fonction du nombre de loci correspondants. Visuellement, il est possible
de distinguer les liens tablis sur la base de profils
complets et partiels en exploitant la convention du
trait-till pour les liens incertains. Le nombre de loci
correspondants peut alors tre indiqu sous la forme
dun attribut de la trace.

Simplifier la reprsentation en regroupant le profil et la personne nest pas souhaitable. En


effet, un profil ADN similaire peut tre dtect pour plusieurs personnes diffrentes
(notamment dans le cas de jumeaux univitellins, mais galement en cas de concidences
fortuites qui peuvent survenir pour des profils de mlange ou des profils partiels plus
particulirement). Une mme personne peut galement avoir plusieurs profils (les chimres). Il
parat donc important de ne pas supprimer cette indirection pour ne pas cacher lincertitude
possible entre le profil et la personne.


56
Un profil de mlange peut toutefois tre considr comme le rsultat de plusieurs traces. Dans cette optique
cette structure visuelle explicite la prsence de plusieurs traces (vestiges des activits de plusieurs personnes).


Analyser une srie dvnements 155

E x e m p l e d e c a s

La srie reprsente ci-dessous a t dtecte sur la base de trois profils ADN. Le premier
schma reprsente les traces par des entits lies aux cas et aux profils. Le second exploite la
simplification propose.

Reprsentation de la trace par une entit


Reprsentation de la trace par un lien

S a i s i e s d e s t u p f i a n t e t c l a s s e s c h i m i q u e s

Ltablissement de liens entre des chantillons de stupfiants saisis peut tre ralis par
diffrents moyens, tels que la comparaison des proprits physiques (formes, tailles ou
couleurs de pilules par exemple) ou lanalyse chimiques du contenu des stupfiants (tels que
des principes actifs, des impurets ou des produits de coupage). Les liens dtects partir de
la composition chimique du stupfiant se basent sur lhypothse que des variations
importantes sont observables entre diffrents lots et quil est possible de dfinir des profils
dont la spcificit permet dinfrer que deux chantillons dont les profils sont similaires
proviennent dune mme masse (Guniat & Esseiva, 2005).


156 Patterns de visualisation relationnelle

La dtermination du profil chimique dun chantillon de stupfiants permet dtablir des liens
entre les saisies et par l-mme de dtecter des groupes de cas. Les relations issues du
profilage peuvent alors tre interprtes en regard des donnes circonstancielles de l'enqute
et permettent ainsi de reconstruire lactivit de suspects.

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s


Un chantillon de stupfiants ne peut tre li qu un seul vnement et une seule classe
chimique (par dfinition de la classe chimique). Il peut donc tre reprsent par un lien.

Reprsenter lchantillon sous la forme dun


lien permet dexploiter lpaisseur du trait
pour reprsenter la masse de lchantillon
(information utile dun point de vue de la
qualification pnale, puisque la distinction
entre le cas grave et le cas simple se base sur la quantit de stupfiant57). De plus, le type de
stupfiant peut tre distingu par la couleur (selon le principe de similarit).


57
ATF 109 IV 143 (Art. 19 ch. 2 lettre a LStup : ds 12g dhrone, 18g de cocane, 4 kg de haschich ou 200 trips de
LSD) et ATF 113 IV 32 (ds 36g damphtamines).


Analyser une srie dvnements 157

E x e m p l e d e c a s

Le cas prsent est tir dune affaire relle ayant une porte internationale. Lobjectif du
schma tait de reprsenter lensemble des relations tablies par le profilage entre les
diffrentes saisies. Le schma initialement produit a t labor en dcomposant les
informations en trois entits principales : les saisies, les chantillons et les classes chimiques.
Le second schma illustre la simplification apporte en reprsentant les chantillons par des
liens. Ce cas t utilis lors de lvaluation de la reprsentation des relations58. Pour rappel, le
changement de structure propos a engendr une augmentation du taux de rponses
correctes de 8.9% et une rduction du temps de rponse moyen de 27.3% pour identifier la
classe chimique lie au plus grand nombre de saisies59.

Reprsentation des chantillons par des entits

19/01/03 17/06/03 08/01/04 22/05/03 01/11/02 18/06/03 14/10/03 15/10/04 19/08/02 02/08/02 11/04/02 04/08/01 20/06/04 01/01/05 26/02/03 27/07/03 08/10/03 30/01/04 05/09/02 15/01/03 13/02/03 31/07/01 11/12/01 21/08/01 13/05/01 25/01/04 16/09/02
Diepoldsau Milan Cavenago Paderno Dugnano Turin Felizzano Melegnano Munich Slovnie Slovenie Milan Milan Zurich Delmont France Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 5'000 g 35'000 g 19'600 g 1g 28'500 g 26'500 g 191'000 g 14'000 g 8'357 g 6'000 g 20'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g
129-03.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 424-10.04 033-02.03 033-02.03 015-01.05 015-01.05 150-03.05 219-05.05 033-02.03 033-02.03 033-02.03 486-12.04 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05 015-01.05

95 g
6500 g 39 %
25 % 6500 g
7500 g 23500 g 9500 g 5000 g 35000 g 19600 g 1 g 0 g 191000 g 14000 g 6000 g
2000 g 25 % 4500 g 4500 g
4% 4% 4% 4% 4% 4% 1% 2000 g 6% 16 % 12 %
1000 g 7000 g 500 g 3000 g 0 g 22 % 0 g 82800 g 10500 g 32700 g 30000 g 69000 g 99600 g 30000 g 8800 g 9900 g
500 g 29 % 12 % 3% 3%
28 % 30 % 41 % 30 % 36 % 4% 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
25 %
2000 g
12 %

h009 h992 h007 h993 h008 h010 h003 h002 h999 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
1'000 g 500 g 11'107 g 500 g 3'465 g h005 h006 h001 5g 4'535 g 11'500 g 0g 9'500 g 2'030 g 4'505 g 5'125 g 82'800 g 10'500 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
heroine heroine heroine heroine heroine 112'060 g 178'826 g 8'205 g heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine heroine morpine cocaine cocaine
heroine heroine heroine

60 g 5 g 1000 g 30 g 5 g
25 g 75 g 5000 g 125 g 5 g 1000 g 172 g 0 g 0 g 2000 g 0 g 0.1 g 3500 g 0.7 g 75 g 2.6 g
0.4 g 5 g 4080 g 8 g 7 g 7 g 415 g 20 g 10 g 20 g 2% 10 % 16 % 12 % 10 %
1% 8% 34 % 14 % 16 % 31 % 4% 10 % 10 % 8% 13 % 8% 14 % 14 % 16 % 25 %
7% 9% 10 % 10 % 10 % 13 % 22 % 19 % 21 % 16 %
1000 g 4000 g 30 g
12 % 39 % 15 %

01/04/03 23/04/01 27/06/03 10/06/99 13/07/04 24/06/99 25/03/03 08/06/99 22/06/99 14/07/04 12/11/04 19/04/01 02/12/02 12/09/03 14/07/04 10/12/04 23/04/01 03/04/01 19/07/04 29/04/04 10/06/04 26/06/04 07/06/04 22/05/01 09/12/04 29/01/04 15/03/04 21/06/01 30/10/03 11/03/03 07/04/04
Geneve Geneve Lausanne Geneve Lausanne Lancy Geneve Geneve Geneve Vernier Yverdon Grand-Saconnex St-Margrethen Geneve Grand-Saconnex Geneve Geneve Renens Onex Bad Reichenhall Vernier Geneve Vernier Vernier Meyrin Vernier Geneve Bellinzona Geneve Geneve Geneve Bellinzona
16 g 54 g 1'361 g 8g 7g 43 g 419 g 30 g 40 g 20 g 85 g 1'300 g 40'000 g 129 g 57 g 2'700 g 10 g 172 g 97 g 43'500 g 78 g 2'061 g 7'269 g 1'450 g 1'576 g 1'000 g 15'360 g 570 g 230 g 950 g 3g
154-05.03 164-05.01 194-06.03 286-06.99 305-07.04 313-06.99 137-05.03 283-06.99 310-06.99 317-07.04 477-11.04 305-09.01 185-03.05 311-10.03 319-07.04 508-12.04 165-05.01 105-04.01 368-09.04 306-07.04 281-06.04 367-09.04 278-06.04 189-06.01 047-02.05 069-02.04 124-03.04 242-07.01 386-11.03 136-05.03 162-04.04

5 g 6 g 50 g
9% 4% 25 g 3000 g 14 % 5 g 2043 g 2.7 g
10 g 8% 32 % 19 % 12 % 15 %
26 %

h886 h019
275 g 75 g
h012 h990 h889 h017 h884 h018 h020
heroine heroine
50 g 25 g 3'000 g 980 g 5g 2'063 g 23 g
heroine heroine heroine heroine heroine heroine heroine

270 g
8% 62 g 7.1 g 40 g 20 g 20 g
0 g 19 % 11 %
10 % 11 % 11 %
22 % 30 g 900 g
8% 11 %

27/08/02 10/12/04 07/05/99 12/03/02


Geneve Chavannes Geneve Lausanne
08/12/01 08/05/01
23/06/03 07/05/03 92 g 121 g 145 g 76 g
Geneve Thurgovie
386-11.02 508-12.05 260-06.99 086-03.02
Vandoeuvres Geneve 546 g 033-02.03
332 g 7g 011-01.02
213-07.03 211-07.03

En raison du nombre important d'chantillons, tous ceux faisant partie d'une mme saisie et
lis la mme classe chimique ont t regroups et reprsents par une seule icne. Des
drapeaux ont t utiliss comme icnes des saisies afin de mettre en vidence les liens
gographiques.


58
Cf. Reprsentation dune entit sous la forme dun lien, page 112
59
Dans lvaluation: le rond rouge ayant le plus de liens directs avec des carrs noirs


158 Patterns de visualisation relationnelle

Reprsentation des chantillons par des liens entre les saisies et les classes chimiques

Diepoldsau Milan Cavenago Paderno Dugnano Munich Melegnano Felizzano Turin Slovnie Zurich Slovenie Milan Milan France Delmont Komugllave Vrbnica Kukkes Nogarole Rocca Milan Turin Milan Seriate Milan Milan Orio al Serio Modena
12'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 28'500 g 8'357 g 26'500 g 14'000 g 191'000 g 20'000 g 6'000 g 18'000 g 36'000 g 26'000 g 27'600 g 3'500 g 10'900 g 10'000 g 23'000 g 33'200 g 10'000 g 4'400 g 3'300 g

6'500 g 4'500 g
25 % 4'500 g 3%
2'000 g
3%
2'000 g 0g 12 %
0g 6'000 g 0g 14'000 g 191'000 g 6'500 g 2'000 g 95 g 82'800 g 10'500 g 32'700 g 30'000 g 69'000 g 99'600 g 30'000 g 8'800 g 9'900 g
500 g 500 g 1'000 g 3'000 g 7'500 g 23'500 g 9'500 g 1g 19'600 g 35'000 g 5'000 g 4%
7'000 g 29 % 22 % 6% 12 % 16 % 25 % 12 %
25 % 41 % 28 % 30 % 4% 4% 4% 4% 36 % 39 % 3% 42 % 46 % 9% 30 % 35 % 0% 46 % 72 %
30 % 4% 4% 1%

h992 h993 h009 h008 h010 h001 h999 h002 h003 h014 h013 h015 h016 h994 h995 h996 h004 h997 h998 morpine c001 c999
h007 1'000 g 3'465 g 5g 8'205 g 0g 11'500 g 4'535 g 32'700 g 30'076 g 69'000 g 99'600 g 30'000 g 8'803 g 9'900 g
11'107 g h005 h006
112'060 g 178'826 g

60 g 25 g
2% 1% 30 g 5g 1g 75 g
2'000 g 0g 3'500 g 0g 0g 172 g 30 g 1'000 g 4'000 g 3g
7g 4'080 g 20 g 20 g 415 g 5g 1'000 g 75 g 125 g 5'000 g 12 % 10 % 14 % 16 %
0g 5g 7g 8g 10 g 5g 0g 8% 8% 14 % 10 % 10 % 4% 15 % 12 % 39 % 25 %
7% 9% 10 % 13 % 10 % 10 % 21 % 19 % 16 % 22 % 10 % 31 % 16 % 8% 14 % 34 % 13 %

Bad Reichenhall Vernier Vernier Onex Renens Meyrin Vernier Geneve Geneve Bellinzona Geneve Geneve Bellinzona
Geneve Geneve Lausanne Lancy Geneve Lausanne Geneve Geneve Vernier Geneve Yverdon Geneve Geneve Grand-Saconnex Grand-Saconnex Geneve St-Margrethen Vernier Geneve 43'500 g 2'061 g 7'269 g 97 g 172 g 1'450 g 1'576 g 570 g 1'000 g 15'360 g 230 g 950 g 3g
16 g 54 g 7g 43 g 8g 1'361 g 40 g 30 g 20 g 419 g 85 g 10 g 121 g 57 g 1'300 g 129 g 40'000 g 78 g

25 g
8%
3'000 g 2'043 g
5g 6g 10 g 50 g 5g 3g
32 % 12 %
9% 4% 26 % 14 % 19 % 15 %

h886 h019 h012 h017 h884 h889 h018 h990 h020


50 g

1'000 g
16 %
270 g 62 g 7g 0g 40 g 900 g 30 g 20 g 20 g
8% 10 % 11 % 22 % 11 % 11 % 8% 19 % 11 %

Vandoeuvres Geneve Thurgovie Geneve Chavannes Geneve Geneve Lausanne


332 g 7g 546 g 121 g 92 g 145 g 76 g

Les chantillons sont reprsents par des liens entre les saisies et les classes chimiques.
L'paisseur des liens est proportionnelle la masse de stupfiant saisie. La couleur du lien
dcrit le type de stupfiant (gris pour l'hrone et vert pour la cocane). La quantit et la puret
sont affiches sur le lien. Le nombre d'chantillons ainsi que leurs numros pourraient
galement y tre inscrit. L'espace utilis pour reprsenter la mme information est rduit. Les
relations entre les saisies sont mises en vidence et des groupes de saisies apparaissent de
manire plus vidente. Un repositionnement global des icnes amliorerait encore cet aspect.
De nouvelles informations apparaissent plus rapidement, telles que le type et la masse des
chantillons (ici regroups par classe chimique). La rpartition gographique des chantillons
est plus facilement comparable (essentiellement grce au nombre rduit d'icnes).

Lexemple prsent ci-dessous a t effectu pour reprsenter les relations tablies avec une
saisie particulire (laffaire numro huit sur le schma) :


Analyser une srie dvnements 159

Sur ce schma les deux structures ont t exploites afin de reprsenter deux niveaux de
dtails diffrents. Pour laffaire en cours, lensemble des chantillons a t reprsent par des
entits. Les chantillons analyss pour les saisies lies sont quant eux reprsents de
manire simplifie. Lobjectif ici tait de faciliter la communication des rsultats danalyse.
Chaque chantillon est reprsent pour laffaire en cours afin que les enquteurs puissent
mettre en relation ces informations avec les autres lments de lenqute (notamment les
donnes issues des auditions).

R e l a t i o n s a v e c d e s v h i c u l e s

Lors de la commission de dlits, il nest pas rare que les auteurs volent des vhicules pour se
dplacer entre des lieux de cambriolages ou pour transporter leurs butins par exemple.
Certains vhicules sont vols directement lors de cambriolage (par exemple en volant les cls
du vhicule), tandis que dautres sont parfois retrouvs proximit de cambriolages. Ces
vhicules permettent donc de mettre en vidence des relations entre diffrents cas de
cambriolages. De plus, les auteurs changent souvent les plaques dimmatriculations des
vhicules afin dviter les contrles et dexploiter les vhicules sur de plus longues priodes.

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s


160 Patterns de visualisation relationnelle

Les relations entre les vnements, les vhicules et les plaques dimmatriculation sont
reprsentes par des liens multiples. Bien que diverses structures de graphe soient
envisageables, le lien multiple est la seule reprsentation qui permet de reprsenter ces
relations efficacement et sans ambigut.

Les structures bases sur lutilisation de liens simples (entre deux entits) sont prsentes ci-
dessous afin dexpliquer les difficults de reprsentation :

Lorsquun vhicule est li plusieurs vnements


et plaques, il nest plus possible de dterminer
quelle plaque tait appose sur le vhicule lors
de chaque vnement.

Exemple : un vhicule est vol avec une plaque, puis retrouv avec une autre.


Lorsquune plaque est lie plusieurs
vnements et vhicules, il nest plus possible de
dterminer quel vhicule est li chaque
vnement.

Exemple : une plaque est vole sur un vhicule et retrouve sur un autre.

Lorsquun vnement est li plusieurs vhicules


et plaques, il nest plus possible de dterminer
quelle plaque est appose sur quel vhicule.

Exemple : plusieurs vhicules sont vols, contrl sou retrouvs en mme temps.

Afin dviter les ambigits prsentes ci-dessus, les trois types dentits peuvent tre lies par
trois liens :


Certaines situations peuvent toutefois porter confusion. Dans cet exemple, deux vhicules (1
et 2) sont lis un vnement (E1). Pour dterminer quel vhicule les plaques A sont lies


Analyser une srie dvnements 161

lors de lvnement E1, il est ncessaire de se baser sur les relations des plaques B. Si le
vhicule 1 navait pas de plaques lors de lvnement E1, il ne serait pas possible de le voir
visuellement. Dans cette situation, la reprsentation est donc ambige. De telles relations
ncessitent donc une forme adapte de reprsentation : les liens multiples. Il faut relever que
la plupart des logiciels utiliss actuellement ne permettent pas de crer de telles relations. Lier
lensemble des entits est alors recommand en prenant garde aux situations particulires
prsentes ci-dessus.

E x e m p l e d e c a s

Les schmas ci-dessous reprsentent des relations issues dune banque de donnes de police.
Le premier schma a t ralis en utilisant des liens multiples. Le second schma reprsente
les mmes relations avec des liens simples. Lefficacit des liens multiples par rapport aux liens
simples na pas t teste dans le cadre de lvaluation prsente dans le chapitre prcdent,
puisque lutilisation de liens simples peut engendrer des ambigits. Lintgrit de la
reprsentation nest donc pas garantie en exploitant des liens simples. Visuellement,
lutilisation des liens multiples semble rendre la reprsentation plus lisible. Cet aspect pourrait
galement tre valu formellement.

Reprsentation des relations avec des liens Reprsentation des relations avec des liens
multiples simples (entre deux entits)


162 Patterns de visualisation relationnelle

Dans la majeure partie des sries analyses, les relations tablies sur la base de vhicules
vols, retrouvs ou observs sont plus simples. Les situations o lutilisation de liens multiples
est ncessaire pour viter de lambigut sont assez rares. Il est donc possible dexploiter des
liens simples (entre deux entits) pour reprsenter les relations :



Les relations avec des vhicules et des plaques ont t volontairement mises en vidence pour
cet exemple (contrairement au schma transmis dans le cadre de laffaire).

R e l a t i o n s s p a t i o - t e m p o r e l l e s

Lors de la reprsentation dune srie dvnements, la proximit spatio-temporelle entre les


vnements constitue galement une information pertinente. En effet, plusieurs cas ne
peuvent avoir t commis par un mme auteur ou un mme groupe dauteurs que si les
distances spatio-temporelles entre les cas sont compatibles avec les temps de dplacement
ncessaires pour parcourir les distances entre les cas.

C o n c e p t s r e p r s e n t e r


Analyser une srie dvnements 163

R e p r s e n t a t i o n d e s r e l a t i o n s

Comme dj mentionn, il est dusage de reprsenter le temps par la position des vnements
sur laxe horizontal. Les relations spatiales peuvent tre reprsentes de diverses manires :
par des entits spcifiques, par les icnes ou les couleurs des vnements ou encore par des
cadres. Dans lexemple de la reprsentation des relations entre des saisies de stupfiant
prsent prcdemment, des icnes sont utilises pour distinguer des pays ou des cantons.
Les relations spatiales peuvent galement tre reprsentes par la couleur :

Des cadres peuvent galement tre exploits. Toutefois, lorsque de nombreux vnements
sont reprsents, il nest pas rare que des vnements aient lieu dans les mmes rgions sur
plusieurs priodes distinctes. Des croisements de cadres peuvent alors tre crs :

Les croisements peuvent tre vits en exploitant le positionnement sur laxe vertical :

Une modification de placements sur laxe vertical nest cependant pas toujours suffisante pour
viter tous les croisements de traits (notamment en raison des autres relations reprsentes
entre les cas). Dans une telle situation, les cadres peuvent tre diviss et reprsentent alors
une proximit spatio-temporelle :

Les relations peuvent aussi tre reprsentes par des entits lieux lies chaque
vnement :


164 Patterns de visualisation relationnelle

Afin de minimiser le nombre dentits et de liens et ainsi rduire les risques de croisements de
traits, un tel choix nest gnralement pas adapt. En effet, lors de la reprsentation de
grandes sries (plusieurs dizaines, voire centaines de cas), ajouter des entits et des liens
supplmentaires complexifie inutilement la reprsentation. Exploiter des cadres est, dans ce
contexte, particulirement efficace. Un effet de couches est engendr. Celui-ci permet de
distinguer les diffrents types de relations.

E x e m p l e d e c a s

La srie reprsente regroupe plus de cent cas de cambriolages du soir supposs avoir t
commis par un mme groupe dauteurs.



La ligne horizontale bleue reprsente un profil ADN dtect sur plus de cinquante cas. Des
relations tablies sur la base de motifs de traces de semelle sont galement reprsentes. Les
images des motifs ont t insres pour les reprsenter.

Les relations tablies sur la base des traces ont permis de lier prs de quatre-vingt pourcent
des cas de la srie. Les autres vingt pourcent ont t lis sur la base de proximits spatio-
temporelles. Un schma dvnement a donc t produit. La chronologie est reprsente par
la position sur laxe horizontal et la proximit spatiale est visualise par des cadres. Le schma
ci-dessous met en vidence ces relations qui sont surlignes en rouge :


Slectionner des traces analyser 165

S l e c t i o n n e r d e s t r a c e s a n a l y s e r
Dans le prcdent pattern, la reprsentation visait soutenir lanalyse des relations entre un
ensemble dvnements afin de reconstruire une srie. Lvnement tait lentit principale de
lanalyse et les traces taient considres parmi un ensemble de relations, telles que les
relations spatio-temporelles, les relations avec des vhicules, du butin, etc. Dans le cadre de la
situation prsente ici, la trace est lentit centrale de lanalyse.

C o n t e x t e

Lors dinfractions graves, comme des brigandages ou des meurtres par exemple, il nest pas
rare quun nombre important de traces soient prleves sur la ou les scnes de crimes, ainsi
que sur lensemble des lieux ou des objets en relation avec laffaire. Dans de tels cas, des choix
doivent tre effectus afin de dterminer quelles traces seront analyses et dans quel ordre de
priorit. En effet, lanalyse des traces ncessite un temps plus ou moins important et parfois
des cots levs. Cest le cas plus particulirement des analyses ADN qui peuvent prendre
plusieurs jours, voire quelques semaines et coter plusieurs centaines de francs par trace. Des
choix doivent tre effectus et les priorits sont dfinies et rvalues diffrents stades de
lenqute. Dans la phase initiale de lenqute, ces choix sont parfois vidents, notamment
lorsque les traces sont prleves sur des armes, sur des victimes ou sur des voies daccs. Par
contre, lorsque certains rsultats sont obtenus et quil sagit de dfinir quelles sont les autres
traces qui seront analyses en regard des informations dj disponibles, les choix peuvent tre
plus compliqus.

O b j e c t i f d e l a r e p r s e n t a t i o n

Des schmas relationnels peuvent tre produits afin de faciliter et guider la prise de dcision
pour slectionner quelles sont les traces les plus pertinentes analyser.

C o n c e p t s r e p r s e n t e r

Pour valuer la pertinence des traces, plusieurs paramtres doivent tre considrs en
parallle :
- chaque scne doit tre clairement distingue
- lendroit de prlvement de la trace (sur les lieux ou sur un objet) est reprsent afin
dvaluer la pertinence en fonction des chances de retrouver une trace. Celles-ci sont
values en regard du support des traces (transfert, affinit, etc.) et des lments
circonstanciels sur lactivit (issus notamment des dclarations de tmoins).


166 Patterns de visualisation relationnelle

- le rsultat d'analyse doit tre inclus. Pour lanalyse ADN, il peut se classifier : pas
analys, ngatif, profil tabli (complet, partiel, mlange) et profil non-interprtable
- les relations avec des individus (identifi ou non) et le degr de certitude des relations

R e p r s e n t a t i o n d e s r e l a t i o n s


Slectionner des traces analyser 167

E x e m p l e d e c a s

A la suite dun brigandage survenu dans un muse, de nombreux prlvements ont t


effectus sur les lieux du crime, dans les vhicules utiliss par les auteurs et lendroit de la
dcouverte du butin. Le schma a t produit plusieurs semaines aprs le cas. Sur la centaine
de prlvements effectus, la moiti environ avait dj t analyse. Le schma produit ci-
dessous a t exploit lors dune sance avec le magistrat instructeur pour dfinir quelles
autres traces devaient tre analyses.

petite poche avant Sac dos


Dans sac en plastique JUMBO Dans sac en plastique de marque THALIN
Au fond de la grande poche Dans sac en plastique de marque THALIN
Dans sac en plastique JUMBO Au fond de la grande poche Dans sac en plastique JUMBO
Non Transmis Dans sac en plastique JUMBO
petite poche avant

prsentoirs et supports Carte magntique


97 Montres
de montres 4 ligatures/attaches lectricien Botier gris indtermin Tlcommande bleue de Cadenas Cl de vhicule VW (No1) Training de marque NIKE club de fitness "FIT INN" Gants de type fitness ou Lunettes noires de marque Cl de vhicule VW (No2) Cble avec port USB (firewire) Cble de fabrication artisanale Petit sac rouge de marque T-shirt gris Pantalon kaki de marque Veste ADIDAS de couleur noire Chaussettes grises de marque Chaussures de marque NIKE,
en plastique de couleur noire, marque NICE cycliste de marque ENERGICS, CHRISTIAN DIOR BALLY de marque ADIDAS JOGGER NIKE blanche, pointure 45
env. 36.5cm blanc et noir

gant droit poche latrale droite, infrieure chaussure droite

Profil non interprtable Profil non interprtable Profil complet Non Transmis Profil non interprtable Profil non interprtable
Non Transmis Profil non interprtable Profil partiel Salle 2a
Non Transmis
Profil partiel Profil partiel Profil complet Profil partiel Profil partiel Profil partiel
Profil non interprtable Profil non interprtable Sur le sol
Non Transmis 8/10 4/10 7/10 9/10 5/10
Non Transmis 9/10 trace de semelle
TPTR225241

Sur morceau de verre


devant grande vitrine brise
trace de semelle
Sas d'entre TPTR225242
Inconnu Inconnue
Dans le sas dentre
bauche de cl sans dents salle 2a, vitrine 2, sur langle de saisie (selon vido)
Sur prises du botier sous le volant 8/10 taille dans un outil FACOM ( 6 Profil complet une ligature/attache Non Transmis
pans 10mm) dlectricien de couleur noire
Profil partiel salle 2a, vitrine 3, sur langle de saisie (selon vido)
bande adhsive
Sur 2 cbles pendant sous le volant 5/10 Dans le sas dentre Non Transmis
Profil Complet
Profil non interprtable salle 2a, vitrine 13, sur langle de saisie (selon vido)
Profil partiel Au nom bande adhsive chiffone, de
couleur noire, Non Transmis
ligatures
approximativement (car plie)
50mm de largeur. Contient au salle 2a, vitrine 14, sur langle de saisie (selon vido)
Profil Complet moins deux ligatures.
Profil de mlange Non Transmis
complet
Dans le sas dentre
salle 2a, vitrines restantes portion gauche, sur langle de saisie (selon vido)
Profil Complet 2 ligatures/attaches Non Transmis
dlectricien de couleur noire
salle 2a, vitrines restantes, portion droite, sur langle de saisie (selon vido)
sur vitre casse du sas dentre
Bouchon rservoir essence 8/10 Profil de mlange
Non Transmis
Non Transmis
complet
Profil partiel
Sur sonnette entre principale
Salle 1a
Non Transmis
salle 1a, vitrine 1, sur langle de saisie (selon vido)
Sur volant
Non Transmis
Profil non interprtable
au sol sur le tapis/paillasson
salle 1a, vitrine 2, sur langle de saisie (selon vido)
Appuie-tte avant gauche + accoudoir + ceinture de scurit Profil de mlange Partie dun gant en tissu de Non Transmis
Profil non interprtable couleur gris chin
salle 1a, sur vitrine 2me droite, sur empreinte digitale

Appuie-tte avant droit + accoudoir +ceinture de scurit WC du rez Non Transmis


Profil non interprtable Profil de mlange Extrmits Sur le sol des WC (rez) interrupteur clairage salle 1a (1er tage)
Profil de mlange
Systme ouverture portire droite complet complet Non Transmis Non Transmis
3 morceaux de bande adhsive
Non Transmis Profil de mlange de couleur noire
salle 1a, vitrines restantes, sur langle de saisie (selon vido)
7/10. Profil majeur
Sur face extrieure du couvercle de la cuvette Profil non interprtable
Protection plastique sous le tableau de bord enleve par les auteurs
Non Transmis
Non Transmis Profil de mlange
complet poigne intrieure des wc du rez
Salle 1b
Sur levier de vitesses Non Transmis salle 1b, interrupteur clairage
Profil non interprtable
poigne extrieure des wc du rez Non Transmis
Appuie-tte central arrire + ceinture de scurit Profil non interprtable salle 1b, vitrine 1, sur langle de saisie (selon vido)
Non Transmis
Non Transmis

Appuie-tte arrire droit + levier porte + ceinture de scurit Mains courantes escaliers salle 1b, vitrine 2, sur langle de saisie (selon vido)
Non Transmis Profil de mlange Profil de mlange 7/10 Non Transmis
complet 1er - 2me tage
complet
Profil non interprtable salle 1b, vitrines restantes, sur langle de saisie (selon vido)
Appuie-tte arrire gauche + levier porte + ceinture scurit
Non Transmis
Non Transmis 7/10
rez - 1er tage,
sur la deuxime portion de la rampe
Profil de mlange
Profil mineur non interprtable Salle 2b
portire arrire droite
salle 2b, vitrine 1, sur langle de saisie (selon vido)
Profil non interprtable
Autocollant HOPP SCHWIIZ (en Non Transmis
trois langues)
Au dos du paquet froiss Divers
salle 2b, vitrine 2, sur langle de saisie (selon vido)
Suspendue - Sur la gauche du volant Profil complet Profil complet Profil complet Profil de mlange Profil de mlange Profil complet Profil partiel Profil complet Profil complet poigne extrieure porte local vido (1er tage)
Au dos du paquet froiss Non Transmis
Non Transmis Profil non interprtable
Cl de marque inconnue avec
inscription V. STEP Au dos du paquet froiss salle 2b, vitrines restantes, sur langle de saisie (selon vido)
coffre-fort du local vido (1er tage), niveau systme douverture
Au dos du paquet froiss Non Transmis
propritaire de la porsche Non Transmis
Non Transmis salle 2b, devant vitrine 2 - sur prsentoir se trouvant au sol
Sac plastique
Carte SIM Orange Sur le recto du paquet froiss
"Spar-Natur pur" Extrmits Non Transmis

Sur sige arrire gauche Profil complet 2 bandes adhsives colles sur
bouteille en PET 0.75l bouteille en PET 0.75l bouteille PET Vslauer sans bouteille en PET 0.75l le pantalon de marque
Non Transmis Vslauer lgrement plie Vslauer gaz carbonique Vslauer
Une pice en plastique blanc BIAGGINI, taille 46, avec
ceinture,

bouteille en PET 0.75l bouteille en PET EVIAN 1.5l Bouteille en PET 0.5l Coca Light canette RedBull 0.25l
Vslauer
Emballage de boulangerie froiss.

bouteille en PET 0.75l


boisson nergtique CAPS boisson nergtique CAPS Vslauer bouteille en PET 0.75l
grapefruit orange-lemon Vslauer

Profil complet Profil complet Profil non interprtable Profil non interprtable sur le recto de la carte sur le recto de la carte
une carte routire MICHELIN, FRANCE
Profil de mlange

Profil de mlange paire de gants de jardinier


7/10. Profil mineur
Dans le coffre portire conducteur, ds vide poche latral

Le gant tissu droit, de Profil complet


laborantin, de couleur blanche,
au sol derrire sige passager avant.
de marque SHOWA
Dans le coffre Dans le coffre

ds vide poche portire conducteur sur lunettes

Dans le coffre Profil de mlange Un tui en cuir, de marque Profil complet


Non Transmis complet. Profil mineur Sur la premire page
GUCCI et contenant une paire
bidon de carburant (n1) de lunettes solaire GUCCI
Carte gographique Sur le goulot
de l'Europe MICHELIN passager av
ds filet proximit des pieds Sur le goulot - ct passager av, au sol

Dans le coffre Profil complet une canette de


Tong gauche RED BULL, 25 cl une canette de COCA ZERO, Profil complet
Non Transmis Sur le volant et le levier de vitesses 33 cl
bidon de carburant (n3) Profil complet
Sur lextrieur du plastique Dans le coffre
Sur le bouchon du rservoir
sol passager arrire gauche Tong droite
Emballage plastique transparent
pour bouteilles PET Vslauer Profil non interprtable Sur le goulot Profil complet
Dans le coffre sans gaz carbonique. paire de Tong de marque ZARA cot conducteur, ds porte-bouteille
Non Transmis Profil complet Une canette de
bidon de carburant (n2) COCA ZERO 33 cl
au sol devant sige passager av.
Non Transmis
bote SCHOKOBANANEN Feuille A4 avec impression N/B
dun plan de Besanon
sous la banquette arrire Sur lappuie-tte arrire du milieu comportant un trac manuscrit
Sur le volant + levier vitesses Sur la grosse poigne de la cache du coffre Sur la portire avant gauche Sur la portire arrire droite Sur lappuie-tte arrire droit Tirette couvre-coffre Sur lappuie-tte arrire gauche Sur lappuie-tte conducteur bleu
Non Transmis
1 montre gousset diamtre Non Transmis
env. 36 mm marque (...)
Girard-Perregaux CDF Genve Sur le volant
Profil non interprtable
n46891 Non Transmis Non Transmis Non Transmis Non Transmis Profil non interprtable Non Transmis Profil non interprtable
Non Transmis
sous la banquette arrire
Profil non interprtable Sur lappuie-tte passager Sur la poigne extrieure du coffre Autour du bouchon dessence Sur la portire avant droite Sur la portire arrire gauche Sur lappuie-tte conducteur Petites poignes au fond du coffre Sur lappuie-tte passager
Sur le bouton en bas du coffre
1 montre gousset diamtre
env. 43 mm marque (...)
Non Transmis
Bautte Genve n42870
Profil non interprtable Non Transmis Profil non interprtable Non Transmis Non Transmis Profil non interprtable Non Transmis Non Transmis

sous la banquette arrire


Non Transmis
1 montre gousset diamtre 37
mm env., marque (...) Bautte
Dans le coffre Sur la feuille global refund cheque
Genve n 53371
Quittance de magasin Footlocker
83125 Eggstaett,
sous la banquette arrire agrafe un formulaire de dtaxe
Non Transmis
1 montre gousset diamtre Profil de mlange
env. 35 mm, marque (...) Vide-poches portire avant droite
Bautte Genve n 65271 complet. Profil majeur
Amas de fibres noires Profil de mlange
de provenance indtermine
sous la banquette arrire Profil de mlange
Non Transmis complet. Profil majeur
1 montre gousset en or
diamtre 24 mm, marque 1701
et 71617

Bien quapparemment complexe, le schma faciliter les discussions sur la pertinence des
traces. En moins dune heure de sance, lensemble des traces non transmises avaient t
discutes et directement annotes sur le schma.


168 Patterns de visualisation relationnelle

Le schma simplifi ci-dessous permet de voir plus clairement la structure propose :

Dans sac en plastique

Cble Non Transmis

Dans sac en plastique

Natel Profil non interprtable


Entre
Sac dos
Dans sac en plastiqu3 entre

Bote Profil non interprtable Non Transmis une ligature/attache

Non Transmis entre


4 ligatures/attaches Profil non interprtable
bande adhsive

Non Transmis
Au fond de la grande poche Profil partiel

Lunettes noires Profil partiel


Inconnue 1 entre

Italie - Lieu B Non Transmis 2 ligatures/attaches

Au fond de la grande poche Profil complet Profil majeur complet sur vitre casse

Gants Profil complet Non Transmis


Inconnu 1
Sur sonnette entre principale

Non Transmis

Petit sac Non Transmis


au sol sur le tapis

Profil de mlange Partie dun gant

T-shirt gris Non Transmis LIEU X


Salle 1
Sur le sol (voir plan)

Non Transmis 3 morceaux de bande adhsive


de couleur noire

Sur le sol

Non Transmis
ds vide poche portire conducteur Profil complet
poigne intrieure
Profil mineur partiel (7/10)
Un tui en cuir Profil complet
Non Transmis
poigne extrieure
Sur le goulot - ct passager av, au sol Profil complet
Profil non interprtable
une canette Profil complet

Sur le bouchon du rservoir Profil complet Profil complet sur la fentre

Profil complet Profil complet


Monsieur A
au sol devant sige passager av.

Bote Non Transmis


Feuille A4
VOITURE A
Sur lappuie-tte conducteur

Non Transmis
Sur le volant

Non Transmis
Sur lappuie-tte passager

Non Transmis

Sa 01.12.07,
16:30-23:40, Ma 04.12.07,
Cornaux 13:30-18:35, Les
Cambriolage Villa. Geneveys-s/Coffr.
Num Comm: ... Cambriolage Villa.
Num SF: ... Num Comm: ...
Adresse: ... Num SF: ...
Ve 30 / Sa Adresse: ...

01.12.07,
16:55-00:15,
Cormondrche
Cambriolage Villa.
Num Comm: ... Ma 04.12.07,
Num SF: ... 15:30-18:15, Les
Adresse: ...
Geneveys-s/Coffr.
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...

NE-S141

Di 20.01.08,
14:30-20:30,
Saules
Je 22 / Di Cambriolage Villa.
Num Comm: ...
25.11.07,
Di 25.11.07, Num SF: ...
10:00-14:25,
16:30-19:20, Adresse: ...
Coffrane
Colombier
Cambriolage Villa.
Num Comm: ... Cambriolage Villa.
Num Comm: ...
Num SF: ...
Num SF: ...
Je 01.11.07, Adresse: ...
Adresse: ...
19:25-21:40,
Wavre
Cambriolage Villa. Sa 17.11.07,
Num Comm: ... 21:30-22:00,

Le schma relationnel ci-contre issu du mme


Num SF: ... Colombier
Adresse: ... Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
Je 01.11.07,
17:00-18:30,
Marin-Epagnier
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
NE-S68

NE-S259

cas que prsent dans la section prcdente NE-S89


Di 02.12.07,
10:00-19:25,
Marin-Epagnier
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
Ve 07 / Di
09.12.07,
09:30-15:15, Fenin
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
Je 06.12.07,
17:45-18:00,
Di 20 / Lu
Thielle
21.01.08,
Cambriolage Villa.

( Reprsentation des relations spatio-


18:00-13:30, Num Comm: ...
Ve 30.11.07, Saules
08:15-21:20, Ble Num SF: ...
Cambriolage Villa. Adresse: ...
Di 04.11.07, Cambriolage Villa. Num Comm: ...
Me 31 / Ve Num Comm: ...
10:30-18:20, Les Num SF: ...
02.11.07, Num SF: ...
Geneveys-s/Coffr. Adresse: ...
20:00-18:15,Adresse: ...
Cambriolage Villa. Sa 08.12.07,
Num Comm: ... Wavre
Je 01.11.07,
Cambriolage Villa.
19:25-21:40, Sa 26.01.08, 18:30-21:45, Fenin
Num SF: ... Ve 20.04.07,
WavreNum Comm: ... 20:25, Wavre Cambriolage Villa.
Adresse: ... 22:00-22:10, Num Comm: ...
Cambriolage CormondrcheCambriolage Villa.
Num
Villa.
SF: ...
Num Comm: ... Num Comm: ... Num SF: ...
Adresse: ...
Cambriolage Villa. NE-S57 Adresse: ...
Num SF: ... Num SF: ...
Num Comm: ...
Adresse: ... Adresse: ...
Num SF: ...
Adresse: ...
NE-S245

Sa 24.11.07,
16:30-20:30, Les
Geneveys-s/Coffr.
Cambriolage Villa.
Di 21.10.07, Ve 23.11.07, Num Comm: ...
16:00-20:45, 19:40-21:45, Les Num SF: ...
Montezillon Ve 26 / Di Je 06.12.07,
Sa 24.11.07, Hauts-Geneveys Adresse: ... 28.10.07, 10:00-19:30,
Cambriolage Villa.

temporelles ) met en vidence une stratgie


16:00-21:30, Les Cambriolage Villa. 18:00-20:15, Ble Thielle
Num Comm: ... Num Comm: ...
Num SF: ... Geneveys-s/Coffr. Cambriolage Villa. Cambriolage Villa.
Num SF: ...
Adresse: ...
Cambriolage Villa. Num Comm: ... Num Comm: ...
Num Comm: ... Adresse: ... Num SF: ...
Me 14.11.07, Num SF: ...
Sa 08.12.07,
Num SF: ... Adresse: ... Adresse: ...
18:20-21:15, 17:15-20:45, Fenin
Adresse: ...
Wavre Cambriolage Villa.
Cambriolage Villa. Je 17 / Ma Num Comm: ...
Ve 23 / Sa
Num Comm: ... Sa 08.11.08, 22.01.08, Num SF: ...
24.11.07, Ve 26 / Di
Num SF: ... 01:50-01:55, 14:00-09:00, Adresse: ...
17:20-02:00, 28.10.07,
Adresse: ... Montezillon Corcelles
Fontainemelon 17:00-20:00, Ble Cambriolage Villa. Cambriolage Villa.
Cambriolage Villa. Cambriolage Villa. Num Comm: ...
Num Comm: ... Num Comm: ...
Num Comm: ... Num SF: ...
Num SF: ...
Num SF: ... Num SF: ...
Adresse: ... Adresse: ...
Adresse: ... Adresse: ...

Ve 07.11.08,
09:00-20:55,
Ve 23.11.07, Saules Lu 21.01.08,
18:15-21:30, Les Cambriolage Villa. 18:39-19:10,
Hauts-Geneveys Di 04.11.07, Num Comm: ...
Cormondrche
Tent. Cambriolage 20:20-20:30, Les Num SF: ...
NE-ADN8 Cambriolage Villa.
Villa. Geneveys-s/Coffr. Adresse: ... Num Comm: ...
Num Comm: ...
Tent. Cambriolage Num SF: ...
Num SF: ...
Villa. Adresse: ...
Adresse: ... Num Comm: ...

intressante. Pour chaque groupe de cas lis


Di 28.10.07, Num SF: ...
19:30-20:00, Ble Sa 27 / Di Adresse: ... Sa 15 / Lu
Cambriolage Villa. 28.10.07, 17.11.08, 12:00,
Num Comm: ... Lu 01.12.08,
19:30-16:00, Cressier Tent. 12:30-20:30,
Num SF: ... Montezillon Cambriolage Villa. Fontaines
Adresse: ... Cambriolage Villa. Je 22 / Lu Num Comm: ...
Di 25.11.07, Cambriolage Villa.
NE-S203 Num Comm: ... 26.11.07, Num SF: ...
16:15-19:30, Num Comm: ... Lu 01.12.08,
Num SF: ... Sa 08.11.08, 11:00-18:30, Adresse: ... 13:00-19:50,
Colombier Num SF: ...
Adresse: ... 17:15-21:45, Fontainemelon Fontaines
Cambriolage Villa. Adresse: ...
Di 17.12.06, Saules Cambriolage Villa. Num Comm: ... Cambriolage Villa.
Num Comm: ... Num Comm: ...
17:00-21:30, Cambriolage Villa. Sa 01.11.08, Num SF: ...
Num SF: ...
Cressier Num Comm: ...
11:00-21:50, Adresse: ... NE-S4735 Num SF: ...
Adresse: ... Adresse: ...
Cambriolage Villa. Num SF: ...
Neuchtel
Num Comm: ... Adresse: ... Cambriolage Je 31 / Ve
Num SF: ... Appartement. 01.02.08,
Di 30 / Lu
Adresse: ... Num Comm: ... 19:00-10:10,
Di 16 / Lu 01.12.08,
Num SF: ... St-Blaise
17.11.08, 19:30-08:15,
Adresse: ... Cambriolage Villa.
17:00-09:30, Num Comm: ...
Neuchtel
Sa 10 / Di Di 20.01.08, Cambriolage Villa.
St-Blaise Num SF: ...
11.11.07, 20:00-20:45, Num Comm: ...
Cambriolage Villa. Vilars Adresse: ...
17:00-17:15, Ve 23 / Sa Num Comm: ... Num SF: ...
Colombier 24.11.07, Cambriolage Villa. Adresse: ...
Ma 27.11.07, Num SF: ...
Cambriolage Villa. Num Comm: ...
12:00-07:30, 19:00-22:30, Adresse: ...
Num Comm: ... Num SF: ... Sa 01.11.08, Lu 01 / Ma
Fontainemelon Montezillon 17:00-20:10, 02.12.08,
Num SF: ... Adresse: ...
Cambriolage Villa. Cambriolage Villa. Ma 02.12.08, St-Blaise 17:30-00:30,

par un motif, un nombre limit de cas sont


Adresse: ... Num Comm:Ma ... 27.11.07,
Num Comm: ... 17:00-18:45, Cambriolage Villa. Fontaines
Num SF: ... 21:00-21:30, Num SF: ... Boudevilliers Num Comm: ... Cambriolage Villa.
Adresse: ... Montezillon
Adresse: ... Cambriolage Villa. Num SF: ... Num Comm: ...
Cambriolage Villa. Ma 27.11.07, Num Comm: ... Adresse: ... Num SF: ...
Num Comm: ...07:00-19:15, Num SF: ... Adresse: ...
Sa 10.11.07, Num SF: ... Montezillon Tent.
Adresse: ...
18:45-21:15, Ble Adresse: ...Cambriolage Villa.
Cambriolage Villa. Num Comm: ...
Num Comm: ... Num SF: ...
Num SF: ...
Adresse: ...
Adresse: ...
Me 19.11.08,
16:15-18:20,
Sa 10.11.07,
19:40-21:45, Ble Ma 18.11.08, Boudevilliers Ve 31.10.08,
Cambriolage Villa.
06:10-18:30,
Cambriolage Villa. Num Comm: ... 17:45-18:15,
Num Comm: ... Boudry Savagnier
Num SF: ... NE-S216 Cambriolage Villa.Num SF: ... Cambriolage Villa.
Num Comm: ... Adresse: ...
Adresse: ... Num Comm: ...
Num SF: ...
Num SF: ...
Adresse: ...
Adresse: ...
Ve 09.11.07,
17:40-19:57, Les NE-S4695
NE-S163 Di 18.11.07,
Hauts-Geneveys
Cambriolage Villa. 12:00-19:00, Di 18.11.07,
Num Comm: ... Wavre 11:50-19:45,
Num SF: ... Cambriolage Villa. Wavre
Ve 09.11.07, Num Comm: ...
Cambriolage Villa.

galement lis par lADN. A la lecture de ce


Adresse: ...
15:00-18:30, Num SF: ... Num Comm: ...
Fontainemelon Adresse: ... Num SF: ...
Cambriolage Villa. Ve 09.11.07,
Adresse: ...
Num Comm: ... 13:10-19:50, Les
Num SF: ... Hauts-Geneveys
Adresse: ... Cambriolage Villa.
Num Comm: ...
Num SF: ...

Ve 09 / Sa Adresse: ...

10.11.07,
16:15-22:50, Ve 07.11.08,
Fontaines 19:00-20:10,
Cambriolage Villa. Boudevilliers
Num Comm: ... Cambriolage Villa.
Sa 10 / Di Num Comm: ...
Num SF: ...
11.11.07, Num SF: ...
Adresse: ... 19:15-10:00,
NE-S4718 Adresse: ...
Colombier
Cambriolage Villa.
Num Comm: ...
Num SF: ...
Adresse: ...
Ma 27.11.07,
17:40-18:50,
Montezillon Tent.
Cambriolage Villa.
Num Comm: ...

schma, il est possible de penser que les liens


Num SF: ...
NE-S4676
Adresse: ...

NE-S215

Ve 31.10.08,
Ma 18.11.08, 19:30-22:45, Fenin
18:00-19:45, Ble
Cambriolage Villa.
Cambriolage Villa. Num Comm: ...
Num Comm: ...
Num SF: ...
Num SF: ...
Adresse: ...
Adresse: ...

tablis par les motifs de semelles ont t


Ve 31.10.08,
18:38, Savagnier
Tent. Cambriolage
Villa.
Num Comm: ...
Num SF: ...
Adresse: ...

Je 15.11.07,
13:30-18:00,
Colombier
Cambriolage Villa. Je 15 / Lu
Num Comm: ...
19.11.07,
Num SF: ...
14:00-08:00,
Adresse: ... Ve 16.11.07,
Montezillon
16:00-20:15, Les Cambriolage Villa.
Geneveys-s/Coffr. Num Comm: ...
Cambriolage Villa. Num SF: ...
Num Comm: ...
Adresse: ...
Num SF: ...
Adresse: ...

exploits pour guider la prise de dcision lors


de la slection des traces biologiques envoyer pour analyse. Une telle slection est souvent
ncessaire pour minimiser les cots danalyse. Une stratgie pourrait tre de slectionner un
cas par groupe (dfini par les relations tablies sur la base des traces de semelles), puis
denvoyer un prlvement pour analyse. Le choix du cas et plus particulirement du
prlvement envoy est, dans une deuxime phase, effectu en fonction des critres prsents
prcdemment. Si le rsultat est ngatif, une autre trace du groupe est envoye. Dans le cadre
de cette affaire, deux traces par cas avaient en fait t analyses en raison de limportance de
la srie. Une telle stratgie pourrait nanmoins tre exploite.


Analyser des transactions 169

A n a l y s e r d e s t r a n s a c t i o n s

C o n t e x t e

Les appels tlphoniques entre des numros de tlphones, les oprations financires entre
des comptes et les ventes entre des personnes sont des relations frquemment rencontres
dans le cadre denqutes. Ces relations sont diriges : un appel est effectu depuis un numro
appelant vers un numro appel, une transaction financire sopre entre un compte dbiteur
et un compte crditeur, finalement une vente est ralise entre un vendeur et un acheteur.
Bien quissues de sources diffrentes, toutes ces relations peuvent tre reprsentes de faon
similaire par un lien dirig.

Un pattern danalyse de transactions est formalis sur la base des similitudes observes entre
ces trois situations danalyse. Dans certains manuels, ce type danalyse est appele analyse
de flux (Interpol, 1997) (Peterson, 1998) (UNODC, 2002) (Fedpol, 2010). Celle-ci est
gnralement dcomposes en plusieurs sous catgories. Lanalyse de flux de marchandises se
focalise sur le transfert de biens et dargent entre des personnes et/ou entre des socits. Elle
vise la reconstruction de la structure dun trafic et lidentification des rles des protagonistes.
Lanalyse de flux dvnements (Event Flow Analysis) et lanalyse de flux dactivits (Activity
Flow Analysis) sont parfois galement dfinies (Peterson, 1998) (UNODC, 2002). Celles-ci
visent ce pendant des objectifs diffrents : dcomposer une squence dvnements pour
mieux comprendre leurs relations (temporelles et de causalit) et respectivement comprendre
une activit criminelle par la description des tapes ncessaires sa ralisation. Elles
exploitent les schmas chronologiques et respectivement les schmas dactivits
prcdemment dcrits60.

Le pattern propos intgre lanalyse de flux de marchandises, mais se diffrencie des analyses
de flux dvnements et dactivits qui exploitent des formes de reprsentation diffrentes. Il
inclut par contre lanalyse de donnes de tlphonie et lanalyse de donnes financires. Ces
trois formes danalyse sont souvent abordes sparment et des formes de reprsentations
propres sont dfinies (Peterson, 1990) (Peterson, 1998) (UNODC, 2002) (AGIS, 2004). Bien que
chacune delles rponde des besoins spcifiques, plusieurs similitudes sont observes entre
elles. Une abstraction plus globale est donc propose sous la forme dun pattern danalyse de
transactions (ou de flux). Son application est galement dcrite pour chaque type de


60
Cf. Analyse et visualisation relationnelle, page 42


170 Patterns de visualisation relationnelle

transactions : les communications tlphoniques, les transactions financires et les ventes de


marchandises.

Communications tlphoniques

Analyse de flux Transactions Transactions financires

Ventes de marchandises

O b j e c t i f s d e l a r e p r s e n t a t i o n

Les schmas de flux relationnels reprsentent des transactions afin de dtecter des rgularits
particulires signes dune activit illicite, de reconstruire la structure dun trafic de
marchandises, didentifier des entits (des personnes, des socits, des tlphones)
intressantes pour lenqute, notamment par leur position centrale dans le flux.

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s


Analyser des transactions 171

Que cela soit des ventes, des communications ou des transactions financires, les transactions
peuvent tre reprsentes par des liens entre des entits (respectivement des personnes, des
comptes ou des numros de tlphones).

Globalement plusieurs types de relations et leurs reprsentations associes peuvent tre


intgres sur les schmas de flux relationnels. De plus, reprsenter les transactions par des
liens permet de regrouper par agrgation un ensemble de transactions sous la forme dun seul
trait. Lpaisseur de celui-ci et alors exploit pour reprsenter une variable quantitative utile
pour lobjectif danalyse, telle que le nombre de transactions, ou la quantit de produits
vendue.


172 Patterns de visualisation relationnelle

C o m m u n i c a t i o n s t l p h o n i q u e s

C o n t e x t e

Lanalyse de donnes issues de communications tlphoniques est une technique courante de


linvestigation criminelle. En effet, certaines activits criminelles ncessitent lutilisation de ces
moyens de communication ou sont facilites grce eux. Lavnement de la tlphonie
mobile a conduit lintgration complte de la tlphonie dans nos activits routinires et
videmment celles des criminels.

Lintrt du contenu des communications interceptes par le biais dcoutes actives est
vident. De manire complmentaire, les mtadonnes techniques (tels que les numros des
correspondants, la date et lheure des appels) sont galement prcieuses. Lhistorique des
appels contenant ces donnes techniques peut tre obtenu rtroactivement sur des priodes
plus ou moins longues en fonction des lgislations nationales. Les reprsentations discutes
ici portent sur lanalyse de ces informations techniques indpendamment du contenu des
communications.

Ces donnes sont dites massives . En effet, les donnes rcoltes pour un seul numro
peuvent contenir plusieurs centaines, voire milliers de communications sur quelques mois. Des
techniques particulires sont donc ncessaires pour les analyser. Lapport de la visualisation
pour traiter ces informations est reconnu depuis plusieurs dcennies (Peterson, 1990). Lors
dune investigation sur un trafic de stupfiants, lanalyse des contacts dun suspect peut, entre
autres, permettre didentifier des fournisseurs (lors dappels internationaux notamment) ou
des transporteurs sur la base de dplacements spcifiques connus.

Les donnes de facturations tlphoniques sont particulirement intressantes et complexes


traiter car elles offrent des possibilits danalyse dans lensemble des dimensions. En effet,
chaque appel est dfini dans le temps par une date, une heure et une dure. Des
reprsentations particulires peuvent tre tablies dune part pour reprsenter le profil de
lactivit tlphonique par jour de la semaine ou par heure notamment (voir lannexe un pour
des exemples de reprsentation) et dautre part pour visualiser la squence temporelle des
appels (par exemple au moyen de diagrammes ou de schmas de flux temporels). Lorsque
lanalyse porte sur les donnes issues dun tlphone portable, lantenne par laquelle la
communication a transit est galement mmorise. Une analyse spatiale peut donc tre
effectue afin didentifier des dplacements particuliers ou des patterns dactivits suspects.


Analyser des transactions 173

Dans le cadre de sries de cambriolages, comparer spatio-temporellement les appels dun


suspect des vnements permet parfois de trouver des correspondances intressantes.

Dun point de vue quantitatif, le nombre et la frquence des appels pour chaque
correspondant sont, par exemple, des questions rcurrentes. Ces aspects ne sont pas dtaills
dans cette section qui prsente les formes de reprsentations exploites pour analyser ces
donnes dans la dimension relationnelle afin de reprsenter les contacts.

O b j e c t i f s d e l a r e p r s e n t a t i o n

Les schmas de flux relationnels sont produits sur la base des communications tlphoniques
entre diffrents numros. Des schmas reprsentant les relations entre les numros et les
botiers peuvent galement tre produits lors de lutilisation de tlphones portables. En effet,
il est parfois observ que des individus schangent ou se prtent ponctuellement leurs
botiers, alors mme quaucune communication nest dtecte entre leurs numros.

C o n c e p t s r e p r s e n t e r

De manire gnrale, les relations tablies sur la base des donnes de tlphonie permettent
de lier des raccordements, voire des appareils et non directement des individus. Les relations
avec des personnes physiques ou morales sont tablies sur la base de lenregistrement du
numro auprs des fournisseurs de services.


174 Patterns de visualisation relationnelle

R e p r s e n t a t i o n d e s r e l a t i o n s

La relation principale sur laquelle porte lanalyse est la communication tablie entre les
numros de tlphone:

Une communication tant par dfinition lie un numro appelant et un numro appel,
peut tre reprsente par un lien ( lexception des confrences tlphoniques). Le lien a un
sens entre le numro appelant et le numro appel :

Sur chaque relation, la date, lheure, la localisation et le type de communication sont des
informations qui peuvent tre reprsentes sous forme de texte notamment. Chaque entit
reprsente un numro. Licne et la couleur peuvent tre exploites pour diffrencier des
types de numro (fixe, mobile, cabine tlphonique), ou pour distinguer des pays dorigine ou
des cantons par exemple. La couleur des relations peut galement tre exploite pour
diffrencier des types de communications :


Analyser des transactions 175

Le nombre de communications entre deux numros peut tre trs grand. La reprsentation
devient rapidement illisible si un lien est trac pour chaque communication. Cest pourquoi, il
est dusage de regrouper les communications (le nombre de communications est
gnralement inscrit sur le label du lien) :

Plusieurs stratgies peuvent tre exploites pour reprsenter les communications de faon
agrge :

Deux liens dirigs sont exploits. Les paisseurs sont


proportionnelles au nombre de communications. Il sagit du
modle le plus couramment utilis actuellement.

Lutilisation dun seul lien permet de simplifier la reprsentation,


mais rend impossible le dnombrement des communications en
fonction du sens.

Historiquement, Andrews et Peterson (1990) proposent un


modle bas sur la reprsentation des communications par de
petits cercles dont le label correspond au nombre de
communications. Le nombre dentit est fortement augment au
dtriment de la lisibilit gnrale.

Morris (1986) propose une reprsentation simple base sur le


positionnement de deux labels pour dcrire le sens des relations.


176 Patterns de visualisation relationnelle

Le modle propos se base sur une reprsentation spcifique des relations bidirectionnelles61 :

La largeur globale du lien reprsente le nombre total de communications. Un seul lien permet
de reprsenter les deux sens de communication. La position des flches permet d'valuer
visuellement la proportion de communications dans chaque sens. Cette forme de
reprsentation a t value dans le chapitre prcdent par rapport lutilisation de deux liens
dirigs. Pour rappel, une amlioration significative a t observe pour identifier le numro
ayant le plus de contacts, tant au niveau du taux de rponses correctes que du temps de
rponse62.

Comme mentionn ci-dessus, il est souvent ncessaire de distinguer des types de numros
tels que des cabines, des tlphones mobiles, etc. Certains numros sont parfois lis entre eux
et forment des groupes particuliers. Cest le cas notamment dun ensemble de numros
appartenant une mme socit ou une mme personne. A titre dexemple, des cabines
tlphoniques situes dans une mme rgion gographique forment galement des groupes
particuliers. Ces groupes peuvent tre reprsents soit par le biais dune entit lie ou par un
cadre :


61
Cf. Typologie de relations, page 103
62
Cf. Reprsentation de liens bidirectionnels, page 116


Analyser des transactions 177

Les numros de tlphones et les communications tant gnralement nombreux, lajout


dentits et de liens supplmentaires aurait tendance complexifier le schma. Il est donc
recommand dutiliser des cadres qui peuvent se distinguer des liens par des effets de
couches (notamment en variant le type de trait ou la couleur). Les cadres vitent la
dmultiplication des entits et liens. Lutilisation de cadres ne permet toutefois pas de
commenter les relations spcifiques entre chaque numro et le groupe. Le placement des
entits peut galement tre exploit pour reprsenter des groupes selon le principe de
proximit (des entits places proximit tendent tre perue comme un groupe).

Des groupes de numros peuvent galement tre reprsents sous la forme dun ensemble63
afin de diminuer le nombre dentits et simplifier la reprsentation. Une telle simplification
peut tre utile notamment pour regrouper lensemble des numros dune mme socit :

Les relations entre les numros ainsi fusionns ne sont videmment plus visibles. Mais en
fonction de la question danalyse une telle simplification peut tre trs efficace. Les outils
actuellement disponibles ne permettent cependant pas dexploiter ce type de reprsentation.


63
Cf. Typologie de relations, page 102


178 Patterns de visualisation relationnelle

Des relations sont galement tablies sur la base dchanges de botiers entre les utilisateurs.
En effet, pour chaque communication le numro IMEI64 est prsent pour le numro partir
duquel les donnes ont t obtenues. Des schmas relationnels peuvent tre produits pour
reprsenter les relations entre les numros et les botiers.


Finalement, pour chaque numro, le dtenteur est identifiable auprs des oprateurs. Des
informations denqute peuvent galement tre disponibles sur les utilisateurs des tlphones.
Il est alors possible de reprsenter ces relations sur les schmas relationnels (sous la forme
dentits lies, telles que prsentes ci-dessus, ou sous la forme dun attribut de chaque
numro). Lorsque le nombre de numros de tlphone utiliss par chaque individu s'accrot,
une simplification de visualisation peut tre effectue en ne reprsentant que les relations
entre les personnes :

Toutefois des incertitudes sur les liens entre les personnes et les numros existent. Le fait
quun individu soit bel est bien lutilisateur dun tlphone est trs souvent incertain. Il n'est
dailleurs pas rare de voir des communications entre des numros attribus une mme
personne. Ceci peut sexpliquer par la vente ou le prt de cartes SIM ou simplement par lachat
dune carte effectu sous un faux nom. Il nest donc pas recommand deffectuer cette
simplification qui cache cette indirection importante.


64
lInternational Mobile Equipment Identity est un numro didentification des appareils mobiles. Il permet
notamment didentifier le fabricant et le modle de lappareil.


Analyser des transactions 179

E x e m p l e d e c a s

Dans lexemple prsent ci-dessous, la forme de reprsentation des liens bidirectionnels na


pas pu tre exploite, car les outils disponibles noffrent pas cette possibilit. Des liens simples
regroupant les communications entrantes et sortantes sont exploits. Un exemple de cas
exploitant le pattern propos a t prsent dans lvaluation65.



Cet exemple met en vidence lusage des icnes et des couleurs pour distinguer des types de
tlphone (fixe, mobile, cabine, etc.), ainsi que des pays. Le placement des nuds a galement
t ralis en fonction des types de numros pour faciliter la lecture du schma, tel que
discut dans le chapitre prcdent. Cet exemple illustre lutilit de positionner les entits en
fonction de leurs types. Malheureusement, il nexiste lheure actuelle aucun algorithme
automatique facilitant un tel positionnement. Le travail est donc compltement manuel.
Finalement la taille des icnes est proportionnelle au nombre de communications.


65
Cf. Reprsentation de liens bidirectionnels, page 114


180 Patterns de visualisation relationnelle

Le schma ci-contre prsente une stratgie particulire dintgration de la dimension


temporelle sur un schma relationnel. En effet, la couleur des liens est exploite pour
distinguer des priodes temporelles prcises : en gris pour la premire priode, en turquoise
pour la seconde et en rouge lorsque des communications ont t effectues sur les deux
priodes. Dans cette affaire lobjectif tait didentifier un numro particulier en fonction de
deux activits supposes de son dtenteur sur deux priodes particulires. Il tait galement
suppos que le
Zrich Aeroport
2 7
30/01/2010 12:20:33 30/01/2010 22:54:58

dtenteur de ce
30/01/2010 12:21:03 30/01/2010 23:42:15 8
30/01/2010 22:50:51
1 1 30/01/2010 23:43:17
17/01/2010 19:17:22 17/01/2010 15:55:36
1
17/01/2010 19:21:48
1 1
19/01/2010 16:32:21 17/01/2010 18:58:49
2
17/01/2010 16:21:11
2 17/01/2010 16:50:55 1

numro avait eu des


17/01/2010 19:20:22 16/01/2010 18:30:23
17/01/2010 19:31:54

2 1
17/01/2010 17:31:36 29/01/2010 14:38:47
1 10:16:54
18/01/2010 2
20/01/2010 19:00:34 17/01/2010 17:15:33

15-30.01.2010 17/01/2010 17:16:39 3


15/01/2010 14:51:20
1 30/01/2010 13:24:13
21/01/2010 12:27:38

15-30.03.2010 2 4

contacts avec les


17/01/2010 17:34:53 20/01/2010 20:39:33
17/01/2010 17:46:20 1 15:51:01
29/01/2010
16/01/2010 15:58:06

Deux priodes
3 1 1
25/01/2010 22:56:34 30/01/2010 15:42:10 29/01/2010 14:34:29
29/01/2010 20:35:54

1 5
28/01/2010 18:10:04 17/01/2010 15:53:26
1 21:42:51
22/01/2010

protagonistes de
17/01/2010 19:00:51
1
29/01/2010 20:15:59
13
18/01/2010 17:49:14
3 21/01/2010 17:22:21
25/01/2010 22:56:34
6
29/01/2010 20:35:54 13
27/01/2010 13:01:49
5
16/01/2010 13:20:23 15/03/2010 16:44:52
6 29/01/2010 18:20:19
15/03/2010 20:35:02 30/01/2010 15:05:04 17/03/2010 17:04:08
10 3 66 1

laffaire pendant ces


25/03/2010 08:45:03
16/03/2010 23:06:48 18/01/2010 13:24:56 16/01/2010 19:30:11 26/01/2010 18:26:41 15/03/2010 16:53:13
25/03/2010 08:31:07 27/01/2010 07:57:36 26/01/2010 23:27:14

4 1 1
16/03/2010 18:02:15 29/01/2010 14:35:02 18/03/2010 17:26:29
25/03/2010 21:45:55 1
25/01/2010 10:50:53 19/03/2010 18:44:25
2 3 1
19/03/2010 03:17:32 16/01/2010 18:46:42 30/03/2010 16:37:56
19/03/2010 03:19:57 29/01/2010 19:37:37

deux priodes.
19 1
20/01/2010 18:58:58 27/03/2010 16:49:52
30/01/2010 08:12:16 1
27/03/2010 16:50:12
7 2
16/01/2010 17:28:11 24/03/2010 13:36:55
30/01/2010 18:02:36 16 24/03/2010 13:41:27 1
23/01/2010 16:56:08 24/03/2010 13:41:30
7 30/01/2010 17:30:18 71
17/01/2010 19:22:25 15/01/2010 12:14:12
30/01/2010 17:30:32 5 30/01/2010 17:45:46 1
18/01/2010 16:20:52 15/03/2010 10:12:19

Lanalyse porte
29/01/2010 20:02:42 36
27/01/2010 11:49:37
30/01/2010 22:01:04
2
17/03/2010 10:17:51
17/03/2010 13:58:46

40 2 2
17/01/2010 15:44:03 20/01/2010 10:48:49 15/01/2010 17:07:23
30/01/2010 14:26:26 61 25/01/2010 17:20:07 3 15/01/2010 17:12:18 3
17/01/2010 17:42:48 20/01/2010 10:52:02 15/01/2010 16:38:17
80 30/01/2010 19:52:22 20/01/2010 11:25:46 15/01/2010 17:11:46
8 27/01/2010 10:32:27

principalement sur
21/03/2010 16:22:28
30/01/2010 22:18:33 46 2 3
21/03/2010 18:30:30 27/01/2010 10:27:26 28/01/2010 17:17:44 21/01/2010 19:20:18
5 2
18/01/2010 15:29:53 18/01/2010 10:35:24 30/01/2010 13:43:52 28/01/2010 17:28:09 27/01/2010 12:14:15
31
19/01/2010 16:46:00 29/01/2010 00:34:04 18/01/2010 13:24:17 2 1
26/01/2010 18:05:21 4 25/01/2010 13:36:07 16/01/2010 21:19:31
7 26/01/2010 18:05:08
28/01/2010 15:58:27 25/01/2010 13:36:10 2 1
27/01/2010 10:27:01 24/01/2010 21:27:14 19/01/2010 14:14:47
28/01/2010 21:59:44
18 9 25/01/2010 13:46:55 1
19/03/2010 03:22:07 17/03/2010 09:24:43
16 16/01/2010 17:17:38
21/01/2010 16:49:44
28/03/2010 18:01:45 1 23/03/2010 16:30:32 1 5
25/03/2010 14:20:33 19/03/2010 11:49:16 27/01/2010 08:15:36 30/01/2010 10:28:20

les contacts. La
30/01/2010 18:59:23 1 1 2
30/01/2010 10:28:15 30/01/2010 18:58:13 19/01/2010 19:53:44
5 2 19/01/2010 19:55:09
16/03/2010 18:01:12 17/03/2010 22:45:50
28/03/2010 18:24:37 20/03/2010 17:42:23 2
23/01/2010 11:14:35
11 4
4 1 26/01/2010 17:48:45 23/01/2010 11:22:14
15/03/2010 20:34:04 24/03/2010 20:05:39 19/01/2010 16:01:18
26/01/2010 17:51:30
28/03/2010 04:22:18 29/01/2010 00:31:11
10 2
18/01/2010 10:33:58 18/01/2010 15:28:25
10 2 28/01/2010 18:46:07 19/01/2010 15:03:01

dimension
15/03/2010 17:42:29 19/03/2010 19:13:50
27/03/2010 16:09:25 21/03/2010 18:10:35
4 2
5 3 19/01/2010 16:07:11 26/01/2010 17:49:21 2 2
16/03/2010 18:07:13 17/03/2010 17:44:26 19/01/2010 17:33:13 15/01/2010 14:50:40 28/01/2010 12:43:21
26/01/2010 17:59:39 3
22/03/2010 19:59:29 25/03/2010 18:38:08 22/01/2010 22:59:04 28/01/2010 12:53:55
1
28/01/2010 11:52:07 15/03/2010 06:33:01
3 5 2
15/03/2010 17:46:27 19/03/2010 18:54:31 19/03/2010 11:49:23 28/01/2010 12:58:51 15/03/2010 06:33:01

18/03/2010 16:44:07 20/03/2010 19:23:36 19/03/2010 22:41:44 4


18/03/2010 19:15:22
69 33 21/03/2010 20:19:07 9

relationnelle est
17/03/2010 18:55:46 16/03/2010 15:02:15 21/03/2010 08:54:17
28/03/2010 18:15:23 44 23/03/2010 12:40:05 43 21/03/2010 18:49:14 26
22/03/2010 21:30:44 17/03/2010 15:43:21 15/03/2010 17:36:57
28/03/2010 18:01:45 23/03/2010 07:42:23
29 21/03/2010 20:15:50
16/01/2010 16:37:55
3
6 2 19/01/2010 20:16:50 18/01/2010 23:36:16 1
17/03/2010 15:25:44 19/03/2010 19:03:26 19/01/2010 12:57:11 19/03/2010 11:01:13
1 20/03/2010 23:17:37 20/03/2010 23:08:57
12
17/03/2010 14:01:31 18/01/2010 12:18:10

23 9 19/01/2010 16:01:53 1
15/03/2010 20:14:28 21/03/2010 16:23:06
5 24/01/2010 14:45:09
28 29/01/2010 00:32:33
28/03/2010 04:11:49 22/03/2010 11:54:49 3

donc dominante.
26/01/2010 17:47:17 30/01/2010 22:11:32
20/03/2010 19:26:05
1 1 10 30/01/2010 22:35:33 2
20/03/2010 19:26:31
20/03/2010 22:10:21 21/03/2010 21:04:53 21/03/2010 14:34:51 2 26/01/2010 08:58:25
1 22 22/03/2010 14:42:51 30/01/2010 20:37:31 26/01/2010 08:59:22
20/03/2010 21:49:32 15/03/2010 20:25:43 2 30/01/2010 20:37:50
2 28/03/2010 04:13:15 20/03/2010 22:17:18 1
27/03/2010 18:00:45 20/03/2010 22:17:45 17/03/2010 10:48:23
28/03/2010 19:55:05

3 1
26/03/2010 16:59:00 21/03/2010 14:55:51
4

Dans la dimension
27/03/2010 16:44:28
28/03/2010 04:33:13
1 28/03/2010 04:34:05 2
17/03/2010 23:57:30 28/03/2010 04:07:21
28/03/2010 04:07:22 1
19/03/2010 10:31:37

1
23/03/2010 12:31:39
1
17/03/2010 15:30:50

temporelle, la 2
19/03/2010 16:07:09
19/03/2010 16:07:15

3
27/03/2010 22:58:55
28/03/2010 04:32:35
7
10
23/01/2010 18:51:02 16/03/2010 16:48:12 2
1
17/03/2010 16:19:45

30/01/2010 17:20:12 21/03/2010 09:09:57 45


20/01/2010 14:03:40 15/03/2010 17:37:20
3
20/01/2010 14:04:05 27/03/2010 11:33:05 19/03/2010 10:32:30

variabilit est
19/03/2010 10:43:12

2
16/01/2010 17:50:21
1 16/01/2010 17:50:26
28/03/2010 10:41:03
1 2 1 1
28/03/2010 20:44:03 19/01/2010 18:52:07 28/03/2010 14:09:30 27/03/2010 20:58:09
19/01/2010 18:52:31 1 1
23/03/2010 17:05:49 25/03/2010 15:40:22
1 2 1
17/03/2010 15:06:07 22/01/2010 10:52:33 21/03/2010 19:08:17

dfinie par trois


25/01/2010 14:26:28 1 1
16/03/2010 12:55:01 16/03/2010 10:31:55
1 1
16/03/2010 15:25:35 22/01/2010 19:04:21
1 1
15/01/2010 10:25:25 19/03/2010 16:54:48
2 1
25/03/2010 09:51:19 25/01/2010 10:26:06
25/03/2010 09:51:33 1 1
19/01/2010 16:31:18 26/01/2010 10:50:41
1 2 1 1
16/03/2010 10:03:48 21/01/2010 13:40:20 21/01/2010 18:18:28 18/01/2010 16:32:39

priodes.
22/01/2010 15:15:32

1 4
18/03/2010 09:28:37 16/01/2010 11:55:26
29/01/2010 18:25:55 1 1
21/01/2010 20:49:02 16/03/2010 17:01:57 16/03/2010 17:04:55
1 1
18/03/2010 08:43:44 23/01/2010 08:13:52
2
1
1 25/03/2010 10:53:34
19/01/2010 16:11:21 18/03/2010 09:43:01
1 3
16/03/2010 14:59:16 17/01/2010 09:56:20 19/01/2010 16:14:08 18/03/2010 09:43:01
5
19/01/2010 18:15:37 3
1 20/01/2010 11:30:10
18/01/2010 08:48:54 22/03/2010 10:51:42
1 1 27/01/2010 16:23:10
22/03/2010 09:40:11 25/01/2010 12:03:29 26/01/2010 08:54:50 22/03/2010 10:51:42

3
1 1 2
22/03/2010 09:54:34 21/01/2010 16:25:34
1 17/03/2010 17:49:56
25/01/2010 13:33:36 18/03/2010 09:07:21
18/03/2010 10:29:51
25/01/2010 18:19:33 18/03/2010 09:07:21
6
1
22/01/2010 10:56:17
20
1 19/01/2010 11:20:58 15/03/2010 20:00:18
1 1
24/03/2010 18:47:42
8 27/01/2010 16:00:00 27/03/2010 14:46:33 25/03/2010 10:39:19
19/01/2010 19:16:09 15/03/2010 20:25:20
1
14/01/2010 17:32:08 19/01/2010 19:16:09 27/03/2010 12:09:24
1
3 2
16/03/2010 15:20:19 15/01/2010 10:43:27
2
25/01/2010 15:20:44 16/03/2010 10:30:36
16/03/2010 15:29:03 2 26/01/2010 09:09:45
20/01/2010 19:05:21 25/01/2010 15:20:44 16/03/2010 10:49:38
1 20/01/2010 19:05:34
24/03/2010 11:46:52
2 1 1
22/01/2010 14:20:51 19/03/2010 09:05:32 19/03/2010 08:11:30
2 22/01/2010 14:21:07 1
19/03/2010 11:31:40 19/03/2010 08:43:13
19/03/2010 11:43:03 4 2 2
25/01/2010 10:19:38 28/03/2010 20:37:53 15/03/2010 15:26:15
1 25/01/2010 10:28:07 28/03/2010 20:38:20 20/03/2010 15:15:04 7
15/03/2010 11:21:08 15/03/2010 15:42:29
1 1 5 25/03/2010 08:45:46
23/01/2010 16:44:09 22/03/2010 16:20:15 15/03/2010 17:50:08
1 26/03/2010 17:11:35 3
18/03/2010 14:50:53 25/03/2010 19:53:38
3 26/03/2010 13:34:29
28/01/2010 19:46:26
28/01/2010 19:46:52 3 1
27/01/2010 16:16:42 27/03/2010 20:58:05
2 2 27/01/2010 16:17:08 14
23/01/2010 16:42:42 27/01/2010 16:27:09 15/03/2010 15:02:44
1 25/01/2010 12:02:07 27/01/2010 16:28:57 28/03/2010 16:22:26
24/03/2010 07:22:11
3
23/01/2010 16:44:01
1 23/01/2010 16:44:25 1 3
18/03/2010 14:51:17 18/01/2010 08:50:48 19/01/2010 18:06:37 19/03/2010 17:30:44
11 4 25/01/2010 15:46:38 21/03/2010 16:50:22 7
20/01/2010 16:35:12 15/01/2010 13:05:33 19/01/2010 18:07:28 15/03/2010 17:40:13
1 24/01/2010 20:26:33 30/01/2010 09:33:47 27/01/2010 11:49:22 21/03/2010 16:53:08
28/03/2010 14:09:26
1 1 1
28/01/2010 09:59:59 22/01/2010 15:32:52 30/01/2010 14:38:54 16/03/2010 12:04:05
1
16/03/2010 11:54:40
1
28/01/2010 09:52:32
2
15/03/2010 21:11:23
2
15/03/2010 21:21:55 40 2
20/01/2010 15:44:18 20/03/2010 17:08:43
1
20/01/2010 13:13:05 27/03/2010 16:14:05
4 24/01/2010 20:26:47 20/03/2010 17:08:54 8
16/03/2010 21:22:11 26/01/2010 09:58:21 27/03/2010 16:14:05
21/01/2010 10:35:33 15/03/2010 18:08:39
19/03/2010 12:58:45 27/01/2010 08:54:04 27/03/2010 16:12:59

3
18/01/2010 14:47:21
18/01/2010 14:47:47

1 9
22/03/2010 16:20:04 24/01/2010 12:01:53 044...
24/01/2010 16:25:04 35
24/01/2010 12:02:36
1 24/01/2010 15:44:34
25/03/2010 09:51:15
86
1
30/01/2010 18:32:46
10
15/01/2010 15:01:46 15/03/2010 17:53:35
1
26/03/2010 18:37:12 30/01/2010 15:36:09 17/03/2010 18:17:36
9
19/01/2010 16:03:25
28/01/2010 18:44:22 78
18/01/2010 17:49:21
1 3 30/01/2010 02:11:32
16/03/2010 15:29:14 25/01/2010 12:27:54
25/01/2010 12:28:20

1 1
19/03/2010 17:59:56 18/01/2010 17:25:22
19
16/01/2010 15:59:11
27/01/2010 15:32:49

11 13
18/01/2010 21:07:36 15/03/2010 21:06:42
23/01/2010 16:17:40 19/03/2010 12:58:31

5 2
22/01/2010 22:51:32 19/03/2010 03:58:50
25/01/2010 17:49:16 19/03/2010 03:59:04

1
16/01/2010 19:33:31

4 4
18/01/2010 17:50:46 27/01/2010 09:08:55 21/03/2010 09:55:56
19/01/2010 13:55:53 28/01/2010 16:33:19 28/03/2010 19:21:11
2
1
27/01/2010 12:18:56
4
23/01/2010 16:55:01 15/03/2010 09:56:18
23/01/2010 16:55:14 15/03/2010 11:21:20
1
27/01/2010 13:08:38
1
2
25/01/2010 14:27:34 16/03/2010 15:32:42
1
23/01/2010 18:59:03 25/01/2010 14:27:34 22/03/2010 09:07:19
3
1
16/01/2010 12:04:26 17/03/2010 09:41:12
1
26/01/2010 18:06:57 16/01/2010 12:05:43 17/03/2010 09:41:12
3
2
25/01/2010 10:31:31 24/03/2010 09:36:48
1
19/01/2010 22:21:08 25/01/2010 10:35:51 24/03/2010 09:38:07

1
23/01/2010 16:18:20
2
1
29/01/2010 16:54:59 23/03/2010 19:16:10 2
1
17/01/2010 20:26:02 29/01/2010 16:55:15 23/03/2010 19:16:10 1
21/01/2010 20:03:37 23/03/2010 20:08:59
21/01/2010 20:08:01 23/03/2010 20:08:59
3
1
19/01/2010 13:24:52
5
28/01/2010 20:33:42 15/03/2010 17:55:52
30/01/2010 15:36:18 17/03/2010 18:17:51


Analyser des transactions 181

Le schma ci-dessous a t ralis pour analyser les communications du numro de tlphone


portable utilis par le suspect dune agression. Lagression a eu lieu dans une ville du littoral
neuchtelois et le suspect habitait dans une autre rgion du canton. Lobjectif du schma tait
de reprsenter la chronologie des appels effectus par le suspect en regard de la position
gographique du relai utilis lors de chaque appel et reprsenter galement les personnes
contactes. Cette question couvre trois des dimensions danalyse : relationnelle (les contacts),
temporelle (la chronologie des appels) et spatiale (la position des relais). Un schma de flux
temporel a t tabli. En effet, dun point de vue spatial, les appels ont t effectus dans deux
rgions uniquement : le lieu de domicile du suspect (en bleu et vert) et le lieu de lagression
(en rouge). Les liens verts sont des messages et les liens bleus des appels vocaux. Le nombre
de contacts est relativement petit (sept numros contacts). Finalement dun point de vue
temporel, lanalyse porte sur une journe particulire.

Ce schma a permis de comparer le scnario dcrit par le suspect et les traces laisses par son
activit tlphonique. Il a ainsi t possible didentifier des incohrences.


182 Patterns de visualisation relationnelle

Le schma ci-dessous reprsente les relations tablies sur la base dchange de tlphones
portables :

891 appels 5541 appels


05.12.2002 18:23:09
12.12.2002 00:58:39
28.04.2003 19:56:43
11.06.2003 23:55:16

276 appels
31.10.2002 10:15:22
05.12.2002 17:30:19

2 appels 32 appels
25.12.2002 13:07:07
2 appels
16.04.2003 11:08:42 2 appels
08.02.2003 13:36:38 10.06.2003 08:55:25
09.02.2003 11:37:25 10.06.2003 22:06:39
10.06.2003 11:59:41
12.02.2003 19:06:21
8 appels 3 appels
21.04.2003 19:15:41
08.01.2003 17:30:25
08.06.2003 19:10:49
09.01.2003 20:41:55
1 appel 64 appels 7 appels
20 appels 05.06.2003 20:44:15 07.06.2003 19:05:55 14.06.2003 23:10:59
09.01.2003 08:54:50 05.06.2003 20:44:15 09.06.2003 19:33:12 17.06.2003 01:34:55
27.04.2003 21:54:12

585 appels
28.03.2003 14:35:47 1365 appels
16.10.2002 09:34:32
15.04.2003 23:48:11
14.04.2003 20:10:36
18 appels 186 appels 552 appels 3 appels 1742 appels
23.02.2003 19:13:50
1 appel 21.10.2002 15:55:24
28.03.2003 15:18:54 21.10.2002 10:42:43 01.12.2002 20:29:16
07.04.2003 13:59:19
23.02.2003 19:23:54 09.04.2003 21:34:06 22.11.2002 13:20:51 21.10.2002 10:46:09 27.03.2003 19:39:57
07.04.2003 13:59:19

11 appels 831 appels 34 appels


1 appels 12 appels 29.03.2003 22:31:35
20.10.2002 16:06:17 14.04.2003 20:07:45 03.03.2003 11:02:51 17.05.2003 15:06:44
09.04.2003 12:14:05
20.10.2002 16:17:13 14.04.2003 20:07:45 10.06.2003 22:51:11 20.05.2003 19:32:47


De tels schmas sont notamment utiles pour dtecter des relations entre deux cartes SIM,
mme si aucun appel na t effectu. En effet, il peut arriver que des complices veillent ne
pas se contacter directement, mais schangent leurs botiers.

T r a n s a c t i o n s f i n a n c i r e s

C o n t e x t e

Lanalyse de transactions financires issues denregistrements bancaires, consiste en lexamen


des dpts, des payements et des retraits effectus par une personne (physique ou morale)
suspecte dune activit illgale. Lanalyse des flux financiers peut tre exploite pour estimer
les dpenses et le train de vie dun individu, pour identifier la prsence ventuelle de revenus
illgaux, et pour dtecter des activits de skimming, de fraude ou de blanchiment notamment.

Les informations sont gnralement fournies directement par des organismes financiers, voire
saisies lors de perquisitions. Lintgration de ces informations pose en Suisse notamment de
nombreux problmes lis aux variations de formats et au support de transmission (la plus
grande partie des banques transmettent les informations sous forme papier). Par ailleurs, ces
donnes sont gnralement fragmentaires. En effet, les relevs de comptes, bien quintgrant


Analyser des transactions 183

la date, le montant et la devise de chaque transaction, ne contiennent pas toujours des


informations prcises sur la source ou la destination des fonds. De telles transactions ne
peuvent donc plus tre reprsentes prcisment entre un compte source et un compte de
destination. De plus, le nombre de comptes analyss dans le cadre dune affaire peut tre
important. Lors de lanalyse des comptes dune socit (par exemple en cas de suspicion dune
fraude), il nest pas rare que la socit soit divise en plusieurs entits disposant de nombreux
comptes (clients, etc.). Des stratgies particulires de reprsentation sont alors exploites pour
obtenir une vue densemble des informations.

O b j e c t i f s d e l a r e p r s e n t a t i o n

Les schmas de flux relationnels de flux sont produits sur la base de transactions financires
afin dexpliciter un mcanisme financier particulier ou de dtecter une activit de fraude ou de
blanchiment par exemple. Ils permettent de dtecter des patterns correspondant des modes
opratoires particuliers (par exemple afin de dissimuler la provenance de fonds).

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s

La relation principale sur laquelle porte lanalyse est la transaction financire effectue entre
un compte dbit et un compte crdit. Les transactions financires peuvent donc tre
reprsentes par des liens dirigs.

Lensemble des observations et des recommandations de reprsentation dcrites pour


lanalyse de donnes de tlphonie sapplique aux donnes financires. Afin dviter des
redondances, elles ne sont pas rexpliques ici. Seuls certains problmes spcifiques
complmentaires sont dvelopps.


184 Patterns de visualisation relationnelle

Produire un schma relationnel efficace est une tche difficile pour les raisons suivantes :

- Le nombre global de transactions


- Le nombre de comptes diffrents pour une mme socit ou personne
- La diversit des types de transactions : payements de factures, de salaires, dpts ou
retraits cash, bonifications, placements, etc.
- Lincompltude des donnes : absence du compte source pour une transaction au
crdit ou du compte de destination pour une transaction au dbit.

Lors de la cration dun schma de flux temporel, plusieurs transactions entre deux mmes
comptes peuvent avoir t effectues le mme jour. Contrairement aux communications
tlphoniques dont lheure et la dure sont dfinies, seule la date de la transaction est
disponible en matire de finance. Les transactions doivent donc tre au minimum agrges
par jour pour viter des superpositions visuelles.

Pour exploiter au mieux la reprsentation, des slections et des agrgations peuvent tre
effectues. Un sous-groupe de transactions peut tre filtr pour reprsenter une portion
particulire des donnes. De telles slections sont gnralement effectues pour rpondre
des questions spcifiques : pour telles priodes, tels comptes, telles personnes, etc. quelles
sont les relations ? Des agrgations particulires peuvent galement tre effectues. Elles sont
dcrites dans ce pattern.

Lensemble des transactions entre deux comptes sont regroupes. Le lien reprsente alors un
groupe de transactions avec comme attributs: le nombre et le montant total des transactions.

Agrgation de lensemble des transactions entre deux comptes. Lpaisseur des liens est alors
proportionnelle au nombre de relations regroupes ou la somme des montants.


Analyser des transactions 185

Lensemble des comptes dune mme personne ou dune mme socit peut tre fusionn.
Les transactions entre ces comptes ne sont plus visibles, mais les entres et sorties dargent
peuvent tre analyses de manire globale.

Agrgation de lensemble des comptes dune mme personne ou dune mme socit (en vert).


Une autre stratgie dagrgation consiste regrouper des transactions en fonction de leurs
types (retraits cash, payements, etc.). Cette mthode permet notamment de grer
lincompltude des donnes, puisquil nest plus ncessaire de connatre prcisment la source
ou la destination de la transaction, mais uniquement son type (reprsent ci-dessous par la
couleur) :

Sur le schma de gauche, la couleur distingue des types de transaction et les nuds reprsentent des
comptes ( ? lorsque celui est inconnu). Sur les deux schmas de droite, les nuds reprsentent les types
de transaction. Lagrgation par type permet de simplifier le schma et deffectuer des analyses
particulires, telles que lanalyse des entres et sorties des comptes dune socit.


Sur le schma temporel o chaque transaction est reprsent par un lien vertical, le compte li
la transaction peut tre reprsent sous la forme dun attribut du lien. La couleur peut
galement tre exploite pour distinguer des personnes ou des socits (voir lexemple de cas
prsent plus loin).


186 Patterns de visualisation relationnelle

E x e m p l e d e c a s

Des schmas relationnels peuvent tre produits pour reprsenter un mcanisme financier
particulier ou un ensemble de transactions suspectes. Le cas prsent porte sur lanalyse des
comptes dune socit de placement suspecte davoir une activit frauduleuse. En effet, sur
lensemble de la priode dactivit de cette socit, seul un placement financier a t retrouv
dans les comptes. Le schma ci-dessous a t produit pour dcrire ce placement.

Le schma dcrit lensemble des transactions depuis les comptes des clients ayant apport des
avoirs jusqu lachat de titres. Les entits ont t positionnes en fonction des types de
comptes. De tels schmas sont utiles pour faciliter la description des mouvements bancaires.


Analyser des transactions 187

Un schma chronologique a galement t produit pour reprsenter lactivit totale de la


socit. Lobjectif tait de reprsenter les entres et les sorties bancaires. Le schma ci-dessous
a t produit en reprsentant lensemble des transactions pour tous les comptes de la socit :

Comptes
de la socit
entres

sorties

Le rsultat est peu lisible. Des stratgies de simplification ont t appliques pour pouvoir
analyser les donner. Le schma final produit est le suivant :

Les comptes de la socit ont t regroups et reprsents par une seule ligne horizontale (au
centre, car les mouvements internes ne sont pas pertinents pour lobjectif danalyse. De plus,
seules les transactions dun montant suprieur dix milles francs ont t slectionnes. Ce
choix a t effectu par le magistrat instructeur. Une telle slection permet de rduire le
nombre dinformations reprsenter et donc la complexit du schma. Un tel choix doit
toutefois tre justifi en fonction du contexte de laffaire. Finalement lensemble des entres et


188 Patterns de visualisation relationnelle

des sorties ont t regroupes selon leurs types (apports de clients, dactionnaires et cash,
frais divers, retraits cash, retraits au profit des actionnaires, etc.). La couleur a t exploite
pour distinguer les diffrents clients.

Ce schma met en vidence labsence dune activit de placement sur lensemble de la


priode (sauf un placement en dbut dactivit). Il montre comment largent des clients a t
dpens. Finalement, il met en vidence le mcanisme particulier de la fraude. Lorsquun client
mcontent souhaite rcuprer son argent, une somme comparable provenant dun autre client
est crdite.

Des reprsentations peuvent galement tre produites pour mettre en relation des
transactions financires avec dautres informations. Sur le schma ci-dessous, les apports
effectus sur des comptes sont mis en relation avec des vols particuliers.

Informations sur des vols

Apports sur les comptes

Le schma ci-dessous reprsente la relation tablie entre des communications tlphoniques


et des transactions financires :


Analyser des transactions 189

Laffaire porte sur la dtection dapports supposs frauduleux dor auprs dune socit.
Lanalyse des communications tlphoniques de cette socit a permis de dtecter un numro
de tlphone ayant effectu des communications avec la socit de faon rgulire ; deux ou
trois jours avant chaque apports. Cette analyse a permis de remonter la source des dpts.

V e n t e s d e m a r c h a n d i s e s

C o n t e x t e

Des transactions sont galement frquemment analyses lors de lanalyse dun trafic (par
exemple en matire de stupfiants). A la diffrence des analyses effectues sur la base de
donnes de tlphonie ou de transactions financires, lanalyse dun trafic se base
gnralement sur les dclarations de suspects ou de tmoins.

O b j e c t i f s d e l a r e p r s e n t a t i o n

Les schmas de flux relationnels reprsentent un ensemble de ventes entre des personnes, afin
dobtenir une vue densemble du trafic et afin notamment de comparer les versions des
diffrentes sources dinformation.

C o n c e p t s r e p r s e n t e r

R e p r s e n t a t i o n d e s r e l a t i o n s

Une vente est un type particulier dvnement o chaque individu possde un rle particulier :
le vendeur, lacheteur, voire un intermdiaire. Bien quune vente puisse tre ralise entre plus
de deux personnes, la majeure partie dentre elles est effectue entre un acheteur et un
vendeur.


190 Patterns de visualisation relationnelle

Les ventes peuvent alors tre considres comme des transactions entre deux personnes,
cest--dire des relations diriges entre le vendeur est lacheteur :

Les informations sur la nature, la quantit et le prix des objets vendus peuvent tre
reprsentes comme attributs sur les liens :

Pour chaque vente particulire (ou ensemble de ventes


entre deux mmes individus), les dclarations des
diffrentes sources dinformations peuvent tre
compares en ajoutant des attributs pour chaque
source.

La couleur du lien peut tre exploite pour distinguer


des types dobjets vendus par exemple.

Lpaisseur des liens peut tre proportionnelle la


quantit ou au nombre dobjets vendus, voire au
montant de la transaction en fonction de lobjectif
danalyse. Si la quantit est llment principal pour la
qualification pnale (notamment en matire de
stupfiants), il peut tre souhait de la reprsenter
visuellement. Si au contraire le prix est une variable
plus importante (par exemple afin destimer si lacheteur pouvait se douter quil faisait
lacquisition dun bien vol ou dune contrefaon), il pourra tre privilgi.

Reprsenter une vente sous la forme dun lien dirig


prsuppose que la transaction ne concerne que
deux personnes et soit dirige dans un seul sens. Les
changes et les ventes entre plusieurs individus sont
des cas particuliers qui peuvent tre reprsents en
exploitant les liens bidirectionnels et les liens multiples.


Analyser des transactions 191

E x e m p l e d e c a s

Cet exemple (dj prsent dans la section Reprsentation dun trafic de marchandises du
chapitre Evaluations prliminaires ) porte sur lanalyse dun trafic dobjets vols ou
contrefaits. Le schma ci-dessous rsume les informations tires dune cinquantaine de
procs-verbaux effectus au cours de lenqute. Il dcrit lensemble des transactions pour une
marque particulire dobjets. Les personnes impliques dans cette affaire ont effectu un
nombre trs important de ventes et dchanges dobjets de diverses marques. Le deuxime
schma reprsente lensemble du trafic. La couleur des liens a t exploite pour diffrencier
les marques et permettre de lier visuellement les schmas de dtails (tel que celui prsent ci-
dessous) et le schma gnral.

Lpaisseur des traits est Dans cet exemple particulier, les


proportionnelle au objets retrouvs et saisis sont ajouts
nombre dobjets vendus. sur les transactions. Le lieu de saisie
est galement reprsent.

La couleur est exploite comme lien


visuel entre le schma gnral et les
schmas de dtails.

Les dclarations sont rsumes sous la forme


dattributs pour chaque lien, afin de faciliter la
comparaison des versions.


192 Patterns de visualisation relationnelle

Ce dernier exemple de reprsentation de transactions est prsent afin dillustrer un usage


peu efficace des schmas relationnels. Les donnes reprsentes ici sont issues dun fichier
tenu jour par un trafiquant de stupfiants sur lensemble des achats quil a ralis au cours
de plusieurs annes :

Reprsenter un ensemble de transactions lies un seul individu


(ou compte, ou tlphone) par un schma relationnel nest pas
efficace. Lutilisation de tableaux ou de graphiques est par contre
beaucoup plus utile.

Le tableau peut tre tri en fonction du prix, de la quantit de


marchandise ou du nombre de transactions. Les histogrammes
permettent de comparer les diffrents ratios (quantit/prix,
quantit/nombre, etc.).




The methods and technologies that are supposed to support data analysis and reporting
known as business intelligence - have failed so far to deliver on their promise of intelligence.
Despite great technical progress in data acquisition, data integration, data improvement
through cleansing and transformation, and the construction of huge data warehouses that we
can access at incredible speeds, the business intelligence industry has largely ignored the fact
that intelligence resides in human beings, and that information only becomes valuable when it
is understood, not just when its made available. (Few, 2009, p.3)

I m p a c t s u r l a c o n c e p t i o n d o u t i l s

P r o b l m a t i q u e
Avant lavnement du micro-ordinateur, les reprsentations graphiques taient produites la
main. Actuellement elles sont produites, quasiment en totalit, laide de logiciels de
visualisation spcialiss. Ceux-ci imposent parfois leurs propres standards et les possibilits
sont videmment cantonnes aux fonctionnalits offertes. De plus, les logiciels sont trs
souvent dvelopps pour rpondre aux attentes du plus grand nombre. Ils offrent donc des
solutions gnriques, alors que les problmes rsoudre sont souvent spcifiques. Dun ct
lanalyste dispose de donnes propres la situation traite qui sont souvent volumineuses
(telles que des donnes tlphoniques, des procs-verbaux dauditions ou des listings de cas).
De lautre, il exploite des outils qui, malgr un nombre impressionnant de fonctionnalits, ne
le guident que rarement vers des choix de reprsentation adapts aux questions danalyse.

Le processus de conception dune reprsentation se base sur un ensemble de choix et de


traitements qui doivent tre effectus par lanalyste (Xu & Chen, 2005). Pourtant, les lments
mthodologiques et les recommandations prsents dans le premier chapitre sont rarement
intgrs dans les outils. Les moyens techniques sont mis disposition de lutilisateur, mais il
est rarement guid pour effectuer ses choix (Sparrow, 1991). Cette libert est certainement
souhaitable. Elle offre de nombreuses perspectives dexploitation et une large possibilit pour
lutilisateur duser dimagination. Par ailleurs, lorsquune mthodologie de travail est reconnue
comme efficace, il serait certainement profitable que les outils lintgrent - surtout lorsque lon
sait que de mauvais choix peuvent engendrer des biais dinterprtation.

La mthode dcrite dans le premier chapitre et les exemples prsents dans le second
reposent sur les possibilits offertes par les outils. Il a t montr par les exemples que le
langage visuel actuellement disponible est malheureusement encore insuffisant. Par exemple,


194 Impact sur la conception doutils

les notions de groupe, densemble et de relation multiple sont rarement intgres de faon
formelle dans les outils de visualisation relationnelle. Slectionner une structure de graphe
adapte nest pas toujours une tche vidente : il est souvent ncessaire deffectuer plusieurs
essais avant daboutir une solution efficace. De plus, pour un mme problme et un mme
jeu de donnes, plusieurs questions peuvent se poser. Elles peuvent porter sur plusieurs
dimensions danalyse, sur lensemble des donnes, une partie ou un lment spcifique. Afin
de faciliter la conception dun graphe, il devrait techniquement tre possible dintgrer des
donnes indpendamment de leurs structures et par le biais de transformations, reprsenter
les informations selon divers modles de graphe (Senator, 2005). Les outils exploits pour
soutenir le processus danalyse doivent donc permettre de modifier dynamiquement la
reprsentation afin de pouvoir tester diffrentes solutions et changer les points de vue sur les
donnes. Certains auteurs relvent mme que les outils actuellement utiliss sont plus utiles
pour llaboration de comptes-rendus, quen tant quoutils danalyse facilitant les
raisonnements et le dveloppement dhypothses alternatives (Wright et al., 2006).

Les outils de visualisation sont galement largement exploits pour simplifier la


communication de problmes complexes. Simplifier un problme, en cartant des lments de
dtails, nest pas toujours une bonne solution (Tillers, 2007). Les outils de visualisation doivent
permettre de naviguer entre diffrents niveaux dagrgation, afin deffectuer lanalyse des
informations la plus fine possible au niveau de dtails souhait.

La premire partie de ce chapitre dcrit le processus dtaill de conception dun graphe dun
point de vue technique et tel quil devrait tre intgr dans les outils. La seconde section
prsente des exemples de transformations dynamiques qui sont gnralement utiles pour
faciliter lanalyse des donnes par un graphe et modifier les points de vue sur les donnes. La
question de lintgration de lensemble des quatre dimensions dans un outil global est
aborde dans la troisime partie. Finalement un prototype de visualisation multidimensionnel
est prsent. Le prototype dvelopp est une extension dun logiciel de visualisation spatiale
au sein duquel un module temporel a t intgr. Lintgration de reprsentations
relationnelles na pu tre ralise dans le cadre de cette recherche, mais la manire de la
raliser est prsente.


Processus de visualisation 195

P r o c e s s u s d e v i s u a l i s a t i o n
Une adaptation du modle labor par Ed H. Chi (Chi & Riedl, 1998), (Chi, 2000) et (Chi &
Panizzi, 2002) sous le nom de "data state model" puis repris dans (Card et al., 1999) sous le
nom de "information visualization reference model" est propose. La description du processus
prsente ci-dessous intgre des aspects dcrits par (Tang et al., 2004) et (Heer & Agrawala,
2006). Etonnamment, aucun de ces modles ne formalisent le processus global selon une
dcomposition en cinq tapes, telle que dcrite ici.

Modlisation Modlisation
des donnes de la reprsentation

Modle Modle de Reprsentation Visualisation


Donnes de donnes reprsentation statique dynamique

Prtraitement Transformation Transposition Transformation


d'intgration du modle visuelle dynamique

Figure 8 Processus de conception dune visualisation

Ce processus dcrit la relation qui lie les donnes et les vues par une combinaison de
transformations entre diffrents tats. Il permet une dcomposition des problmatiques
rencontres lors de l'laboration d'une reprsentation graphique et met en vidence
l'existence d'oprations (combinaisons de transformations) lies soit la nature des donnes
traites, soit aux caractristiques de la vue (Chi & Riedl, 1998). Afin d'expliciter le modle, la
visualisation des donnes issues des contrles policiers de personnes et de vhicules est prise
comme exemple plus loin. Cette formalisation met en vidence lune des difficults du
processus : les reprsentations graphiques ncessitent une structuration de linformation qui
nest pas toujours en adquation avec le modle de donnes conu lors de lintgration. Cette
problmatique est identifie, dans le domaine de la conception logicielle, sous le nom
dImpedance Mismatch66. Les termes de reprsentation et de visualisation sont parfois utiliss
pour diffrencier les reprsentations statiques des visualisations dynamiques67 (Card et al.,
1999).


66
http://c2.com/cgi/wiki?ImpedanceMismatch (dernier accs le 14 aot 2010)
67
Des techniques de transformations dynamiques sont utilises pour faciliter les interactions avec lutilisateur ;
telles que lutilisation de popups, doutils de slection ou des distorsions de la vue.


196 Impact sur la conception doutils

Contrles de personnes et de

Donnes vhicules accomplis par les


patrouilles de gendarmerie

Modlisation
du domaine

Prtraitement Personnes
d'intgration np - ne
Nom
Prnom
Evnements
Modle de
Date
donnes Lieu
Vhicules

Marque
Modle nv - ne
Transformation
de modle

Nombre de contrles par


personne
Modle de

reprsentation
Identit de la personne: A, B, C, D
Nombre de contrles: 6, 5, 7, 3
Modlisation
de la visualisation

Transposition
visuelle

Reprsentation
Nombre de A B C D
contrles
Personnes



Processus de visualisation 197

La premire tape du processus consiste intgrer les donnes sources brutes dans une ou
plusieurs tables formant le modle des donnes. Cette structure de donnes est dfinie par la
modlisation du domaine pour le problme traiter. Dans le processus danalyse, cette tape
est effectue dans le processus dintgration.

Toutefois ce modle ne permet pas toujours une transposition directe vers la vue. Par
exemple, afin de produire un histogramme du nombre de contrles par personne, une table
contenant les identits des individus et leurs nombres respectifs de
contrles est ncessaire. Un processus de transformation du modle
(constitu d'oprations spcifiques) est ncessaire pour transfrer les
donnes dans le modle de la reprsentation. Ces oprations sont, pour
cet exemple, une slection des attributs d'intrt (nom, prnom, date de
temps
naissance des personnes) et le calcul du nombre de cas par individu. Cette
dcomposition entre le modle de donnes et le modle de la vue, permet
de dcrire les visualisations indpendamment de la nature des donnes.
Par ailleurs, pour un mme modle de donnes, plusieurs modles de vue B

peuvent tre exploits.


A

Le processus de modlisation de la visualisation dfinit la structure de la


reprsentation (son modle). Pour un histogramme il sagit dune table
contenant une valeur numrique associe chaque catgorie d'une
variable. Le modle est fonction de la vue (une carte, un schma
relationnel ou un graphique par exemple) et peu requrir la prsence de
donnes spcifiques (comme des donnes gocodes pour la production
d'une carte).

Finalement, une reprsentation peut tre produite sur la base du modle de la


reprsentation. Il est important de noter que plusieurs vues peuvent partager la mme
structure. En effet, sur la base d'un mme modle (de vue), plusieurs vues peuvent tre
produites:

Exemples de transpositions
6 5 7 3
visuelles
A B C D A B C D A B C D


198 Impact sur la conception doutils

Cette dcomposition du processus de visualisation dfinie dans le domaine informatique a de


fortes implications sur la conception dun logiciel de visualisation. Malheureusement, la
majeure partie des logiciels nintgre pas ou mal la transformation de modles. Des logiciels
spcialiss sont parfois dvelopps pour traiter cet aspect spcifiquement. Les problmatiques
informatiques lies cette tape du processus ne seront pas abordes plus en dtail. Afin
dillustrer le problme, un exemple est prsent. Il a t montr dans le chapitre prcdent
que la visualisation relationnelle de communications tlphoniques peut tre tablie de faon
analogue la visualisation de ventes de stupfiants, par exemple. Ces deux problmatiques
possdent toutefois des modles de donnes diffrents.

Modle
de donnes



Modle
de vue



Vue

Le modle de vue est identique, mais pas les modles des donnes sous-jacents. Une
transformation du modle doit donc tre effectue pour produire la reprsentation. Cette
incompatibilit de modles implique donc deffectuer des traitements sur le donnes. Dans
lidal ce processus devrait tre automatis et intgr dans loutil.




Modification dynamique de la structure du graphe 199

M o d i f i c a t i o n d y n a m i q u e d e l a s t r u c t u r e
d u g r a p h e
Afin de faciliter lexploration des donnes, ils serait trs utile que les outils de visualisation
relationnelle disposent de mcanismes de modification de la structure des graphes.
Actuellement, lorsque lutilisateur souhaite effectuer des modifications, il peut soit les
effectuer manuellement sur le graphe, soit rimporter les donnes pralablement modifies.
Dans ce deuxime cas, si le modle des donnes nest pas adapte pour la nouvelle structure
visuelle souhaite, des transformations manuelles et fastidieuses doivent tre effectues pour
reconstruire une modle de donnes adapt pour la vue.

Lors du traitement des diffrents cas prsents dans cette thse, un certain nombre de
transformations gnriques frquemment utiles ont t identifies. La ncessit de telles
transformations a t confirme lors de discussions avec des praticiens. Labsence de cette
fonctionnalit gnre de nombreuses frustrations et des pertes de temps parfois importantes.
Il est dailleurs intressant de relever que, lors de formations, il est frquent que les utilisateurs
dbutants identifient cette lacune et sinterrogent sur cette absence tant elle leur parat
frappante.

Le tableau ci-dessous dcrit les principales transformations identifies comme utiles pour
explorer visuellement les informations sur un graphe. La liste nest certainement pas
exhaustive. Elle regroupe des types gnriques de transformation et permet dexpliciter la
nature des modifications frquemment effectues. Ces transformations sont videmment
dfinies en regard de la typologie de relations proposes. Elles permettraient notamment de
faciliter la deuxime tape de la mthode qui consiste dfinir quelle est la manire la plus
adapte de reprsenter les relations entre les entits pertinentes. En effet, cette tape nest pas
toujours vidente et elle pourrait tre facilite si loutil permettait deffectuer ces changements
dynamiquement. Il serait alors possible de modifier la reprsentation en cours danalyse et
mettre en avant certaines relations plutt que dautres au fil des questionnements. Par
exemple lors de lanalyse dune srie de cambriolages, extraire le lieu de commission du dlit
sous la forme dune entit lie permet de visualiser rapidement les relations spatiales selon le
principe de connectivit dcrit prcdemment.


200 Impact sur la conception doutils

Transformer une entit en lien


Reprsenter une entit sous la
forme dun cadre

Combiner des liens dirigs en



un lien bidirectionnel


Transformer une clique68 en lien
multiple

Fusionner un groupe dentit et



le reprsenter comme un
ensemble

Fusionner les liens entre deux



entits en un seul lien

Extraire un attribut sous la



attribut forme dune entit lie

Exemples de modifications dynamiques de la structure dun graphe utiles lors de lanalyse des informations

La sparation du modle de donnes et du modle de vue constitue lune des cls du


dveloppement de telles interactions. Les transformations devraient galement tre
bidirectionnelles. En effet, les oprations inverses sont galement utiles. Lors de la
simplification dun schma, transformer une entit lie (comme le lieu de rsidence dune
personne) en attribut permet de rduire le nombre dentits et ainsi accrotre la lisibilit
globale de la reprsentation.


68
Portion dun graphe dont lensemble des sommets sont lis deux deux.


Intgration des dimensions danalyse 201

I n t g r a t i o n d e s d i m e n s i o n s d a n a l y s e
Lanalyse simultane des informations dans les quatre dimensions danalyse constitue lune
des problmatiques majeures de la visualisation de linformation. De nombreuses recherches
ont t menes sur le sujet (notamment en matire danalyse spatio-temporelle) depuis le
dbut des annes deux-mille. A lpoque, il tait constat que peu doutils offraient des
possibilits danalyse dans plusieurs dimensions simultanment (Buetow et al., 2003). Depuis
lors, de nouveaux outils performants ont t dvelopps dans ce sens (voir notamment (Guo
et al., 2006) et (Brunsdon et al., 2007)). Les logiciels actuels, tels que Tableau Software ,
Spotfire et Analysts Notebook 69 intgrent dj plusieurs des dimensions danalyse. La
tendance actuelle est clairement de dvelopper des outils intgrateurs, dcomposant les
problmes selon ces dimensions afin de faciliter lexploration des donnes. La dmarche
propose rejoint cette tendance actuelle.

Un prototype de visualisation multidimensionnelle a t dvelopp dans le cadre de cette


recherche. La technique de reprsentation exploite pour intgrer lensemble des dimensions
dans un systme commun et faciliter ainsi lanalyse dynamique des informations est prsente
dans la section suivante.

P r o t o t y p e d e v i s u a l i s a t i o n
m u l t i d i m e n s i o n n e l l e

Le dveloppement dun outil informatique ntait certainement pas un objectif fondamental


de cette recherche. Plusieurs prototypes ont toutefois t dvelopps pour tenter dintgrer
les dimensions danalyse dans un seul logiciel et pour intgrer des mcanismes de
modification dynamiques des vues. Lun des composants dvelopps a montr son utilit dans
le cadre daffaires relles. Il porte sur la combinaison des dimensions spatiales et temporelles.
En effet, la visualisation spatio-temporelle constitue un sujet de recherche spcifique qui
soulve de nombreuses questions et problmes de reprsentation. Naviguer entre une
reprsentation gographique et des vues temporelles cause des ruptures dans les processus
de raisonnement. En effet, il nest pas rare que lanalyste souhaite investiguer la distribution
temporelle dune srie dvnements pour une rgion dtermine o comparer ces
distributions pour un ensemble de sous-rgions. Diverses stratgies de reprsentation spatiale
et temporelle sont prsentes dans lannexe un, ainsi que des formes classiques de
questionnements et diverses formes de relations temporelles et spatiales. Toutefois la

69
http://www.tableausoftware.com/, http://spotfire.tibco.com/ et http://i2.co.uk/, derniers accs le 22 janvier 2011


202 Impact sur la conception doutils

combinaison de ces deux types de reprsentation ncessite des efforts particuliers et le


dveloppement de nouvelles stratgies de reprsentation.

Soutenir linterprtation des informations spatiotemporelles en visualisant les deux


dimensions sur une mme reprsentation ou en tablissant un lien visuel entre plusieurs vues
est crucial en analyse criminelle. En effet, les crimes sont commis dans un environnement
social et physique qui dfinit des situations spcifiques (Felson & Clarke, 1998). Les contraintes
imposes par le temps (notamment le moment de la journe) et lespace influencent les
activits des criminels. Ces comportements se manifestent selon des patterns spatio-temporels
que lanalyste tente de discerner au sein des donnes collectes (telles quun historique de
cas, des donnes de facturation tlphonique ou un relev GPS). De nombreuses questions
surviennent au cours de lanalyse pour comprendre et reconstruire ces activits. Par exemple,
existe-t-il des rgularits temporelles ou spatiales pour un phnomne criminel particulier?
Quelles sont les relations entre les crimes formant une srie particulire ? Est-il possible de lier
lactivit tlphonique dun suspect avec la commission dinfractions ? Quels taient les
dplacements dun individu pour une priode particulire ? A chaque question pose
correspond un ou plusieurs produit(s) de renseignement spcifique(s). Sur la base des
rgularits dtectes, lanalyste peut alors rechercher des causes possibles, explicatives de la
situation et sur lesquelles des recommandations peuvent tre labores (par exemple, pour la
mise en place de surveillances ou pour dvelopper des stratgies de prvention).

Diverses techniques de reprsentation spatio-temporelle ont t dveloppes. Elles sont


prsentes ci-dessous. Il faut relever que chaque dimension soulve dj de nombreux
problmes spcifiques lis la qualit et la quantit dinformations accessibles : comment
reprsenter limprcision et lincertitude temporelle, comment grer la superposition de
symbole sur une carte, comment choisir des couleurs appropries et les niveaux dagrgation
adapts pour ne pas biaiser la perception ? Combiner plusieurs dimensions amplifie ces
difficults et les visualisations produites sont parfois inexploitables. Lapproche dveloppe
dans le cadre de cette recherche se base sur lutilisation de reprsentation en deux dimensions
(pour des raisons explicites dans lannexe deux). Une approche vidente dintgration de la
dimension temporelle sur une carte, consiste reprsenter le temps par la couleur des
symboles. Une autre approche consiste exploiter des signes particuliers comme des flches
par exemple. Des techniques dinterpolations sont galement exploitables pour reprsenter le
temps par une variation de couleurs. Ces techniques ne fonctionnent cependant pas lorsque
les vnements reprsents se superposent spatialement. En effet, les symboles se
chevauchent et linterprtation est alors difficile voire impossible. Trois approches principales


Intgration des dimensions danalyse 203

ont t dveloppes pour grer la superposition spatiale des points : les animations, les treillis
et lier des vues par le symbole.

A n i m a t i o n s

Certaines tudes ont montr que lutilisation danimations pour reprsenter des donnes
spatio-temporelles semble tre un moyen efficace offrant de nombreuses perspectives
(Brunsdon et al., 2007). En effet, une animation est souvent intuitive et elle peut tre
directement associe au temps. Cependant, les animations se basent sur les capacits de
mmorisation de lutilisateur. Cette contrainte pose problme lorsque celles-ci sont longues.
De plus les animations ncessitent dtre contrles par lutilisateur (notamment au niveau de
la vitesse de dfilement des cas) et des supports de transmission adapts doivent tre
dvelopps. Dans le cadre de lenqute judiciaire, des reprsentations annexes un rapport
crit sont souvent souhaitables. Lusage danimations est donc relativement peu frquent et
moins pratique que lusage de reprsentations statiques.

T r e i l l i s ( c o m a p , s m a l l - m u l t i p l e s )

Un treillis est la juxtaposition de plus cartes en parallle. Chaque carte peut alors reprsenter
la rpartition spatiale pour une priode temporelle dfinie (Keim et al., 2005). Lanalyse spatio-
temporelle est effectue par comparaison des cartes. Tufte (1990) dcrit cette technique sous
le nom de small-multiples . Il relve notamment que lensemble des diagrammes aligns
cte--cte doit pouvoir tre observ en une seule fois, afin de deffectuer des comparaisons
sur lensemble des donnes. Selon lui, cette technique fait partie des meilleures solutions
exploitables pour effectuer des comparaisons entre plusieurs groupes dintrts. Cette
technique nest cependant efficace que pour un nombre limit de cartes et donc pour un
nombre de limit de priodes. Dans le cas contraire, le nombre de comparaisons et le temps
de lecture ncessaires pour interprter les rsultats sont gnralement trop importants.
Certains chercheurs rejettent dailleurs lhypothse que cette technique est efficace, car ils
estiment que le processus de comparaison est difficile voire imprcis (MacEachren, 2004).


204 Impact sur la conception doutils

L i e r d e s v u e s ( f o c u s i n g , l i n k i n g a n d a r r a n g i n g )

Une troisime technique consiste exploiter plusieurs vues spares pour explorer les
donnes en parallle pour chaque dimension. Diverses techniques peuvent tre utilises pour
lier les vues suivant que la reprsentation est dynamique ou non, et que les vues sont
prsentes simultanment ou en squence (Fredrikson et al., 1999). Par exemple, un moyen
courant consiste utiliser des techniques de slections. Lorsque lutilisateur slectionne une
zone particulire sur lune des vues, les donnes sont filtres ou mises en valeur sur les autres
vues (technique dite du Brushing (Keim et al., 2005) (Chen & Czerwinski, 2000)). Une autre
approche consiste exploiter la couleur pour reprsenter un attribut particulier. Les couleurs
ainsi dfinies sont reportes dans chaque vue (cette technique est notamment exploit dans
(Guo et al., 2006)). Lier des vues laide de la couleur est gnralement fait sur la base dun
attribut de la dimension relationnelle (comme le type dvnement, lge dune personne, etc.)

Cette technique est reconnue comme efficace et exploite par de nombreux outils (Brunsdon
et al., 2007). Lhypothse fondamentale de cette technique est quil est plus efficace de
chercher combiner plusieurs vues spcifiques et adaptes pour reprsenter des dimensions
particulires, plutt que de tenter de dvelopper une vue unique optimale (MacEachren, 2004).
Lapproche propose se base sur cette technique de reprsentation combine la mthode
des treillis.


Intgration des dimensions danalyse 205

A p p r o c h e d v e l o p p e

Lapproche imagine pour dvelopper le prototype est issue du travail de master en sciences
forensiques effectu par Bndict Heidl (Heidl, 2007). Loutil dvelopp est disponible en
ligne70.

La mthode de reprsentation dveloppe est base sur lide que lanalyse visuelle est
facilite en intgrant la dimension temporelle sur des vues spcifique plutt que directement
sur une carte. Le lien entre les vues est ralis par un usage spcifique de la couleur. La
distribution gographique est divise en sous-rgions et une couleur est attribue chaque
delles. Pour chaque sous-groupe dobservations (des cas, des positions GPS ou dans le cas
prsent ci-dessus des appels tlphoniques), la couleur est reporte sur les vues temporelles
afin de reprsenter chaque distribution. Dans cet exemple, le diagramme du haut est une ligne
de temps linaire (les donnes sont reprsentes par semaine). Le diagramme de droite
exploite la technique des treillis pour reprsenter les distributions par heure de la journe
pour chaque sous-groupe.


70
http://www.analysecriminelle.org/visualist/, dernier accs le 23 janvier 2011.


206 Impact sur la conception doutils

Afin de faciliter lanalyse, le prototype permet deffectuer diverses modifications


dynamiques (pour plus de dtails, voir les descriptions des dimensions temporelle et spatiale
de lannexe un, ainsi que les formes de reprsentations associes):

1. Les groupes peuvent tre personnaliss par slection des cas sur la carte.
2. Les niveaux dagrgations sont modifiables dynamiquement sur les vues temporelles.
Les donnes peuvent tre reprsentes linairement (par jour, semaine, mois et par
annes) et cycliquement (par heure de la journe, jour de la semaine, jour du mois et
par jour de lanne).
3. Les niveaux dagrgations peuvent tre modifis sur la carte : au niveau des
observations ou par regroupement selon des rgions administratives telles que les
communes, districts, pays, etc. Diffrents type de reprsentation peuvent tre exploits
(tels que dcrit dans lannexe un) : carte points, symboles proportionnels ou
choroplthe.

Le prototype ncessite cependant des dveloppements afin de pouvoir effectuer des


slections dynamiques sur les reprsentations temporelles et crer des groupes en fonction du
temps.

P e r s p e c t i v e

Finalement, la dmarche dveloppe permet galement dintgrer les informations spatiales


sur des reprsentations relationnelles :
Les couleurs correspondant aux zones
gographiques dfinies sur la carte peuvent
notamment tre intgres sur les liens dun
schma relationnel. Par exemple, lors de
lanalyse de donnes de tlphonie les
communications effectues dans chaque
rgion peuvent tre investigues dans la
dimension relationnelle. Le schma permet
ainsi didentifier rapidement les correspondants dun numro en fonction des rgions o celui-
ci tait localis. La dmarche permet ainsi danalyser un jeu de donnes dans les trois
dimensions simultanment et dynamiquement. A noter que lintgration de la dimension
relationnelle na pas encore t implmente.

D I S C U S S I O N G E N E R A L E

R s u l t a t s e m p i r i q u e s
Les valuations prliminaires et les tudes de cas ralises mettent en vidence de relles
difficults de conception des schmas relationnels. Concevoir un schma efficace pour
rpondre une question danalyse requiert des capacits spcifiques en termes de
modlisation. Llaboration dun schma ncessite en effet de savoir isoler les aspects
essentiels du problme et didentifier clairement les entits pertinentes sur lesquelles portent
les questionnements et la recherche de relations. La ralisation dune visualisation ne relve
pas uniquement de lutilisation dun outil informatis, mais constitue essentiellement une
activit de modlisation. Cela confirme la ncessite dtendre la formation au-del de la
matrise des outils informatiss.

Les trois cas prsents pour illustrer les variabilits de reprsentation ont t slectionns
parmi un ensemble dexercices effectus par des tudiants et des praticiens. Plusieurs autres
exercices portant sur diverses thmatiques (telles que lanalyse de trafics de stupfiants, de
srie de cambriolages ou danalyse de spams par exemple) ont galement mis en exergue les
difficults observes. Lchantillon prsent dans cette thse na pas t slectionn pour
amplifier le constat. Au contraire, les exemples portant sur une seule phrase ont t choisis
pour leur simplicit, afin de montrer que la complexit des informations nest pas la seule
cause des variations. Le troisime cas a t choisi en raison du nombre de participants afin de
prsenter les difficults sur un chantillon le plus reprsentatif possible.


208 Discussion generale

Labsence dun consensus global semble notamment tre le rsultat de diffrences de


perception sur les objectifs dexploitation de la visualisation. Mmoriser lensemble des faits,
dtecter des incohrences, chercher de nouvelles pistes denqute, rsumer les lments
essentiels sont autant de perspectives diffrentes pouvant expliquer les variations. Les
difficults observes pour identifier les entits et dfinir leurs relations indiquent galement
que le processus nest pas vident et ncessite un certain entrainement. Labsence dune
mthode clairement formalise est certainement lune des causes de ce constat.

Finalement, limpact des choix de reprsentation sur lutilisabilit des reprsentations a t


discut par une srie dtudes de cas. Les exemples prsents sont des cas particuliers, mais ils
sont issus de cas rels et illustrent des problmes rcurrents. Ils attestent de limportance de la
lisibilit et de lintgrit des reprsentations. Des ambiguts peuvent, en effet, engendrer des
difficults et des erreurs dinterprtation, voire limpossibilit dexploiter la reprsentation de
faon efficace. Bien que largement exploite pour soutenir les raisonnements et faciliter la
communication, la visualisation soulve de relles questions mthodologiques. Labsence
dune formalisation claire du langage (Reed & Kocura, 2005), la masse dinformation
reprsenter (Schroeder et al., 2007) et lidentification des concepts pertinents et de leurs
relations (Stasko et al., 2008) sont autant de causes supposes des difficults. La ralit de ces
difficults reste nanmoins implicite dans ces tudes. Dans ce contexte, les valuations
effectues fournissent une image empirique de ltendue des variations observables et
prsentent, par des exemples rels, limpact de choix inadapts sur lanalyse et la
communication.

M t h o d e s d v a l u a t i o n
Lors de la prsentation du plan de recherche, la question de lvaluation des
recommandations mthodologiques et techniques proposes a t souleve. Un effort
particulier avait dj t effectu pour rcolter des donnes empiriques afin dexpliciter et
valuer la ralit et lampleur de la problmatique. Lutilisation des exercices rendus lors de
formations a t choisie comme stratgie.

Cette dmarche a permis dobtenir plusieurs chantillons sans mettre en place des
exprimentations spcifiques trop difficile mettre en uvre. Les reprsentations ont t
produites sans pression de temps et selon des objectifs pdagogiques. Elles nont donc pas
t produites dans lobjectif spcifique des valuations, mais dans des conditions relles


Apports sur un plan mthodologique 209

dapprentissage. Il faut toutefois relever que les conditions ntaient pas formellement
contrles. En effet, les participants pouvaient librement discuter entre eux et consulter le
travail de leurs voisins. Une grande diversit de reprsentation a nanmoins t observe.

Par ailleurs, lvaluation effectue sur les modifications du type de reprsentation (une carte,
un histogramme et un diagramme circulaire) sest avre trs intressante et utile dun point
de vue qualitatif. En effet, la comparaison des constatations et des analyses effectues par les
tudiants a permis dillustrer limpact de choix de reprsentation sur lanalyse, mais galement
de profiter des commentaires des participants sur les reprsentations elles-mmes. En effet, la
totalit des observations discutes sur les avantages et limites de chaque reprsentation a t
releve par les participants. Une telle dmarche facilite la discussion en profitant des
commentaires de lensemble des participants. Une approche similaire aurait certainement pu
tre mise en place lors de lvaluation de la typologie de relations propose. Cette dernire a
cependant rpondu lobjectif dfini. Elle a confirm limpact sur lefficacit de la structure des
schmas. Les diffrences dexactitude observes ntaient dailleurs a priori pas attendues. Les
reprsentations ayant t conues en respectant lintgrit des donnes sous-jacentes, des
diffrences de temps de rponse taient plutt supposes. La lisibilit dun graphe semble
ainsi avoir un impact important sur lutilisabilit dune reprsentation.

A p p o r t s s u r u n p l a n m t h o d o l o g i q u e

D i m e n s i o n s d a n a l y s e

Afin dexploiter de manire efficace la visualisation, lanalyste doit choisir le type de


reprsentation le plus adapt pour rpondre la question danalyse. Il sagit certainement de
la premire difficult rencontre lors de la conception dune reprsentation. La dcomposition
des questions danalyse selon quatre dimensions principales semble offrir une mthode utile
pour guider ces choix. Lanalyste identifie quels sont les paramtres importants dans chaque
dimension et identifie la dimension dominante qui guide alors la slection dune
reprsentation particulire. La validit de cette dcomposition na pas t formellement
value. Il faut cependant relever quune telle approche est galement exploite dans dautres
domaines que lanalyse criminelle, comme en tmoigne les nombreux ouvrages et articles sur
lanalyse temporelle, spatiale, relationnelle ou quantitative. Lors de formations, il a galement
t constat que dcomposer les problmes ainsi permet, dune part, dexpliciter les causes de


210 Discussion generale

mauvais choix de reprsentation et, dautre part, de prsenter en dtails les choix qui ont
men aux solutions proposes.

P r o c e s s u s d e c o n c e p t i o n d u n s c h m a
r e l a t i o n n e l

La formalisation propose a permis de mettre en vidence dautres sources de difficult.


Choisir un signe (une entit, un lien ou un cadre par exemple) pour reprsenter un concept
nest pas un processus direct. En effet, pour chaque symbole une signification spcifique est
dfinie (telle quune relation dirige pour une flche). Choisir la manire de reprsenter un
concept revient donc identifier quel signifi est le plus adapt. La dfinition dune typologie
de relations est propose afin de dfinir clairement le langage est ainsi faciliter ces choix.
Lvaluation empirique effectue a montre sur des cas prcis que certaines formes de
reprsentation des relations sont plus efficaces et efficientes pour des tches prcises. Ces
choix sont donc importants est doivent tre guids.

Lapproche globale propose pour concevoir un graphe et grer les difficults lies la
complexit des informations reprsenter se fonde sur un usage adapt de structures
graphiques et des proprits visuelles pour amliorer la lisibilit de la visualisation par
diverses stratgies de simplification. Cette approche est certainement novatrice en analyse
criminelle. Elle se distingue des approches proposes dans la littrature. En effet, de nombreux
travaux ont t mens pour amliorer les algorithmes de placement des nuds, sans prendre
en compte la smantique des concepts reprsents et la possibilit dexprimer des relations
par le placement. Lapproche propose repose notamment sur un placement des entits en
regard de leurs types ou afin de distinguer des groupes. Lapproche est certes manuelle, mais
elle permet dobtenir un rsultat visuel efficace. Par ailleurs, lapproche des rseaux sociaux qui
connait un essor particulier pour rsoudre le problme de la surcharge dinformation,
namliore pas la qualit visuelle et lutilisabilit des reprsentations. Elle soutient lanalyse en
facilitant la dtection des entits centrales dun rseau par exemple, mais namliore pas la
reprsentation des fins de communication. Lapproche propose offre quant elle des pistes
pour exploiter de manire efficace la visualisation tant pour lanalyse que la communication en
amliorant la lisibilit du graphe.

Afin de complter la validation la dmarche propose, des exprimentations subsquentes


pourraient tre effectues. Lutilisabilit de la typologie de relations propose repose sur la
capacit de lanalyste identifier les types dentits et de liens investigus. Il nest pas certain
que cette tape soit vidente. Cest pourquoi, le dveloppement dun catalogue de bonnes


Perspectives 211

pratiques est propos. Il faut relever ici que la dmarche gnrale propose a t formalise
sur la base des situations rcurrentes prsentes et des solutions identifies pour les traiter.
Mme si la mthode est probablement applicable dautres situations, il nest absolument pas
certain que les catgories de relations identifies soient exhaustives. Il semble toutefois que le
niveau dabstraction auquel elles ont t dfinies devrait permettre de les exploiter pour la
rsolution de nouveaux problmes, voire dtendre ultrieurement la classification.

P a t t e r n s d e v i s u a l i s a t i o n

Les solutions proposes bien quayant dmontr leur utilit dans le cadre daffaires relles, ne
sauraient tre considres comme les meilleures possible. La dcouverte de nouvelles
mthodes ou lapplication de meilleures stratgies de reprsentation peuvent remettre en
question les solutions proposes et enrichir les rsultats. L'optimisation de la mthode de
reprsentation des informations est donc une question permanente. Dans cette perspective, le
regroupement de solutions graphiques ayant montr une certaine efficacit est ncessaire.
Llaboration dun catalogue de situations rcurrentes a t amorce dans cette optique. Cette
approche fixe un cadre qui ouvre la voie des dveloppements ultrieurs.

P e r s p e c t i v e s

D v e l o p p e m e n t s e n t e r m e s d e r e c h e r c h e

Cette recherche sest essentiellement focalise sur lexploitation de la visualisation pour


lanalyse relationnelle dans le cadre trs oprationnel des enqutes criminelles. La visualisation
a un rle plus large en matire danalyse de la criminalit, dans lensemble des dimensions
dfinies et tant dun point de vue oprationnel que stratgique. Diverses perspectives
complmentaires sont donc envisageables pour mieux comprendre les rles, les difficults et
les apports de la visualisation dans le domaine des sciences criminelles. Dun point de vue des
mthodes, les dimensions danalyse dfinies forment un cadre certainement utile pour
explorer et mieux comprendre les exploitations possibles de la visualisation pour soutenir les
processus danalyse des donnes collectes et de communication des renseignements
produits.


212 Discussion generale

La visualisation sintgre en effet dans de nombreux processus du traitement de linformation.


A titre dexemples :
- La lecture et linterprtation des rsultats fournis par lectrophorse lors de lanalyse
dun profil ADN est facilite par des reprsentations graphiques.
- Le profilage des stupfiants exploite galement des visualisations. Des
chromatogrammes sont utiliss pour vrifier que lanalyse cest bien droule (que les
substances se sont bien spares). La visualisation est galement exploite pour ajuster
le calcul de lintgrale des pics en ajustant manuellement sur la reprsentation la base
des pics.
- Linterprtation de la valeur indiciaire des traces peut tre effectue au moyen de
rseaux baysiens qui exploitent des graphes pour dcrire les relations de causalits
entre des variables.
- La visualisation joue un rle certainement central lors de la prsentation des indices.
Investiguer limpact de lusage de reprsentations sur la prise de dcision fait
galement lobjet de recherche dans le domaine judiciaire.
- Lanalyse globale de phnomne criminel en criminologie profite galement des
possibilits de la visualisation pour mieux apprhender et comprendre lampleur,
lvolution et ltendue spatio-temporelle des problmes.

Dans le cadre de lanalyse criminelle oprationnelle, les patterns dfinis ont t formaliss en
regard dobjectifs danalyse prcis. Ils sont cependant largement influencs et orients en
fonction de la nature des informations reprsentes. Il serait certainement souhaitable
dtendre la dmarche et de formaliser les pratiques en regard des types de raisonnement
exploits. A titre dexemple, lors de lanalyse de donnes de tlphonie, les traces rcoltes
sont issues de lactivit globale de suspects. Les indices en lien avec une activit suspecte
doivent donc tre distingus de lensemble des communications non pertinentes qui forment
un bruit de fond important. Lanalyse des traces seffectue au niveau de lactivit en exploitant
notamment les informations circonstancielles du cas :


Perspectives 213

Certains exemples danalyse prsents exploitent ce genre de raisonnement. La visualisation


est exploite pour dtecter les traces dactivits, directement ou indirectement lies aux
activits criminelles, en se basent sur des informations circonstancielles du cas telles que des
donnes spatio-temporelles ou des relations supposes avec des individus particuliers. Il serait
certainement utile didentifier et de formaliser les formes dexploitation de la visualisation en
fonction des formes de raisonnement effectus lors des analyses.

E c h a n g e d e c o n n a i s s a n c e s

Le catalogue de patterns amorc dans le cadre de cette recherche est fond principalement
sur les cas traits par lauteur au cours des six annes passes collaborer sur des enqutes.
Les situations prsentes ne sont toutefois pas spcifiques un cas particulier, mais dcrites
un niveau dabstraction qui devrait permettre de r-exploiter les solutions sur des cas
analogues. Il faut noter quil a t difficile de rcolter des exemples traits par des collgues
en raison notamment de la sensibilit des informations reprsentes. De nombreuses
discussions avec des collgues analystes et enquteurs ont toutefois permis denrichir le
contenu des solutions proposes. A lexception de certaines propositions lies au
dveloppement du langage visuel, les patterns prsents ne sont certainement pas novateurs
pour des analystes expriments. Ils ont probablement une utilit plus grande pour des
analystes dbutants. La prochaine tape est certainement de mettre disposition ces
propositions afin de stimuler lchange dexpriences et faire voluer les propositions vers des
solutions peut-tre plus efficaces et innovantes et tendre le recueil de bonnes pratiques. Une
plateforme en ligne intgrant des patterns de visualisations est certainement un
dveloppement ncessaire pour stimuler ces changes.

I m p a c t s u r l e n s e i g n e m e n t

Les rsultats obtenus et les recommandations formalises ont une utilit directe en matire
denseignement. Ils ont dailleurs dj t intgrs lors de formations lanalyse criminelle
oprationnelle. Les mthodes de visualisation sont cependant exploites de manire plus
large. En criminologie par exemple, il est intressant de relever que les mthodes dvaluations
statistiques sont trs courantes et largement enseignes. La visualisation en tant que mthode
complmentaire reste quant elle principalement du domaine de lapprentissage personnel.
Alors que les statistiques permettent de tester des hypothses, la visualisation peut jouer un
rle important en amont lors de llaboration dhypothses. Il est dailleurs trs frquent de
trouver des chapitres sur le sujet dans des ouvrages sur la fouille de donnes et lanalyse
quantitative notamment. La reprsentation de linformation fait partie des mthodes facilitant


214 Discussion generale

lexploration des donnes. Connatre les possibilits quelle offre, savoir valuer ses limites et
comprendre comment lexploiter de manire efficace pour analyser des informations sont
autant de motivations qui conduisent dailleurs au dveloppement de programmes
denseignement en la matire. Ils restent cependant pour la plupart intgrs dans des cursus
spcifiques, tels que le dveloppement informatique ou la pdagogie par exemple.

D v e l o p p e m e n t s i n f o r m a t i q u e s

Lexploitation de logiciels de visualisation a visiblement t perue au cours des vingt


dernires annes comme une solution aux problmes de gestion et danalyse des informations
rcoltes au cours des enqutes et pour lanalyse des phnomnes de criminalit. De
nombreuses bases de donnes et divers outils de visualisation se sont multiplis dans les
services de police. Ils ont certainement amlior lefficience des processus de travail, mais ils
ont galement impos des standards de travail et ajouter des contraintes dfinies par leurs
fonctionnalits. Les observations effectues dans cette recherche et les recommandations
dfinies devraient permettre de mieux exploiter ces techniques. Elles prsentent galement
des pistes de dveloppement certainement utiles voire ncessaires. Les outils exploits
devraient notamment tre repenss afin de mieux guider les choix de conception et
pourraient intgrer les lments de mthode dcrits.

Le prototype dvelopp a dailleurs rpondu une lacune existante au niveau de lanalyse


multidimensionnelle des informations. Il a prouv son utilit dans le cadre daffaires
criminelles et est toujours exploit. De tels dveloppements pousse notamment clarifier les
pratiques et formaliser les mthodes.

C O N C L U S I O N

Dans ce travail, nous avons montr que lexploitation des mthodes de visualisation en
analyse criminelle soulve de nombreuses difficults mthodologiques. Le processus
systmatique de lanalyse criminelle se veut global et nintgre pas formellement une tape de
visualisation de linformation, alors que celle-ci forme certainement une partie centrale des
produits de renseignement.

Les schmas relationnels exploits dans les enqutes judiciaires ont t choisis comme sujet
dtude. Des manuels de bonnes pratiques existent, mais les niveaux de gnralit des
recommandations dfinies sur la conception de tels schmas sont variables et elles ne sont
pas prsentes dans un cadre clairement formalis.

Des valuations prliminaires ont t effectues afin de mesurer lampleur des difficults. Elles
fournissent une image empirique de ltendue des variations observables lors de la conception
des schmas et prsentent, par des exemples rels, limpact de choix inadapts sur lanalyse et
la communication. Elles rvlent limportance de consolider les mthodes. La lisibilit des
schmas produits semble notamment avoir un impact important sur leur utilisabilit.

Dans ce contexte, une double approche a t entreprise. Dune part, des rgles et des
recommandations gnrales issues notamment dtudes sur la visualisation ont t
recherches afin de proposer une dmarche de conception des schmas relationnels:

- Une description du processus de lanalyse criminelle en cinq tapes (acquisition,


intgration, reprsentation, analyse et communication) permet de clarifier les rles de
la visualisation dans la mthode : (1) faciliter la mmorisation, (2) soutenir le processus


216 Conclusion

dexploration des informations, (3) soutenir le processus de validation des hypothses,


(4) faciliter la communication du renseignement produit.
- Une dcomposition des questions danalyse est propose afin de faciliter la slection
dune mthode de visualisation adapte. Lapproche retenue dcompose lobjectif
danalyse selon une ou plusieurs dimensions dominantes : temporelle, spatiale,
relationnelle et quantitative.

- Plusieurs mthodes rduisant la complexit des schmas et ainsi augmentant leur


lisibilit sont prsentes.

Dautre part, ltude de cas spcifiques a permis didentifier des situations rcurrentes pour
lesquelles des reprsentations efficaces ont pu tre dfinies. Le terme de pattern est utilis
pour dcrire ces bonnes pratiques. Chaque pattern est compos de quatre parties : le contexte
dexploitation, le ou les objectifs danalyse, les concepts reprsenter et la solution graphique
propose. Lobjectif est damorcer le dveloppement dun catalogue de patterns.

La dmarche effectue a donc permis de dfinir des recommandations gnrales facilitant la


conception des schmas relationnels. Elle a galement permis didentifier des bonnes
pratiques rpondant des problmes spcifiques, dans loptique de dvelopper un catalogue
de patterns facilitant lanalyse de situations rcurrentes de lanalyse criminelle oprationnelle.
Par lchange de connaissances entre praticiens, une telle dmarche pourrait stendre
lensemble des mthodes de la discipline et ainsi amliorer lenseignement notamment.

Cette recherche sest essentiellement focalise sur lexploitation de la visualisation dans le


cadre trs oprationnel des enqutes criminelles. Diverses perspectives complmentaires sont
envisageables pour mieux comprendre les rles, les difficults et les apports de la visualisation
pour analyser les donnes de la criminalit, tant dun point de vue oprationnel que
stratgique. Dun point de vue des mthodes, les dimensions danalyse dfinies forment un
cadre certainement utile pour explorer et mieux comprendre les exploitations possibles de la
visualisation dans le domaine des sciences criminelles.

B I B L I O G R A P H I E
(Zachry & Thralls, 2004)

ADDERLEY, R. W. & MUSGROVE, P. (2001). Police crime recording and investigation systems -
A user's view. Policing 24, no. 1: 100-114.

AEPLI, P., RIBAUX, O. & SUMMERFIED, E. (2011). Decising making in policing. Lausanne,
Switzerland: EPFL Press.

AGIS. (2004). Le guide mthodologique et des bonnes pratiques de lanalyse financire


criminelle. Commission europenne (direction gnrale justice et affaire intrieures).

AIGNER, W., BERTONE, A., MIKSCH, S., TOMINSKI, C. & SCHUMANN, H. (2007). Towards a
conceptual framework for visual analytics of time and time-oriented data. Dans
Proceedings of the 2007 Winter Simulation Conference, d. S. G. Henderson, B. Biller,
M.-H. Hsieh, J. Shortle, J. D. Tew, & R. R. Barton, 721-729. WSC '07. Piscataway, NJ:
IEEE Press.

ALEXANDER, C. (1979). The timeless way of building. New York, NY: Oxford University
Press.

AMAR, R., EAGAN, J. & STASKO, J. (2005). Low-level components of analytic activity in
information visualization. Dans Proceedings of the 2005 IEEE Symposium on
Information Visualization, 111117. INFOVIS '05. Minneapolis, MN: IEEE Computer
Society.

AMAR, R. & STASKO, J. (2005). A knowledge task-based framework for design and evaluation
of information visualizations. Dans Proceedings of the 2004 IEEE Symposium on
Information Visualization, 143150. INFOVIS '04. Austin, TX: IEEE Computer
Society.

ANDERSON, T. J. (2007). Visualization tools and argument schemes: a question of standpoint.


Law, Probability and Risk 6, no. 1-4: 97-107.


218 Bibliographie

ANDRESEN, M. A., WUSCHKE, K., KINNEY, J. B., BRANTINGHAM, P. J. & BRANTINGHAM, P. L.


(2009). Cartograms, crime, and location quotients. Crime Patterns and Analysis 2, no.
1: 31-46.

ANDRIENKO, N. & ANDRIENKO, G. (2005). Exploratory analysis of spatial and temporal data: a
systematic approach. 1er d. Berlin Heidelberg: Springer.

ANSELIN, L., COHEN, J., COOK, D., GORR, W. & TITA, G. (2000). Spatial analyses of crime.
Criminal Justice 4: 213262.

ANSELIN, L. & GETIS, A. (1992). Spatial statistical analysis and geographic information
systems. The Annals of Regional Science 26, no. 1: 19-33.

ATKIN, H. (1998). Keep it simple: a practitioners approach to applying the


intelligence process, from formulating premises to recommendations. IALEIA Journal
11, no. 2: 1-11.

ATKIN, H. (2000). Criminal intelligence analysis: a scientific perspective. IALEIA Journal 13,
no. 1: 1-15.

ATZENBECK, C., HICKS, D. L. & MEMON, N. (2009a). Supporting emergent knowledge and team
communication in police investigations. Dans Proceedings of the 2009 IEEE
international conference on Intelligence and Security Informatics, 95-100. ISI '09.
Richardson, TX: IEEE Press.

ATZENBECK, C., OZGULYZ, F. & HICKS, D. L. (2009b). Linking and organising information in
law enforcement investigations. Dans Proceedings of the 2009 13th International
Conference Information Visualisation, 443-449. IV '09. Barcelona, Spain: IEEE
Computer Society.

BARCLAY, D. (2009). Using forensic science in major crime inquiries. Dans Handbook of
forensic science, d. J. Frazer & R. Williams, 337358. Cullompton, Willan.

BARTHLEMY, M., CHOW, E. & ELIASSI-RAD, T. (2005). Knowledge representation issues in


semantic graphs for relationship detection. Dans Proceedings of the AAAI Spring
Symposium on AI Technologies for Homeland Security, 91-98. Stanford, CA: AAAI
Press.

BERTIN, J. (2005). Smiologie graphique: les diagrammes - les rseaux - les cartes. 4 d. Paris:
Les r-impressions des Editions de l'Ecole des Hautes Etudes en Sciences Sociales.

BESSON, J.-L. (2004). Les cartes du crime. 1er d. Paris: Presses Universitaires de France.

BEX, F., VAN DEN BRAAK, S. W., VAN OOSTENDORP, H., PRAKKEN, H., VERHEIJ, B. &
VREESWIJK, G. (2007). Sense-making software for crime investigation: how to combine
stories and arguments? Law, Probability and Risk 6, no. 1-4: 145168.

BEX, F., PRAKKEN, H., REED, C. & WALTON, D. (2003). Towards a formal account of reasoning
about evidence: argumentation schemes and generalisations. Artificial Intelligence and
Law 11, no. 2: 125165.


219

BOBA, R. (2009). Crime analysis and crime mapping. 2 d. Thousand Oaks, CA: Sage
Publications, Inc.

VAN DEN BRAAK, S. W. (2010). Sensemaking software for crime analysis. Utrecht, Netherlands:
PhD thesis, Utrecht University.

VAN DEN BRAAK, S. W., VAN OOSTENDORP, H., PRAKKEN, H. & VREESWIJK, G. (2006). A
critical review of argument visualization tools: do users become better reasoners. Dans
Workshop Notes of the ECAI-06 Workshop on Computational Models of Natural
Argument, d. F. Grasso, R. Kibble, & C. Reed, 67-75. CMNA '06. Riva del Garda,
Italy.

BRANTINGHAM, P. L. & BRANTINGHAM, P. J. (1993). Environment, routine and situation:


toward a pattern theory of crime. Dans Routine activity and rational choice: advances
in criminological theory, d. R. Clarke & M. Felson, 5:25994. New Brunswick, NJ:
Transaction Publishers.

BRESCIANI, S. & EPPLER, M. (2008). The risks of visualization. A classification of


disadvantages associated with graphic representations of information. ICA Working
Paper 1/2008. Lugano, Switzerland: University of Lugano.

BRODEUR, J.-P. (2005a). Le renseignement: distinctions prliminaires. Revue canadienne de


criminologie et de justice pnale 47, no. 1: 15-43.

BRODEUR, J.-P. (2005b). Lenqute criminelle. Criminologie 38, no. 2: 39-64.

BRUCE, C. (2009). Fundamentals of crime analysis. Dans Exploring crime analysis: readings
on essential skills, d. S. Gwinn, C. Bruce, J. P. Cooper, & S. Hick. 2 d. Overland
Park, KS: BookSurge Publishing.

BRUNSDON, C., CORCORAN, J. & HIGGS, G. (2007). Visualising space and time in crime
patterns: a comparison of methods. Computers, Environment and Urban Systems 31,
no. 1: 52-75.

BUETOW, T., CHABOYA, L., OTOOLE, C., CUSHNA, T., DASPIT, D., PETERSEN, T., ATABAKHSH,
H. & CHEN, H. (2003). A spatio temporal visualizer for law enforcement. Dans
Proceedings of the 1st NSF/NIJ conference on Intelligence and Security Informatics,
181-194. ISI'03. Tucson, AZ: Springer.

CANTER, P. (2000). Using a geographic information system for tactical crime analysis. Dans
Analyzing crime patterns: frontiers of practice, d. V. Goldsmith, P. G. McGuire, J. H.
Mollenkopf, & T. A. Ross. Thousand Oaks, CA: Sage Publications, Inc.

CARD, S. K. & MACKINLAY, J. (1997). The structure of the information visualization design
space. Dans Proceedings of the 1997 IEEE Symposium on Information Visualization,
92-99. INFOVIS '97. Phoenix, AZ.

CARD, S. K., MACKINLAY, J. & SHNEIDERMAN, B. (1999). Readings in Information


Visualization: Using Vision to Think. San Francisco, CA: Morgan Kaufmann.


220 Bibliographie

CARILLO, C. (2010). Police judiciaire et renseignement. Cahiers de la Scurit 13: 39-50.

CARLIS, J. V. & KONSTAN, J. A. (1998). Interactive visualization of serial periodic data. Dans
Proceedings of the 11th annual ACM symposium on User Interface Software and
Technology, 29-38. UIST '98. San Francisco, CA: ACM Press.

CARPENDALE, S. (2008). Evaluating information visualizations. Dans Information


visualization: human-centered issues and perspectives, d. A. Kerren, J. T. Stasko, J.-D.
Fekete, & C. North. Berlin Heidelberg: Springer.

CHAINEY, S. & RATCLIFFE, J. (2005). GIS and crime mapping. London, England: John Wiley
and Sons.

CHANG, D., DOOLEY, L. & TUOVINEN, J. E. (2002). Gestalt theory in visual screen design: a
new look at an old subject. Dans Proceedings of the Seventh World Conference on
Computers in Education: Australian topics, 8:512. CRPIT '02. Darlinghurst, Australia:
Australian Computer Society, Inc.

CHEN, C. (2006). Information Visualization: Beyond the Horizon. 2 d. London: Springer.

CHEN, C. & CZERWINSKI, M. (2000). Empirical evaluation of information visualization: an


introduction. International Journal of Human-Computer Studies 53, no. 5: 631-635.

CHEN, C., HRDLE, W. & UNWIN, A. (2008). Handbook of data visualization. 1er d. Berlin
Heidelberg: Springer.

CHEN, C. & YU, Y. (2000). Empirical studies of information visualization: a meta-analysis.


International Journal of Human-Computer Studies 53, no. 5: 851-866.

CHEN, H., ATABAKHSH, H., TSENG, C., MARSHALL, B., KAZA, S., EGGERS, S., GOWDA, H.,
SHAH, A., PETERSEN, T. & VIOLETTE, C. (2005). Visualization in law enforcement. Dans
Extended abstracts on Human factors in computing systems, 12681271. CHI '05. New
York, NY: ACM Press.

CHEN, H., ZENG, D., ATABAKHSH, H., WYZGA, W. & SCHROEDER, J. (2003). COPLINK:
managing law enforcement data and knowledge. Communications of the ACM 46, no. 1:
28-34.

CHEN, P. P.-S. (1976). The entity-relationship model: toward a unified view of data. ACM
Transactions on Database Systems 1: 9-36.

CHI, ED H & PANIZZI, E. (2002). Expressiveness of the data flow and data state models in
visualization systems. Dans Proceedings of the Working Conference on Advanced
Visual Interfaces, d. M. De Marsico & S. Levialdi, 375-378. AVI '02. Trento, Italy:
ACM Press.

CHI, ED H. (2000). A taxonomy of visualization techniques using the data state reference
model. Dans Proceedings of the 2000 IEEE Symposium on Information Vizualization,
69-75. INFOVIS '00. Salt Lake City, UT: IEEE Computer Society.


221

CHI, ED H. & RIEDL, J. (1998). An operator interaction framework for visualization systems.
Dans Proceedings of the 1998 IEEE Symposium on Information Visualization, 6370.
INFOVIS '98. Research Triangle Park, NC: IEEE Computer Society.

CHUNG, W., CHEN, H., CHABOYA, L. G., O'TOOLE, C. D. & ATABAKHSH, H. (2005). Evaluating
event visualization: a usability study of COPLINK spatio-temporal visualizer.
International Journal of Human-Computer Studies 62, no. 1: 127-157.

CLARKE, R. V. (2004). Technology, criminology and crime science. European Journal on


Criminal Policy and Research 10, no. 1: 55-63.

CLEVELAND, W. S. & TERPENNING, I. J. (1982). Graphical methods for seasonal adjustment.


Journal of the American Statistical Association 77: 52-62.

COCKBURN, A. & MCKENZIE, B. (2001). 3D or not 3D?: evaluating the effect of the third
dimension in a document management system. Dans Proceedings of the SIGCHI
conference on Human factors in computing systems, 434-441. CHI '01. Seattle, WA:
ACM press.

COCKBURN, A. & MCKENZIE, B. (2004). Evaluating spatial memory in two and three
dimensions. International Journal of Human-Computer Studies 61, no. 3: 359-373.

COCKBURN, A. & MCKENZIE, B. (2000). An evaluation of cone trees. Dans People and
Computers XIV: British Computer Society Conference on Human Computer
Interaction, 425-436. HCI '00. University of Sunderland, UK: Springer.

COPE, N. (2003). Crime analysis: principles and practice. Dans Handbook of policing, d. T.
Newburn, 340-362. 1er d. Cullompton, Devon: Willan Publishing.

CROSBY, A. W. (1997). The measure of reality: quantification and western society, 1250-1600.
New York: Cambridge University Press.

CUSSON, M. (2008). De l'action de scurit. Dans Trait de scurit intrieure, d. M. Cusson,


B. Dupont, & F. Lemieux, 43-57. Lausanne, Switzerland: Presses polytechniques et
universitaires romandes.

ECK, J. (2003). Police problems: the complexity of problem theory, research and evaluation.
Crime Prevention Studies 15: 79114.

EPPLER, M. J. & AESCHIMANN, M. (2009). A systematic framework for risk visualization in risk
management and communication. Risk Management 11, no. 2: 67-89.

FEDPOL. (2010). Manuel d'analyse criminelle oprationnelle. Office fdral de la police


(Groupe de travail suisse analyse criminelle oprationnelle).

FEIGENSON, N. & SHERWIN, R. K. (2007). Thinking beyond the shown: implicit inferences in
evidence and argument. Law, Probability & Risk 6, no. 1-4: 295-310.


222 Bibliographie

FELSON, M. & CLARKE, R. V. (1998). Opportunity makes the thief: practical theory for crime
prevention. Police Research Series. London: Home Office: Policing and Reducing
Crime Unit (Research, Development and Statistics Directorate).

FEW, S. (2009). Now you see it: simple visualization techniques for quantitative analysis. 1er
d. Oakland, CA: Analytics Press.

FREDRIKSON, A., NORTH, C., PLAISANT, C. & SHNEIDERMAN, B. (1999). Temporal, geographical
and categorical aggregations viewed through coordinated displays: a case study with
highway incident data. Dans Proceedings of the 1999 workshop on new paradigms in
information visualization and manipulation, 26-34. NPIV '99. Kansas City, MI: ACM
press.

FRIENDLY, M. (2008). A brief history of data visualization. Dans Handbook of computational


statistics: data visualization, d. C. Chen, W. K. Hrdle, & A. Unwin, 15-56. Berlin
Heidelberg: Springer.

GAMMA, E., HELM, R., JOHNSON, R. & VLISSIDES, J. (1995). Design patterns: elements of
reusable object-oriented software. Boston, MA: Addison-Wesley Longman Publishing
Co., Inc.

GHONIEM, M., FEKETE, J.-D. & CASTAGLIOLA, P. (2005). A comparison of the readability of
graphs using node-link and matrix-based representations. Dans Proceedings of the 2004
IEEE Symposium on Information Visualization, 1724. INFOVIS '04. Austin, TX:
IEEE Computer Society.

GIROD, A., CHAMPOD, C. & RIBAUX, O. (2008). Traces de souliers. Lausanne, Switzerland:
Presses polytechniques et universitaires romandes.

GIWG. (2004). National criminal intelligence sharing plan. 1er d. Washington, DC:
Department of Justice (Global Intelligence Working Group).

GOODWIN, J. & FISHER, A. (2000). Wigmore's chart method. Informal Logic 20, no. 3: 223-243.

GOTTLIEB, S., ARENBERG, S. & SINGH, R. (1994). Crime analysis: from first report to final
arrest. Montclair, CA: Alpha Publishing.

GUENIAT, O. & ESSEIVA, P. (2005). Le profilage de l'hrone et de la cocane: une


mthodologie moderne de lutte contre le trafic illicite. Lausanne, Switzerland: Presses
polytechniques et universitaires romandes.

GUERRY, A.-M. (1833). Essai sur la statistique morale de la France. Paris, France: Crochard.

GUO, D., CHEN, J., MACEACHREN, A. M. & LIAO, K. (2006). A visualization system for space-
time and multivariate patterns (VIS-STAMP). IEEE Transactions on Visualization and
Computer Graphics 12, no. 6: 1461-1474.

HARPER, W. R. & HARRIS, D. H. (1975). The application of link analysis to police intelligence.
Human Factors 17, no. 2: 157-164.


223

HARRIS, R. L. (2000). Information graphics: a comprehensive illustrated reference. 1er d.


New York, NY: Oxford University Press.

HEER, J. & AGRAWALA, M. (2006). Software design patterns for information visualization.
IEEE Transactions on Visualization and Computer Graphics 12, no. 5: 853860.

HEIDL, B. (2007). La visualisation de donnes temporelles et laboration de nouvelles


reprsentations spatio-temporelles de donnes tlphoniques. Universit de Lausanne,
Switzerland: travail de master Institut de Police Scientifique.

HELMS, D. (2009). Temporal analysis. Dans Exploring crime analysis: readings on essential
skills, d. S. Gwinn, C. Bruce, J. P. Cooper, & S. Hick, 214-257. 2 d. Overland Park,
KS: BookSurge Publishing.

HEUER, R. J. (1999). Psychology of intelligence analysis. 1er d. Washington, DC: Central


Intelligence Agency (Center for the Study of Intelligence).

HEUER, R. J. & PHERSON, R. H. (2010). Structured analytic techniques for intelligence analysis.
Washington, DC: CQ Press.

HICKS, M., O'MALLEY, C., NICHOLS, S. & ANDERSON, B. (2003). Comparison of 2D and 3D
representations for visualising telecommunication usage. Behaviour and Information
Technology 22, no. 3: 185-201.

HUANG, W., EADES, P. & HONG, S.-H. (2008). Beyond time and error: a cognitive approach to
the evaluation of graph drawings. Dans Proceedings of the 2008 conference on BEyond
time and errors: novel evaLuation methods for Information Visualization, 1-8. BELIV
'08. Florence, Italy: ACM press.

HUBONA, G. S., SHIRAH, G. W. & FOUT, D. G. (1997). 3D object recognition with motion. Dans
extended abstracts on Human factors in computing systems: looking to the future, 345-
346. CHI '97. Atlanta, GA: ACM press.

IALEIA. (2004). Law enforcement analytical standards. Richmond, VA: U.S. Department of
Justice (Bureau of Justice Assistance).

INMAN, K. & RUDIN, N. (2001). Principles and practices of criminalistics: the profession of
forensic science. Boca Raton: CRC Press.

INNES, M., FIELDING, N. & COPE, N. (2005). The appliance of science? The theory and practice
of crime intelligence analysis. British Journal of Criminology 45: 39-57.

INSELBERG, A. (1985). The plane with parallel coordinates. The Visual Computer 1, no. 2: 69-
91.

INSELBERG, A. (1997). Multidimensional detective. Dans Proceedings of the 1997 IEEE


Symposium on Information Visualization, 100-107. INFOVIS '97. Phoenix, AZ: IEEE
Computer Society.


224 Bibliographie

INTERPOL. (1997). Guide sur l'analyse criminelle. 2 d. Lyon: Interpol (Groupe de travail sur
l'analyse criminelle).

IRANI, P. & WARE, C. (2003). Diagramming information structures using 3D perceptual


primitives. ACM Transactions on Computer-Humain Interaction 10, no. 1: 1-19.

JOHNSON, S. D. (2010). A brief history of the analysis of crime concentration. European


Journal of Applied Mathematics 21, no. 4-5: 349-370.

JOSEPH, G. P. (2006). Modern visual evidence. New York, NY: Law Journal Press.

KEIM, D. & WARD, M. (2007). Visualization. Dans Intelligent data analysis, d. M. Berthold &
D. J. Hand, 403-427. 2 d. Berlin Heidelberg: Springer.

KEIM, D. A., PANSE, C. & SIPS, M. (2005). Information visualization: scope, techniques and
opportunities for geovisualization. Dans Exploring Geovisualization, d. Dykes, A. M.
MacEachren, & M.-J. Kraak, 23-52. Amsterdam: Elsevier.

KELLEY, J. E. JR & WALKER, M. R. (1959). Critical-path planning and scheduling. Dans Papers
presented at the December 1-3, 1959, eastern joint IRE-AIEE-ACM computer
conference, 160173. IRE-AIEE-ACM '59. New York, NY: ACM press.

KELLY, R. J. (1990). The development of inferences in the assessment of intelligence data.


Dans Criminal intelligence analysis, d. P. Andrews & M. B. Peterson, 149-180.
Loomis, CA: Palmer Press.

KIND, S. S. (1987). The scientific investigation of crime. Harrogate: Forensic Science Services
Ltd.

KIND, S. S. (1990). What makes a good forensic scientist? Journal of the Forensic Science
Society 30, no. 4: 247-256.

KIND, S. S. (1992). Mental images in crime investigation. The Criminologist 16, no. 1: 15-24.

KIND, S. S. (1994). Crime investigation and the criminal trial: a three chapter paradigm of
evidence. Journal of the Forensic Science Society 34, no. 3: 155-164.

KLERKS, P. & SMEETS, E. (2001). The network paradigm applied to criminal organizations:
theoretical nitpicking or a relevant doctrine for investigators? Recent developments in
the Netherlands. Connections 24, no. 3: 53-65.

KOLDA, T., BROWN, D., CORONES, J., CRITCHLOW, T., ELIASSI-RAD, T., GETOOR, L.,
HENDRICKSON, B. ET AL. (2004). Data sciences technology for homeland security
information management and knowledge discovery. Lawrence Livermore Nat'l
Laboratory: Report of the DHS Workshop on Data Sciences.

LAXMAN, S. & SASTRY, P. S. (2006). A survey of temporal data mining. Sadhana 31, no. 2:
173198.


225

LEE, B., PLAISANT, C., PARR, C. S, FEKETE, J. D & HENRY, N. (2006). Task taxonomy for graph
visualization. Dans Proceedings of the 2006 AVI workshop on beyond time and errors:
novel evaluation methods for information visualization, 15. BELIV '06. New York,
NY: ACM press.

LENGLER, R. & EPPLER, M. J. (2007). Towards a periodic table of visualization methods for
management. Dans Proceedings of the Conference on Graphics and Visualization in
Engineering, 1-6. GVE '07. Clearwater, FL: ACTA press.

LOHSE, G. L., BIOLSI, K., WALKER, N. & RUETER, H. H. (1994). A classification of visual
representations. Communications of the ACM 37, no. 12: 36-49.

MACEACHREN, A. M. (1992). Visualizing uncertain information. Cartographic Perspective 13,


no. 3: 1019.

MACEACHREN, A. M. (2004). How maps work: representation, visualization, and design. New
York, NY: The Guilford Press.

MACKINLAY, J. (1986). Automating the design of graphical presentations of relational


information. Dans Readings in intelligent user interfaces, d. M. T. Maybury & W.
Wahlster, 5:177-193. San Francisco, CA: Morgan Kaufmann Publishers Inc.

MALLER, V. A. J. (1996). Criminal investigation systems: the growing dependence on advanced


computer systems. Computing and Control Engineering Journal 7, no. 2: 93-100.

MARSHALL, B., CHEN, H. & KAZA, S. (2008). Using importance flooding to identify interesting
networks of criminal activity. Journal of the American Society for Information Science
and Technology 59, no. 13: 20992114.

MCGRATH, C., BLYTHE, J. & KRACKHARDT, D. (1997). The effect of spatial arrangement on
judgments and errors in interpreting graphs. Social Networks 19, no. 3: 223-242.

MENA, J. (2003). Investigative data mining for security and criminal detection. Burlington,
MA: Butterworth-Heinemann.

MENNIS, J. L., PEUQUET, D. J. & QIAN, L. (2000). A conceptual framework for incorporating
cognitive principles into geographical database representation. International Journal of
Geographical Information Science 14, no. 6: 501520.

MILES, M. B. & HUBERMAN, A. M. (1994). Qualitative data analysis: an expanded sourcebook.


2 d. Thousand Oaks, CA: Sage Publications, Inc.

MORRIS, JACK. (1986). The Crime Analysis Charting. Loomis, CA: Palmer Press.

MOWBRAY, C. (2009). Analytical charting. Dans Exploring crime analysis: readings on


essential skills, d. S. Gwinn, C. Bruce, J. P. Cooper, & S. Hick. 2 d. Overland Park,
KS: BookSurge Publishing.


226 Bibliographie

MLLER, W. & SCHUMANN, H. (2003). Visualization for modeling and simulation: visualization
methods for time-dependent data - an overview. Dans Proceedings of the 35th
conference on Winter simulation: driving innovation, 1:737-745. WSC '03. New
Orleans, LA.

MULLET, K. (1995). 3D or not 3D: "more is better" or "less is more"? (panel session). Dans
Conference companion on Human factors in computing systems, 174-175. Denver, CO:
ACM press.

NCIS. (2000). The National Intelligence Model. National Crime Intelligence Service.

NCPE. (2005). Guidance on the national intelligence model. Wyboston, England: Association
of Chief Police Officers (National Centre for Policing Excellence).

NEWMAN, M. E. J. (2003). The structure and function of complex networks. SIAM Review 45,
no. 2: 167-256.

NORMAN, D. A. (1993). Things that make us smart: defending human attributes in the age of
the machine. New York, NY: Basic Books.

NORTH, C. (2006). Toward measuring visualization insight. IEEE Computer Graphics and
Applications 26, no. 3: 69.

OATLEY, G., EWART, B. & ZELEZNIKOW, J. (2006). Decision support systems for police:
Lessons from the application of data mining techniques to soft forensic evidence.
Artificial Intelligence and Law 14, no. 1-2: 35-1000.

OATLEY, G., ZELEZNIKOW, J., LEARY, R. & EWART, B. (2005). From links to meaning: a
burglary data case study. Dans International Conference on Knowledge-Based
Intelligent Information and Engineering Systems, 813822. Melbourne, Australia:
Springer.

OCAGNE, M. D'. (1885). Coordonnes parallles et axiales. Mthode de transformation


gomtrique et procd nouveau de calcul graphique dduits de la considration des
coordonnes paralllles. Paris, France: Gauthier-Villars.

PAAS, F., TUOVINEN, J. E., TABBERS, H. & VAN GERVEN, P. (2003). Cognitive load
measurement as a means to advance cognitive load theory. Educational psychologist
38, no. 1: 6371.

PALMER, S. & ROCK, I. (1994). Rethinking perceptual organization: the role of uniform
connectedness. Psychonomic Bulletin & Review 1, no. 1: 2955.

PARKER, G., FRANCK, G. & WARE, C. (1998). Visualization of large nested graphs in 3D:
navigation and interaction. Journal of Visual Languages and Computing 9, no. 3: 299-
317.

PATTYN, M & DICKENS, C. (2001). Formation analyse stratgique. Police fdrale belge
(CGC/AS).


227

PAULSEN, D. J., BAIR, S. & HELMS, D. (2010). Tactical crime analysis: research and
investigation. Boca Raton, FL: CRC Press.

PCSCO. (2002). Crime organis - Etude des meilleures pratiques no. 4. Conseil de l'Europe,
Direction Gnrale I (Groupe de Spcialistes sur les aspects de droit pnal et les aspects
criminologiques du crime organis).

PELEKIS, N., THEODOULIDIS, B., KOPANAKIS, I. & THEODORIDIS, Y. (2004). Literature review of
spatio-temporal database models. The Knowledge Engineering Review 19, no. 3: 235-
274.

PETERSON, M. B. (1990). Telephone record analysis. Dans Criminal intelligence analysis, d. P.


Andrews & M. B. Peterson, 85-116. Loomis, CA: Palmer Press.

PETERSON, M. B. (1998). Applications in criminal analysis: a sourcebook. Westport, CT:


Praeger.

PETERSON, M. B., MOREHOUSE, B. & WRIGHT, E. (2000). Intelligence 2000: revising the basic
elements. Lawrenceville, NJ: Law Enforcement Intelligence Unit and International
Association of Law Enforcement Intelligence Analysts.

PEUQUET, D. J. (1984). A conceptual framework and comparison of spatial data models.


Cartographica: the International Journal for Geographic Information and
Geovisualization 21, no. 4: 66-113.

PEUQUET, D. J. (1994). It's about time: a conceptual framework for the representation of
temporal dynamics in geographic information systems. Annals of the Association of
American Geographers 84, no. 3: 441461.

PFITZNER, D., HOBBS, V. & POWERS, D. (2003). A unified taxonomic framework for
information visualization. Dans Proceedings of the Asia-Pacific symposium on
Information visualisation - Volume 24, 24:5766. APVis '03. Darlinghurst, Australia:
Australian Computer Society, Inc.

PHAN, D., XIAO, L., YEH, R., HANRAHAN, P. & WINOGRAD, T. (2005). Flow map layout. Dans
Proceedings of the 2005 IEEE Symposium on Information Visualization, 219224.
INFOVIS '95. Minneapolis, MN: IEEE Computer Society.

PIROLLI, P. & CARD, S. (2005). The sensemaking process and leverage points for analyst
technology as identified through cognitive task analysis. Dans Proceedings of
International Conference on Intelligence Analysis. McLean, VA.

PLAISANT, C. (2004). The challenge of information visualization evaluation. Dans Proceedings


of the Working Conference on Advanced Visual Interfaces, 109116. AVI '04. New
York, NY: ACM press.

PLAYFAIR, W. (2005). Commercial and political atlas and statistical breviary. d. H. Wainer
& I. Spence. New York, NY: Cambridge University Press.


228 Bibliographie

POTTENGER, W. M., YANG, X. & ZANIAS, S. V. (2007). Link analysis survey status update -
january 2006. U.S. Department of Justice (National Criminal Justice Reference
Service).

PURCHASE, H. C. (2000). Effective information visualisation: a study of graph drawing


aesthetics and algorithms. Interacting with Computers 13, no. 2: 147162.

QUETELET, A. (1842). A treatise on man and the development of his faculties. Edinburgh,
England : W. and R. Chambers.

RATCLIFFE, J. H. (2000). Aoristic analysis: the spatial interpretation of unspecific temporal


events. International Journal of Geographical Information Science 14, no. 7: 669-679.

RATCLIFFE, J. H. (2008). Intelligence-led policing. Cullompton, Devon: Willan Publishing.

REED, C. & ROWE, G. (2007). A pluralist approach to argument diagramming. Law, Probability
and Risk 6, no. 1-4: 5985.

REED, R. N. & KOCURA, P. (2005). Conceptual graph based criminal intelligence analysis. Dans
Common semantics for sharing knowledge: contributions to ICCS 2005 13th
International Conference on Conceptual Structures, d. F. Dau & M.-L. Mugnier, 146-
159. ICCS 2005. Kassel, Germany: Kassel university press.

REGALI, J. E. (1999). Visual investigative analysis: an underutilized case management tool.


IALEIA Journal 12, no. 1: 48-52.

RIBAUX, O. (1997). La recherche et la gestion des liens dans l'investigation criminelle: le cas
particulier du cambriolage. Thse de doctorat, Universit de Lausanne, Switzerland.

RIBAUX, O. (2008). Chapitre 3. Definitions. Dans D6.7c: Forensic Profiling, d. Z. Geradts &
P. Sommer, 12-30. FIDIS Future of Identity in the Information Society.

RIBAUX, O., BAYLON, A., LOCK, E., DELMONT, O., ROUX, C., ZINGG, C. & MARGOT, P. (2010).
Intelligence-led crime scene processing. Part II: Intelligence and crime scene
examination. Forensic Science International 199, no. 1-3: 63-71.

RIBAUX, O., GIROD, A., WALSH, S. J., MARGOT, P., MIZRAHI, S. & CLIVAZ, V. (2003). Forensic
intelligence and crime analysis. Law, Probability and Risk 2, no. 1: 47-60.

RIBAUX, O. & MARGOT, P. (1999). Inference structures for crime analysis and intelligence: the
example of burglary using forensic science data. Forensic Science International 100,
no. 3: 193210.

RIBAUX, O. & MARGOT, P. (2003). Case based reasoning in criminal intelligence using forensic
case data. Science and Justice 43, no. 3: 135144.

RIBAUX, O. & MARGOT, P. (2008). La trace matrielle vecteur d'information au service du


renseignement. Dans Trait de scurit intrieure, d. M. Cusson, B. Dupont, & F.
Lemieux, 300-321. Lausanne, Switzerland: Presses polytechniques et universitaires
romandes.


229

RIBAUX, O., WALSH, S. J. & MARGOT, P. (2006). The contribution of forensic science to crime
analysis and investigation: forensic intelligence. Forensic Science International 156,
no. 2-3: 171-181.

RUMBAUGH, J., BLAHA, M., LORENSEN, W., EDDY, F. & PREMERLANI, W. (1991). Object-
oriented modeling and design. New York, NY: Prentice-Hall International, Inc.

SCAIFE, M. & ROGERS, Y. (1996). External cognition: how do graphical representations work?
International Journal of Human-Computer Studies 45: 185213.

SCHROEDER, J., XU, J., CHEN, H. & CHAU, M. (2007). Automated criminal link analysis based
on domain knowledge. Journal of the American Society for Information Science and
Technology 58, no. 6: 842-855.

SENATOR, T. E. (2005). Link mining applications: progress and challenges. SIGKDD


Explorations 7, no. 2: 76-83.

SHNEIDERMAN, B. (1996). The eyes have it: a task by data type taxonomy for information
visualizations. Dans Proceedings of the 1996 IEEE Symposium on Visual Languages,
336343. VL '96. Boulder, CO: IEEE Computer Society.

SHNEIDERMAN, B. (2003). Why not make interfaces better than 3D reality? IEEEE Computer
Graphics and Applications 23, no. 6: 12-15.

SHNEIDERMAN, B. & ARIS, A. (2006). Network visualization by semantic substrates. IEEE


Transactions on Visualization and Computer Graphics 12, no. 5: 733740.

SIMMS, B. W. & PETERSEN, E. R. (1991). An information processing model of a police


organization. Management Science 37, no. 2: 216232.

SPARROW, M. K. (1991). The application of network analysis to criminal intelligence: an


assessment of the prospects. Social networks 13, no. 3: 251274.

SPRINGMEYER, R. R., BLATTNER, M. M. & MAX, N. L. (1992). A characterization of the


scientific data analysis process. Dans Proceedings of the 3rd conference on
Visualization, 235-242. VIS '92. Los Alamitos, CA: IEEE Computer Society.

ST JOHN, M., COWEN, M. B., SMALLMAN, H. S. & OONK, H. M. (2001). The use of 2D and 3D
displays for shape-understanding versus relative-position tasks. Human Factors 43, no.
1: 79-98.

STASKO, J., GRG, C. & LIU, Z. (2008). Jigsaw: supporting investigative analysis through
interactive visualization. Information Visualization 7, no. 2: 118132.

STASKO, J. & WEHRLI, J. F. (1993). Three-dimensional computation visualization. Dans


Proceedings of the 1993 IEEE Symposium on Visual Languages, 100-107. VL '93.
Bergen, Norway: IEEE Computer Society.

TANG, D., STOLTE, C. & BOSCH, R. (2004). Design choices when architecting visualizations.
Information Visualization 3, no. 2: 65-79.


230 Bibliographie

TAVANTI, M. & LIND, M. (2001). 2D vs 3D, implications on spatial memory. Dans Proceedings
of the 2001 IEEE Symposium on Information Visualization, 139-145. INFOVIS '01. San
Diego, CA: IEEE Computer Society.

TAYLOR, B., KOWALYK, A. & BOBA, R. (2007). The integration of crime analysis into law
enforcement agencies: an exploratory study into the perceptions of crime analysts.
Police Quarterly 10, no. 2: 154-169.

TEYSEYRE, A. R. & CAMPO, M. R. (2009). An overview of 3D software visualization. IEEE


Transactions on Visualization and Computer Graphics 15, no. 1: 87-105.

TILLERS, P. (2007). Introduction: visualizing evidence and inference in legal settings. Law,
Probability and Risk 6, no. 1: 1-4.

TILLERS, P. & SCHUM, D. (1991). A theory of preliminary fact investigation. UC Davis Law
Review 24: 931-1012.

TORY, M., KIRKPATRICK, A. E., ATKINS, M. S. & MLLER, T. (2006). Visualization task
performance with 2D, 3D, and combination displays. IEEE Transactions on
Visualization and Computer Graphics 12, no. 1: 2-13.

TUFTE, E. R. (1990). Envisioning information. Cheshire, CT: Graphics Press.

TUFTE, E. R. (1997). Visual explanations: images and quantities, evidence and narrative.
Cheshire, CT: Graphics Press.

TUFTE, E. R. (2001). The visual display of quantitative information. 2 d. Cheshire, CT:


Graphics Press.

TUFTE, E. R. (2005). Visual and statistical thinking: displays of evidence for making decisions.
3 d. Cheshire, CT: Graphics Press.

TUOVINEN, J. E. & PAAS, F. (2004). Exploring multidimensional approaches to the efficiency of


instructional conditions. Instructional Science 32, no. 1: 133152.

TWEEDIE, L. (1997). Characterizing interactive externalizations. Dans Proceedings of the


SIGCHI conference on Human factors in computing systems, 375-382. CHI '97.
Atlanta, GA: ACM press.

UNODC. (2002). Criminal intelligence training: manual for analysts. United Nations Office on
Drugs and Crime.

WARE, C. (2004). Information visualization: perception for design. Burlington, MA: Morgan
Kaufmann.

WARE, C. (2008). Visual thinking for design. Burlington, MA: Morgan Kaufmann.

WARE, C. & FRANCK, G. (1994). Viewing a graph in a virtual reality display is three times as
good as a 2D diagram. Dans Proceedings of the 1994 IEEE Symposium on Visual
Languages, 182-183. St. Louis, MO: IEEE Computer Society.


231

WARE, C. & MITCHELL, P. (2008). Visualizing graphs in three dimensions. ACM Transactions
on Applied Perception 5, no. 1: 1-15.

WEHREND, S. & LEWIS, C. (1990). A problem-oriented classification of visualization


techniques. Dans Proceedings of the 1st IEEE conference on Visualization '90, 139
143. VIS '90. Los Alamitos, CA: IEEE Computer Society.

WIGMORE, J. H. (1913). The principles of judicial proof as given by logic, psychology, and
general experience, and illustrated in judicial trials. Boston: Little, Brown, and
company.

WONG, P.C., CHIN, G., FOOTE, H., MACKEY, P. & THOMAS, J. (2006). Have green - a visual
analytics framework for large semantic graphs. Dans Proceedings of the IEEE
Symposium on Visual Analytics Science and Technology, 67-74. VAST '06. Baltimore,
MD: IEEE Computer Society.

WRIGHT, W., SCHROH, D., PROULX, P., SKABURSKIS, A. & CORT, B. (2006). The Sandbox for
analysis: concepts and methods. Dans Proceedings of the SIGCHI conference on
Human Factors in computing systems, d. R. Grinter, T. Rodden, P. Aoki, E. Cutrell, R.
Jeffries, & G. Olson, 810-810. CHI '06. Montral, Quebec: ACM press.

XIANG, Y., CHAU, M., ATABAKHSH, H. & CHEN, H. (2005). Visualizing criminal relationships:
comparison of a hyperbolic tree and a hierarchical list. Decision Support Systems 41,
no. 1: 6983.

XU, J. & CHEN, H. (2005). Criminal network analysis and visualization. Communications of the
ACM 48, no. 6: 100-107.

ZACHRY, M. & THRALLS, C. (2004). An interview with Edward R. Tufte. Technical


Communication Quarterly 13, no. 4: 447462.

A N N E X E S



A n n e x e 1 : D i m e n s i o n s d a n a l y s e e t
v i s u a l i s a t i o n

A n a l y s e q u a n t i t a t i v e
De nombreuses reprsentations diffrentes ont t inventes au cours de lhistoire pour
analyser des donnes quantitatives. William Playfair (1759-1823) est considr comme
linventeur de la plupart des types de diagrammes utiliss de nos jours (linaires,
histogrammes, circulaires, etc.) (Playfair, 2005) (Friendly, 2008). Ces reprsentations ont t
largement tudies et dveloppes depuis les travaux de Playfair, comme en tmoigne
louvrage de Robert L. Harris qui rfrence une liste encyclopdique de reprsentations (Harris,
2000). Les travaux dEdward Tufte (Tufte, 2001),(Tufte, 1997),(Tufte, 1990) ont largement
contribu au dveloppement de ltude moderne de ces reprsentations. Laccent est mis, en
particulier sur les effets visuels exploits pour tronquer des donnes et par opposition sur les
techniques efficaces et intgres. Paralllement, depuis les travaux de Bertin sur la smiologie
graphique (Bertin, 2005), de nombreuses tudes ont explicit divers aspects de la
reprsentation de donnes quantitatives. A titre dexemple, citons les travaux sur le processus
de la visualisation (Card et al., 1999), sur limpact du processus de perception et la smiotique
visuelle (MacEachren, 2004) (Ware, 2008), ou encore sur les types danalyses effectues laide
de reprsentations quantitatives (Few, 2009). Selon Stephen Few, lanalyse quantitative vise
ltude des relations entre des valeurs. Les mthodes de visualisation exploites varient en
fonction de la nature de ces relations : temporelles, classements et proportions, dviations,
distributions, corrlations et multi-varies (Few, 2009). La dcomposition propose par Few est
utilise pour prsenter les principales techniques. Les reprsentations temporelles font lobjet
de la section suivante.


234 Annexe 1: Dimensions danalyse et visualisation

Reprsentations de classements et de proportions

Les diagrammes circulaires


sectoriss

Ces diagrammes visent la comparaison de proportions et rpondre aux questions du type :


Quelle est la proportion dune valeur par rapport lensemble ? .

Les histogrammes

Ces diagrammes visent la comparaison de proportions, le classement et la comparaison


de valeurs.

Les diagrammes en points

Ces diagrammes visent la comparaison de diffrences entre les catgories, principalement


lorsque lensemble des valeurs sont grandes. Ils permettent dadapter lchelle sans ajouter de
biais visuels lis la comparaison de la longueur des barres.

Les diagrammes
de Pareto

Ces diagrammes permettent de reprsenter la distribution par ordre dcroissant des valeurs et
incluent une courbe cumulative des valeurs, gnralement exprimes en pourcentage.


Analyse quantitative 235

Les diagrammes
de Bumps

Ces diagrammes en lignes reprsentant lvolution du classement (axe vertical) au cours du


temps (axe horizontal).

Reprsentations de diffrences / de dviations

Les diagrammes de
dviations

Variation annuelle en pourcent par rapport la moyenne

Les diagrammes de dviation reprsentent les valeurs quantitatives en fonction dune


valeur dfinie : la moyenne, une valeur du pass, actuelle ou du futur, une valeur standard
(seuil acceptable, maximum, minimum, etc.). Les diffrences peuvent tre exprimes en
pourcentage et reprsentes par des barres ou des lignes.

Reprsentations de distributions

Les strip plot

Diagramme reprsentant la distribution dune variable sur un seul axe (dans cet exemple,
le temps). Lexemple ci-dessus est un multiple strip plot puisque les distributions de
plusieurs catgories sont reprsentes (axe vertical).


236 Annexe 1: Dimensions danalyse et visualisation

Les diagrammes de
distribution

Diagramme reprsentant la distribution dune variable en indiquant la quantit pour chaque


classe sur laxe vertical.

Les diagrammes en bote


(Box and Whiskers plot)

Les box plot reprsentent ltendue, la mdiane et les quartiles de la distribution. Dans
lexemple ci-dessus, la moyenne et le nombre dobservations (en bas) sont galement
reprsents. Ce type de diagramme a t invent par John Tukey (1915-2000), dans les annes
septantes.

Tige feuille ge de 10 19 ans :


1 0566778889 10, 15, 2x 16, 2x 17, 3x 18, 19
2 001112223444566678889 .
Les diagrammes feuilles 3 01248 .
4 0112367889 .
(Stem-and-Leaf plot)
5 00113344667888 .
6 001467 ge de 70 79 ans :
7 0113 70, 2x 71, 73

Diagramme divis en deux parties : chaque ligne reprsente une tranche dune chelle (ci-
dessus les dizaines) affiche gauche de la ligne verticale. A droite, chaque observation est
reprsente par le reste (ici lunit). La longueur de chaque ligne est donc proportionnelle
au nombre dobservations par tranche. Ce type de diagramme a galement t invent par
John Tukey (1915-2000), dans les annes septantes.


Analyse quantitative 237

Reprsentations de corrlations

Les nuages de points


(Scatter plot)

Diagramme reprsentant la variation dune variable quantitative en fonction dune autre.

Reprsentations de multiples variables

Les cartes de chaleur


(Heatmap)

Diagramme reprsentant les variations par une chelle de couleurs ou de niveaux de gris.

Les tables de donnes


(Table lens)

Reprsentation exploitant une forme de tableau o les valeurs sont reprsentes par des
diagrammes pour remplacer le texte (en plus de celui-ci dans lexemple ci-dessus)

Les diagrammes
coordonnes parallles


238 Annexe 1: Dimensions danalyse et visualisation

Alors que la majorit des diagrammes dvelopps pour lanalyse quantitative sont largement
utiliss en analyse criminelle, les graphiques coordonnes parallles semblent tre sous
exploits. Ils ont pourtant t spcifiquement dvelopps afin de faciliter la dtection et la
formalisation de profils71. En effet, la reprsentation par un graphe des profils peut tre trs
difficile voire inefficace si le nombre de relations du profil est important. Dans une telle
situation, lemploi dun diagramme coordonnes parallles est recommand. Ces
reprsentations sont dailleurs galement dsignes sous le nom de diagramme de profil.
Dans les ouvrages rcents (Card et al., 1999) (Few, 2009), linvention de cette forme de
reprsentation est attribue Alfred Inselberg (Inselberg, 1985) (Inselberg, 1997). Leur
exploitation remonterait en fait la fin du dix-neuvime sicle, priode laquelle, Maurice
dOcagne les auraient invents (Ocagne, 1885). La raison principale de la sous-utilisation de
cette forme de reprsentation rside dans la difficult initiale de les apprhender : The first
time I laid eyes on a parallel coordinates plot, I laughed and cringed simultaneously because it struck me as a
ridiculously complex and ineffective display. However, this frenzy of intersecting lines, when used properly for
multivariate analysis, can actually lead to great insight (Few, 2009).

Diagramme coordonnes parallles des cambriolages du soir

Date1 Semaine Heure1 Heure2 Jour semaine Lieu


01.01.09 1 23 23 Di

Villa

Appart.

31.12.09 52 0 0 Lu
Source : banque de donnes du CICOP, anne 2009, canton de Vaud


71
Cf. Analyse, profil et pattern, page 26


Analyse temporelle 239

Le choix de lordre des variables (et leur nombre) sur laxe horizontal et le nombre
dobservations reprsentes influence fortement la lisibilit de ces graphiques (Few, 2009).
Leur production ncessite des outils dynamiques afin de modifier les arrangements,
deffectuer des slections et de modifier les variables visuelles (telles que la couleur,
lpaisseur des traits et la transparence), afin didentifier des profils. Lexemple ci-dessus
reprsente un profil particulier de cambriolages dhabitations (cf. variable lieu ) commis
pendant la priode hivernale (cf. variables date1 et semaine ), le soir (cf. heure1 et
heure2 ). Il est notamment possible de dtecter une corrlation entre la variable heure2
(heure laquelle les victimes dtectent le cambriolage, cest--dire lorsquelles rentrent chez
elles) et le jour de la semaine. En effet, le week-end les victimes sabsentent visiblement plus
frquemment jusque tard le soir (en loccurrence tt le lendemain matin). Les variables
reprsentes dans ce cas sont principalement de type temporel. Dautres formes de
reprsentation temporelle peuvent tre exploites pour dtecter un tel profil (cf. section
suivante). Ces diagrammes sont particulirement efficaces pour regrouper dans une seule vue
un nombre important de variables diffrentes. Les diagrammes dit en toiles sont bass sur
le mme paradigme visuel, mais les axes sont positionns de faon radiale plutt quen
parallle.

A n a l y s e t e m p o r e l l e
Lanalyse temporelle couvre un ensemble de questionnements complexes. Les objectifs de
cette forme danalyse peuvent tre classifis selon six tches principales : la prdiction, la
classification, le regroupement (clustering), la recherche et la rcupration, ainsi que la
dtection de pattern (Laxman & Sastry, 2006). En matire danalyse criminelle, deux objectifs
principaux sont dfinis : la comprhension des vnements qui se sont passs et la prdiction
de ce qui va se produire (Boba, 2009) (Helms, 2009).

Contrairement aux autres variables quantitatives, la composante temporelle possde une


structure smantique particulire qui augmente sa complexit (Aigner et al., 2007). En effet, le
temps possde une structure hirarchique. Il est dcrit selon des niveaux dagrgation
complexes dont les divisions varient (soixante minutes, vingt-quatre heures, sept jours de la
semaine, douze mois de lanne, etc.). De plus le temps est peru la fois comme linaire,
mais galement selon des cycles et des rptitions, tels que les jours de la semaine ou les
saisons. Ces cycles peuvent galement tre irrguliers, notamment ceux lis des facteurs
sociologiques (comme les vacances par exemple).


240 Annexe 1: Dimensions danalyse et visualisation

Un cadre conceptuel est globalement reconnu pour dcrire la variable temporelle (Peuquet,
1994) (Mller & Schumann, 2003) (MacEachren, 2004) (Aigner et al., 2007) :

Le temps peut tre organis selon deux structures conceptuelles primaires :


- Linaire (sries temporelles) : le temps est observ selon une squence linaire
dvnements du pass jusquau prsent
- Cyclique (cycles temporels) : le temps est trait selon des cycles rptitifs lis la
rotation et la rvolution de la terre. Des cycles sociologiques sont galement
observs.

Le temps est dcrit selon deux types dchelles :


- Discrte (ordinale) : lorsque le temps est dcrit selon une chelle discrte, il nest
possible de rpondre quaux questions de type avant/aprs
- Continue : lorsque lchelle est continue, les diffrences temporelles peuvent tre
quantifies et compares.

Le temps peut tre dcompos en entits de base :


- Lvnement : un point identifiable dans le temps un moment spcifique
- La priode (la scne) : dure entre deux tats identifiables (deux vnements)
- Lpisode : un lment dune squence de scnes ordonnes de faon linaire
- La phase : un lment identifiable dun cycle (un pisode de la structure cyclique du
temps).

Le temps peut tre observ selon trois perspectives :


- Ordonne : les vnements se produisent les uns aprs les autres
- Ramifie : lorsque plusieurs alternatives sont considres, que plusieurs squences
dvnements peuvent succder chaque vnement
- Multiple : lorsque plusieurs alternatives sont considres, que plusieurs squences
dvnements sont observes en parallle.

Le temps peut tre dcrit selon trois niveaux dagrgation:


- Aucune : lorsque le temps est considr de faon continue
- Simple : tel que les secondes dune minute, les jours de la semaine, etc.
- Multiple : la combinaison de plusieurs granularits engendre une structure
hirarchique, comme les calendriers qui intgrent les jours, les semaines, et les mois.


Analyse temporelle 241

Cadre conceptuel de la dimension temporelle

Structure

Linaire Cyclique

Discrte

Echelles

Continue

Evnement

Entits

Priode
pisode phase

Ordonne

Perspectives Ramifie

Multiple

Aucune

Niveaux Simple
dagrgation

Multiple

Reprsentations inspires de (Aigner et al., 2007)


242 Annexe 1: Dimensions danalyse et visualisation

Les questions danalyse se dcomposent galement en catgories (MacEachren, 2004):

Question danalyse

Lexistence Est-ce que llment existe un moment prcis ?

La position temporelle Quand ? La position dcrit le moment de lobservation.

Combien de temps ? Lintervalle dcrit la dure de vie de


Lintervalle temporel
lobservation.
Avec quelle frquence ? la frquence dcrit un intervalle de
La frquence temporelle temps entre les observations en fonction dune unit
temporelle dfinie.
A quelle vitesse, selon quelle diffrence ? Le taux de
Le taux de changement changement dcrit le ratio entre le nombre dobservations
entre deux vnements et leur intervalle temporel.

La squence Selon quel ordre ?

La synchronisation Les observations se produisent-elles simultanment ?

De nombreuses formes de visualisations ont t dveloppes pour analyser les donnes dans
la dimension temporelle, afin de dtecter des patterns et rpondre aux questions prsentes
ci-dessus. Certaines permettent de rpondre plusieurs questions, alors que dautres sont
spcifiques une question particulire. Sans tre exhaustifs, les tableaux des pages suivantes
rsument les diffrentes approches de visualisations exploites pour faciliter lanalyse
temporelle des donnes.


Analyse temporelle 243

Reprsentations avec un systme de coordonnes cartsiennes

Les lignes de
temps

Diagramme une dimension : les vnements sont reprsents le long de laxe horizontal.
Des priodes peuvent galement tre reprsentes.

Les sries
chronologiques

Diagramme deux dimensions : laxe horizontal reprsente le temps. La variable peut tre
continue ou discrte et organise selon une structure linaire ou cyclique. Laxe vertical
reprsente une variable quantitative. De nombreuses sous-catgories de reprsentations
peuvent tre dfinies.

Les diagrammes
saisonniers
(Seasonal
Subseries Plot)

tir de (Cleveland & Terpenning, 1982), p.55


Diagramme deux dimensions : laxe vertical reprsente une variable quantitative. Le temps
est ordonn en saison (structure cyclique) sur laxe horizontal. Chaque sous-
diagramme contient la distribution pour une priode dfinie de chaque phase.

Les diagrammes
dactivit
(de Gantt)

Diagramme deux dimensions : visant la comparaison dvnements, dactivits ou dactions.


Laxe vertical est catgoris selon des activits, des tches, des personnes, etc.


244 Annexe 1: Dimensions danalyse et visualisation

10
8
Les diagrammes de 6
4
tempo 2
(Tempogram) 0

28.09.2009

30.09.2009

02.10.2009

04.10.2009

06.10.2009

08.10.2009

10.10.2009

12.10.2009

14.10.2009

16.10.2009

18.10.2009

20.10.2009

22.10.2009

24.10.2009

26.10.2009

28.10.2009

30.10.2009

01.11.2009

03.11.2009
Diagramme deux dimensions : laxe horizontal reprsente le temps et laxe vertical
lintervalle de temps avec loccurrence suivante.

Les topologies
temporelles
(Heatmaps)

Les deux axes du diagramme reprsentent la dimension temporelle : les heures de la


journe sur laxe horizontal et les jour de la semane sur laxe vertical72. Une structure linaire
peut galement tre reprsente sur lun des axes (par exemple, les semaines de lanne pour
observer la saisonnalit dun phnomne).

Priode 1 Priode 2 Priode 3


Les treillis
(small multiples)

Ensemble de diagrammes similaires ( une ou deux dimensions). Chaque diagramme illustre


une situation un moment diffrent. Linvariant de chaque reprsentation couvre la
dimension temporelle.


72
Les donnes utilises sont les mmes que celle prsentes dans la section analyse quantitative . Le nombre de
cas est plus important les vendredis et samedis soirs (5 et 6 sur laxe vertical). Ltendue est plus grande sur ces
soires du week-end, comme prcdemment expliqu.


Analyse temporelle 245

Reprsentations avec un systme de coordonnes polaires

Les diagrammes
circulaires
(Radars)

Diagramme reprsentant le temps selon une structure cyclique discrte. Lobjectif de ces
graphiques est de comparer plusieurs itrations dun cycle (dfini par le niveau dagrgation)
afin de dtecter des rgularits et des anomalies.

Les diagrammes
en spirale

tir de (Carlis & Konstan, 1998), p.32

Diagramme reprsentant le temps selon une structure cyclique continue. Lobjectif est
similaire celui des diagrammes circulaires.


246 Annexe 1: Dimensions danalyse et visualisation

Reprsentations temporelles intgrant une dimension relationnelle

2 5

Mthode de chemin
1 3 4 6
critique
(Critical path method)

Diagramme exploit pour dcrire une squence dactivits (de priodes). Chaque flche
reprsente une activit dont la longueur sur laxe horizontal est proportionelle sa dure.
Les relations entre les activits sont illustres par des sommets numrots dcrivant la
squence (Kelley & Walker, 1959).

Rseau PERT
(PERT chart : Program
Evaluation and Review
Technique)

Diagramme exploit pour dcrire une squence dvnements. Chaque noeud reprsente
un vnement. La dure nest pas reprsente, mais uniquement le moment de lvnement.

Mois Janvier Fvrier


Semaines 1 2 3 4 5 6 7 8 9
Diagramme dactivit A
B
C

Chaque activit est reprsent par une barre horizontale dont la longueur est
proportionnelle sa dure. Les relations entre les activits (par exemple, si lune ne peut
commencer qu la fin de certaines autres) sont reprsentes par des flches. Laxe vertical est
exploit pour dcomposer soit des types dactivits, de personnes, etc.


Analyse temporelle 247

Diffrents types de patterns sont observables lors de lanalyse temporelle des donnes (Boba,
2009) (Helms, 2009) (Few, 2009) (Paulsen et al., 2010) :

- Les tendances dcrivent un comportement gnral. Elles peuvent tre de trois types :
dcroissante, stable ou croissante73.
- La variabilit dcrit le degr de changement. Elle est gnralement dcrite par lcart-
type et ltendue de la variable.
- Le taux de changement dcrit la diffrence de valeur entre deux observations
successives.
- La covariance dcrit la relation entre deux variables temporelles

Covariance entre le nombre de vols de mtaux et le cours du cuivre.


73
Le tempo est galement classifi selon trois types de tendances : acclration, stabilisation et dclration.


248 Annexe 1: Dimensions danalyse et visualisation

- Les rgularits cycliques sont observes lorsque le temps est analys selon une
structure cyclique (jour de la semaine, mois de lanne, etc.)

Rptitions saisonnires des cambriolages du soir



- Les exceptions sont des valeurs anormales qui ne suivent pas la tendance gnrale.



La gestion de lincertitude lie au temps est particulirement critique en analyse criminelle. En
effet, linformation temporelle collecte pour dcrire une activit criminelle est souvent
imprcise. Les vnements criminels sont gnralement dcrits par un intervalle entre deux
vnements (la date et lheure de dbut et la date et lheure de fin du dlit). Cet intervalle peut
dans certains cas dcrire avec prcision la dure du dlit (par exemple lors de brigandages),
mais il est plus souvent le fait dune incertitude (le dlit sest produit un moment
indtermin entre deux vnements). Cest gnralement le cas des cambriolages commis
pendant labsence des lss. Lintervalle est alors dfini par le moment o la victime a quitt le
lieu de commission du dlit et le moment o elle est revenue. Diffrents types destimateurs,
tels que la moyenne, le mdiane ou un calcul de frquences peuvent alors tre exploits pour
grer lincertitude temporelle (Ratcliffe, 2000).


Analyse spatiale 249

A n a l y s e s p a t i a l e
Lusage de reprsentations cartographiques de lenvironnement semble, pour la plupart des
civilisations, concider avec linvention de lcriture. La plus ancienne reprsentation
gographique dcouverte pourrait tre une carte babylonienne du monde (grav entre 500 et
700 av. J.-C.). La cartographie sest largement dveloppe au cours de lhistoire, notamment
pour la navigation. Ds le XIXe sicle apparaissent les premires cartes dites thmatiques
visant reprsenter des donnes qualitatives et quantitatives en relation avec leurs
distributions spatiales.

Le crime, comme tout vnement, possde videmment une ralit gographique. De trs
nombreuses tudes ont montr la nature non alatoire des phnomnes de criminalit dans la
dimension spatiale. Il ne semble toutefois pas exister de consensus sur les causes des
distributions observes (Canter, 2000).

Les premires cartes de la criminalit sont attribues aux travaux
dAndr-Michel Guerry (1802-1866) sur la statistique morale en
France (Guerry, 1833). Guerry a montr que les taux de criminalit
(dcomposs par dpartement et par types de criminalit : contre
la personne et contre le patrimoine) variaient fortement selon la
rgion gographique et galement selon les saisons. Ces travaux
sont considrs comme fondateurs des sciences sociales
modernes (Friendly, 2008).

A la mme priode, Adolphe Quetelet (1796 1874) effectue


galement des cartes de la criminalit (Quetelet, 1842).

Ces premires analyses spatiales de la criminalit furent possibles


grce aux rformes entreprises, au dbut du XIXe sicle, en France
et en Angleterre, en matire de collecte et denregistrement des
donnes de la criminalit (Anselin et al., 2000) (Chainey & Ratcliffe,
2005).

Au dbut du XXe sicle, lcole de sociologie de Chicago, exploitera largement les cartes pour
mettre en vidence les relations socioculturelles et socio-conomiques de la criminalit, en


250 Annexe 1: Dimensions danalyse et visualisation

fonction des quartiers de la ville de Chicago, notamment lors dtudes longitudinales de la


dlinquance juvnile (Canter, 2000) (Chainey & Ratcliffe, 2005).

Un regain dintrt est observ en matire de cartographie du crime depuis les annes
nonante. Clarke relve que Crime mapping will become as much an essential tool of criminological research
as statistical analysis is at present (Clarke, 2004) p. 60. Des efforts particulirement importants en

termes de recherche et de dveloppement doutils facilitant lanalyse spatiale ont t


effectus. La cartographie est largement exploite afin danalyser la distribution gographique
du crime et de lactivit policire. Elle sert de base la prise de dcision oprationnelle en
identifiant des zones particulirement touches, afin dallouer les ressources et dfinir des
stratgies daction (Anselin et al., 2000) (Chainey & Ratcliffe, 2005) (Boba, 2009) (Taylor et al.,
2007).

En 1994, la police de New-York instaure une nouvelle approche managriale base sur
lanalyse des informations notamment prsentes sous forme de cartes, afin didentifier les
problmes et dfinir les rponses policires. La composante gographique est galement
exploite afin deffectuer du profilage gographique. Cest--dire de mettre en relation les
vnements criminels et les activits routinires des criminels et des victimes afin didentifier
notamment le lieu de rsidence des auteurs, des points de rencontre ou de passage (Paulsen
et al., 2010). La premire exploitation de cartes gographiques des fins de profilage, a
probablement t effectue dans laffaire du Yorkshire Ripper (1976-81) (Kind, 1987) (Kind,
1994) (Barclay, 2009).

La dfinition dun cadre conceptuel dcrivant la variable spatiale prsent ici est tir de
(Peuquet, 1984). Les donnes spatiales peuvent tre classifies selon quatre types principaux :
- Les points : une position unique est associe chaque observation
- Les lignes : la composante gographique est dfinie par un ensemble de positions
pouvant tre reprsentes par des lignes isoles (telles que des failles), des structures
en arbre (comme les rivires) ou des rseaux complexes (les routes)
- Les polygones : la composante gographique est dfinie par des positions formant un
ensemble ferm (des zones). Les polygones peuvent tre isols (ne partageant pas de
frontire avec dautres zones), adjacents ou imbriqus.


Analyse spatiale 251

Une typologie de la variable spatiale (et des formes de visualisation spatiale) est galement
dfinie selon deux dimensions (MacEachren, 2004):
- La continuit spatiale dcrit la distribution du phnomne. Elle est continue lorsque le
phnomne est observ sur lensemble du territoire et discrte lorsquil a lieu des
endroits spars
- La dpendance spatiale dcrit le niveau de
variation spatiale du phnomne. Si le
phnomne possde une indpendance
spatiale, les observations peuvent varier
fortement entre deux lieux proches (la
distribution est abrupte). Les variations
spatiales sont faibles (lisses), si le
phnomne possde une forte dpendance
spatiale.
tir de (MacEachren, 1992) p. 17

La composante spatiale dune observation (dune trace) peut tre de diffrente nature (Reed &
Kocura, 2005) :
- Un point unique (comme un vnement)
- Un ensemble de points (comme un appel tlphonique caractris par la position de
lappelant et de lappel)
- Un chemin (tel le dplacement dun vhicule enregistr par une balise GPS)
- Une zone (telle la couverture dune antenne GSM).

Diverses techniques sont au service de lanalyse spatiale de la criminalit. Besson les


regroupent en neuf catgories (Besson, 2004):
- Lanalyse du point (formation et dispersion : Weisburd, Anselin)
- Le groupement de points (hotspot : Sherman, Eck, Gersh, Taylor, Jerrifs)
- Lanalyse des distances (distance dcroissante, zone tampon : Brantingham, Rossmo)
- Le quotient relatif local de criminalit (Brantigham)
- Le quotient relatif de temps (Ratcliffe, Bair)
- Lanalyse des facteurs dinfluence
- La rgression spatiale
- Lauto-corrlation spatiale (Anselin, Jefferis)
- Les mesures de contrles et de tests


252 Annexe 1: Dimensions danalyse et visualisation

Reprsentations spatiales

Les cartes en points

Cartes reprsentant chaque observation par un point (ou une forme). Une analyse
quantitative est gnralement difficile effectuer, en raison de la superposition des points.
Seule la distribution spatiale est observable.

Les cartes symboles


proportionnels

Cartes exploitant laire des cercles (ou de formes) pour reprsenter une variable
quantitative. La problmatique de la superposition est attnue en exploitant la transparence.

Les cartes statistiques

tir de http://sitn.ne.ch/geoclip/carto.php, dernier accs le 21.09.2010

Cartes exploitant des diagrammes quantitatifs (histogrammes, circulaires sectoriss, etc.)


pour reprsenter la distribution spatiale de plusieurs variables. Les cartes symboles
proportionnels sont parfois considres comme un sous-type des cartes statistiques.


Analyse spatiale 253

Les cartes
lignes gradues

tir de (Johnson, 2010)

Cartes exploitant lpaisseur des lignes pour reprsenter une variable quantitative.

Les cartes choroplthes

Cartes exploitant une chelle de niveau de gris ou de couleur des polygones pour
reprsenter une variables quantitatives. Les polygones sont gnralement dfinis en fonction
de limites administratives (communes, districts, pays, etc.).

Les cartes
isolignes/isoplthes

tir de http://upload.wikimedia.org/wikipedia/
commons/d/d1/Courbe_niveau.svg, dernier accs le 21.09.2010

Cartes utilisant des lignes de points dont la valeur associe est constante. Contrairement
aux cartes choropleth, les lignes ne dpendent pas de polygones prdfinis (telles des
frontires administratives).


254 Annexe 1: Dimensions danalyse et visualisation

Les cartes de densit


(hotspots)

Cartes de type raster dont la valeur de chaque maille de la grille est base sur un calcul de
densit (gnralement par densit de Kernel avec un estimateur gaussien).

Les cartes dformations


(Cartograms)

tir de (Andresen et al., 2009)

Cartes de type choroplthe o la zone (les dimensions du plan) est proportionnelle une
variable quantitative, et non plus directement fixe selon la composante spatiale. Deux
variables quantitatives diffrentes peuvent donc tre reprsentes respectivement par une
chelle de niveaux de gris et par la taille des polygones.


Analyse spatiale 255

Reprsentations spatiales intgrant une dimension relationnelle

Les cartes de flux

tir de http://datavisualization.ch/tools/flow-map-layout,
dernier accs le 21.09.2010

Cartes reprsentant le flux de marchandises ou de personnes. Lavantage de ce type de


carte rside dans la simplification de lensemble des relations en les regroupant par des
chemins (Phan et al., 2005). Les premires cartes de flux sont attribues Charles Joseph
Minard (1781 1870), auteur notamment dune carte des pertes successives en hommes de
larme de Napolon et de la carte de lexportation de vin depuis la France, prsente ci-
dessus (Friendly, 2008).

Les graphes go-rfrencs

Cartes et graphes juxtaposs. La position des nuds du graphe est dtermine par la
position spatiale de chaque observation.

A n n e x e 2 : S c h m a s d e s c n a r i o s
Lexploitation de graphes pour reprsenter les informations dune enqute, se retrouve dj
dans les travaux de John Henry Wigmore (1863-1943) qui pourraient tre bass sur les
diagrammes dvelopps par Richard Whately (1787-1863) publis en 182674 (Reed & Rowe,
2007) :

La mthode de Wigmore appele argument diagram est constitue de sommets et darcs


(Wigmore, 1913) p.751 et suivantes. Les sommets reprsentent des faits (des observations,
des portions dune squence dvnements constituant lhistoire/le scnario de laffaire, des
portions de dclarations). Les arcs (liens) reprsentent des infrences reliant les diffrentes
portions dinformation. Puisque les liens reprsentent des infrences entre des prmisses et
des conclusions, ils sont gnralement accompagns dune flche qui dcrit la causalit de la
relation (Bex et al., 2003) (van den Braak et al., 2006).


74
Illustration tire de http://timvangelder.com/page/5/?archives-list&archives-type=months, dernier accs le 31
janvier 2011.


257

Diverses notations sont exploites afin de


distinguer diffrents types dinformations 75: les
preuves circonstancielles (cercles), les preuves
testimoniales (carrs) et les hypothses (triangles).
Les lignes verticales reprsentent des relations entre
des permisses confirmant les conclusions. Les lignes
horizontales marques dune croix reprsentent des
relations rfutant les conclusions. La crdibilit des
informations est galement reprsente par une
Illustration tire de (Wigmore, 1913) p. 754.
annotation des nuds ( ? : incertain, :
crdible, : plus crdible, ou : non-crdible). Les chiffres sont des indexes qui
font rfrence aux informations (prsentes sous la forme dune liste accompagnant le
schma) (Bex et al., 2003) (Anderson, 2007).

Lun des aspects essentiels de la mthode de Wigmore rside dans lobjectif dexploitation de
ces reprsentations : raisonner de manire critique sur les informations (Bex et al., 2003). Le
graphique explicite le processus de raisonnement effectu pour aboutir une conclusion et
prendre une dcision (Goodwin & Fisher, 2000). Cette forme dexploitation des graphes est
initialement apprhende comme un support de raisonnement pour la prise de dcision lors
de la phase de jugement (afin dvaluer les diverses hypothses dfinies) (Tillers & Schum,
1991). Selon Tillers (2007), de telles reprsentations devraient faciliter lapprhension de la
logique baysienne pour le jury, les avocats et les tudiants en droits notamment. Il met
galement lhypothse que la visualisation peut aider amliorer nos limites cognitives et
expliciter les raisonnements formels effectus sur les traces. La reprsentation facilite lanalyse
des informations et lvaluation des hypothses, mais leur dveloppement reste du ressort de
ses utilisateurs (Bex et al., 2007). Un graphe nest toutefois pas uniquement un support
commode pour reprsenter des raisonnements complexes, mais une aide efficace lors de
llaboration dhypothses et pour faciliter les raisonnements (Tillers, 2007).

Dans les annes cinquante, deux approches complmentaires ont t dveloppes : les
diagrammes de Toulmin et les diagrammes de Beardsley (Reed & Rowe, 2007). Depuis les
annes nonante, plusieurs dveloppements parallles ont t effectus et diffrents logiciels
dvelopps pour reprsenter les raisonnements effectus sur la base des traces en regard de


258 Annexe 2 : Schmas de scnarios

diffrents scnarios (Tillers & Schum, 1991) (Goodwin & Fisher, 2000) (Bex et al., 2003) (Reed &
Rowe, 2007).

De nouveaux outils sont dvelopps afin de reprsenter les informations dune enqute,
dexprimer les infrences effectues, de comparer les versions et les hypothses alternatives
possibles pour interprter les traces collectes (van den Braak, 2010). Van den Braak (2010)
dfinit un langage visuel formel bas notamment sur les travaux de Bex (2007), afin de
concevoir des reprsentations relationnelles explicitant dune part, des scnarios (par exemple
en regard dinformation testimoniales) et, dautre part, les relations entre les indices et ces
scnarios. Le langage intgre sous la forme de nuds : les informations descriptives des
cas (les informations circonstancielles, les tmoignages et les traces collectes), les hypothses
formules sur la base dobservations (physiques ou testimoniales) et les sources
dinformations (un rapport de police, un tmoignage, un constat, etc.). Les types dentits sont
distingus par la forme et la couleur des nuds. Les relations dcrivent les relations entre les
diffrents types de nuds.

tir de (van den Braak, 2010)

Selon Van Den Braak (2010), le langage dfini sert de base la dcomposition des
informations denqute pour valuer les indices et comparer et valuer des scnarios
alternatifs explicatifs des informations collectes. Lensemble des informations est donc
dcompos sous la forme de scnarios sur lesquels sont intgres les infrences effectues sur
la base des informations collectes.

A n n e x e 3 : V i s u a l i s a t i o n
t r i d i m e n s i o n n e l l e
It doesnt seem to matter whether we perform our tasks well or not; many of us like 3D visualizations anyway.
Interestingly, many of us do not like 3D by instinct. (Chen, 2006).

Les questions lies lusage et lefficacit de la troisime dimension sur une reprsentation
graphique font dbats. Les performances des reprsentations en trois dimensions varient en
fonction des tches impliques et des choix de reprsentation (Cockburn & McKenzie, 2004).

Une visualisation trois dimensions (3D) est une projection sur le plan de lenvironnement
tridimensionnel (Tavanti & Lind, 2001). Limage cre est une perspective ou une vue oblique
dun objet ou dune scne sur un espace deux dimensions. La perception de la troisime
dimension est produite par la perspective rsultant de langle de vision et de lusage de
repres visuels dcrivant la profondeur (tel un clairage produisant des ombres) (St John et al.,
2001).

T y p e s d e r e p r s e n t a t i o n
La classification des mthodes de reprsentation propose par (Stasko & Wehrli, 1993) est
utilise pour discuter leurs usages et efficacits :

Vues 2D augmentes: la troisime dimension est ajoute une


reprsentation en deux dimensions pour des raisons
desthtisme (par exemple sur des histogrammes), afin daccroitre
lattractivit. Tufte soutient que lusage de la troisime dimension dans ce type de
reprsentation est superflu (deux dimensions suffisent pour transmettre la connaissance)
(Tufte, 2001) (Irani & Ware, 2003). Dautres auteurs pensent que lajout dlments esthtiques


260 Annexe 3 : Visualisation tridimensionnelle

stimule la perception visuelle et facilite la comprhension qualitative et la prsentation des


ides (Springmeyer et al., 1992). Toutefois, certaines tudes (Aigner et al., 2007) (Hicks et al.,
2003) ont montr que lusage de la troisime dimension sur des histogrammes ralentissent le
processus de lecture et peuvent induire en erreur le lecteur. En effet, une perspective trop
importante peut dformer les tailles des formes. La comparaison des tailles peut alors tre
trompeuse, dans la mesure o les diffrences ne correspondent plus aux variations des
donnes sources.

Vues 2D adaptes : plusieurs reprsentations bidimensionnelles


sont intgres dans une vue trois dimensions, afin de reprsenter
une information supplmentaire. Le principal dsavantage de ces
reprsentations est locclusion : certaines parties du schma sont
caches par des lments placs en premier plan. La lecture de
chacune des distributions prsentes est donc incomplte.

Vue de structures en 3D : la vue reprsente la ralit physique des


objets (comme la reprsentation de structures molculaires en
chimie ou la reprsentation dimmeuble en architecture). Il a t
dmontr empiriquement que ces reprsentations sont trs
efficaces pour comprendre des formes et structures
tridimensionnelles (St John et al., 2001).
(Images tires de Molecular database without transition elements ,
http://www.faidherbe.org/site/cours/dupuis/banque.htm, dernier accs le 4 fvrier 2010)

Lavantage apparemment vident de profiter dune dimension supplmentaire pour encoder


des informations doit tre discut. Gnralement ces reprsentations sont exploites dans un
environnement o lutilisateur peut naviguer dynamiquement au sein de la vue (Stasko &
Wehrli, 1993). La conception dinterfaces permettant une telle navigation implique des
problmes complexes. Paradoxalement, linterface peut engendrer des difficults et des
frustrations pour lutilisateur, mais galement un certain enthousiasme et une apprhension
plus agrable de la reprsentation. Certains valuations relvent que lefficacit des
reprsentations 3D semble dpendre plus de la qualit de linterface que de la nature de la
visualisation (St John et al., 2001). Pour Robertson (dans (Mullet, 1995)) et Schneiderman
(Shneiderman, 2003), lvaluation de lefficacit des reprsentations 3D devrait se focaliser sur
des indicateurs de performance pour accomplir des tches spcifiques. Des tudes empiriques
ont montr quil ny a pas de diffrence significative en termes de performances, mais une


Avantages 261

prfrence (subjective) pour les reprsentations trois dimensions (Cockburn & Mckenzie,
2000) (Cockburn & McKenzie, 2001). Les utilisateurs tendent prfrer la 3D pour
communiquer et pour mmoriser les informations (Aigner et al., 2007). Dautres tudes (voir
notamment (St John et al., 2001), (Teyseyre & Campo, 2009) et (Tory et al., 2006)) ont identifi
des avantages et des inconvnients spcifiques qui sont prsents dans les sections suivantes.

A v a n t a g e s
Description de formes : lavantage principal des visualisations 3D rside
dans son application pour reprsenter de formes tridimensionnelles.
Reconstruire un volume complexe sur la base de reprsentation

bidimensionnelle ncessite un entrainement


particulier et savre souvent bien plus difficile
quobserver une reprsentation tridimensionnelle
(St John et al., 2001). Toutefois pour que la
troisime dimension soit visible, lusage de repres
visuels dcrivant la profondeur est ncessaire (tels
que des ombres, des variations de tailles, etc.). Sinon, la projection est ambigu. Dans
lexemple ci-contre, sans lombre, il nest pas possible didentifier la verticale de quel cube, la
sphre est positionne (exemple tir de (St John et al., 2001)).

Reprsentation de topographie : les vues 3D sont trs


efficaces pour reprsenter la structure des terrains. La
reprsentation symbolique de laltitude dans une vue
deux dimensions ncessite plus de temps interprter
(St John et al., 2001).

Reprsentation de grands graphes : certains auteurs


prtendent que la 3D offre de nombreux avantages
pour la reprsentation de graphes de grande taille
(Ware & Franck, 1994) (Parker et al., 1998) (Ware &
Mitchell, 2008). De ces travaux, il ressort que les
reprsentations 3D stroscopiques (couples des lunettes permettant une immersion) sont
plus efficaces que les reprsentations 2D pour explorer des graphes complexes (en
loccurrence pour trouver le chemin le plus court entre deux nuds). La possibilit de naviguer


262 Annexe 3 : Visualisation tridimensionnelle

dynamiquement lintrieur dun graphe dans toutes les dimensions peut tre une cause
explicatrice des performances observes (Chen, 2006).

Toutefois, les relations entre les nuds et les positions des nuds ont t dfinies
alatoirement dans les conditions exprimentales de ces tudes. Les cas traits ne sont donc
pas vraiment reprsentatifs de situations relles o la structure des graphes et le
positionnement des nuds sont rarement alatoires. De plus, lutilisation dune telle
technique dans la pratique semble difficile en raison du matriel requis pour crer une
reprsentation stroscopique de haute rsolution. Finalement, linterface de navigation
(translation, rotation and zoom) et les algorithmes de placement (pour minimiser les
croisements de traits) sont galement des sources de difficults (Parker et al., 1998) (Teyseyre
& Campo, 2009).

Augmentation de lespace : les reprsentations 3D offrent un espace plus grand qui permet
daugmenter le nombre dinformations reprsentes dans une mme vue (Mullet, 1995). La
structure gnrale dune reprsentation devrait donc tre plus facilement perceptible, puisque
lensemble des donnes sont visualises dans un seul espace. Toutefois, la superposition
souvent invitable des lments reprsents sur une reprsentation 3D est en contradiction
avec cet argument.

Accroissement de la mmoire spatiale : la mmorisation des positions dobjets semblent tre


amliore par la 3D (Tavanti & Lind, 2001). Dautres tudes nont cependant pas observ de
diffrences significatives (Cockburn & McKenzie, 2004). Ces rsultats contradictoires sont
certainement lis au fait que les variables visuelles qui favorisent la mmorisation spatiale ne
sont pas clairement identifies. En effet, dans une vue 3D la taille des lments changent, des
textures et des couleurs sont parfois ajoutes (notamment dans (Irani & Ware, 2003)). Lors des
comparaisons, plusieurs variables visuelles sont donc modifies. La relation entre les
performances et le passage la 3D nest donc pas toujours vidente.

F a i b l e s s e s
Occlusion (superposition) : des parties de la reprsentation peuvent tre caches par des
lments positionns au premier plan (voir lexemple des vues 2D adaptes). Cet effet est
partiellement maitrisable en ajoutant une interaction dynamique (offrant ainsi lutilisateur la
possibilit de varier les angles de vues) (Hubona et al., 1997).


Conclusion 263

Ambigut due la projection : en labsence de repres de profondeur, la position des objets


peut-tre ambige. De plus, alors que les effets de perspective permettent de visualiser la
troisime dimension, les possibilits deffectuer des mesures de distances, dangles et
dvaluer les positions relatives sont rduites (Tory et al., 2006).

Non-linarit : lespace reprsent sur une vue 3D est distordu de faon non linaire. Les
distances et les angles sont donc galement distordus.

Dynamisme : la possibilit de dplacer la vue est gnralement propose comme solution au


problme docclusion et de lambigut due la projection. Le support de transmission du
rsultat est alors limit linformatique ou limage anime.

Reprsentation des textes : les polices ncessaires pour atteindre le mme degr de lisibilit
que sur une reprsentation 2D, doivent tre plus grandes sur une reprsentation 3D (Card et
al., 1999).

Finalement, les ressources de calculs ncessaires pour produire une reprsentation 3D sont
plus importantes et linterface ncessaire est gnralement plus complexe concevoir et
utiliser (Teyseyre & Campo, 2009).

C o n c l u s i o n
Les reprsentations en trois dimensions offrent des solutions efficaces pour la reprsentation
de scnes, dobjets et de la topographie. En matire de reprsentation de donnes abstraites,
lapport de la troisime dimension nest pas clairement tabli. Les reprsentations en deux
dimensions offrent de meilleures performances pour analyser en prcisment des donnes et
comparer des distances notamment. De plus, une interface gnralement plus complexe est
requise pour faciliter la navigation dans la vue.

Pour conclure ce rapide survol de la littrature sur le sujet, il semble que deux avis divergents
existent en matire de reprsentation 3D. Dune part, certains chercheurs, notamment
influence par les travaux dEdward Tufte, pensent que les reprsentations 2D sont suffisantes.
Lusage de la troisime dimension pour augmenter une impression subjective desthtisme ne
devrait pas tre prconis au dtriment de lefficacit et de la simplicit dune reprsentation.
Si les informations reprsenter peuvent ltre par le biais dune reprsentation deux


264 Annexe 3 : Visualisation tridimensionnelle

dimensions, il sagit de la mthode recommande. Dautres chercheurs (principalement issus


du domaine de la conception dinterfaces graphiques et du design) suggrent dexploiter la
troisime dimension des fins de communication. En effet, un usage adapt de la 3D semble
avoir un potentiel pour faciliter linteraction entre lhomme et les reprsentations
informatises, ainsi quaccrotre une certaine forme dattractivit. Les valuations en la matire
montrent toutefois des rsultats contradictoires, dont les causes ne sont pas clairement
tablies. En effet, les mcanismes complexes de la perception humaine et le nombre important
de variables dpendantes impliques en matire de visualisation (comme la 3D, la couleur, la
taille, le positionnement, etc.) rendent difficile les comparaisons et les valuations. Les
reprsentations trois dimensions ont dmontr leurs utilits pour reprsenter la ralit
physique dobjets (en mdicine, en architecture et en chimie notamment), mais la question de
lapport de la 3D en matire de reprsentation dinformations abstraites reste ouverte. Les
dsavantages en termes dintgrit (occlusion et ambigut de projection) ne semblent
toutefois pouvoir tre ignors au profit davantage lis la communication.

A n n e x e 4 : E v a l u a t i o n s
p r l i m i n a i r e s

R e p r s e n t a t i o n d u n s c n a r i o s i m p l e
Lensemble des solutions sont prsentes dans les tableaux des pages suivantes. Afin de
faciliter la comparaison et la lecture des schmas, ils ont t recrs de faon uniforme.


Structures singulires (tudiants)



Reprsentations effectues par des analystes

2x (Type A) 2x (Type D)


266 Annexe 4 : Evaluations prliminaires

Reprsentations effectues par des tudiants

Type A Type B

4x
4x

2x

2x


2x


Reprsentation dun scnario simple 267

Type C Type D

3x
2x

3x


3x


268 Annexe 4 : Evaluations prliminaires

R e p r s e n t a t i o n d u n e v e n t e

Type A

Type B

Autres


Reprsentation dune affaire complexe 269

R e p r s e n t a t i o n d u n e a f f a i r e c o m p l e x e
Nombre dentit et de types dentit exploits :
Enquteurs (n = 40)
7 40 60
6 50 y = 1.4808x

Nombre d'endt
5 30 R = 0.84218
40
4 30
20
3 20
2 10 10
1
0
0 0 0 10 20 30 40
1 6 11 16 21 26 31 Nombre de types d'endt
Sans la valeur extrme de 35 types:
Moyenne de 17 +/- 4 types, Mdiane 17, Etendue de 8 26

Spcialistes (n = 7)
4 50
6 y = 1.6832x
40 R = 0.79274
Nombre d'endt

3
30
4
2 20

1 2 10
0
0 0 0 5 10 15 20 25
1 6 11 16 21 26 31 Nombre de types d'endt

Moyenne de 15 +/- 5 types, Mdiane 14, Etendue de 7 21

Etudiants MAS (n = 10)
5 10 60
4 8 y = 1.8622x
Nomre d'endt

40 R = 0.73975
3 6
2 4 20
1 2
0
0 0 0 5 10 15 20 25 30
1 6 11 16 21 Nombre de type d'endt

Moyenne de 16 +/- 5 types, Mdiane 15, Etendue de 9 25

En regroupant les trois populations, la rgression linaire est Y=1.5663X, R2 = 0.7277


270 Annexe 4 : Evaluations prliminaires

Enquteurs (n = 40) Spcialistes (n = 7) Etudiants MAS (n = 10)


88 types dentit 49 types dentit 58 types dentit

0 50 100 0 10 20 0 20 40
Mobile Phone 39 Mobile Phone 7 Male 9
Male 38 Male 6
Policeman 38 Anonymous 8
Pistol 31 Anonymous 7 Mobile Phone 7
Hotel 36 Telephone 5 Pistol 7
Anonymous 25 Pistol 4 Policeman 7
DNA 32 DNA 4 Telephone 7
Telephone 36 Acpon 2 DNA 9
Incident 12 Male Police 2 Fingerprint 7
Car 23 France 2 SIM Card 4
Fugipve 23 Document 4 Telephone Tap 3
Telephone Tap 17 Date & Time 1 Car 7
Hospital 19 Car 4 Organisapon 5
Fingerprint 18 Government 3
Subscriber 10 Document 4
Body 15 Case 2 Bullet 3
Place 13 Enpty 1 Query 2
Law Enforcement 13 Place 1 Notebook 1
Document 14 Bullet 3 Hospital 6
Bullet 10 Hotel 3 Hotel 4
Government 11 Deceased Male 3 Town 1
Assassinapon 11 Incident 3 Ambulance 3
France 8 Telephone Tap 1 Revolver 2
Car (Rental) 10 Building 1 House 4
Alias 9 Claim 2
Organisapon 7 Body 4
House 2 Incident 2
Building 7 Switzerland 1
Arson 8 Government 2
Claim 8 Communicapon 1 Building 2
Professional Male 5 Oce 1 Subscriber 3
SIM Card 4 Alias 2 Arson 3
Case 4 Car Bomb 2 Algeria 3
Bullet Cases 7 Body 2 Deceased Male 2
Iran (Islamic 6 Date 1 Oce 2
Forensic 6 Iran (Islamic 2 Iran (Islamic 2
Deceased Male 6 Fingerprint 2
Car (Damaged) 6 Town 1 Forensic 2
Insurgent 4 Clan 1 Car (Rental) 2
House 5 Telephone 1 Car (Damaged) 2
Car Bomb 5 Arson 1 Passport 1
Date & Time 4 Personne / 1 Male Figure 1
Sheri 4 Cabinet 1 Insurgent 1
Police Car 4 Detonapon 1
Papent 4 Mosque 1
Query 1 Cannabis 1
Search 3 Assault Weapon 1
Oce 3 Lieu 1
Flat 3 Car (Rental) 1 Alias 1
Evidence Collecpon 3 Laboratory 1 Workshop 1
Aqua Square 3 Black 1 Telephone 1
Revolver 2 Fugipve 1 Surveillance 1
Laboratory 2 Algeria 1 Suisse 1
Detonapon 2 Flat 1 Place 1
Spy 2 Evidence 1 Meepng 1
Query 2 Machine Gun 1
Mosque 2
Garage 2 Laboratory
Fribourg
1
1
Fribourg 2 France 1
Cheque 2 Flat 1
Berne 2
Adult 2 Dealer 1
Teal Square 1 Bridge 1
Magnify 1 Berne 1
Guerrilla 1 Arrest 1
Date 1 Acpon 1
Zurich 1
Town
Telephone Box
1
1
Surveillance 1
Red 1
Person (Shaded 1
Oender 1
Number Plate 1
Limousine 1
Hospital Bed 1
Group of People 1
Green 1
Fraud 1
Explosion 1
Envelope 1
Criminal 1
Boy 1
Blue 1
Black 1
Assault Weapon 1
APC 1
Ambulance 1
Algeria 1
Alert 1


Reprsentation dune affaire complexe 271

Types de liens exploits :


Enquteurs (n = 40) Spcialistes (n = 7) Etudiants MAS (n = 10)
28 types de lien 15 types de lien 13 types de lien

1 10 100 1 10 100 1 10 100


Link 36 Link 7 Link 10
Telephone Call 35 Green 2 Telephone 2
Owner 24 Red 2 Locapon 2
Locapon 13 Rle 1 Associate 2
Subscriber 23 Communicap 1 Commodity 1
Associate 13 Teal 1 Subscriber 1
Parpcipant 8 Silver 1 Address 1
A~ending 5 Suspect 1 Red 1
Address 9 Abonnement 1 A~endee 1
Suspect 6 Proprit/ 1 Transacpon 1
Vicpm 9 Relapon 1 Parpcipant 1
Driver 6 Lieu 1 Owner 1
Red 5 Subscriber 1 Employee 1
Employee 7 Lien trace 1
Transacpon 3

Adresse 1
Alias 6

Account 2
Director 3
Black 1
White 1
Meepng 2
Fuchsia 1
Does Not 1
Departure 2
Arrival 1
Witness 1
Green 1
Aqua 1



A ---- B 905 (40) A ---- B 124 (7) A ---- B 254 (10)
A ---> B 195 (37) A ---> B 43 (7) A ---> B 35 (5)
A <--> B 12 (7) A <--> B 0 (0) A <--> B 3 (1)

Trait plein 1052 (40) Trait plein 153 (7) Trait plein 285 (10)
Trait till 60 (25) Trait till 7 (4) Trait till 7 (3)

Simple 1005 (40) Simple 160 (7) Single 283 (10)
Multiple 97 (22) Multiple 6 (2) Multiple 9 (2)
Double 10 (5) Double 1 (1)


272 Annexe 4 : Evaluations prliminaires

M o d i f i c a t i o n d u t y p e d e r e p r s e n t a t i o n
Ce dernier exemple ne porte pas sur la reprsentation relationnelle spcifiquement, mais sur
limpact des choix effectus en matire de visualisation (notamment le type de reprsentation)
sur lanalyse.

C o n t e x t e d v a l u a t i o n

Lors de formations, il a t demand des tudiants de Master76 de dcrire leurs constatations


et de formuler des hypothses sur la base dune reprsentation graphique. Les donnes
reprsentes proviennent dun chantillon de 5914 spams lis la contrefaon horlogre
(courriels collects pendant le mois de janvier 2008). Les donnes sont issues dune banque de
donnes accessible en ligne (http://untroubled.org/spam/, dernier accs le 28 septembre
2010).

La consigne de lexercice est la suivante :

Soit, la rpartition gographique des adresses IP des envoyeurs de spams:

1. Que constatez-vous ?
Formuler des hypothses sur lenvoi des emails et dcrivez en quoi la reprsentation
graphique ci-dessus vous permet de confirmer ou infirmer vos hypothses.

2. Quelles autres informations souhaiteriez-vous avoir disposition pour affiner votre


analyse ?


76
Lexprience a t ralise avec 57 tudiants de Master des Universits de Lausanne et dAix-Marseille.


Modification du type de reprsentation 273

Les trois reprsentations suivantes ont t testes (Les trois graphiques ont t prsents en
niveau de gris) :

Une carte symboles proportionnels

Un histogramme Pays de l'adresse ip de l'envoyeur


1400

1212
1200

1000

800
705

600

400 314
267 252 252
220 218 214 210 209 206 203 191 169
200 145 144 133 126 110 107 107 101 99

0
UNITED STATES

RUSSIAN FEDERATION

MEXICO
UNITED KINGDOM

THAILAND
BRAZIL

ITALY

INDIA
ARGENTINA

AUSTRALIA
SPAIN

KOREA REPUBLIC OF
CHINA

CHILE
TURKEY

NETHERLANDS

COLOMBIA
PERU

POLAND

FRANCE

URUGUAY
GERMANY

Autres

Un diagramme circulaire sectoris

Pays de l'adresse ip de l'envoyeur


UNITED STATES
TURKEY
12%
SPAIN
20% PERU
RUSSIAN FEDERATION
5% NETHERLANDS
ARGENTINA
CHINA
5% BRAZIL
2% COLOMBIA
GERMANY
2%
4% KOREA REPUBLIC OF
2% UNITED KINGDOM
2% THAILAND
4% POLAND
2%
?
2% FRANCE
4% CHILE
2%
URUGUAY
2% ITALY
4%
2% MEXICO
4% INDIA
3% AUSTRALIA
3% 4%
3% 3% 4% Autres


274 Annexe 4 : Evaluations prliminaires

O b j e c t i f s d e l v a l u a t i o n

Lobjectif principal de cette valuation est de prsenter par un exemple, limpact des choix
effectus en termes de reprsentation de linformation sur lanalyse de donnes. La
mthodologie dvaluation consiste poser une question ouverte pour obtenir des rsultats
en termes de comprhension77. Chacune des reprsentations propose un point de vue
diffrent sur les donnes. La carte permet danalyser la distribution spatiale dans son
ensemble. Lhistogramme permet une comparaison de la prvalence par pays. Le diagramme
circulaire permet de comparer la proportion denvois pour chaque pays en regard du nombre
total (pourcentage).

Lvaluation comparative de lefficacit des reprsentations ne constitue pas un objectif de


cette exprience. En effet, lvaluation de lefficacit ncessite la mise en place dune
procdure exprimentale stricte base sur des critres prcis (exactitude, compltude et temps
de rponse). En outre, chaque reprsentation ses propres limitations et des informations
sont volontairement non reprsentes. Sur la carte, lchelle est absente et la variable
quantitative reprsente nest pas dcrite (en loccurrence le nombre demails envoys). Sur les
diagrammes, lensemble des pays dont le nombre demails envoys est infrieur 2% du total
sont regroups. Les adresses ip dont il na pas t possible de dterminer le pays sont
regroupes dans la catgorie ? . Elles ne sont pas reprsentes sur la carte.


77
Cf. Procdures dvaluation, page 64


Modification du type de reprsentation 275

R s u l t a t s

Le tableau ci-dessous rsume les constatations effectues par les tudiants78 :


(nombre d'tudiants) 17 19 21 57

Histogramme

Circulaire
Carte

Total
Observations effectues
Niveau de lecture global 5 14 10 29
La rpartition gographique est trs grande 4 (23.5) 2 (10.5) 5 (23.8) 11 (19.3)
Plusieurs continents 1 (5.3) 3 (14.3) 4 (7.0)
La distribution est relativement uniforme/homogne 5 (26.3) 5 (8.8)
Certaine rgularit pour les autres pays (hors USA) 6 (31.6) 6 (10.5)
Certaine rgularit pour les autres pays (hors USA et Turquie) 1 (4.8) 1 (1.8)
La rpartition gographique n'est pas uniforme 1 (5.9) 1 (1.8)
Trop de pays reprsents 1 (4.8) 1 (1.8)
Niveau de lecture intermdiaire 47 5 3 55
Beaucoup d'envois depuis lEurope 16 (94.1) 16 (28.1)
Peu d'envoi depuis l'Afrique 13 (76.5) 2 (10.5) 15 (26.3)
Beaucoup d'envois depuis lAmrique du Sud 9 (52.9) 9 (15.8)
Beaucoup d'envois depuis lAsie 6 (35.3) 6 (10.5)
7 pays dAmrique Latine et 7 pays europens 1 (5.3) 1 (1.8)
Envois principalement depuis les pays industrialiss 3 (17.6) 2 (10.5) 5 (8.8)
Envois principalement de l'hmisphre nord 1 (4.8) 1 (1.8)
Principalement de pays o la contrefaon est en vente "libre" 1 (4.8) 1 (1.8)
Une grande partie des mails provient de 8 pays 1 (4.8) 1 (1.8)
Niveau de lecture lmentaire 16 38 18 72
Beaucoup d'envois depuis les Etats-Unis 13 (76.5) 17 (89.5) 5 (23.8) 35 (61.4)
Une grande partie des mails provient de pays inconnus 11 (57.9) 3 (14.3) 14 (24.6)
Une colonne un label "?" (absence dinformation) 6 (31.6) 2 (9.5) 8 (14.0)
Peu d'envoi depuis la Chine 1 (5.9) 2 (10.5) 3 (5.3)
Peu d'envoi depuis L'Australie 2 (10.5) 2 (3.5)
Peu d'envoi depuis Le Canada 1 (5.9) 1 (1.8)
Peu d'envoi depuis La Russie 1 (5.9) 1 (1.8)
Les spams proviennent principalement de 2 pays (20% et 12%) 3 (14.3) 3 (5.3)
Beaucoup d'envois depuis Chine (sans certitude) 1 (4.8) 1 (1.8)
Beaucoup d'envois depuis Chine (produit beaucoup de contrefaon) 1 (4.8) 1 (1.8)
20% des envois proviennent d'un pays, peut-tre la chine 1 (4.8) 1 (1.8)
20% des envois proviennent d'un pays, on ne peut pas dire lequel 1 (4.8) 1 (1.8)
La Chine a la plus grande proportion de spams, suivi des USA 1 (4.8) 1 (1.8)
68 57 31 156
Total


78
Les constatations dont le sens est jug similaire sont regroupes, mme si la formulation varie suivant les
tudiants.


276 Annexe 4 : Evaluations prliminaires

De ces rsultats, il ressort que :

1. Le nombre total de constatations est deux fois moins important lorsque le graphique
circulaire est prsent.

Le diagramme ayant t prsent en niveau de gris, un nombre important dtudiants ne sest


pas exprim car ils narrivaient pas faire le lien entre le graphique et la lgende (remarque
crite par les tudiants). Seul un nombre restreint dtudiants sest exprim, en observant que
les catgories taient tries (sur le graphique : dans le sens des aiguilles de la montre depuis
midi et sur la lgende : de haut en bas).

2. Au niveau de lecture global, 58% des tudiants, ayant reu lhistogramme, constatent
que la distribution est relativement uniforme.

Cette observation est probablement engendre par lagrgation de lensemble des pays dont
le taux de prvalence est infrieur 2%. Dix-huit tudiants (13 pour lhistogramme et 5 pour le
diagramme circulaire) ont dclar souhaiter connatre les dtails de la catgorie Autres .

3. Les observations au niveau intermdiaire de lecture, ont t principalement formules


par des tudiants ayant reu la carte.

Dans le cadre de cette analyse, le niveau intermdiaire se dfinit par les observations portant
sur un groupe de pays. Sur les diagrammes, les pays sont tris en fonction du nombre de
courriels envoys. Un classement par zone gographique (par exemple par continent), aurait
pu faciliter une telle lecture du schma (trois tudiants ayant reu lhistogramme ont fait cette
observation).

4. Sur les diagrammes, des observations sont releves sur la forme et non sur le contenu.

Le fait que des pays sont regroups dans une catgorie unique est relev sur les diagrammes.
Ce choix de regroupement est inappropri pour dix-huit tudiants qui ont crit avoir besoin
de ces informations pour sexprimer. Lattention se focalise donc sur un choix de
reprsentation. Huit tudiants ont galement mis en avant la prsence de la catgorie ? et
un tudiant dclare que trop de pays sont reprsents.


Modification du type de reprsentation 277

5. Le diagramme circulaire a engendr des observations formules sur la base dun a


priori.

La catgorie Autres est reprsente par un niveau de gris similaire la catgorie Chine .
Huit tudiants font lobservation que cette catgorie (dont la proportion est la plus grande) est
un pays. Quatre dentre eux mettent lhypothse quil sagit de la Chine. Des commentaires
crits par ces tudiants, il ressort que cette hypothse vient du fait que la Chine est selon eux
le principal producteur de contrefaons.

D i s c u s s i o n

Globalement, les tudiants ont relev de manire trs pertinente que chacun de ces
graphiques offre des possibilits danalyse limites. Sur la carte, il a t relev quil manque
une indication sur la variable quantitative reprsente (prvalence, ratio, etc.). La couleur a t
trs largement plbiscite par les lecteurs du diagramme circulaire, dont la plupart na pas
souhait sexprimer sur les donnes reprsentes. Sur lhistogramme, lagrgation des
donnes en une catgorie Autres a t releve et juge problmatique pour lanalyse. Un
nombre important dtudiants a galement soulign la ncessit de pondrer les rsultats en
fonction soit de la population des pays, soit du nombre dordinateurs disposant dune
connexion Internet.

De cette exprimentation, il ressort que les choix effectus en matire de reprsentation de


linformation influencent fortement les observations quil est possible de faire sur un ensemble
de donnes. Certains choix peuvent galement engendrer des erreurs.

A n n e x e 5 : E v a l u a t i o n d e l a
r e p r s e n t a t i o n d e r e l a t i o n s

I n f l u e n c e d e s v a r i a b l e s l i e s a u x
p a r t i c i p a n t s

N i v e a u d e f o r m a t i o n

Intervalle de confiance 95%


Rponses correctes pour la moyenne
Erreur Borne Borne
Formation N Moyenne Ecart-type Min Max
standard infrieure suprieure
55 21 9 1,2 18,7 23,7 3 35
Apprentissage, CFC
Formation
professionnelle 46 28 8 1,2 25,4 30,1 4 37
(matrise, brevet)
Maturit (gymnasiale 9 25 8 2,8 18,3 31,2 6 31
ou professionnelle)
Universit, EPF,
Haute cole 125 31 4 0,3 30,7 32,0 21 37
spcialise
235 28 8 0,5 27,0 29,0 3 37
Total
-17
F (3, 231) = 31.705, p = 3.3*10 diffrence significative, corrlation de Pearson = 0.509

Intervalle de confiance 95%


Temps de rponse total (sec) pour la moyenne
Erreur Borne Borne
Formation N Moyenne Ecart-type Min Max
standard infrieure suprieure
55 435 274 37 361 509 36 1220
Apprentissage, CFC
Formation
professionnelle 46 505 252 37 430 580 66 1334
(matrise, brevet)
Maturit (gymnasiale 9 631 511 170 238 1024 116 1512
ou professionnelle)
Universit, EPF, Haute 125 588 253 23 543 633 161 1721
cole spcialise
235 538 277 18 502 573 36 1721
Total
F (3, 231) = 4.645, p = 0.0036 diffrence significative, corrlation de Pearson = 0.229


Influence des variables lies aux participants 279

E x p r i e n c e p r o f e s s i o n n e l l e

Intervalle de confiance 95%


Rponses correctes
pour la moyenne
Erreur Borne Borne
Exprience N Moyenne Ecart-type Min Max
standard infrieure suprieure
Etudiants 84 31 4 0,4 30 32 21 37
Employs ESC 33 32 3 0,5 31 33 23 37
Policiers 101 23 9 0,9 22 25 3 36
Les 2 17 3 3 0,7 32 35 27 36
Total 235 28 8 0,5 27 29 3 37
F (3, 231) = 29.955, p = 2.1*10-16 diffrence significative
Intervalle de confiance 95%
Temps de rponse total (sec) pour la moyenne
Erreur Borne Borne
Exprience N Moyenne Ecart-type Min Max
standard infrieure suprieure
Etudiants 84 517 171 19 479 554 161 981
Employs ESC 33 647 235 41 563 730 214 1292
Policiers 101 498 313 31 436 560 36 1512
Les 2 17 714 423 103 496 931 272 1721
Total 235 541 277 18 505 578 36 1721
F (3, 231) = 5.088, p = 0.002 diffrence significative

A g e

Intervalle de confiance 95%


Rponses correctes pour la moyenne
Erreur Borne Borne
Age N Moyenne Ecart-type Min Max
standard infrieure suprieure
16-25 88 30 5 0,5 29 33 12 37
26-35 80 28 8 0,9 26 30 3 37
36-45 53 24 9 1,2 21 26 3 36
46-55 15 26 10 2,5 20 31 4 35
56-65 7 27 10 3,9 17 37 7 34
Total 243 28 8 0,5 27 29 3 37
-5
F (4, 238) = 6.619, p = 4.6*10 diffrence significative, corrlation de Pearson = -0.264
Intervalle de confiance 95%
Temps de rponse total (sec) pour la moyenne
Erreur Borne Borne
Age N Moyenne Ecart-type Min Max
standard infrieure suprieure
16-25 88 496 188 20 456 536 94 981
26-35 80 507 234 26 455 559 36 1199
36-45 53 596 374 51 492 699 66 1721
46-55 15 731 416 107 501 962 59 1512
56-65 7 615 269 102 365 864 198 930
Total 243 540 277 18 504 574 36 1721
F (4, 238) = 3.418, p = 0.010 diffrence significative, corrlation de Pearson = 0.202


280 Annexe 5 : Evaluation de la reprsentation de relations

C o u r s d a n a l y s e C r i m i n e l l e

Intervalle de confiance 95%


Rponses correctes
pour la moyenne
Erreur Borne Borne
Cours N Moyenne Ecart-type Min Max
standard infrieure suprieure
Je n'ai jamais suivi
de cours 114 26 9 0,8 24 27 3 37
J'ai dj suivi un
cours thorique 76 29 6 0,7 28 31 6 37
J'ai dj suivi un
cours thorique et
pratique 53 31 5 0,7 29 32 16 36
Total 243 28 8 0,5 26,91 28,88 3 37
F (2, 240) = 10.618, p = 3.8*10-5 diffrence significative, corrlation de Pearson = 0.277

S c h m a s

Intervalle de confiance 95%


Rponses correctes
pour la moyenne
Erreur Borne Borne
Schmas N Moyenne Ecart-type Min Max
standard infrieure suprieure
Je ne sais pas ce
qu'est un schma
relationnel 60 25 10 1,2 22 27 3 37
J'ai dj vu un
schma relationnel 122 28 7 0,6 27 30 4 37
J'ai dj fait un ou
plusieurs schma(s)
relationnel(s) 61 30 7 0,8 28 32 3 36
Total 243 28 8 0,5 27 29 3 37
F (2, 240) = 8.076, p = 4.0*10-4 diffrence significative, corrlation de Pearson = 0.241


Rsultats dtaills 281

R s u l t a t s d t a i l l s
Question 1 : Le schma ci-dessous reprsente un trafic. Cliquer sur les personnes qui peuvent
avoir t des intermdiaires entre les deux personnes en rouge.

Positions des clics : aires proportionnelles au pourcentage de participants

N = 113

N = 128

+1.6% +2.2%

+22.3% +0.6%

+6.2%

Lensemble des rponses incorrectes ne sont pas reprsentes sur les schmas, lexception
des deux erreurs faites par plus de 2% des participants (identiques sur les deux versions du
schma).


282 Annexe 5 : Evaluation de la reprsentation de relations

Nombre de rponses correctes

100

75.0
80
60.2
60
Pourcentage de
participants 40
19.5
20 8.8 7.8 10.2
3.5 2.7 1.6 5.3 5.5

0
0 1 2 3 4 5

Nombre de rponses fausses

100
81.3
80 71.7

60
Pourcentage de
participants 40
22.1
14.8
20
2.7 0.8 0.8 0.9 1.6 0.9 0.8 0.9 0.9
0
0 1 2 3 4 5 6 8

Tests statistiques sur lexactitude et la compltude


Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 113 4,2 1,2 0,1 3,9 4,4 0 5
2 128 4,5 1,0 0,1 4,4 4,7 1 5
F (1,239) = 5.08, p = 0.025 diffrence significative, corrlation de Pearson = 0.144
Augmentation du taux de rponse complte et correcte de 14.8%
Intervalle de confiance 95%
Rponses fausses
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 113 0,5 1,2 0,1 0,3 0,7 0 8
2 128 0,3 0,8 0,1 0,2 0,4 0 5
F (1,239) = 2.219, p = 0.138 pas de diffrence significative


Rsultats dtaills 283

Pourcentage des pardcipants 100


90
80
70
60
50
40 Schma 1: Rponses compltes et correctes
30 Schma 2: Rponses compltes et correctes
20 Schma 1: Rponses fausses et/ou incompltes
10 Schma 2: Rponses fausses et/ou incompltes
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 51 44 22 3 38 51 14 108
2 80 42 21 2 38 47 9 126
F (1, 129) = 0.212, p = 0.646 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses et/ou incompltes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 62 54 40 5 44 64 9 250
2 48 56 41 6 44 68 13 234
F (1, 75) = 0.092, p = 0.762 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 111) = 2.442, p = 0.121 pas de diffrence significative

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 126) = 6.442, p = 0.012 diffrence significative, corrlation de Pearson = -0.221
Temps de rponse moyen 24.7% plus court pour les rponses compltes et correctes


284 Annexe 5 : Evaluation de la reprsentation de relations

Question 2 : Le schma ci-dessous reprsente le mme trafic. Cliquer sur la personne qui vous
semble avoir vendu bien plus qu'elle n'a achet.

Positions des clics : aires proportionnelles au pourcentage de participants

N = 110

N = 123

-15.5%

+16.2%


Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 0,32 0,47 0,05 0,23 0,41 0 1
2 123 0,48 0,50 0,05 0,39 0,57 0 1
F (1,231) = 6.412, p = 0.012 diffrence significative, corrlation de Pearson = 0.164
Augmentation du taux de rponse correcte de 16.2%


Rsultats dtaills 285

100
90
Pourcentage des pardcipants

80
70
60
50
40 Schma 1: Rponses correctes
30 Schma 2: Rponses correctes
20 Schma 1: Rponses fausses
10 Schma 2: Rponses fausses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 35 89 67 11 66 112 8 310
2 59 58 35 5 48 67 6 205
F (1, 92) = 8.947, p = 0.0036 diffrence significative, corrlation de Pearson = -0.298
Temps de rponse correcte moyen 28.2% plus court avec le schma 2

Intervalle de confiance 95%


Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 75 53 39 4,4 44 62 4 187
2 64 54 37 4,6 45 64 4 219
F (1, 137) = 0.036, p = 0.849 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 108) = 12.731, p = 0.00054 diffrence significative, corrlation de Pearson = 0.325
Temps de rponse moyen 40.4% plus court pour les rponses incompltes et/ou contenant des
erreurs

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 121) = 0.246, p = 0.621 pas de diffrence significative


286 Annexe 5 : Evaluation de la reprsentation de relations

Question 3 : Cliquer sur tous les ronds rouges lis directement et indirectement au carr bleu.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 131

N = 101


Rsultats dtaills 287


Nombre de rponses correctes

100%

80% 64%
62%
60%
Pourcentage de
participants 40%
11% 10% 11%
20% 2% 10%
2% 1% 2% 4% 6% 5% 7%
1% 1% 1%
0%
0 1 2 3 4 5 6 7 8 9 10 11 12 13

Nombre de rponses fausses

100% 92% 94%

80%

60%
Pourcentage de
participants 40%

20%
7% 5% 1%
1%
0%
0 1 2 3


Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 131 12 2 0,2 11 12 3 13
2 101 12 2 0,2 11 12 3 13
F (1, 230) = 0.145, p = 0.703 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 131 0,1 ,4 0,03 0,03 0,15 0 3
2 101 0,1 ,3 0,03 0,01 0,13 0 2
F (1, 230) = 0.257, p = 0.613 pas de diffrence significative


288 Annexe 5 : Evaluation de la reprsentation de relations

100
Pourcentage des pardcipants

90
80
70
60
50 Schma 1: Rponses compltes et correctes
40 Schma 2: Rponses compltes et correctes
30 Schma 1: Rponses fausses et/ou incompltes
20 Schma 2: Rponses fausses et/ou incompltes
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 75 60 25 2,8 54 66 21 181
2 58 55 21 2,8 49 61 27 153
F (1, 131) = 1.605, p = 0.849 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses et/ou incompltes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 56 50 33 4,4 41 59 18 207
2 43 49 35 5,4 38 60 14 189
F (1, 97) = 0.034, p = 0.855 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 129) = 4.023, p = 0.047 diffrence significative, corrlation de Pearson = 0.174
Temps de rponse moyen 16.8% plus court pour les rponses incompltes et/ou contenant des
erreurs

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 99) = 1.212, p = 0.274 pas de diffrence significative


Rsultats dtaills 289

Question 4 : Cliquer sur le rond rouge ayant le plus de liens directs avec des carrs noirs.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 127

N = 101

+8.9%


Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 127 0,77 0,42 0,037 0,70 0,85 0 1
2 101 0,86 0,35 0,035 0,79 0,93 0 1
F (1,226) = 2.973, p = 0.086 effet tendanciel, corrlation de Pearson = 0.114
Augmentation du taux de rponse correcte de 8.9%


290 Annexe 5 : Evaluation de la reprsentation de relations

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses correctes
30
Schma 2: Rponses correctes
20
Schma 1: Rponses fauses
10
Schma 2: Rponses fauses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 98 69 51 5,1 58 79 4 298
2 87 50 31 3,4 43 57 4 223
F (1, 183) = 8.739, p = 0.0035 diffrence significative, corrlation de Pearson = -0.213
Temps de rponse correcte moyen 27.3% plus court avec le schma 2

Intervalle de confiance 95%


Rponses fausses
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 29 63 56 10 42 84 9 298
2 14 51 33 9 32 70 6 121
F (1, 41) = 0.541, p = 0.466 pas de diffrence significative

Schma 1 : diffrence entre les rponses correctes et les autres :


F (1, 125) = 0.291, p = 0.591 pas de diffrence significative

Schma 2 : diffrence entre les rponses correctes et les autres :


F (1, 99) = 0.009, p = 0.924 pas de diffrence significative


Rsultats dtaills 291

Le graphe ci-dessous reprsente un ensemble de communications entre diffrents tlphones.


Les flches indiquent la direction des communications. Les trois questions qui suivent portent
sur ce mme schma.

Question 5 : Cliquer sur tous les tlphones bleus ayant eu des communications avec le
tlphone orange ET le tlphone vert.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 110

N = 107


292 Annexe 5 : Evaluation de la reprsentation de relations

Nombre de rponses correctes

100%
70%
80%
63%
60%
Pourcentage de
40% 34%
participants 28%

20%
1% 2% 3%
0%
0 1 2 3

Nombre de rponses fausses

100% 90%
86%

80%

60%
Pourcentage de
participants 40%

20% 3%
1% 2% 2%
2% 2% 2% 2% 1% 4% 2% 2% 1%
0%
0 1 2 3 4 5 6 7 8


Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 2,7 0,5 0,05 2,6 2,8 1 3
2 107 2,6 0,6 0,06 2,5 2,7 0 3
F (1,215) = 1.854, p = 0.175 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 0,4 1,5 0,15 0,2 0,7 0 8
2 107 0,6 1,6 0,16 0,3 0,9 0 7
F (1,215) = 0.444, p = 0.506 pas de diffrence significative


Rsultats dtaills 293

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses compltes et correctes
30
Schma 2: Rponses compltes et correctes
20
Schma 1: Rponses fausses et/ou incompltes
10
Schma 2: Rponses fausses et/ou incompltes
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 71 66 52 6 53 78 22 367
2 62 59 24 3 52 65 13 141
F (1, 131) = 0.945, p = 0.333 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses et/ou incompltes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 39 52 28 4 42 61 14 155
2 45 54 43 6 41 67 3 199
F (1, 82) = 0.117, p = 0.733 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 108) = 2.452, p = 0.120 pas de diffrence significative

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 105) = 0.421, p = 0.518 pas de diffrence significative


294 Annexe 5 : Evaluation de la reprsentation de relations

Le graphe ci-dessous reprsente un ensemble de communications entre diffrents tlphones.


Les flches indiquent la direction des communications. Les trois questions qui suivent portent
sur ce mme schma.

Question 6 : Cliquer sur le tlphone ayant reu le plus d'appels.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 110

N = 103


Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 0,23 0,42 0,04 0,15 0,31 0 1
2 103 0,17 0,37 0,04 0,09 0,24 0 1
F (1,211) = 1.297, p = 0.256 pas de diffrence significative


Rsultats dtaills 295

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses correctes
30
Schma 2: Rponses correctes
20
Schma 1: Rponses fausses
10 Schma 2: Rponses fausses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 25 110 68 14 82 138 23 279
2 17 153 114 28 94 212 47 427
F (1, 40) = 2.315, p = 0.136 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 85 53 52 6 42 65 3 281
2 86 68 62 7 55 81 4 315
F (1, 169) = 2.791, p = 0.097 effet tendanciel, corrlation de Pearson = 0.127
Temps de rponse correcte moyen 21.6% plus court avec le schma 1

Schma 1 : diffrence entre les rponses correctes et les autres :


F (1, 108) = 19.865, p = 0.00002 diffrence significative, corrlation de Pearson = 0.394
Temps de rponse moyen 51.6% plus court pour les rponses incorrectes

Schma 2 : diffrence entre les rponses correctes et les autres :


F (1, 101) = 19.325, p = 0.00003 diffrence significative, corrlation de Pearson = 0.401
Temps de rponse moyen 55.5% plus court pour les rponses incorrectes


296 Annexe 5 : Evaluation de la reprsentation de relations

Question 7 : Cliquer sur le tlphone qui est en relation avec le plus grand nombre de
tlphones.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 107

N = 101

+13.4%

Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 107 0,76 0,43 0,04 0,67 0,84 0 1
2 101 0,89 0,31 0,03 0,83 0,95 0 1
F (1,206) = 6.526, p = 0.011 diffrence significative, corrlation de Pearson = 0.175
Augmentation du taux de rponse complte et correcte de 13.4%


Rsultats dtaills 297

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses correctes
30
Schma 2: Rponses correctes
20 Schma 1: Rponses fausses
10 Schma 2: Rponses fausses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 81 37 20 2 32 41 4 142
2 90 31 16 2 28 35 5 81
F (1, 169) = 3.674, p = 0.057 diffrence significative, corrlation de Pearson = -0.147
Temps de rponse correcte moyen 14.7% plus court avec le schma 2

Intervalle de confiance 95%


Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 26 23 22 4 14 32 2 114
2 11 36 42 13 7 64 6 151
F (1, 35) = 1.412, p = 0.243 pas de diffrence significative

Schma 1 : diffrence entre les rponses correctes et les autres :


F (1, 106) = 8.263, p = 0.005 diffrence significative, corrlation de Pearson = 0.270
Temps de rponse moyen 36.7% plus court pour les rponses incorrectes

Schma 2 : diffrence entre les rponses correctes et les autres :


F (1, 99) = 0.457, p = 0.501 pas de diffrence significative


298 Annexe 5 : Evaluation de la reprsentation de relations

Question 8 : Cliquer sur le membre du groupe criminel qui est li au plus grand nombre
d'individus en vert.

Positions des clics : aires proportionnelles au pourcentage de participants


N = 112

N = 87


Tests statistiques sur lexactitude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 112 0,90 0,30 0,03 0,85 0,96 0 1
2 87 0,80 0,40 0,04 0,72 0,89 0 1
F (1,197) = 3.861, p = 0.051 diffrence significative, corrlation de Pearson = -0.139


Rsultats dtaills 299

100
90
Pourcentage des pardcipants

80
70
60
50
40 Schma 1: Rponses correctes
30 Schma 2: Rponses correctes
20
Schma 1: Rponses fausses
10
Schma 2: Rponses fausses
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes


Tests statistiques sur le temps de rponse
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 101 57 50 5 48 67 5 336
2 70 58 36 4 49 67 8 191
F (1, 169) = 0.005, p = 0.942 pas de diffrence significative
Intervalle de confiance 95%
Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 11 112 99 30 45 179 23 307
2 17 77 43 10 55 99 2 143
F (1, 26) = 1.648, p = 0.211 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 110) = 9.297, p = 0.003 diffrence significative, corrlation de Pearson = -0.279
Temps de rponse moyen 48.7% plus court pour les rponses correctes

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 85) = 3.627, p = 0.060 effet tendanciel, corrlation de Pearson = -0.202
Temps de rponse moyen 24.9% plus court pour les rponses correctes


300 Annexe 5 : Evaluation de la reprsentation de relations

Ce schma reprsente les relations d'un groupe criminel constitu des quatre individus en
rouge. Il s'agit du mme schma que prcdemment.

Question 9 : Cliquer sur les individus (vert et rouge) qui semblent avoir eu une activit en
Espagne.

Positions des clics : aires proportionnelles au pourcentage de participants
N = 110


N = 92

-30%

+12% +14%

- 25%

+7%
+6%


Rsultats dtaills 301

Nombre de rponses correctes

100%

80%

60%
Pourcentage de 35%
30% 36%
participants 40%
26%
14% 23%
20% 12% 12%
4%
1% 1% 1% 1% 1% 2%
0%
0 1 2 3 4 5 6 7 8

Nombre de rponses fausses

100%

80% 68%
66%

60%
Pourcentage de
participants 40% 32%
20%
20% 4%
1% 2% 1%
2% 1% 1% 1%
0%
0 1 2 3 4 5 6 7 8 9 10 11 12



Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 6,6 1,2 0,1 6,4 6,8 2 8
2 92 6,6 1,7 0,2 6,2 6,9 0 8
F (1,200) = 0.000, p = 0.984 pas de diffrence significative

Intervalle de confiance 95%


Rponses fausses pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 110 0,4 1,1 0,1 0,2 0,6 0 10
2 92 0,9 2,2 0,2 0,5 1,4 0 12
F (1,200) = 4.214, p = 0.041 diffrence significative, corrlation de Pearson = -0.144


302 Annexe 5 : Evaluation de la reprsentation de relations

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses compltes et correctes
30 Schma 2: Rponses compltes et correctes
20 Schma 1: Rponses fausses et/ou incompltes
10 Schma 2: Rponses fausses et/ou incompltes
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240
Temps de rponse en secondes

Tests statistiques sur le temps de rponse
Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 19 40 20 5 30 50 20 96
2 19 56 22 5 45 67 27 98
F (1, 36) = 5.490, p = 0.025 diffrence significative, corrlation de Pearson = -0.364
Temps de rponse correcte moyen 28.6% plus court avec le schma 1

Intervalle de confiance 95%


Rponses fausses et/ou incompltes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 73 41 25 3 36 47 7 132
2 91 48 32 3 41 54 15 208
F (1, 162) = 1.880, p = 0.172 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 108) = 1.218, p = 0.272 pas de diffrence significative

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 90) = 0.041, p = 0.840 pas de diffrence significative




Rsultats dtaills 303

Les carrs rouges reprsentent des marques de photocopieurs.


Les ronds bleus reprsentent des groupes (de photocopieurs qui impriment de la mme
manire). Pour chaque groupe, le nombre de photocopieurs lis une marque particulire est
indiqu par un chiffre.

Question 10 : Cliquer sur les 3 groupes lis avec le plus grand nombre de photocopieurs.

Positions des clics : aires proportionnelles au pourcentage de participants

N = 102

N = 92

+1%

+3.5%

+13.5%







304 Annexe 5 : Evaluation de la reprsentation de relations

Nombre de rponses correctes

100%

80%
66%
53%
60%
Pourcentage de
participants 40%
25%
16% 13% 13%
20% 8%
7%

0%
0 1 2 3

Nombre de rponses fausses

100%

75%
80%
56%
60%
Pourcentage de
participants 40%
25%
13%
20% 11%
8%
6% 7%

0%
0 1 2 3


Tests statistiques sur lexactitude et la compltude
Intervalle de confiance 95%
Rponses correctes
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 102 2,2 1,1 0,1 1,9 2,4 0 3
2 92 2,3 1,1 0,1 2,1 2,6 0 3
F (1,192) = 1.300, p = 0.256 pas de diffrence significative

Intervalle de confiance 95%


Rponses fausses
pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 102 0,8 1,0 0,1 0,5 1,0 0 3
2 92 0,5 0,9 0,1 0,3 0,7 0 3
F (1,192) = 4.132, p = 0.043 diffrence significative, corrlation de Pearson = -0.145


Rsultats dtaills 305

100
90
Pourcentage des pardcipants

80
70
60
50
40
Schma 1: Rponses compltes et correctes
30 Schma 2: Rponses compltes et correctes
20 Schma 1: Rponses fausses et/ou incompltes
10 Schma 2: Rponses fausses et/ou incompltes
0
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 300
Temps de rponse en secondes

Tests statistiques sur le temps de rponse


Intervalle de confiance 95%
Rponses compltes et correctes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 54 136 83 11 113 158 32 450
2 61 114 65 8 97 130 34 434
F (1, 113) = 2.557, p = 0.113 effet tendanciel
Intervalle de confiance 95%
Rponses fausses et/ou incompltes pour la moyenne
Borne
Schma N Moyenne Ecart-type Erreur standard Borne infrieure Min Max
suprieure
1 48 107 109 16 75 138 3 580
2 31 93 81 15 63 123 15 383
F (1, 77) = 0.366, p = 0.547 pas de diffrence significative

Schma 1 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 100) = 2.336, p = 0.130 pas de diffrence significative

Schma 2 : diffrence entre les rponses compltes et correctes et les autres :


F (1, 91) = 1.792, p = 0.184 pas de diffrence significative

S-ar putea să vă placă și