Sunteți pe pagina 1din 48

Institut national des hautes tudes de la scurit et de la justice

TRAVAUX DES AUDITEURS

BIG DATA
Travaux de la 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

ENTRE RISQUE
ET OPPORTUNIT?
Groupe de veille et danalyse

JUILLET 2016
ISSN 2265-447X
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Les Membres du Groupe de Veille et dAnalyse BIG DATA

Les auteurs de ce travail intitul :


BIG DATA Entre risque et opportunit ? sont :

BEDINI Cdric
BENAMARA Guillaume
BENDER Lionel
CHOCHOI Alexia
DOMECQ Xavier
DUPUICH Jean-Philippe
FISLI Salah-Eddine
LAKRAFI Amal Amlia
RODIERE Frdric
TORRISI Christophe

Ce document ne saurait tre interprt comme une position officielle ou officieuse


de linstitut ou des services de ltat. Les opinions et recommandations qui y
sont exprimes nengagent que leurs auteurs. Il est publi sous la responsabilit
ditoriale du directeur de linstitut.

Directeur de la publication M. Cyrille SCHOTT, directeur de lINHESJ

2 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


big data
Entre risque et opportunit ?
Rapport du Groupe de veille et danalyse
19e Session nationale spcialise
2015-2016 Protection des entreprises
et intelligence conomique

Sommaire
INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Rappel du mandat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Analyse et reformulation du sujet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Mthodologie et difficults rencontres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Prambule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
cONNATRE LE MARCHE DU BIG DATA POUR MIEUX EN PROFITER . . . . . . . . . . 8
Le Big Data, une dfinition complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Les 5V du Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Le Big Data, ce nouvel or noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Le Big Data, un march en pleine croissance et diversifi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ANALYSE STRATEGIQUE DU BIG DATA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Analyse par la matrice SWOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Analyse des facteurs PESTEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Cartographie des acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
GARANTIR LES LIBERTES FONDAMENTALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Laffirmation dun principe de protection des donnes personnelles . . . . . . . . . . . . . . . . . . . . . . . . . 16
Les enjeux stratgiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Le droit comme outil de confiance : le RGPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Le droit ne peut anticiper la technologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Vers des solutions techniques danonymisation des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
LES PROMESSES DU BIG DATA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Les usages Big Data : entre performance-production et jouissance-consommation . . . . . . . . 21
Lutilisation du Big Data dans le domaine prdictif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
Le Big Data pour analyser et anticiper les aspects criminels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Se prparer aux nouveaux mtiers induits par le Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
RECOMMANDATIONS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
AXE 1- Librer les potentialits dusage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
AXE 2- Anticiper en misant sur la formation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
AXE 3- Convertir le grand public . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
AXE 4- Faire du droit un outil de valorisation de la technique par la confiance . . . . . . . . . . . . . . . . 30
AXE 5- Investir sur les avances technologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
CONCLUSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
NOTE DE SYNTHSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1 : Infographie reprsentant une cartographie des acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 : 70% des plus grosses entreprises amricaines ont dj achet des donnes externes leur organisation . 40
3 : En 2016, les revenus gnrs par le Big Data travers le monde slvent 38 milliards de dollars . . . . . 41
4 : Au niveau mondial, les principaux acteurs reconnus sur ce march sont les traditionnelles entreprises
issues du secteur des technologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5 : Analyse SWOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6 : Analyse PESTEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7 : Article du journal Le Monde en date du 21 mars 1974, SAFARI ou la chasse aux franais . . . . . . . . . . . 45
8 : La protection europenne des donnes lre numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
9 : Les mtiers porteurs du Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  3


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

INTRODUCTION

Rappel du mandat
La protection des donnes personnelles, telle quelle sest dveloppe en
France puis en Europe, et ses nouvelles approches notamment celle du privacy
by design, du droit loubli... sont-elles une rponse suffisante la domination
amricaine sur le march du Big Data?
Vous tes un Think Tank spcialis sur les enjeux du Big Data.
Un groupement dintrts conomiques du secteur des technologies de
linformation vous demande de raliser une tude :
Quelles actions dintelligence conomique lEurope et la France pourraient-
elles mettre en place pour garantir les liberts fondamentales, tout en soutenant
linnovation et en favorisant un march sur lequel il est impratif de se positionner
en raison de ses perspectives de dveloppement ?
La rflexion sinscrira dans une synergie public priv, garante des meilleures
chances de succs quant aux prconisations formules.

Analyse et reformulation du sujet


Aujourdhui tout le monde saccorde dire que le secteur du numrique est
domin par les GAFA: Google, Amazon, Facebook et Apple. Ces quatre (1) Lexpression fondamentale
Web 2.0 dsigne
gants amricains, tablis dans Silicon Valley, dtiennent eux seuls 80% des lensemble des techniques,
donnes personnelles gnres chaque minute dans le monde. Leur valorisation des fonctionnalits et des
usages qui ont suivi la forme
boursire cumule reprsente plus de 130% de la capitalisation boursire des originelle du web, www
socits cotes sur le march franais du CAC40. On peut donc considrer ou World Wide Web,
caractrise par plus de
quil y a une vritable hgmonie amricaine sur le secteur du numrique. simplicit et dinteractivit.
Lexpression Web 2.0
La digitalisation de notre socit, entame il y a tout juste une dcennie sous utilise en 2003 par Dale
limpulsion du Web 2.01, a fait natre un nouveau paradigme, celui dun monde DOUGHERTY, un cadre de
la socit OReilly Media,
hyper connect, producteur dun nombre infini de donnes. Les volutions et diffuse par Tim OREILLY
technologiques sont telles quelles pourraient permettre aujourdhui lanalyse en 2004 puis consolide
en 2005 avec lexpos de
en temps rel de gigantesques masses de donnes dsignes par le terme de position What Is Web 2.0
Big Data. Le march gnr par lexploitation de ces datas est en pleine sest impose partir de
2007.
croissance et attire forcment toutes les convoitises, celles des entreprises En ligne: http://www.
comme des tats. oreilly.com/pub/a/web2/
archive/what-is-web-20.html
Pour autant, cest un march qui nest pas sans risque car il menace
potentiellement nos liberts individuelles. La divulgation en 2013 de laffaire
PRISM, par exemple, a provoqu un vritable scandale, ne serait-ce que
par lampleur et le niveau de sophistication du programme de surveillance
dvelopp par lagence de scurit amricaine (NSA). La France et lEurope
se sont pourtant mobilises depuis la fin des annes 1970 notamment dun point
de vue rglementaire pour garantir nos liberts fondamentales. Cette approche

4 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

diffrencie et thique du march des donnes est une relle opportunit pour
nos tats par opposition louverture quasi-totale prne et mise en uvre par
les gants amricains.
Cest donc dans ce contexte de concurrence exacerbe au niveau mondial
que les entreprises se sont engages dans une vritable course linnovation
afin dexploiter au mieux cette manne providentielle des donnes.

Mthodologie
et difficults rencontres
La ralisation du prsent rapport de veille et danalyse sest effectue avec
(2) Le Think Tank Big Data fait la volont de notre Think Tank2 dapporter la fois une rponse analytique
tat de prs de neuf mois
dexistence.
la question pose et daboutir la formulation de recommandations simples et
adaptes afin que la France et lEurope puissent clairement se positionner sur
le march du Big Data.
Notre savoir-faire repose sur une quipe pluridisciplinaire compose dingnieurs
aux expertises diverses, de juristes, de chefs dentreprises et consultants, ainsi
que de reprsentants de ltat spcialiss dans les enjeux du numrique et la
sensibilisation des acteurs conomiques.
Si les enjeux du Big Data alimentent nos rflexions quotidiennes, nous disposons
de la particularit dtre dissmins aux quatre coins de lhexagone dont une
bonne part en rgion parisienne. Lun de nos collaborateurs vit et travaille de
manire quasi exclusive en Algrie. Loin dtre anecdotique, ce point de dtail
nous a conduit adopter trs tt des processus de travail distance (utilisation
dune solution de partage dinformation en mode Cloud), en complment de
nos runions mensuelles en prsentiel.
(3) Indpendamment de cette Aprs avoir reformul les attentes de notre commanditaire3, nous nous
reformulation, nous avons
galement demand au sommes attachs rpartir, au regard des comptences de chacun, les
commanditaire de nous pr- diffrents domaines de veille (juridique, business, emploi et formation, usages,
ciser si les termes opportu-
nit et risque devaient tre technologique, acteurs). Les donnes utilises sont issues de sources ouvertes.
considrs au singulier ou Notre veille sest appuye sur les rseaux sociaux, Twitter notamment avec
dun point de vue gnrique
(conception retenue). lexploitation dune liste4 de suivi, mais aussi sur la gestion de flux RSS. Afin
(4) Une cinquantaine de veilleurs dviter lcueil dun ventuel manque de fiabilit, nous avons appuy notre
du domaine ont t suivis. analyse sur la base de documents, issus du monde acadmique, de la
communaut scientifique ou tout simplement de rapports officiels.
La notion dalgorithme utilise par les moteurs de recherche, notamment Google,
lesquels exploitent davantage la popularit des publications, nous a conduit
investir le champ du web profond et exploiter les sources accumules au sein
de notre Think Tank. Le Big Data se situe au cur de toutes les proccupations
et il suffit de formuler une requte simple dans un moteur de recherche pour
comprendre le caractre plthorique de linformation quil gnre. On peut
mme parler dinfobsit.
Toutefois, au fil de nos lectures et de lapprofondissement de notre sujet, nous
avons pris conscience des opportunits induites par la libration des donnes

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  5


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

personnelles mais galement des risques quune gestion non matrise pourrait
faire peser sur notre socit.
Cette recherche bibliographique nous a permis deffectuer une analyse SWOT,
une analyse PESTEL, une infographie, ainsi quune cartographie des acteurs
dans le domaine du Big Data.
Runions, salons et changes, tout au long de notre dmarche exploratoire, ont
favoris notre rflexion. Cest ainsi que nous nous sommes rendus successivement
au FIC5 de Lille, que nous avons rencontr ou interrog en confrence-dbats (5) Forum international de la
diffrents experts6 du sujet. cyberscurit des 25 et 26
janvier 2016 Lille.
Afin de raliser un travail efficace, conforme la commande initiale, il nous (6) Axelle LEMAIRE et Matre
Thibaut DU MANOIR DE
est apparu essentiel de traiter les opportunits induites par le Big Data sous la JUAYE notamment.
forme de promesses tant le sujet est en mouvement permanent. Sagissant des
risques, et compte tenu du fait quils voluent aussi en fonction des contraintes
rglementaires et lgislatives, nous avons pris le parti de les aborder de
manire intgre dans le corps du rapport.
Finalement, il en ressort des recommandations simples et qui mettent en lumire
la ncessit de soutenir linnovation sur les marchs franais et europens en
poursuivant les partenariats entre les sphres publiques et prives.

6 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

PRAMBULE
LHomo sapiens fut le premier manipuler des concepts. Cette capacit lui permit,
daprs certains scientifiques, de supplanter Nandertal, pourtant plus robuste et
a priori mieux adapt aux conditions de vie difficiles de lpoque.
Depuis, lHomme a volu et imagin de nouveaux concepts, de nouvelles doctrines,
ou idologies toujours plus complexes et sophistiqus, fruits dune crativit
dbordante. LHomme cre des normes et thories pour mieux modliser et
matriser le monde rel dans lequel il volue.
Avec la cration et lexpansion dInternet facilites par les nouvelles technologies
de linformation, lHomme saventure dsormais sur un territoire virtuel mais bien rel
quil ne matrise plus tout fait. LHomme devient lhomo numericus cest--dire un
individu ultra connect qui contribue par ce biais (sans en tre forcment conscient)
au dveloppement de lconomie numrique. Nous sommes donc aujourdhui
les principaux acteurs de cette conomie, nos interactions sur la toile et les donnes
que nous y changeons constituent une valeur inestimable tout du moins pour
les entreprises qui auront su les capter et les valoriser, au premier rang desquels les
GAFA (Google, Apple, Facebook, Amazon).
Ces nouvelles pratiques, qui impliquent le recueil et le traitement dinformations
personnelles, ne sont pas trangres au sentiment de mfiance, voire de dfiance,
qui sest dvelopp. Les nom, prnom, ge, profession, gots, prfrences
sexuelles ou politiques, les convictions religieuses et les appartenances syndicales
sont autant dlments dont regorge le web prt livrer tous nos secrets malgr
(7) Lobfuscation est une stratgie tous les efforts dobsfucation7. Lhyper-connectivit inhrente au dveloppement
de protection de la vie prive
qui consiste publier en
de lInternet, des rseaux sociaux et des objets connects pose le dbat, justifi
quantit des informations. ou non, des liberts individuelles.
De cette manire, on tente
de noyer les informations Dans un usage priv, Internet8 incite lutilisateur contribuer enrichir le systme,
existantes que lon souhaite abandonnant, sans vritablement sen rendre compte, ses donnes personnelles.
cacher.
La contrapose professionnelle implique que les entreprises utilisent au quotidien
(8) Internet est ici considr
dans son acception la plus des donnes personnelles pour comprendre et apprhender au mieux leur
large du terme, cest--dire sa environnement et les comportements de leurs clients.
capacit relier les terminaux
informatiques et rapprocher Devant un tel mlange des genres (vie publique-vie prive), ltat doit raffirmer
les hommes.
son double rle de rgulateur dune part et de protecteur des liberts individuelles
dautre part.
Avec lavnement du Big Data, limprieuse ncessit de prserver les liberts
individuelles demeure. Elle ne doit pourtant pas en annihiler les formidables
opportunits qui soffrent aux entreprises et aux tats.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  7


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

CONNATRE LE MARCH
DU BIG DATA POUR
MIEUX EN PROFITER

LE BIG DATA,
UNE DFINITION COMPLEXE
La transformation numrique qui sopre devant nos yeux, lchelle de la
plante entire, doit son succs une matire premire dont la source nest pas
prte de se tarir, et qui constitue dsormais le nouveau ptrole: le Big Data.
Dans un ouvrage rcent9, les journaliste et romancier Christophe LABBE et (9) Marc DUGAIN et Christophe
LABBE. Lhomme nu. La
Marc DUGAIN dcrivent le monde des Big Data comme un monde qui met sous dictature invisible du
cloche les individus, de manire beaucoup plus subtile et indolore. Les donnes numrique, Paris, Plon, 2016.
sempilent sans autre objet que dalimenter des bases vise commerciale, dans
lesquelles les services peuvent piocher discrtion quand un homme connect
devient suspect.
Le 22 Aot 2015, la commission gnrale de terminologie et de nologie sest
saisie de lexpression Big Data pour lui donner une traduction officielle en franais.
On parle ds lors de volumes de donnes structures et non structures,
difficilement grables avec des solutions classiques de stockage et de
traitement. Ces donnes proviennent de sources diverses et sont (pour la
plupart) produites en temps rel.
Le Big Data ne doit pas tre confondu avec des notions connexes qui tutoient tout
autant lunivers des donnes personnelles.
Le cloud computing, par exemple, dsigne des prestations distance, cest--dire
des logiciels et supports de stockage de donnes, lesquels se trouvent physiquement
rpartis dans des Datacenter10 et non pas sur le terminal de lutilisateur. (10) Un data-center (ou centre
de donnes) est un site
Lorsque lon voque le terme de datamining, on fait rfrence lensemble des physique sur lequel se
trouvent regroups des
techniques ayant pour objet lextraction dun savoir partir de grandes quantits quipements constituants
de donnes, par des mthodes automatiques ou semi-automatiques. le systme dinformation
de lentreprise. Il peut
LOpen data matrialise un processus qui consiste en louverture des donnes tre interne ou externe
publiques ou prives en vue de les rendre disponibles lensemble de la lentreprise considre.
population sans restriction juridique, technique ou financire.
Linternet des objets fait rfrence aux objets connects internet qui transmettent
des donnes numriques par le biais de puces radiofrquences (RFID). Ces objets
peuvent communiquer entre eux. On les retrouve dans la grande distribution, dans
les objets du quotidien (podomtres connects, domotique, compteurs lectriques
intelligents), dans les avions, les voitures, dans le monde mdical, etc.
8 INHESJ juillet 2016 Rapport du Groupe de veille et analyse
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LES 5V DU BIG DATA


Pour caractriser le Big Data, on parle de la rgle des 3V qui est devenue par
extension, rgle des 4V, puis rgle des 5V.
La rgle des 3V fait rfrence Volume, Varit, Vitesse.
Sagissant de la notion de Volume, on parle de Big Data au-del de 100To
(traoctets) de donnes non structures. La Varit nous rappelle que la diversit
des donnes est fondamentale pour le Big Data, autorisant ainsi tous les
recoupements et toutes les corrlations imaginables. La vitesse de traitement est
enfin cruciale et propre la notion de Big Data.
Ces trois dimensions supposent que lon soit capable:
De stocker et dexploiter des volumes normes de donnes
(des centaines de To),
Daccder de multiples sources par un rseau performant,
De traiter dans des temps toujours plus courts des volumes considrables
de donnes.
(11) Globalement, le prix dun Ce progrs a t renduGVApossible par leffondrement
Big Data du prix
: Entre risque de stockage11? mais
et opportunit
gigaoctet pour un disque aussi par laccroissement de la performance des rseaux (internet notamment) et
dur est pass denviron
16USD (12,30euros) en des puissances de calcul12.
fvrier 2000 0,10USD
5V du Big Data(0,07euros) en aot 2010. Avec la rgle des 4V: on rajoute la Vracit. Il est indispensable de penser
Analyse des Big Data. vrifier systmatiquement la validit des donnes dentre et de traiter notamment
Quels usages, quels dfis?
actriser le Big Data,
http://www.strategie.gouv. onle cas
parle de la rgle
dobsolescence des Il 3V
des donnes. en vaqui
de la est devenue
fiabilit des rsultats par
obtenus.
des 4V, puis rgle des 5V.
fr/publications/analyse-big-
Avec
data-usages-defis la rgle des 5V: on rajoute la Valeur. Car il ne faut pas oublier que
(12) Rappelons ce titre que
lexploitation des donnes massives reste une source de valeur ajoute pour
es 3V fait rfrence
la thorie de Gordon Volume,
lentreprise. Varit, Vitesse.
MOORE, qui veut que la
de la notion de
puissance des ordinateurs
soit multiplie par deux tous
e de Bigles Data
18 mois, sestau-del
dmontre
exacte pendant plus de
raoctets)30 ansde donnes
(1965-2000).

s. La Varit nous
diversit des donnes
le pour le Big Data,
tous les recoupements
rlations imaginables.
traitement est enfin
re la notion de Big

imensions supposent
able :
r et dexploiter des
normes de donnes
aines de TO),
de multiples sources par un rseau performant,
INHESJ juillet 2016 Rapport du Groupe de veille et analyse  9
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Dans le domaine du Big Data, certaines suites logicielles ont t dveloppes


pour raliser ce traitement de volumes de donnes en masse. On peut citer par
exemple: HADOOP, STORM, Elastic Search, SPARK, ETL (Extract Transform Load),
Mongo DB, Cassandra. Les comptences lies la matrise de ces outils sont
de plus en plus souvent exiges dans les offres demploi dexperts en traitement
des donnes.

LE BIG DATA,
CE NOUVEL OR NOIR
La seconde moiti du XIXe sicle a vu natre lindustrie du ptrole dcoupant
le monde en deux savoir dun ct les pays producteurs et de lautre les
pays consommateurs.
Le XXe sicle consacra le ptrole comme la ressource ultime. La gopolitique
sest construite autour des zones daffluence de lor noir. Lconomie, le business
vit au rythme (des battements) des derricks et du prix du baril. Tout ce qui tourne
autour de cette nergie fossile devient un vritable enjeu. Quelques crises et
guerres plus tard, le dfaut de ptrole aiguise les ides des pays qui sont dpourvus
de cette matire premire et lon imagine pouvoir le remplacer ou tout du moins
lui adjoindre de nouvelles nergies.
La fin des annes 1990 met en exergue un nouveau ptrole, linformation. Celui
qui sait avant les autres possde ds lors un atout stratgique de premier plan.
Laube du XXIe sicle acclre le dveloppement de nouvelles technologies
offrant une nouvelle re linformation en la fragmentant en donnes lmentaires
brutes, disperses et pourtant exploitables, cest lavnement du Big Data.
Lavantage de la donne sur le ptrole est que tout le monde en produit,
individuellement, en organisation, consciemment ou inconsciemment. Cette
multitude de donnes concerne tous les pans de nos vies prives, publiques et
professionnelles. Ces donnes agglomres deviennent des informations qui
sont autant de trsor pour qui sait les manipuler et les comprendre. Ce Big Data
est un vritable El Dorado pour les entreprises et ce quel que soit leur secteur
dactivit. Fini la dpendance une matire premire exclusive et confisque par
un petit nombre. La donne est celui qui la produit ou la collecte. Les entreprises
lont bien compris se mettant en qute de donnes pour leur propre compte
ou pour en faire commerce.
Pour sen convaincre, il suffit danalyser les principaux chiffres lis lconomie du
Big Data. Les pays et/ou les entreprises du monde entier saisissent lopportunit
qui soffre elles dexploiter un ptrole aux sources innombrables et inpuisables.
Les prvisions mondiales saffolent car on prte au Big Data la capacit de crer
une conomie qui lui est propre et dont on fait depuis peu une comptabilit mondiale
et par march. Comme toute conomie, les prvisions de son dveloppement
deviennent autant dindicateurs capitaux.

10 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LE BIG DATA, UN MARCH EN


PLEINE CROISSANCE
ET DIVERSIFI
Une fois nest pas coutume, lorsque lon sintresse lmergence du phnomne
du Big Data, on constate trs rapidement que les tats-Unis tiennent lieu de
prcurseurs. Ils ont su profiter trs vite des travaux de R&D engags par Google,
Apache et Yahoo.
(13) MapReduce est un patron En 2004, Google donne naissance MapReduce13. Un an plus tard, sinspirant
darchitecture de dveloppe-
ment informatique, invent par des travaux de leur principal concurrent, Doug CUTTING et Michael CAFARELLA,
Google, dans lequel sont ef- lpoque employs chez Yahoo, crent Nutch Search Engine, qui deviendra
fectus des calculs parallles,
et souvent distribus, de don- Hadoop14. Le Big Data est n.
nes potentiellement trs volu-
mineuses, typiquement sup- Selon une tude statistique du cabinet IDC Forecast, en date du mois de novembre
rieures en taille 1 traoctet. 2015, la croissance du march global du Big Data serait de lordre de +23,1%
En ligne : https://fr.wikipedia.
org/wiki/MapReduce.
en moyenne et par an. Une tude statistique ralise par Forbes (Cf. annexe 2)
(14) Hadoop est un framework libre
rappelle que 70% des plus grosses entreprises amricaines ont dj achet des
et open source crit en Java donnes externes leur entreprise et que 100% le feront lhorizon 2020.
destin faciliter la cration
dapplications. Il permet aux Comme le dmontre ltude Statista de 2015 (Cf. annexe 3), les revenus gnrs
applications de travailler avec par le Big Data devraient crotre fortement pour atteindre 85 milliards de dollars
des milliers de nuds et des
ptaoctets de donnes. en 2026.
(15) Pierre DELORT, Scnario date, le march mondial du Big Data est estim 38 milliards de dollars dont
une part prpondrante (63%) serait ralise aux tats-Unis.
LEurope nest certes pas en reste, le march tait estim 2,3 milliards deuros
en 2013, la France ayant ralis quant elle 285 millions deuros de revenus en
2014. Le march franais prvoit une croissance de 24%, conforme au niveau
mondial, entre 2014 et 2019.
Au niveau mondial, les principaux acteurs reconnus sur ce march sont les
traditionnelles entreprises technologiques (Cf. annexe 4).

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  11


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

ANALYSE STRATGIQUE
DU BIG DATA

II. ANALYSE STRATEGIQUE DU BIG DA

ANALYSE PAR LA MATRICE


2.1. Analyse par la matrice SWOT
(Cf. A
SWOT Les
(Cf. annexe 5) !
donn
Les forces !
Disponibilit de grands volumes de disp
donnes. des r
Grande varit des donnes dispo- C
nibles (avnement de lIOT aprs prov
celui des rseaux sociaux). par
Ces deux premiers phnomnes nouv
proviennent des nombreux usages offerts
L
par les technologies Web 2.0 et des
les
nouvelles pratiques.
indiv
Les entreprises collectent et conservent phnomnale
les donnes maisdinformations
surtout les clients ou
selon le principe du si cest gr
individus partagent librement une quantit phnomnale dinformations selon le
principe du si cest gratuit, cest que vous tes! le Possibilits
produit. infinies de recoupement de donnes (corr
! Efficacit et rapidit des outils danalyse ( la porte d
Possibilits infinies de recoupement de donnes (corrlations insouponnes)
! Prise en main de la dfinition des traitements par le m
Efficacit et rapidit des outils danalyse ( la porte de lutilisateur mtier)
! Libration de lutilisateur mtier des contraintes des a
Prise en main de la dfinition des traitements par le mtier (crativit libre)
Les progrs technologiques croissants du stockage e
Libration de lutilisateur mtier des contraintes des applications DSI (faisabilit,
cot, dlai)
algorithmes toujours plus puissants, offrent des capa
toujours plus performants. Ces services mis dispositi
Les progrs technologiques croissants du stockage et dulinnovation
librent partage de lamtier.
donne,
croiss aux algorithmes toujours plus puissants, offrent des capacits de traitement
et de corrlations toujours plus performants. !CesLe BigmisData
services permet
disposition des de Comprendre ce
sachants non informaticiens librent linnovation Prvoir ce qui tait imprvisible .
mtier.
 Le Big Data permet de Comprendre ceLexemple qui tait incomprhensible
de Google permet dillustrer cet aspect pr
et Prvoir ce qui tait imprvisible. corrles lui permettant didentifier voire de localiser une
Lexemple de Google permet dillustrer cet Les aspect prdictible grce lafflux
faiblesses dtaill dans Le Big Data,
dinformations corrles lui permettant didentifier voire de localiser une pandmie Que sais-je ?, n4027.
grippale avant lOMS .15 ! Vracit des donnes soumise caution (validit vr
La rgle des 5V prend en compte cette dimension de
12 lon alimente les modlisations. Lobsolescence de la
INHESJ juillet 2016 Rapport du Groupe de veille et analyse
ngligeable. Na-t-on jamais crois sur les rseaux socia
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Les faiblesses
Vracit des donnes soumise caution (validit vrifier: obsolescence).
La rgle des 5V prend en compte cette dimension de la vracit qui est
fondamentale lorsque lon alimente les modlisations. Lobsolescence de la
donne est galement un pige non ngligeable. Na-t-on jamais crois sur les
rseaux sociaux des profils de personnes disparues? Ce phnomne est pris en
considration par les principaux rseaux sociaux.
Organisation dlicate des donnes pour des usages difficiles anticiper
(data architect).
Afin de corrler les donnes entre-elles, il faut les organiser, les structurer. Des
rflexions sur des nouveaux mtiers ou normes prennent forme.
Complexit des algorithmes spcifiques (hors corrlations ou statistiques).
Utilisation dlicate des donnes personnelles (pistes: anonymisation/
profilage).
Difficult pour afficher a priori lusage des donnes personnelles collectes
(dclaration CNIL). Il peut en tre de mme pour dterminer la finalit
du traitement.

Les opportunits
Multiplicit des sources de donnes dans le Cloud.
ce jour toutes les informations sont loin dtre utilises et surtout de nouvelles
applications, objets connects agrgent encore plus dinformations toujours plus
varies et prcises.
Capacit de traitement illimit offerte par le Cloud.
Disponibilit de composants pour constituer un Data Pipeline modulaire ( la
porte du mtier).
Mise disposition par ltat des donnes publiques (Public Data, Open Data).
Cette information a lavantage dtre rpute fiable par sa source et surtout elle
ouvre un accs des informations trs peu prsentes sur la toile.
La dynamique des objets connects favorise linteroprabilit des systmes.
Le nouveau rglement de lUE va faire disparatre lobligation de dclaration
pralable pour la cration de base de donnes incluant des donnes
personnelles. Cela ouvre une nouvelle flexibilit dans les usages.

Les menaces
Risques induits sur la protection de la vie prive des citoyens.
De nombreuses informations sont colliges avec le consentement des intresss
sans pour autant que ceux-ci aient vritablement conscience de la richesse de
la donne offerte ni du spectre dapplication qui en dcoule.
Prdictibilit des comportements individuels si anonymat non respect.
Orwellisation (1984) de la socit (drive Big Brother).
Utilisation du Big Data des fins malveillantes (manipulation de lopinion,
contrle totalitaire).
Le film Data Gueule (Big Data: donnes, donnes, donnez-moi ! #DATAGUEULE 15)
dmontre les drives possibles.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  13


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

GVA Big Data : Entre risque et opportunit ?


GVA Big Data : Entre risque et opportunit ?

ANALYSE
alyse des facteurs PESTEL
2.2. Analyse des facteurs PESTEL
6-spage 46) DES FACTEURS PESTEL
(Cf. Annexe n6-spage 46)
yse des facteurs(Cf. annexepolitiques
6)
PESTEL - Analyse des facteurs politiques
Data, les GAFA jouent dune vritable influence auprs des politiques. Les
Avec
nent le BigPESTEL
offrent Data,
de les GAFAdes
- Analyse
nombreuses jouent
facteursdune
perspectives. vritable influence auprs des politiques. Les
politiques
nnes quils dtiennent
Avec le Bigoffrent
Data, les de nombreuses
GAFA perspectives.
jouent dune vritable influence auprs des politiques.
ont a t gre la campagne prsidentielle dObama, et dans une moindre
La manireLesdont
donnes quils dtiennent offrent de nombreuses perspectives.
a t gre la campagne prsidentielle dObama, et dans une moindre
ande, en constituent des exemples concrets.
sure celle de Hollande,
La manire en constituent
dont a t gre lades exemples
campagne concrets.
prsidentielle dObama, et dans une
moindre mesure
nalyse des facteurs conomiques celle de Hollande, en constituent des exemples concrets.
PESTEL - Analyse des facteurs conomiques
masses dePESTEL donnes- Analyseconstitue
des facteurs un conomiques
vritable enjeu. Au-del des GAFA, de
Lanalyse des masses de donnes constitue un vritable enjeu. Au-del des GAFA, de
ient le jour commedescelui de Data Brokers (courtier en donnes). Une chaine
uveaux mtiersLanalyse masses
voient le jour de donnes
comme constitue
celui un vritable
de Data enjeu. Au-del
Brokers des GAFA,
(courtier en donnes). Une chaine
tre producteurs, stockeurs,
de nouveaux courtiers,
mtiers voient le jour commeanalyseurs et exploiteurs
celui de Data Brokers (courtier en des donnes de
valeurs se cre entre producteurs, stockeurs, courtiers, analyseurs et exploiteurs des donnes de
donnes). Une chane de valeurs se cre entre producteurs, stockeurs, courtiers,
sse. analyseurs et exploiteurs des donnes de masse.
s, le leader surtats-Unis,
Aux Etats-Unis,
Aux ce march
le leader est
sursur
le leader Acxiom
cecemarch (Socit
estAcxiom
march est Acxiom texane
(Socit
(Socit texane qui qui exploite
texane qui
exploite les
les exploite lesdonnes
donnes
ersonnes avec un
donnes CA
de 700de 1,1
millionsmilliards
de personnes de
avec dollars).
un CA
700 Millions de personnes avec un CA de 1,1 milliards de dollars). de 1,1 milliards de dollars).
nalyse
PESTELdes -facteurs
Analyse des socitaux
facteurs socitaux
PESTEL - Analyse des facteurs socitaux
analyse du LaBig
La finesse danalyse
finesseData dupermet
danalyse Big Data
du Big Datapermet
permet
ances ou les comportements
didentifier les tendances
dentifier les tendances ou les comportements ou les comporte-
e des
is aussiindividus.
ments mais
le profilage Cela
des
aussioffre
individus. des
le profilage
Cela
des individus.
offre des
Cela offre des possibilits de proposition de
sition de
ssibilits de services
proposition oudeproduits
services ou produits services ou produits
sur mesure mais ga-
galement une
mesure maislement possibilit
galement
une possibilit de
unede possibilit
procder dede la
ure et de la discrimination.
cder de la censure et de la discrimination.
censure et de la discrimination.

habitudes Les nouvelles


des usagers habitudes
hyper des usagers hyper
Les nouvelles habitudes des usagers hyper
connects et du Web2.0 gnrent une trs
2.0 gnrent
nnects et du Web2.0 une trs grande
gnrententre
grande permabilit unelestrs grande
vies publiques
es vies publiques
mabilit entre les vies
et prives. etlepubliques
Tout prives.
monde na pas et conscience
prives.
pasle conscience
ut monde na si que
que pas sicestcest
conscience
cest gratuit, que
que lon estsipeut-tre
cest
est peut-tre
tuit, le produit
cest que lonleest (ex:
produit
peut-treGoogle,
le Facebook,
(Ex: etc.).
produit (Ex:
c.)
ogle, Facebook,Laetc.)notion de cyber-thique tout comme
larsenal rglementaire rattrapent peu peu
cyber-thique tout
La notion lesdepratiques comme
cyber-thique
contestes. tout comme
senalrattrapent
ire rglementaire rattrapent
peu peu peu
les peu les
PESTEL
tiques contestes. - Analyse des facteurs techniques
Si les puces RFID ont rvolutionn la gestion des stocks, le Big Data optimise et
PESTEL
nalyse des -facteurs
Analyse
dmultiplie des facteurs
techniques
la puissance techniques
de croisement des donnes. Les principales raisons en sont:
FIDSiont
les puces RFID
rvolutionn
ont rvolutionn
La mmoire la
des gestion la
des
ordinateurs sansgestion ou des
stocks,
limites stocks,
le
presque. Big le Big Data
Data optimise
optimise et etdmultiplie
dmultiplie
puissance
ement des de croisement des
Lesdonnes.
Les capacits
donnes. de stockageLes
principales dansprincipales
leraisons
Cloud. raisons
en sont en: sont :
La collecte des donnes facilite par des supports de flux toujours plus
La mmoire des
ordinateurs
es ordinateurs
sans
puissants (fibre, 4Gsans
limites limites
ou- cf.presque
) ou presque
Plan numrique 2025.
Les14
capacits
stockage
de dansde stockage
le Cloud dans le Cloud INHESJ juillet 2016 Rapport du Groupe de veille et analyse
La collecte des donnes facilite par des supports de flux toujours plus puissants (fibre, 4G
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

PESTEL - Analyse des facteurs environnementaux


Les facteurs environnementaux du Big Data se traduisent, lheure actuelle, dans:
Le secteur du transport, avec la constitution de communauts o le partage
de donnes sorganise. Le comportement du voyageur est dsormais trac
en temps rel et les initiatives de co-voiturages et autres optimisations (cartes
intelligentes par exemple) sont proposes.
Le secteur de la distribution et des produits de grande consommation (Meilleure
connaissance client). Dveloppement des entreprises dites Pure player, qui
exercent leur activit sur Internet uniquement.
Le secteur de lnergie o La donne est utilise pourGVA Big Data
assurer une: meilleure
Entre risque et opportunit ?
matrise de la demande dnergie (eau, gaz, lectricit, etc.).
PESTEL - Analyse des facteurs environnementaux
PESTEL - Analyse des facteurs lgislatifs
Les facteurs environnementaux du Big Data se traduisent, lheure actuelle, dans :
La dfinition des donnes personnelles apparat comme une question fondamentale.
Le secteur du transport, avec la constitution de communauts o le partage de donnes
Elle conditionne
s'organise. la loi. Sonduinterprtation
Le comportement voyageur estdiverge selon lestrac
dsormais pays,en
lestemps
continents,
rel ceet les initiatives
qui constitue
de co-voiturages et autres
la foisoptimisations
un problme et(cartes
une opportunit conomique.
intelligentes Sur unsont
par exemple) planproposes.
Le secteurjuridique
dedesla notions essentielles
distribution etcomme peuvent ltre
des produits de legrande
consentement, la finalit
consommation (Meilleure
ou la proportionnalit
connaissance doivent tre prcises
client). Dveloppement pour les dites
des entreprises donnes du Big
Pure Data., qui exercent leur
player
activitLe
sur Internet
danger du Biguniquement.
Data? Devenir trop intrusif dans le domaine de la vie prive.
Le secteur de lnergie o La donne est utilise pour assurer une meilleure matrise de la
demande Certains pensent
dnergie quegaz,
(eau, la frontire entreetc.)
lectricit, anonymisation et donnes personnelles est
trs lgre et quil y a un risque de re-identification dans les donnes anonymes.
PESTEL - Analyse des facteurs lgislatifs
Le Privacy by design apporte une relle solution aux enjeux lgislatifs et
La dfinition des donnes personnelles apparat comme une question fondamentale. Elle
conditionne larglementaires.
loi. Son interprtation diverge selon les pays, les continents, ce qui constitue la fois
un problme et une opportunit conomique. Sur un plan juridique des notions essentielles comme
peuvent ltre le consentement, la finalit ou la proportionnalit doivent tre prcises pour les
donnes du Big Data.
Le danger du Big Data ? Devenir trop intrusif dans le domaine de la vie prive.

CARTOGRAPHIE DES ACTEURS


Certains pensent que la frontire entre anonymisation et donnes personnelles est trs lgre
et quil y a un risque de re-identification dans les donnes anonymes.
Le Privacy by design apporte une relle solution aux enjeux lgislatifs et rglementaires.
Les cartes heuristiques constituent sans nul doute un excellent moyen de faire
surgir des ides par la possibilit offerte de disposer dune vue densemble.
2.3. Cartographie
Si nous des acteurs
en avons parfaitement exploit les ressources, nous avons privilgi la
restitution de notre travail de rflexion
Les cartes heuristiques constituent soussans
la forme
nul dune
douteinfographie (Cf. annexe
un excellent moyen 1) de faire
surgir des
quiides partlcharge
peut tre la possibilit offerte de
en scannant disposer
le flash code dune vue densemble. Si nous en
ci-dessous.
avons parfaitement exploit les ressources, nous avons privilgi la restitution de notre
travail de rflexion sous la forme dune infographie (Cf. Annexe n1-page 41) qui peut
tre tlcharge en scannant le flash code ci-dessous.
Tlchargez notre infographie

Tlchargez notre infographie

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  15


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LAFFIRMATION DUN
PRINCIPE DE PROTECTION DES
DONNES PERSONNELLES
En 1974, la France lance le projet gouvernemental SAFARI16 qui vise identifier (16) Du nom de SAFARI pour
systme automatis pour les
chaque citoyen par un numro et interconnecter, par le truchement de ce numro, fichiers administratifs et le
tous les fichiers de ladministration. Cela suscite un vif moi dans lopinion publique. rpertoire des individus. (Cf.
annexe 7).
La presse titre: SAFARI: La chasse au franais. (17) Loi n78-17 du 6
Il en rsulte quatre ans plus tard, la loi17 du 6 janvier 1978 relative linformatique janvier 1978 relative
linformatique, aux fichiers et
aux fichiers et aux liberts qui institue une autorit administrative indpendante aux liberts.
franaise, garante de la protection des donnes caractre personnel: la CNIL18. (18) Commission nationale de
linformatique et des liberts.
En 1985, la Convention dite19108 est le premier instrument international (19) Convention pour la
contraignant qui a pour objet de protger les personnes contre lusage abusif du protection des personnes
traitement automatis des donnes caractre personnel. Elle rglemente les flux lgard du traitement
automatis des donnes
transfrontaliers des donnes et proscrit, entre autres, le traitement des donnes caractre personnel. Son
sensibles20 relatives lorigine raciale, aux opinions politiques, la sant, la entre en vigueur seffectue
le 01/10/85.
religion et la vie sexuelle.
(20) Google annonce
En 1995, une directive europennes21 reprend les principes de la loi franaise aujourdhui, dans ses
conditions dutilisation, la
de 1978. Larticle 29 de cette directive cre un groupe de travail protection de ces mmes
europen (G29) sur la protection des donnes, qui rassemble lquivalent des donnes sensibles.
CNIL lchelle europenne. (21) La directive 95/46/CE du
24 octobre 1995. Elle est
Le G29 ngocia avec les Amricains le Safe Harbor visant amliorer la rforme et transpose en
droit franais par la loi du
protection des donnes personnelles des rsidents de lUnion europenne traites 6 aot 2004 sur lconomie
aux tats-Unis. En effet, le Privacy Act en vigueur aux tats-Unis depuis 1974 numrique.
naccordait cette protection, par ailleurs juge infrieure celle tablie dans lUE,
quaux seuls ressortissants amricains.
Le principe de la protection des donnes personnelles se trouve rsum dans la
Charte des droits fondamentaux de lUnion europenne en son article 8 :
1- Toute personne a droit la protection des donnes caractre personnel
la concernant.
2- Ces donnes doivent tre traites loyalement, des fins dtermines et sur
la base du consentement de la personne concerne ou en vertu dun autre
fondement lgitime prvu par la loi. Toute personne a le droit daccder aux
donnes collectes la concernant et den obtenir la rectification.
3- Le respect de ces rgles est soumis au contrle dune autorit indpendante.

LES ENJEUX STRATGIQUES


Le Big Data se positionne au carrefour de trois volonts contradictoires.
Dune part, lentreprise qui veut accder au maximum de donnes personnelles
pour les valoriser en amliorant son offre de produits et services. Dautre part,

16 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

ltat, ou le rgulateur, qui entend conserver ses prrogatives en matire de


liberts publiques et de sret publique en encadrant lutilisation de ces donnes.
Enfin, lutilisateur final/consommateur qui veut bnficier de services plus pertinents
(22) Donne caractre personnel: tout en gardant le contrle de ses donnes caractre personnel22,
toute information relative une
personne physique identifie En 1978, la cible de la loi tait la puissance publique (administrations ou oprateurs
ou qui peut tre identifie,
directement ou indirectement, conomiques dtat). Aujourdhui, la dtention de la donne sest vulgarise
par rfrence un numro entre tous les utilisateurs finaux qui la consomment autant quils la crent, avec
didentification ou un ou
plusieurs lments qui lui sont
pour corollaire une collecte aveugle et massive par les entreprises, qui dans le
propres. secteur des nouvelles technologies chappaient la loi europenne.
Cette collecte constitue le cur des liberts individuelles de demain.
Lenjeu est dassurer la confiance des citoyens/consommateurs autant que la
scurit juridique des entreprises afin de stimuler linnovation et le dveloppement
futur du march du numrique.
Pour les tats de lUE, lenjeu est de conserver la souverainet sur les donnes de
leurs nationaux et de garantir leurs citoyens leffectivit de leurs liberts publiques
tant vis--vis dentreprises nationales ou trangres que vis--vis dtats tiers lUE.

FOCUS sur les rapports UE/USA : le cas du Safe Harbor


En 2001, les tats-Unis dAmrique et la Commission europenne ngocient
des principes dchanges et de protection des donnes: le Safe Harbor
qui encadre la faon dont les entreprises amricaines peuvent transmettre vers
(23) Le dpartement du commerce les tats-Unis les donnes23 des citoyens europens qui utilisent leurs services.
amricain tablit une liste des
quelques 4500 entreprises En 2011, un autrichien, activiste et figure de la protection des donnes
qui adhrent au principe du
Safe Harbor. personnelles, Maximilian SCHREMS demande Facebook une copie de
toutes les donnes que lentreprise dtient sur lui. Il obtient un CD-ROM
contenant 1200 pages de ses changes sur Facebook, de ses messages
effacs, ainsi que la liste de ses amis accepts ou refuss sur le rseau social.
Il lance alors le site Europe versus Facebook et dpose avec dautres
adhrents 22 plaintes lencontre de Facebook auprs de lautorit de
protection de la vie prive irlandaise (sige europen de la socit Facebook).
En 2014, faisant suite aux rvlations dEdward SNOWDEN, Maximilian
SCHREMS dpose plainte contre Facebook mais aussi contre Yahoo, Apple,
Skype et Microsoft. Il est suivi par 25 000 personnes et lance une action
collective contre Facebook quil accuse denfreindre les dispositions du Safe
Harbor et les rgles europennes de protection des donnes personnelles.
Le 2 fvrier 2015, la Commission europenne annonce avoir conclu un accord
cadre de principe avec les tats-Unis pour une nouvelle rglementation
de transfert des donnes personnelles: le Privacy Shield ou bouclier pour la
protection de la vie prive.
En octobre 2015, la cour de justice Europenne dnonce le Safe Harbor, ce
qui entrane un vide juridique. Des contrats sont alors tablis au cas par cas
pour le transfert des donnes personnelles, ceci dans lattente du rsultat des
ngociations du Privacy Shield entre Europe et tats-Unis (accord finalement
conclu en fvrier 2016).

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  17


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Droit loubli: la mmoire des hommes


lpreuve de la mmoire numrique
La reconnaissance dun droit loubli sous-entend la possibilit offerte une
personne de retirer du Web des informations publiques qui la concernent et dont
elle souhaite ne plus permettre la consultation. Indpendamment du paradoxe
que cela soulve lheure o lexposition de soi est presque rendue au rang
de normalit, la mise en application dun tel droit parat presque utopique tant le
stockage et la rplication des donnes caractrisent le numrique aujourdhui.
Si lon ajoute cela le fait que la mmoire des hommes qui alimente cette mmoire
numrique constitue une source de profit pour ceux qui en exploitent la substance,
on comprend aisment la difficult lgifrer.
En mai 2009, un rapport parlementaire prconisait dans sa recommandation
n14, de Rflchir la cration dun droit lhtronymat et dun droit loubli.
La Cour europenne de Justice dans son arrt du 13 mai 2014 dbouta la socit
Google en estimant que lexploitant dun moteur de recherche sur internet est
responsable du traitement des donnes personnelles apparaissant sur ses pages.
Cette dcision ouvre, pour les particuliers, la possibilit de suppression des liens
vers les pages internet comportant des donnes personnelles.
Laffaire commence en 2010, lespagnol Mario COSTEJA GONZALEZ tente
en vain de faire retirer du moteur de recherche une archive dun quotidien
espagnol. Cette archive retranscrit la vente aux enchres dun bien immobilier
fin de recouvrer une dette de scurit sociale de son pouse. Exerant lactivit
de consultant il estime que cette archive indexe par Google porte prjudice
ses activits. Il saisit alors lautorit espagnole de protection des donnes qui lui
donne raison. Google fait valoir son droit de recours et porte laffaire auprs de la (24) La rvision portait sur
deux textes lgislatifs: un
Cour de Justice europenne qui donne raison Mario COSTEJA. rglement gnral sur le
traitement des donnes
Depuis cette dcision Google met disposition un formulaire de droit loubli . personnelles dans lUE et
une directive sur les donnes
Selon ltude du cabinet Rputation VIP, Google a reu entre mai 2014 et traites par les autorits
mai 2015, 249509 demandes de suppressions de lien de son moteur de policires et judiciaires
recherche. Si la procdure propose fonctionne, il faut souligner cependant que qui forment ensemble le
paquet sur la protection des
trois demandes de drfrencements sur quatre restent refuses par Google donnes.
qui sinstaure la fois comme juge et partie. La directive sur la protection
des donnes couvre le
traitement des donnes
par le secteur de la police
et de la justice pnale.
Elle vise assurer que les

LE DROIT COMME OUTIL donnes des victimes, des


tmoins et des suspects
de crimes soient dment

DE CONFIANCE: LE RGPD protges dans le cadre


dune enqute pnale ou
dune action dapplication
de la loi et, en mme temps,
harmoniser les lgislations
Le Parlement europen a finalis plus de quatre ans de ngociations en adoptant pour faciliter la coopration
par vote en assemble plnire le jeudi 14 avril, le texte24 dun rglement gnral transfrontalire de la police
ou des procureurs dans la
sur la protection du traitement des donnes personnelles (RGPD) dans lUnion lutte contre la criminalit et le
europenne (UE), dont les dispositions sont directement applicables dans tous les terrorisme travers lEurope.
tats-membres partir du 24 mai 2018 minuit (ou le 25 mai 2018 00h00). Les tats-membres auront
galement deux ans pour
Le rglement remplace la directive de 1995 sur la protection des donnes de lUE transposer les dispositions
de la directive dans leur
alors quInternet nen tait encore qu ses dbuts. Il transforme le patchwork actuel lgislation nationale.

18 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

des lgislations nationales en un ensemble unique de rgles en vue de donner


aux citoyens plus de contrle sur leurs propres informations prives dans un
monde numrique fait de tlphones intelligents, de mdias sociaux, de services
bancaires sur Internet et de transferts mondiaux.
Il vise crer la clart juridique pour les entreprises afin de stimuler linnovation
et le dveloppement futur du march unique du numrique, mais galement
renforcer la confiance en fournissant un niveau lev de protection pour tous les
citoyens de lUE, quelles que soient les circonstances dans lesquelles leurs donnes
personnelles sont traites, sauf si elles le sont des fins dapplication de la loi (ce
cas est couvert par la directive).
Le RGPD (Cf. annexe 8) offre lUE un outil dinfluence conomique et de
souverainet (soft power), puisquil sapplique galement aux entreprises hors
Europe ds lors quelles traitent des donnes caractre personnel des citoyens/
consommateurs de lUE.
Parmi les 25 changements importants du Rglement, les plus notables sont dabord
linternational, laffirmation de leffet extraterritorial de la loi (article 3) et la
mention expresse quun transfert de donnes hors UE ne peut tre impos par les
lois et rglements dun pays tiers lUE.
Il institue de nouvelles rgles concernant le transfert de donnes hors UE (article 44)
qui prvoient la possibilit de se fonder sur un code de conduite (Binding
Corporate Rules) par secteur dactivit contribuant lapplication du Rglement
ou sur un label/certificat. Le transfert de donnes vers des tats tiers ne ncessite
plus dautorisation de transfert par la CNIL mais exige la signature dun contrat de
transfert de donnes.
Au plan interne, le Rglement bascule vers une logique de protection prventive
et danticipation, travers lAccountability cest--dire la fin des formalits
pralables mais lobligation de documenter le respect du Rglement (article 5.2,
chapitre IV), puis les exigences de respect dune analyse dimpact relative la
protection des donnes (PIA) (article 35); le standard Privacy by Design, Privacy
by Default (article 25) ; la dsignation dun dlgu la protection des donnes
DPO (article 37 et s.); un registre des traitements obligatoire (article 30) dans
toutes les entreprises de plus de 250 salaris ; la promotion des codes de conduite
(article 40) ou des procdures de certification et de labellisation (article 42).
Il renforce en outre le contrle a posteriori en instituant le principe de notification des
failles de scurit dans les 72h (articles 33 et 34) et sappuie sur une dissuasion
raliste en prvoyant des amendes proportionnes au chiffre daffaires mondial
de lentreprise fautive.

LE DROIT NE PEUT ANTICIPER


LA TECHNOLOGIE
Le Big Data repose sur une technologie en volution permanente (puissance
de calcul, capacit de stockage, algorithme danalyse) et une innovation des
usages permanente (objets connects et/ou internet des objets, applications
intelligentes et personnalises, etc.). Il est donc volutif, mouvant, complexe, ce

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  19


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

que le droit embrasse difficilement puisque son essence est de dfinir une rgle stable,
prenne donc prvisible par et pour le sujet de droit.
Dans ce contexte, si la donne est le nouveau carburant de lconomie, le droit est
ncessairement bouscul, notamment au regard des donnes caractre personnel
qui, travers lunimdia du numrique (multimdia des usages ou des appareils
(devices) mais unit du langage machine), recouvrent en ralit la quasi-totalit de
lactivit et de la personne humaine.
En outre sajoute une catgorie particulire des donnes caractre personnel,
les donnes sensibles cest--dire traduisant un choix/appartenance philosophique,
religieux, politique, une orientation sexuelle ou des donnes relatives la sant.
Ds lors, le premier principe respecter (et donc la premire problmatique) dun
projet Big Data est celui du respect de la finalit ou plus exactement de limitation de
finalit des donnes collectes.
Se pose ensuite le problme de la pertinence des donnes, puisque par hypothse,
aucune donne nest inutile au traitement lorsquil sagit de dresser un profil, mme si lon
ne sait pas lavance ce quelle va rvler, de sorte que toutes les donnes non sensibles
peuvent a priori tre collectes dans le cadre dun tel projet
Corrlativement, si linformation est capte dans le seul but de profiler, elle doit tre
qualifie de donne personnelle.
Enfin se posent les problmes dexactitudes et de qualits des donnes, notamment au
regard dune duplication linfini de linformation et de sa conservation sans rapport
avec les volutions dune vie dhomme.
Ainsi, le Prpos fdral la Protection des Donnes et la Transparence de
la Confdration Helvtique (PFPDT) note au sujet du Big Data lexigence de
lexactitude des donnes constitue une difficult supplmentaire: les algorithmes
appliqus aux donnes massives analysent de grande masses de donnes de manire
autonome, automatise, la recherche notamment de corrlations/...ces procdures
danalyse crent de nouvelles informations lies des personnes, sans quil soit
possible de les qualifier dexactes ou de fausses, puisquelles ne constituent que des
probabilits ou des interprtations.

VERS DES SOLUTIONS TECHNIQUES


DANONYMISATION DES DONNES
La question de la collecte massive de donnes par les entreprises pose invitablement
la question de la protection des donnes personnelles.
Pour autant, des solutions techniques sont dores et dj avances pour pallier les
problmes de confidentialit. Il sagit notamment du chiffrement homomorphe, lequel
devrait autoriser trs prochainement le traitement des donnes chiffres sans ncessit
de les dchiffrer au pralable.
Par ailleurs, sagissant de traitements statistiques, on notera quil nest pas utile de
chercher identifier prcisment lutilisateur. Bien souvent, un identifiant anonyme est
suffisant pour conserver les informations le concernant.
Par exemple, pour lanalyse de donnes statistiques, lentreprise na pas besoin
didentifier prcisment son client. Il suffira par exemple de le dsigner par:
UTIL12456, peu importe quil se nomme Pierre Dupont.

20 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LES PROMESSES
DU BIG DATA

LES USAGES BIG DATA : ENTRE


PERFORMANCE-PRODUCTION ET
JOUISSANCE-CONSOMMATION
La valeur sociale ou motionnelle doit tre considre en plus de la valeur
dusage dun produit, ou la qualit du service rendu en vue du dveloppement
de nouvelles offres de service. La frontire entre le ludique et lutile sestompe.
Culture part entire, le Big Data doit coller aux usages afin de rpondre aux
tendances socitales de fond.

Big Data
et objets connects
LInternet des objets occupe une place centrale, la fois outil au service des
utilisateurs (paiement invisible, domotique) et collecteur de donnes (machines
agricoles, drones, compteurs intelligents).
Les objets connects revtent une ralit trs large dapplications ouvrant la voie
de nouveaux Business Models. Loffre est trs en avance sur les usages. En effet,
lexplosion des usages est facilite par lre de lInternet tout connect.
Les cosystmes slargissent pour apprhender un march plus large ou apporter
des solutions un modle socital. Les rpercussions de lInternet des objets sont
plus tangibles dans lautomobile comme en tmoignent lindustrie 4.0 (technologies
connectes et de modlisation) et le dveloppement de nouvelles offres de
services (voiture connecte). Les services de la ville reprsentent, quant eux, des
cas trs concrets o se croisent les problmatiques dintrt gnral, de confiance
et de rgulation. Ils rpondent au triptyque scurit, efficacit et qualit.
Le systme de sant soriente sur une mdecine prventive (pidmiologie) et
prdictive. Les mtiers de lassurance tendent individualiser le risque de lassur.
Les villes sont impactes par les attentes des citoyens/usagers en matire de
bien-tre, de qualit de vie et de dveloppement durable. La valeur des services
sen trouve par ailleurs dmultiplie notamment dans le domaine des transports
qui intgre dans son environnement des applications mobiles (Blablacar, Autolib,
Faciligo), des rseaux sociaux et des infrastructures urbaines.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  21


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Big Data et publicit


digitale/marketing
Une des particularits de lusage du Big Data dans la publicit digitale est de pouvoir
utiliser la donne afin de cibler efficacement les utilisateurs par diverses approches.
Le concept du SoLoMo est fond sur les donnes issues des objets connects.
Les donnes rcupres qui sinscrivent dans une sphre gographique
proximit du consommateur permettent de fournir des publicits cibles localement,
en fonction des profils et affichables sur diffrents mdias (tels les rseaux sociaux,
idals pour le multi canal et plateforme) ou encore les applications mobiles (ex:
API Pinpoint).
Le Real Time Marketing (RTM) propose du contenu en temps rel au consommateur.
Le RTM utilise du contenu issu de sites tiers, comme Google, Facebook etc...
Le pr-targeting permet de cibler des utilisateurs nayant mme pas visit le site en
identifiant un profil data type de visiteur et ciblant les utilisateurs correspondant
ce mme profil type. Grce au pr-targeting, il est ainsi possible de gnrer du
trafic additionnel et des ventes incrmentales en ciblant des futurs clients.
Dans le marketing, le VRM (Vendor Relationship Management) se veut comme un
renversement de la logique du CRM (Customer Relationship Management) par
lequel lentreprise contrle sa relation avec le client. Le VRM doit permettre aux
clients de protger leurs donnes personnelles et terme de les commercialiser.
Le VRM semble tre le contre-pied du CRM et du Big Data tout en tant
complmentaire ces derniers et innovant pour les clients et les vendeurs en
respectant la vie prive et les donnes personnelles.

Big Data
et intelligence artificielle25 (25) h t t p : / / w w w .
informatiquenews.fr/
lintelligence-ar tificielle-
morte-vive-le-big-
Lapproche avec les Big Data est assez diffrente de celle qui sous-tendait data-13392
lintelligence artificielle des annes 1980. Les premiers traducteurs sappuyaient
sur des modles et de la programmation qui tendaient reproduire lintelligence et
la rflexion humaine (programme Watson conu par IBM).
Les systmes actuels sappuient sur des ordinateurs capables dutiliser des millions
de textes et de trouver la bonne quivalence dune langue lautre.
Pour exemple, le systme Google Vision de Google est capable de trouver une
image qui ressemble une autre. galement, des tudes bases sur lanalyse
dexamens IRM permettent didentifier des criminels avec une bonne probabilit.
Et sans aucune thorie sous-jacente, il est galement possible de faire sparer les
rcidivistes des non rcidivistes. Une telle approche nest certes pas sans poser
de lourdes questions.

22 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LUTILISATION DU BIG DATA


DANS LE DOMAINE PRDICTIF
Lextraction ou la captation dinformations sera sous peu supplante par lanalyse
et les aspects prdictifs. Il sagit de comprendre les tendances ou encore
mieux dinfluer sur les types de consommation. Nous quittons la priode de
lchantillonnage pour entrer dans lre de lanalyse et de la modlisation des
donnes mondiales. Sil est ncessaire de demeurer plus efficient dans lacquisition
et la capacit danalyse des donnes, il faut toutefois rester en mesure de
rechercher et trouver de nouvelles opportunits daffaires. Lobjectif des exploitants
du Big Data est de faire saillir ou merger une ide qui se transformera ensuite en
produit, bien de consommation, avance sociale, dcouverte scientifique, mdicale
ou autre! En dautres termes, lobjectif demeure la valorisation de la donne.
Avec le Big Data, les entreprises mettent invitablement en place des modles
daide la dcision qui sont prdictibles mais qui ne sont pas interprtables.
Par exemple, le modle Big Data dune compagnie dassurance peut recommander
de ne pas assurer une personne sans pour autant tre capable dexpliquer les
raisons qui ont conduit cette dcision, puisque la cause peut prendre son origine
sur un plan statistique seul.
La mise en place de prvisions ou prdictions par un systme Big Data peut avoir
(26) En langage technique, ce un effet induit sur le systme observ26, systme qui va ragir en fonction des
systme se dit observer
effect.
prdictions annonces. Un tel systme peut ne pas tre neutre. Dans le domaine
des sciences politiques, il est ainsi possible de modifier des intentions de vote en
fonction des prvisions annonces. Mais pour coller au plus prs aux informations
collectes, il faut tre capable de faire voluer trs rapidement le modle.

LE BIG DATA POUR ANALYSER


ET ANTICIPER LES ASPECTS
CRIMINELS
Lusage des donnes permet de lutter contre la fraude, de renforcer la scurit
des citoyens et leur confiance envers les forces de lordre. Dans le secteur
bancaire, le Big Data constitue une aide prcieuse pour respecter les obligations
rglementaires et rduire les cots lis aux fraudes externes au secteur, les fraudes
internes et les fraudes managriales.
Une meilleure dtection et prvention est possible grce la cration de
score de suspicion et au Machine Learning. galement, les entits frauduleuses
peuvent tre traques grce lutilisation des donnes de lopen data ou issues
de rseaux sociaux.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  23


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Dans le domaine des crimes ou des dlits, les donnes permettent danticiper les
crimes prmdits typiquement les cambriolages, vol de voitures, braquages (outil
Predpol), les dlits ou actes terroristes (fichiers PNR), et de fournir en temps rel
les informations pertinentes aux quipes sur le terrain sur des smartphones ou des
assistants numriques personnels.

SE PRPARER AUX NOUVEAUX


MTIERS INDUITS PAR
LE BIG DATA
Dans une tude parue en 2012, le cabinet Gartner prvoyait que le phnomne
Big Data allait crer 4,4 millions demplois travers le monde dont 1,9 millions
rien quaux tats-Unis.
En France, le gouvernement a lanc un Plan Big Data pour positionner le pays
sur ce crneau hautement stratgique et espre la cration de 10000 emplois
directs dici 2018. Les professionnels du secteur sont ce stade plus mesurs
- le Syntec Numrique, prvoit la cration de 2 000 postes de data scientist
dici 2018.
La Data Science se dveloppe vite, sorganisant en vritable filire professionnelle
regroupant des Chief Data Officers, Data Analysts et Data Scientists.
La fonction de Chief Data Officer est trs rcente et gagne peu peu les grandes
entreprises. Selon Fabrice OTANO du groupe AccorHotels Ce poste est une
fuse trois tages. Dans le premier, vous produisez des analyses de plus en
plus complexes et prdictives. Dans le second, vous recrutez des Data Scientists
et les formez aux besoins spcifiques de lentreprise ; au troisime, vous dployez
cette nouvelle culture data au sein de lencadrement. Sans ngliger les aspects
rglementaires lis la CNIL.
Les mtiers de Data Analyst et de Data Scientist sont particulirement priss. Le
premier dveloppe les outils pour structurer, collecter, faire parler les donnes et
les prsenter sous un format simple (No SQL ou Hadoop). Le second manipule
les donnes une fois la base exploitable pour faire remonter les informations
susceptibles de favoriser la prise de dcisions. Il sagit l dun profil au cur
de linnovation mme dapprhender la fois les mthodes statistiques,
mathmatiques et informatiques mais aussi managriales dans le cadre dun
contexte mtier particulier.
La Harvard Business Review a mme consacr le mtier de Data Scientist: job le
plus sexy du XXIe sicle! Il faut dire que les Data Scientists se font dsirer. Ainsi, plus
de la moiti des postes proposs en 2015 dans lHexagone sont rests vacants.
Le cabinet McKinsey estime quant lui que dici 2018, aux tats-Unis, il y aura une
pnurie de 140000 190000 Data Scientists.
Un dficit, qui risque de saccentuer mesure que les entreprises prendront
conscience du potentiel et de limpact du Big Data sur leurs profits. Principale
cause de ce dficit dexperts: les coles et universits occidentales ne forment
pas suffisamment de ces profils. Un constat quelque peu paradoxal face un
phnomne porteur mais rsolument neuf.
24 INHESJ juillet 2016 Rapport du Groupe de veille et analyse
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

(27) Agence pour lemploi des LAPEC27 a reu de 2011 2015 moins de 650 offres demploi sur des postes
cadres.
de Data Analyst et Data Scientist. Avides de data talents, les entreprises crent
un vritable rseau spcialis afin de capter directement la ressource et anticiper
sur leurs besoins en personnels.
Dans un contexte de march de lemploi plutt morose en Europe, il y a des
opportunits saisir.
La France qui est le deuxime pays ayant obtenu le plus de mdailles Fields en
mathmatiques et dont les coles dingnieurs et formations en mathmatiques,
bnficient dune excellente rputation au niveau mondial, doit donc adapter son
systme ducatif pour rpondre aux besoins croissants en matire de recrutement
lis au Big Data. Elle a le potentiel de former les meilleurs experts de la data au
niveau international.
Il y a donc un besoin de formation et de prolifration de programmes acadmiques
autour de la thmatique Big Data. Certains vont mme jusqu penser que
lducation nationale devrait intgrer des modules de familiarisation avec le
codage et le traitement de la donne, afin de susciter des vocations et dveiller la
curiosit ds le plus jeune ge.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  25


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

RECOMMANDATIONS
Les recommandations dactions dIntelligence conomiques proposes ici
sentendent comme autant de moyens identifis par notre Think Tank pour
permettre notre client le GIE spcialis en nouvelles technologies de
se dvelopper en favorisant linnovation dans le respect des contraintes
rglementaires existantes et venir.

AXE 1-
LIBRER LES POTENTIALITS
DUSAGE
OBJECTIFS GNRAUX
Disposer dinformations prcises sur lcosystme du Big Data en termes
juridique, conomique, technologique et ducatif.
Identifier, anticiper, insuffler et promouvoir les nouveaux usages.
Fdrer la communication pour entretenir la confiance des acteurs et en
particulier le grand public.
 tre la tte dune filire Big Data et ainsi alimenter la fois les services
de ltat, un ple de comptitivit ddi, des filires ducatives et
professionnelles.
Fournir une source de dveloppement et daccs de nouveaux produits
et services.

OBJECTIFS OPRATIONNELS
Reprendre et faire aboutir la prconisation ralise par Nouvelle France
Industrielle savoir la mise en place dun observatoire des usages du Big Data.
Depuis 2 ans, le ministre de lconomie multiplie les initiatives telles que les
appels projets, les challenges ou encore comme en octobre 2015 lorsquil a
diligent une tude baptise Observatoire des usages du Big Data (donnes
massives) suivant ainsi une prconisation manant de Nouvelle France
Industrielle de 2014. Or ce jour, cette rsolution na pas connu les suites
(28) En ligne : http://www.
espres comme en atteste, le 12 avril 2016, le Conseil gnral de lconomie e c o n o m i e . g o u v. f r / c g e /
(CGE) sur son site internet28 en publiant la synthse de son rapport dtude meilleures-pratiques-pour-
big-data-et-lanalytique-dans-
avec un constat dimmobilisme. ladministration-nouvelle-etape

26 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Offrir au GIE une exposition avantageuse pour son image et augmenter


sa capacit dinfluence.
Capter les tendances et orientations des nouveaux usages du Big Data.
Suivre les volutions rglementaires.

ACTIONS
Crer et animer une fondation ou une association de type loi 1901 ayant
pour objectif de mettre en place un Observatoire des usages Big Data.
Reprendre et ranimer les analyses et les initiatives du ministre de
lconomie pour sadosser la deuxime phase des 34 plans de
reconqute de Nouvelle France Industrielle.
Fdrer les principaux acteurs selon trois typologies: les producteurs, les
courtiers et les consommateurs des donnes.
Cibler directement un secteur conomique en particulier pour lancer
lobservatoire et ainsi dbuter avec un nombre dacteurs matrisable.
Se rapprocher des initiatives europennes.
Mettre en place une plate-forme (www.observatoiredesusages_BIGDATA.fr).

CONTRIBUTEURS
Le principal animateur, fondateur de lobservatoire doit tre le GIE afin
dorienter les travaux. Les autres acteurs pouvant tre:
Ministre de lconomie au travers de linitiative Nouvelle France Industrielle.
Universits et Grandes coles (dingnieurs ou de commerce).
Branche professionnelle des Technologies de linformation prsente dans
le GIE.
Un ple de comptitivit du numrique.
Juristes spcialiss dans le numrique.

AXE 2-
ANTICIPER EN MISANT
SUR LA FORMATION
OBJECTIFS GNRAUX
Adapter le systme ducatif franais afin de faire face la demande
exponentielle de spcialistes du Big Data (data scientist, data analyst,
data architect, chief data officer) ;
Former des profils, reconnus lchelle internationale, capables de
valoriser les donnes pour:
o Gnrer de la croissance pour les entreprises ;
o Extraire de la connaissance utile loptimisation des offres et services.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  27


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

OBJECTIFS OPRATIONNELS
Dvelopper une offre de formation (initiale ou continue) par nature
transdisciplinaire lintersection de trois domaines dexpertise:
(i) linformatique, (ii) les statistiques et les mathmatiques, et (iii) les
connaissances mtier.
Construire une vritable filire Big data comprenant des modules de
familiarisation avec le traitement de la donne ds le plus jeune ge.
Faire voluer les comptences des professionnels actuellement la
priphrie du secteur (Charg dtudes statistiques, Chef de projet
informatique, Ingnieur en systme dinformation) pour les adapter aux
enjeux du Big Data.

ACTIONS
En matire de formation:
Construire un rfrentiel de formation Big Data qui permettra
dtablir pour chaque niveau dtude un contenu adapt et les
objectifs pdagogiques associs. Il fournira galement des lments
de mthodologie pour proposer un parcours de formation Big Data au
sein dune entit (publique ou prive).
Dfinir un rseau dcoles et universits pilotes charges de mettre en
uvre les recommandations du rfrentiel.
Cartographier et suivre lvolution des formations initiales ou continues
autour de la thmatique Big Data.
Crer de nouvelles formations transdisciplinaires entre institutions de
comptences varies (universits, coles dingnieurs, grandes coles
de management) et en y associant les entreprises. Celles-ci seront
charges de proposer des projets dexprimentation aux apprenants
(tudes de cas ou stages longs) ;
Crer une cole ex nihilo (inspire du modle 42) formant exclusivement et
en masse des spcialistes Big Data. Lcole sera entirement finance par
les principaux recruteurs franais et europens de comptences Big Data.
Dvelopper une gamme de matriels ducatifs ouverts et notamment:
o Crer des MOOC (Massive Open Online Courses) afin de rendre
disponibles des cours de rfrence notamment dans le monde
francophone. Pour y arriver, on pourra sappuyer sur la plateforme
FUN du MENESR. Le contenu offert pourra galement servir
la formation continue dans les entreprises et la formation des
enseignants eux-mmes.
o Dvelopper des serious games: application informatique, dont
lobjectif est de combiner la fois des aspects srieux (Serious)
tels, de manire non exhaustive, lenseignement, lapprentissage, la
communication, ou encore linformation, avec des ressorts ludiques
issus du jeu vido (Game).
Dvelopper dans les tudes juridiques la place des droits du numrique
et des donnes.

28 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

En matire demploi (au sein de lObservatoire du Big Data):


Dfinir et faire voluer (en lien avec les services de lemploi) un rfrentiel
des mtiers et comptences du Big Data.
Raliser chaque anne, en lien avec les branches professionnelles, une
valuation des besoins tant qualitatifs que quantitatifs.
Assurer une prospective des nouveaux mtiers du Big Data.

CONTRIBUTEURS
Ministre de lducation nationale, de lEnseignement suprieur et de la
Recherche (MENESR).
o La direction du numrique pour lducation (DNE).
Ministre du Travail, de lEmploi, de la Formation professionnelle et du
Dialogue social.
Universits et Grandes coles (dingnieurs ou de commerce).
Collges et Lyces.
Branches professionnelles.

AXE 3-
CONVERTIR LE GRAND PUBLIC
Promouvoir laide et le support apports aux citoyens par les innombrables
services issus du Big Data ainsi que les opportunits de croissance et
dveloppement pour les entreprises utilisatrices de services lis au Big Data.
Ddiaboliser le Big Data auprs du grand public et des entreprises
utilisatrices.

OBJECTIFS OPRATIONNELS
Communiquer sur des cas dusage grand public marquants (tmoignage
ou prospective).
Diffuser un ensemble de connaissances des forces et avantages de
lutilisation des solutions de Big Data auprs des entreprises.
Communiquer sur les lois, rgles, normes, labels en vigueur autour de lutilisation
des donnes prives auprs des consommateurs afin de les rassurer.
Former les entreprises utilisatrices lvaluation de la conformit des
solutions de Big Data.

ACTIONS
Designer une agence de communication pour dcliner les campagnes.
Engager les autorits sponsoriser les campagnes en qualit de caution
morale.
Promouvoir les normes et labels de bonnes pratiques dans lutilisation
massive des donnes.
INHESJ juillet 2016 Rapport du Groupe de veille et analyse  29
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Diffuser des messages destination du grand public (usage et protection): presse,


tlvision, radio, affichage.
Diffuser des messages destination des entreprises au travers de leurs rseaux:
associations professionnelles, salons, clubs, CCI, banques, assurances.
Crer pour les entreprises des sminaires de sensibilisation aux bienfaits du Big Data
et la connaissance des risques et protections existantes.

CONTRIBUTEURS
Associations professionnelles dutilisateurs et de producteurs.
Associations de consommateurs.
Ministre de lconomie, de lIndustrie et du Numrique.
CCI, Collectivits territoriales, services gouvernementaux.
Organismes de lablisation, normalisation, certification.
Agences de communication.

AXE 4-
FAIRE DU DROIT UN OUTIL
DE VALORISATION DE LA
TECHNIQUE PAR LA CONFIANCE
OBJECTIFS GNRAUX
Le respect de la norme juridique par la technique ne peut tre obtenu efficacement
que par la technique. Le code (au sens de programme informatique) doit faire Loi.
La donne personnelle est lempreinte numrique, lADN numrique dun homme.
Un impratif: garantir la confiance.
Comme pour toute relation ou interaction humaine, un projet Big Data durable
ncessite de garantir la confiance de lutilisateur, qui, allie la scurit juridique
ne du respect de la conformit, devient alors un avantage concurrentiel.

OBJECTIFS OPRATIONNELS
Anticiper par la formation, lapplication de la nouvelle rglementation europenne de
protection des donnes de 2018, pour que les entreprises du GIE obtiennent ds
prsent un avantage concurrentiel sur le march franais mais galement lexport.
Valoriser la technique pour valoriser limage des entreprises vis--vis des clients/
utilisateurs.
Dans le cadre du partenariat public/priv: dvelopper un label qualit de
compliance by design pour garantir la confiance en couplant le respect des
donnes personnelles ds la conception leur conservation par un registre et donc
au respect dun droit de proprit autonome analogue au droit dauteur, tant droits
patrimoniaux quextra-patrimoniaux.
30 INHESJ juillet 2016 Rapport du Groupe de veille et analyse
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

ACTIONS
Action de formation auprs des entreprises du GIE lapplication de la
rglementation europenne au printemps 2018.
Action de veille juridique auprs des entreprises du GIE sur le suivi de lapplication
de la rglementation.
Action dinfluence auprs de la chancellerie via un partenariat public/priv pour
la mise en place de:
formation spcifique la protection des donnes notamment auprs des
magistrats;
politique civile et pnale de protection des donnes et du patrimoine immatriel.
Action de veille juridique des dcisions et sanctions prises pour le non-respect de
la RGPD afin danticiper les futures volutions de la rglementation.
Action de financement public subordonn au respect du label de compliance by
design.

CONTRIBUTEURS
Juristes spcialiss dans la protection des donnes.
Acteurs et entrepreneurs des entreprises du Big Data.
Hommes politiques.
Associations thiques de protection des droits de lhomme et/ou en faveur dun
dveloppement durable sustainable development.

AXE 5-
INVESTIR SUR LES AVANCES
TECHNOLOGIQUES
OBJECTIFS GNRAUX
Se positionner en tant que leader sur les technologies de pointe en matire
dexploitation et surtout de protection des donnes.
Encourager lexcellence franaise et europenne en termes de conformit des
applications avec les rglementations actuelles et futures.
Protger les champions technologiques franais et europens des vises
amricaines.

OBJECTIFS OPRATIONNELS
Poursuivre et intensifier les efforts de recherche et dveloppement dans le primtre
technologique concern par des subventions ou partenariats public/priv.
Gagner la course de la mise sur le march des innovations technologiques majeures
afin de bnficier des avantages de premier entrant par des assouplissements,
aides incitatives ou partenariats public/priv.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  31


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Imposer la conception native de la confidentialit (privacy by design) comme un


standard, une norme incontournable et en devenir le champion.
Protger les entreprises innovantes des risques dintelligence conomique.

ACTIONS
Crer ou renforcer des ples de comptitivit autour de lexploitation et/ou la
protection des donnes en y attirant les champions franais du secteur.
Subventionner les recherches universitaires et/ou crer des chaires spcifiques,
notamment sur le chiffrement homomorphe en lien avec des entreprises prives.
Encourager les initiatives voire influencer les objectifs des coles innovantes
(Ecole 42, ) et incubateurs/acclrateurs de start-up (The Family, ) par des
partenariats public /priv afin de maximiser les chances de trouver les projets
trs haut potentiel.
Crer un crdit impt recherche additionnel spcifique pour les entreprises
travaillant sur les sujets critiques (chiffrement homomorphe, ).
Btir un rfrentiel normatif de privacy by design lgitim par une obligation
assurantiel pour toute application ou service traitant des donnes.
Protger le capital des socits innovantes dans le secteur en limitant les prises de
participation trangre (prise de participation BPI France, fusion autres champions,
).
Lister et accompagner les socits innovantes afin de les prmunir des risques et
menaces conomiques (vol de technologies, ingnierie sociale, piratage) au
travers de rencontres (CCI, groupements, syndicats patronaux, ) ou de conseils
(DGSI, gendarmerie).

CONTRIBUTEURS
Ministre de lconomie, de lIndustrie et du Numrique.
Ministre de lducation nationale, de lEnseignement suprieur et de la Recherche.
Universits, centres de recherche.
Branches professionnelles.
BPI France.
Services dintelligence conomique.

32 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

CONCLUSION

Le Big Data constitue une volution majeure du monde numrique. Sous-


tendu par des progrs et une innovation constante des technologies, le Big
Data confre une capacit de modlisation des marchs sans prcdent.
Lingniosit et la cration de lHomme faisant le reste.
Laspect dbrid qui accompagne les nouveauts a permis aux Etats-Unis de
prendre une avance sur le reste du monde. Lapproche europenne et franaise
en particulier a consist se proccuper du respect de lindividu au travers de
ses donnes personnelles.
Les craintes lies une rglementation outrancire bridant le dveloppement
conomique savrent finalement infondes. En effet le principe de Privacy
by Design met au cur de toute conception de solution ou de traitement les
moyens de prserver les donnes personnelles.
Lusage du Big Data sera scrut et la loi ne pouvant anticiper la technologie
veillera sadapter pour garantir les liberts individuelles.
Dans ce contexte les tats joueront leur rle de rgulateurs et donc de garants
de la confiance et ainsi lconomie du numrique continuera de prosprer,
entranant dans son sillage des mutations structurelles concernant, entre autres,
le monde de lemploi et celui de lducation. Les entreprises qui respecteront
ces principes dthique creront les conditions propices leur dveloppement
dans lre du Big Data.
(29) Serge LAMOUR. Libert, Dans une conception davantage religieuse29 du Big Data, larbre30 de la
scurit et technologies de
linformation: une approche connaissance du bien et du mal dfinit le pouvoir par la connaissance. Peu
philosophique et spirituelle. importe quil soit politique, conomique, financier ou militaire.
(30) Le chapitre 2 de la Gense,
premier texte, de la Bible et Linterprtation qui en est faite peut-tre mise en perspective avec la centralisation
la Torah nonce Le Seigneur
Dieu prit lhomme et ltablit
de la connaissance qui sest renforce avec lavnement du cloud computing.
dans le Jardin dden pour
cultiver le sol et le garder. La capitalisation numrique de pans entiers de la vie de milliards dinternautes,
Le Seigneur Dieu prescrivit par des organismes publics et privs, rpond dans la plupart des cas des
lhomme: Tu pourras manger
de tout arbre du jardin mais finalits dordres scuritaire ou conomique. Mais lon peut sinterroger sur la
tu ne mangeras pas de capacit de lhomme, ainsi complt des nouveaux attributs technologiques
larbre de ce qui est bon ou
mauvais car, du jour o tu en quil a lui-mme crs, conserver toute la sagesse ncessaire lexercice du
mangeras, tu devras mourir. pouvoir quasi divin qui lui est confr.
[ ] Tous deux taient nus,
lhomme et sa femme, sans se
faire mutuellement honte.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  33


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

NOTE DE SYNTHSE

LE BIG DATA : ENTRE RISQUE ET OPPORTUNIT

Propos liminaire
Lappellation Big Data, donnes massives en franais, fait rfrence un domaine
en pleine expansion qui affectera demain tous les aspects de nos vies quotidiennes.
La transformation numrique de la socit qui sopre devant nos yeux, lchelle
de la plante entire, doit son succs une matire premire dont la source nest
pas prte de se tarir, et qui constitue dsormais le nouveau ptrole: le Big Data.

Mthodologie de veille et danalyse


Aprs analyse du sujet, nous avons identifi les thmes saillants pour mieux diviser
notre veille et rpartir le travail. La rpartition sest effectue selon les comptences
des membres de lquipe. Le pige a vit fut linfobsit.
Nos savoir-faire combins furent enrichis par des participations des salons,
confrences et maills de rencontres avec des Experts et des acteurs du Big Data.
Le fruit de ces recherches a t pass au tamis de nos outils danalyse stratgique
comme les matrices de rfrence SWOT et PESTEL. Les axes de recommandations
dactions IE ont merg naturellement de ces travaux pousss danalyse.

Primtre du sujet
Le Big Data met en jeu des volumes gigantesques de donnes, structures ou non,
qui sont difficilement grables avec les solutions classiques.
Ces donnes proviennent de sources diverses, pour la plupart produites en temps
rel, et trs souvent gnres leur insu par les utilisateurs. Cet aspect pose le
dbat de la protection des donnes individuelles et de lthique des entreprises et
du rle des tats, dautant quau cours des deux dernires annes, on a produit
davantage de donnes que dans toute lhistoire de lhumanit auparavant.

Les enjeux du Big Data


Sur le plan conomique, le Big Data est aussi un march considrable qui crot
en moyenne de plus de 20% par an. En 2018, il reprsentera plus de 40 Md
au niveau mondial, dont prs de 7 Md pour lEurope et plus de 600 M
pour la France.
Cest aussi un secteur prometteur en matire demploi, avec lapparition de
nouveaux mtiers tels que: data architect, data analyst ou autre data scientist,
spcialistes la croise des technologies de linformation, des statistiques et des
mtiers des entreprises utilisatrices.

34 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Analyses
Avec le Big Data, nous quittons la priode de lchantillonnage artisanal pour entrer
dans lre de lanalyse systmatique et de la modlisation des donnes mondiales.
GVA Big Data : Entre r
Son ambition nest pas moins que de Comprendre ce qui tait incomprhensible
et de Prvoir ce qui tait imprvisible.
SonII.
objectifANALYSE
est en priorit pourSTRATEGIQUE
les entreprises de rpondreDU BIG DATA
la question suivante:
quel avantage concurrentiel puis-je tirer
GVA Big Data : Entre risque et opportunit ? des donnes massives auxquelles jai
accs concernant2.1. Analyse
monData
GVA Big activit? par la matrice SWOT
: Entre risque et opportunit ?
(Cf. Annexe n5 page
urs PESTEL Les forces
yse des facteurs PESTEL
! Disponibilit de
-spage 46) donnes.
rs politiques ! Grande varit d
e des facteurs politiques
jouent dune vritable influence auprs des politiques. Les disponibles (avnemen
ta, les GAFA jouent dune vritable influence auprs des politiques. Les des rseaux sociaux)
nombreuses perspectives.
ent offrent de nombreuses perspectives. Ces deux pre
la campagne prsidentielle dObama, et dans une moindre proviennent des nom
nt a t gre la campagne prsidentielle dObama, et dans une moindre
uent des exemples concrets. par les technologies
de, en constituent des exemples concrets. nouvelles pratiques.
eurs conomiques
lyse des facteurs conomiques Les entreprises col
nnes constitue un vritable enjeu. Au-del des GAFA, de les donnes mais su
masses de donnes constitue un vritable enjeu. Au-del des GAFA, de
me celui de Data Brokers (courtier en donnes). Une chaine individus partagent lib
nt le jour comme celui de Data Brokers
phnomnale (courtier en donnes).
dinformations selon Une chaine
le principe du de
si cest gratuit, cest que vou
stockeurs, courtiers, analyseurs et exploiteurs des donnes
e producteurs, stockeurs, courtiers, analyseurs et exploiteurs des donnes de
Le Big
! Data repose surinfinies
Possibilits une technologie en volutionde
de recoupement constante
donnes (puissance de
(corrlations insoupon
calcul, capacit de stockage, algorithmes) et une permanente innovation des
! Efficacit et rapidit des outils danalyse ( la porte de lutilisateur mt
ce march
le leader sur est Acxiom
ce march (Socit
usages Prisetexane
! (applications qui
de la exploite
intelligentes).
en main
est Acxiom (Socit texane qui exploite les donnes dfinition des lestraitements
donnes par le mtier (crativit li
nsonnes
CA de 1,1 milliards de Mais
dollars).
! le Libration
avec un CA de 1,1 milliards dollars).de lutilisateur
droit ne pouvant
de mtier des
anticiper la technologie, lescontraintes des applications
limitations introduites en DSI (f
France par la CNIL, portant notamment sur lobligation de dclarer a priori la
eurs socitaux Les progrs technologiques croissants du stockage et du partage de la
lyse des facteurs socitaux finalit des donnes personnelles collectes, ont rapidement t dpasses.
algorithmes toujours plus puissants, offrent des capacits de traiteme
Datadupermet
alyse Big Data permet toujours plus performants. Ces services mis disposition des sachants
omportements librent linnovation mtier.
ces ou les comportements
Cela
des offre des
individus. Cela offre des ! Le Big Data permet de Comprendre ce qui tait inco
es
tionou deproduits
services ou produits Prvoir ce qui tait imprvisible .
possibilit de
lement une possibilit de Lexemple de Google permet dillustrer cet aspect prdictible grce l
imination.
e et de la discrimination. corrles lui permettant didentifier voire de localiser une pandmie grippa

usagers hyper Les faiblesses


abitudes des usagers hyper
ne trs grande
0 gnrent une trs grande ! Vracit des donnes soumise caution (validit vrifier : obsolescenc
esviesetpubliques
prives.et prives. La rgle des 5V prend en compte cette dimension de la vracit qui est
que si cest
s conscience que si cest lon alimente les modlisations. Lobsolescence de la donne est gal
produit
st peut-tre le produit (Ex: ngligeable. Na-t-on jamais crois sur les rseaux sociaux des profils de p
(Ex:
Ce phnomne est pris en considration par les principaux rseaux sociaux
! Organisation dlicate des donnes pour des usages difficiles anticiper
tout comme
cyber-thique tout comme
e rattrapent
peu peu peules peu les
INHESJ juillet 2016 Rapport du Groupe 15
de veille et analyse  35
Scnario dtaill dans Le Big Data: Que sais-je ? n 4027 par Pierre Delort.
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Aprs la dnonciation de laccord Safe Harbor avec les tats-Unis en octobre


2015, le Parlement europen a finalis, le jeudi 14 avril 2016, le texte du
rglement gnral sur la protection du traitement des donnes personnelles
(RGPD) dans lUnion europenne. Ce texte constitue un ensemble unique de rgles
en vue de donner au citoyen plus de contrle sur ses propres informations prives
dans un monde numrique omniprsent.
Ce nouveau rglement apporte de la clart juridique pour les entreprises, de
ce fait concourant stimuler linnovation et le dveloppement futur du march
unique du numrique. Il renforcera la confiance et fournira un niveau lev de
protection pour tous les citoyens de lUE en toutes circonstances, et sappliquera
galement des entreprises hors Europe ciblant les consommateurs de lUE.

Quels risques pour quelles opportunits?


Sur le plan thique, le Big Data se retrouve tiraill entre trois catgories dacteurs
qui ont des attentes souvent contradictoires:
Les entreprises veulent accder au maximum de donnes personnelles dans le but
damliorer leurs offres de produits et services.
Les tats et autres rgulateurs entendent encadrer lutilisation de ces donnes.
Les utilisateurs et consommateurs veulent bnficier de services plus pertinents tout
en gardant le contrle de leurs donnes personnelles.
On peine imaginer toutes les applications bases sur le Big Data qui verront le
jour dans les prochaines annes, et ce quel que soit le secteur dactivit:
le commerce (publicit cible);
la finance (conseil prt / assurance);
la sant (prvention);
la scurit (lutte contre la criminalit);
lnergie (rgulation de production);
les transports (gestion et optimisation de flottes)

36 INHESJ Juin 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

LES RECOMMANDATIONS DE NOTRE THINK TANK

RECOMMANDATION n1
Librer les potentialits dusage
Contribuer la mise en place dun observatoire des usages du Big Data dans le but
doffrir au GIE une position en vue, lui permettant dassocier son image la notion
de Big DATA.
Cette place stratgique est un atout pour suivre les volutions rglementaires, du
march et les nouveaux usages avec un temps davance. Cet observatoire devant
devenir un lieu dinfluence.

RECOMMANDATION n2
Anticiper en misant sur la formation
Tous les acteurs mondiaux (privs et publics) convoitent le march Big Data. Pour
profiter de la manne, ils vont devoir entre autres choses se doter de comptences
capables de valoriser linfini potentiel des donnes.
La formation (et par suite le recrutement) de ces nouveaux experts de la data revt
donc un intrt majeur pour les tats. La France devra adapter son systme ducatif
et imaginer une vritable filire Big Data comprenant notamment: des modules de
sensibilisation au traitement de la donne tout au long du cycle de formation, de
nouveaux programmes transdisciplinaires entre institutions de comptences varies
et enfin une gamme de matriels ducatifs innovants (MOOC, serious games, etc.).

RECOMMANDATION n3
Convertir le grand public
La dfiance des particuliers tout comme des entreprises vis--vis de lexploitation
de leurs donnes et, encore plus, des oprateurs les manipulant, est un frein au
dveloppement du Big Data. Les pouvoirs publics, les associations professionnelles
et les associations de consommateurs doivent donc diffuser des messages dans le
but de ddiaboliser le Big Data. Ces messages viseront expliquer les avantages
des usages du Big Data (au plan personnel mais aussi en termes de comptitivit
conomique) et dmontrer que la protection des donnes existe en faisant la
promotion des normes, labels existants ainsi quen vulgarisant larsenal juridique en
faveur de cette protection. Les moyens classiques de communication seront utiliss:
publicit, salons, sponsoring.

INHESJ Juin 2016 Rapport du Groupe de veille et analyse  37


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

RECOMMANDATION n4
valuer la mise en uvre de la rglementation
La rglementation appelle une normalisation du dveloppement sous forme de
label et de bonnes pratiques du dveloppement. Le respect du Privacy by Design
ou du Privacy by Default garantira la confiance et ladhsion du grand public
aux entreprises qui lappliqueront. Il convient de ne pas attendre lentre en vigueur
de la rglementation en 2018 pour mettre en place ces principes fondamentaux.
Laccompagnement et la sensibilisation des entreprises doit sarticuler autour dune
veille juridique sur les risques ne pas tre vertueux, une formation des acteurs et les
avantages que le secteur public pourrait offrir aux pionniers.

RECOMMANDATION n5
Investir sur les avances technologiques
Linnovation technologique reste la base du Big Data. La France dispose dentreprises
performantes et de femmes et dhommes de talent autour des technologies de
traitement ou de protection des donnes, y compris natives (privacy by design).
Il faut donc la fois les encourager, les aider et les protger. Pour cela, les pouvoirs
publics et/ou les associations professionnelles peuvent renforcer les ples de
comptitivit, subventionner la recherche et accompagner les coles innovantes
(Ecole 42), allouer un crdit dimpt recherche additionnelle afin de faire converger
leurs efforts vers lmergence de solutions disruptives.
Avec les organismes normatifs et les assureurs, ils doivent mettre en place un systme
assurantiel pour imposer le privacy by design toutes les solutions existantes.
Enfin, les services ddis (DGSI, gendarmerie, CCI,) doivent protger les fleurons
franais, du point de vue capitalistique et des risques conomiques en les surveillant
et les sensibilisant.

38 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

ANNEXES
Annexe 1
GVA Big Data : Entre risque et opportunit ?
Infographie reprsentant
Annexe n1une cartographie
: Infographie des
reprsentant uneacteurs
cartographie des acteurs.

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  39


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Annexe 2
70% des plus grosses entreprises amricaines ont dj
GVA Big Data : Entre risque et oppor
achet des donnes externes leur organisation
Annexe n2 : 70% des plus grosses entreprises amricaines ont dj achet des donnes externes
organisation.

42

40 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Annexe 3
En 2016, les revenus gnrs par le Big Data travers
GVA Big Data : Entre risque et opportun

le monde slvent 38 milliards de dollars


Annexe n3 : En 2016, les revenus gnrs par le Big Data travers le monde slvent 38 milliards de
dollars.

43

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  41


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Annexe 4
Au niveau mondial, les principaux acteurs reconnus GVA Big Data : Entre risque et opportu
sur ce march sont les traditionnelles entreprises issues
Annexe n4du
: Ausecteur des technologies
niveau mondial, les principaux acteurs reconnus sur ce march sont les traditionne
entreprises issues du secteur des technologies.

44

42 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

GVA Big Data : Entre risque et oppor

Annexe 5
Analyse SWOT
Annexe n5 : Analyse SWOT

45

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  43


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

Annexe 6 GVA Big Data : Entre risque et opportunit ?

Analyse PESTEL
Annexe n6 : Analyse PESTEL

46

44 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
GVA Big Data : Entre risque et opp

Annexedu7 journal Le Monde en date du 21 mars


e n7 : Article
ARI ou la chasse aux franais.
Article du journal Le Monde en date du 21 mars 1974,
SAFARI ou la chasse aux franais

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  45


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

GVA Big Data : Entre risque et opportunit ?

Annexe 8
La protection
Annexe europenne
N8 : La protection desdesdonnes
europenne donnes lre numrique.
lre numrique

46 INHESJ juillet 2016 Rapport du Groupe de veille et analyse


BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique

GVA Big Data : Entre risque et opportunit ?

Annexe 9
Les mtiers
mtiers porteurs porteurs
du Big Data. du Big Data

49

INHESJ juillet 2016 Rapport du Groupe de veille et analyse  47