Documente Academic
Documente Profesional
Documente Cultură
BIG DATA
Travaux de la 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
ENTRE RISQUE
ET OPPORTUNIT?
Groupe de veille et danalyse
JUILLET 2016
ISSN 2265-447X
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
BEDINI Cdric
BENAMARA Guillaume
BENDER Lionel
CHOCHOI Alexia
DOMECQ Xavier
DUPUICH Jean-Philippe
FISLI Salah-Eddine
LAKRAFI Amal Amlia
RODIERE Frdric
TORRISI Christophe
Sommaire
INTRODUCTION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Rappel du mandat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Analyse et reformulation du sujet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Mthodologie et difficults rencontres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Prambule . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
cONNATRE LE MARCHE DU BIG DATA POUR MIEUX EN PROFITER . . . . . . . . . . 8
Le Big Data, une dfinition complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
Les 5V du Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Le Big Data, ce nouvel or noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
Le Big Data, un march en pleine croissance et diversifi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ANALYSE STRATEGIQUE DU BIG DATA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Analyse par la matrice SWOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
Analyse des facteurs PESTEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
Cartographie des acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
GARANTIR LES LIBERTES FONDAMENTALES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Laffirmation dun principe de protection des donnes personnelles . . . . . . . . . . . . . . . . . . . . . . . . . 16
Les enjeux stratgiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Le droit comme outil de confiance : le RGPD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Le droit ne peut anticiper la technologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
Vers des solutions techniques danonymisation des donnes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
LES PROMESSES DU BIG DATA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
Les usages Big Data : entre performance-production et jouissance-consommation . . . . . . . . 21
Lutilisation du Big Data dans le domaine prdictif . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .23
Le Big Data pour analyser et anticiper les aspects criminels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
Se prparer aux nouveaux mtiers induits par le Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
RECOMMANDATIONS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
AXE 1- Librer les potentialits dusage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
AXE 2- Anticiper en misant sur la formation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
AXE 3- Convertir le grand public . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
AXE 4- Faire du droit un outil de valorisation de la technique par la confiance . . . . . . . . . . . . . . . . 30
AXE 5- Investir sur les avances technologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
CONCLUSION . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
NOTE DE SYNTHSE . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
ANNEXES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1 : Infographie reprsentant une cartographie des acteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 : 70% des plus grosses entreprises amricaines ont dj achet des donnes externes leur organisation . 40
3 : En 2016, les revenus gnrs par le Big Data travers le monde slvent 38 milliards de dollars . . . . . 41
4 : Au niveau mondial, les principaux acteurs reconnus sur ce march sont les traditionnelles entreprises
issues du secteur des technologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
5 : Analyse SWOT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6 : Analyse PESTEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
7 : Article du journal Le Monde en date du 21 mars 1974, SAFARI ou la chasse aux franais . . . . . . . . . . . 45
8 : La protection europenne des donnes lre numrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
9 : Les mtiers porteurs du Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
INTRODUCTION
Rappel du mandat
La protection des donnes personnelles, telle quelle sest dveloppe en
France puis en Europe, et ses nouvelles approches notamment celle du privacy
by design, du droit loubli... sont-elles une rponse suffisante la domination
amricaine sur le march du Big Data?
Vous tes un Think Tank spcialis sur les enjeux du Big Data.
Un groupement dintrts conomiques du secteur des technologies de
linformation vous demande de raliser une tude :
Quelles actions dintelligence conomique lEurope et la France pourraient-
elles mettre en place pour garantir les liberts fondamentales, tout en soutenant
linnovation et en favorisant un march sur lequel il est impratif de se positionner
en raison de ses perspectives de dveloppement ?
La rflexion sinscrira dans une synergie public priv, garante des meilleures
chances de succs quant aux prconisations formules.
diffrencie et thique du march des donnes est une relle opportunit pour
nos tats par opposition louverture quasi-totale prne et mise en uvre par
les gants amricains.
Cest donc dans ce contexte de concurrence exacerbe au niveau mondial
que les entreprises se sont engages dans une vritable course linnovation
afin dexploiter au mieux cette manne providentielle des donnes.
Mthodologie
et difficults rencontres
La ralisation du prsent rapport de veille et danalyse sest effectue avec
(2) Le Think Tank Big Data fait la volont de notre Think Tank2 dapporter la fois une rponse analytique
tat de prs de neuf mois
dexistence.
la question pose et daboutir la formulation de recommandations simples et
adaptes afin que la France et lEurope puissent clairement se positionner sur
le march du Big Data.
Notre savoir-faire repose sur une quipe pluridisciplinaire compose dingnieurs
aux expertises diverses, de juristes, de chefs dentreprises et consultants, ainsi
que de reprsentants de ltat spcialiss dans les enjeux du numrique et la
sensibilisation des acteurs conomiques.
Si les enjeux du Big Data alimentent nos rflexions quotidiennes, nous disposons
de la particularit dtre dissmins aux quatre coins de lhexagone dont une
bonne part en rgion parisienne. Lun de nos collaborateurs vit et travaille de
manire quasi exclusive en Algrie. Loin dtre anecdotique, ce point de dtail
nous a conduit adopter trs tt des processus de travail distance (utilisation
dune solution de partage dinformation en mode Cloud), en complment de
nos runions mensuelles en prsentiel.
(3) Indpendamment de cette Aprs avoir reformul les attentes de notre commanditaire3, nous nous
reformulation, nous avons
galement demand au sommes attachs rpartir, au regard des comptences de chacun, les
commanditaire de nous pr- diffrents domaines de veille (juridique, business, emploi et formation, usages,
ciser si les termes opportu-
nit et risque devaient tre technologique, acteurs). Les donnes utilises sont issues de sources ouvertes.
considrs au singulier ou Notre veille sest appuye sur les rseaux sociaux, Twitter notamment avec
dun point de vue gnrique
(conception retenue). lexploitation dune liste4 de suivi, mais aussi sur la gestion de flux RSS. Afin
(4) Une cinquantaine de veilleurs dviter lcueil dun ventuel manque de fiabilit, nous avons appuy notre
du domaine ont t suivis. analyse sur la base de documents, issus du monde acadmique, de la
communaut scientifique ou tout simplement de rapports officiels.
La notion dalgorithme utilise par les moteurs de recherche, notamment Google,
lesquels exploitent davantage la popularit des publications, nous a conduit
investir le champ du web profond et exploiter les sources accumules au sein
de notre Think Tank. Le Big Data se situe au cur de toutes les proccupations
et il suffit de formuler une requte simple dans un moteur de recherche pour
comprendre le caractre plthorique de linformation quil gnre. On peut
mme parler dinfobsit.
Toutefois, au fil de nos lectures et de lapprofondissement de notre sujet, nous
avons pris conscience des opportunits induites par la libration des donnes
personnelles mais galement des risques quune gestion non matrise pourrait
faire peser sur notre socit.
Cette recherche bibliographique nous a permis deffectuer une analyse SWOT,
une analyse PESTEL, une infographie, ainsi quune cartographie des acteurs
dans le domaine du Big Data.
Runions, salons et changes, tout au long de notre dmarche exploratoire, ont
favoris notre rflexion. Cest ainsi que nous nous sommes rendus successivement
au FIC5 de Lille, que nous avons rencontr ou interrog en confrence-dbats (5) Forum international de la
diffrents experts6 du sujet. cyberscurit des 25 et 26
janvier 2016 Lille.
Afin de raliser un travail efficace, conforme la commande initiale, il nous (6) Axelle LEMAIRE et Matre
Thibaut DU MANOIR DE
est apparu essentiel de traiter les opportunits induites par le Big Data sous la JUAYE notamment.
forme de promesses tant le sujet est en mouvement permanent. Sagissant des
risques, et compte tenu du fait quils voluent aussi en fonction des contraintes
rglementaires et lgislatives, nous avons pris le parti de les aborder de
manire intgre dans le corps du rapport.
Finalement, il en ressort des recommandations simples et qui mettent en lumire
la ncessit de soutenir linnovation sur les marchs franais et europens en
poursuivant les partenariats entre les sphres publiques et prives.
PRAMBULE
LHomo sapiens fut le premier manipuler des concepts. Cette capacit lui permit,
daprs certains scientifiques, de supplanter Nandertal, pourtant plus robuste et
a priori mieux adapt aux conditions de vie difficiles de lpoque.
Depuis, lHomme a volu et imagin de nouveaux concepts, de nouvelles doctrines,
ou idologies toujours plus complexes et sophistiqus, fruits dune crativit
dbordante. LHomme cre des normes et thories pour mieux modliser et
matriser le monde rel dans lequel il volue.
Avec la cration et lexpansion dInternet facilites par les nouvelles technologies
de linformation, lHomme saventure dsormais sur un territoire virtuel mais bien rel
quil ne matrise plus tout fait. LHomme devient lhomo numericus cest--dire un
individu ultra connect qui contribue par ce biais (sans en tre forcment conscient)
au dveloppement de lconomie numrique. Nous sommes donc aujourdhui
les principaux acteurs de cette conomie, nos interactions sur la toile et les donnes
que nous y changeons constituent une valeur inestimable tout du moins pour
les entreprises qui auront su les capter et les valoriser, au premier rang desquels les
GAFA (Google, Apple, Facebook, Amazon).
Ces nouvelles pratiques, qui impliquent le recueil et le traitement dinformations
personnelles, ne sont pas trangres au sentiment de mfiance, voire de dfiance,
qui sest dvelopp. Les nom, prnom, ge, profession, gots, prfrences
sexuelles ou politiques, les convictions religieuses et les appartenances syndicales
sont autant dlments dont regorge le web prt livrer tous nos secrets malgr
(7) Lobfuscation est une stratgie tous les efforts dobsfucation7. Lhyper-connectivit inhrente au dveloppement
de protection de la vie prive
qui consiste publier en
de lInternet, des rseaux sociaux et des objets connects pose le dbat, justifi
quantit des informations. ou non, des liberts individuelles.
De cette manire, on tente
de noyer les informations Dans un usage priv, Internet8 incite lutilisateur contribuer enrichir le systme,
existantes que lon souhaite abandonnant, sans vritablement sen rendre compte, ses donnes personnelles.
cacher.
La contrapose professionnelle implique que les entreprises utilisent au quotidien
(8) Internet est ici considr
dans son acception la plus des donnes personnelles pour comprendre et apprhender au mieux leur
large du terme, cest--dire sa environnement et les comportements de leurs clients.
capacit relier les terminaux
informatiques et rapprocher Devant un tel mlange des genres (vie publique-vie prive), ltat doit raffirmer
les hommes.
son double rle de rgulateur dune part et de protecteur des liberts individuelles
dautre part.
Avec lavnement du Big Data, limprieuse ncessit de prserver les liberts
individuelles demeure. Elle ne doit pourtant pas en annihiler les formidables
opportunits qui soffrent aux entreprises et aux tats.
CONNATRE LE MARCH
DU BIG DATA POUR
MIEUX EN PROFITER
LE BIG DATA,
UNE DFINITION COMPLEXE
La transformation numrique qui sopre devant nos yeux, lchelle de la
plante entire, doit son succs une matire premire dont la source nest pas
prte de se tarir, et qui constitue dsormais le nouveau ptrole: le Big Data.
Dans un ouvrage rcent9, les journaliste et romancier Christophe LABBE et (9) Marc DUGAIN et Christophe
LABBE. Lhomme nu. La
Marc DUGAIN dcrivent le monde des Big Data comme un monde qui met sous dictature invisible du
cloche les individus, de manire beaucoup plus subtile et indolore. Les donnes numrique, Paris, Plon, 2016.
sempilent sans autre objet que dalimenter des bases vise commerciale, dans
lesquelles les services peuvent piocher discrtion quand un homme connect
devient suspect.
Le 22 Aot 2015, la commission gnrale de terminologie et de nologie sest
saisie de lexpression Big Data pour lui donner une traduction officielle en franais.
On parle ds lors de volumes de donnes structures et non structures,
difficilement grables avec des solutions classiques de stockage et de
traitement. Ces donnes proviennent de sources diverses et sont (pour la
plupart) produites en temps rel.
Le Big Data ne doit pas tre confondu avec des notions connexes qui tutoient tout
autant lunivers des donnes personnelles.
Le cloud computing, par exemple, dsigne des prestations distance, cest--dire
des logiciels et supports de stockage de donnes, lesquels se trouvent physiquement
rpartis dans des Datacenter10 et non pas sur le terminal de lutilisateur. (10) Un data-center (ou centre
de donnes) est un site
Lorsque lon voque le terme de datamining, on fait rfrence lensemble des physique sur lequel se
trouvent regroups des
techniques ayant pour objet lextraction dun savoir partir de grandes quantits quipements constituants
de donnes, par des mthodes automatiques ou semi-automatiques. le systme dinformation
de lentreprise. Il peut
LOpen data matrialise un processus qui consiste en louverture des donnes tre interne ou externe
publiques ou prives en vue de les rendre disponibles lensemble de la lentreprise considre.
population sans restriction juridique, technique ou financire.
Linternet des objets fait rfrence aux objets connects internet qui transmettent
des donnes numriques par le biais de puces radiofrquences (RFID). Ces objets
peuvent communiquer entre eux. On les retrouve dans la grande distribution, dans
les objets du quotidien (podomtres connects, domotique, compteurs lectriques
intelligents), dans les avions, les voitures, dans le monde mdical, etc.
8 INHESJ juillet 2016 Rapport du Groupe de veille et analyse
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
s. La Varit nous
diversit des donnes
le pour le Big Data,
tous les recoupements
rlations imaginables.
traitement est enfin
re la notion de Big
imensions supposent
able :
r et dexploiter des
normes de donnes
aines de TO),
de multiples sources par un rseau performant,
INHESJ juillet 2016 Rapport du Groupe de veille et analyse 9
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
LE BIG DATA,
CE NOUVEL OR NOIR
La seconde moiti du XIXe sicle a vu natre lindustrie du ptrole dcoupant
le monde en deux savoir dun ct les pays producteurs et de lautre les
pays consommateurs.
Le XXe sicle consacra le ptrole comme la ressource ultime. La gopolitique
sest construite autour des zones daffluence de lor noir. Lconomie, le business
vit au rythme (des battements) des derricks et du prix du baril. Tout ce qui tourne
autour de cette nergie fossile devient un vritable enjeu. Quelques crises et
guerres plus tard, le dfaut de ptrole aiguise les ides des pays qui sont dpourvus
de cette matire premire et lon imagine pouvoir le remplacer ou tout du moins
lui adjoindre de nouvelles nergies.
La fin des annes 1990 met en exergue un nouveau ptrole, linformation. Celui
qui sait avant les autres possde ds lors un atout stratgique de premier plan.
Laube du XXIe sicle acclre le dveloppement de nouvelles technologies
offrant une nouvelle re linformation en la fragmentant en donnes lmentaires
brutes, disperses et pourtant exploitables, cest lavnement du Big Data.
Lavantage de la donne sur le ptrole est que tout le monde en produit,
individuellement, en organisation, consciemment ou inconsciemment. Cette
multitude de donnes concerne tous les pans de nos vies prives, publiques et
professionnelles. Ces donnes agglomres deviennent des informations qui
sont autant de trsor pour qui sait les manipuler et les comprendre. Ce Big Data
est un vritable El Dorado pour les entreprises et ce quel que soit leur secteur
dactivit. Fini la dpendance une matire premire exclusive et confisque par
un petit nombre. La donne est celui qui la produit ou la collecte. Les entreprises
lont bien compris se mettant en qute de donnes pour leur propre compte
ou pour en faire commerce.
Pour sen convaincre, il suffit danalyser les principaux chiffres lis lconomie du
Big Data. Les pays et/ou les entreprises du monde entier saisissent lopportunit
qui soffre elles dexploiter un ptrole aux sources innombrables et inpuisables.
Les prvisions mondiales saffolent car on prte au Big Data la capacit de crer
une conomie qui lui est propre et dont on fait depuis peu une comptabilit mondiale
et par march. Comme toute conomie, les prvisions de son dveloppement
deviennent autant dindicateurs capitaux.
ANALYSE STRATGIQUE
DU BIG DATA
Les faiblesses
Vracit des donnes soumise caution (validit vrifier: obsolescence).
La rgle des 5V prend en compte cette dimension de la vracit qui est
fondamentale lorsque lon alimente les modlisations. Lobsolescence de la
donne est galement un pige non ngligeable. Na-t-on jamais crois sur les
rseaux sociaux des profils de personnes disparues? Ce phnomne est pris en
considration par les principaux rseaux sociaux.
Organisation dlicate des donnes pour des usages difficiles anticiper
(data architect).
Afin de corrler les donnes entre-elles, il faut les organiser, les structurer. Des
rflexions sur des nouveaux mtiers ou normes prennent forme.
Complexit des algorithmes spcifiques (hors corrlations ou statistiques).
Utilisation dlicate des donnes personnelles (pistes: anonymisation/
profilage).
Difficult pour afficher a priori lusage des donnes personnelles collectes
(dclaration CNIL). Il peut en tre de mme pour dterminer la finalit
du traitement.
Les opportunits
Multiplicit des sources de donnes dans le Cloud.
ce jour toutes les informations sont loin dtre utilises et surtout de nouvelles
applications, objets connects agrgent encore plus dinformations toujours plus
varies et prcises.
Capacit de traitement illimit offerte par le Cloud.
Disponibilit de composants pour constituer un Data Pipeline modulaire ( la
porte du mtier).
Mise disposition par ltat des donnes publiques (Public Data, Open Data).
Cette information a lavantage dtre rpute fiable par sa source et surtout elle
ouvre un accs des informations trs peu prsentes sur la toile.
La dynamique des objets connects favorise linteroprabilit des systmes.
Le nouveau rglement de lUE va faire disparatre lobligation de dclaration
pralable pour la cration de base de donnes incluant des donnes
personnelles. Cela ouvre une nouvelle flexibilit dans les usages.
Les menaces
Risques induits sur la protection de la vie prive des citoyens.
De nombreuses informations sont colliges avec le consentement des intresss
sans pour autant que ceux-ci aient vritablement conscience de la richesse de
la donne offerte ni du spectre dapplication qui en dcoule.
Prdictibilit des comportements individuels si anonymat non respect.
Orwellisation (1984) de la socit (drive Big Brother).
Utilisation du Big Data des fins malveillantes (manipulation de lopinion,
contrle totalitaire).
Le film Data Gueule (Big Data: donnes, donnes, donnez-moi ! #DATAGUEULE 15)
dmontre les drives possibles.
ANALYSE
alyse des facteurs PESTEL
2.2. Analyse des facteurs PESTEL
6-spage 46) DES FACTEURS PESTEL
(Cf. Annexe n6-spage 46)
yse des facteurs(Cf. annexepolitiques
6)
PESTEL - Analyse des facteurs politiques
Data, les GAFA jouent dune vritable influence auprs des politiques. Les
Avec
nent le BigPESTEL
offrent Data,
de les GAFAdes
- Analyse
nombreuses jouent
facteursdune
perspectives. vritable influence auprs des politiques. Les
politiques
nnes quils dtiennent
Avec le Bigoffrent
Data, les de nombreuses
GAFA perspectives.
jouent dune vritable influence auprs des politiques.
ont a t gre la campagne prsidentielle dObama, et dans une moindre
La manireLesdont
donnes quils dtiennent offrent de nombreuses perspectives.
a t gre la campagne prsidentielle dObama, et dans une moindre
ande, en constituent des exemples concrets.
sure celle de Hollande,
La manire en constituent
dont a t gre lades exemples
campagne concrets.
prsidentielle dObama, et dans une
moindre mesure
nalyse des facteurs conomiques celle de Hollande, en constituent des exemples concrets.
PESTEL - Analyse des facteurs conomiques
masses dePESTEL donnes- Analyseconstitue
des facteurs un conomiques
vritable enjeu. Au-del des GAFA, de
Lanalyse des masses de donnes constitue un vritable enjeu. Au-del des GAFA, de
ient le jour commedescelui de Data Brokers (courtier en donnes). Une chaine
uveaux mtiersLanalyse masses
voient le jour de donnes
comme constitue
celui un vritable
de Data enjeu. Au-del
Brokers des GAFA,
(courtier en donnes). Une chaine
tre producteurs, stockeurs,
de nouveaux courtiers,
mtiers voient le jour commeanalyseurs et exploiteurs
celui de Data Brokers (courtier en des donnes de
valeurs se cre entre producteurs, stockeurs, courtiers, analyseurs et exploiteurs des donnes de
donnes). Une chane de valeurs se cre entre producteurs, stockeurs, courtiers,
sse. analyseurs et exploiteurs des donnes de masse.
s, le leader surtats-Unis,
Aux Etats-Unis,
Aux ce march
le leader est
sursur
le leader Acxiom
cecemarch (Socit
estAcxiom
march est Acxiom texane
(Socit
(Socit texane qui qui exploite
texane qui
exploite les
les exploite lesdonnes
donnes
ersonnes avec un
donnes CA
de 700de 1,1
millionsmilliards
de personnes de
avec dollars).
un CA
700 Millions de personnes avec un CA de 1,1 milliards de dollars). de 1,1 milliards de dollars).
nalyse
PESTELdes -facteurs
Analyse des socitaux
facteurs socitaux
PESTEL - Analyse des facteurs socitaux
analyse du LaBig
La finesse danalyse
finesseData dupermet
danalyse Big Data
du Big Datapermet
permet
ances ou les comportements
didentifier les tendances
dentifier les tendances ou les comportements ou les comporte-
e des
is aussiindividus.
ments mais
le profilage Cela
des
aussioffre
individus. des
le profilage
Cela
des individus.
offre des
Cela offre des possibilits de proposition de
sition de
ssibilits de services
proposition oudeproduits
services ou produits services ou produits
sur mesure mais ga-
galement une
mesure maislement possibilit
galement
une possibilit de
unede possibilit
procder dede la
ure et de la discrimination.
cder de la censure et de la discrimination.
censure et de la discrimination.
LAFFIRMATION DUN
PRINCIPE DE PROTECTION DES
DONNES PERSONNELLES
En 1974, la France lance le projet gouvernemental SAFARI16 qui vise identifier (16) Du nom de SAFARI pour
systme automatis pour les
chaque citoyen par un numro et interconnecter, par le truchement de ce numro, fichiers administratifs et le
tous les fichiers de ladministration. Cela suscite un vif moi dans lopinion publique. rpertoire des individus. (Cf.
annexe 7).
La presse titre: SAFARI: La chasse au franais. (17) Loi n78-17 du 6
Il en rsulte quatre ans plus tard, la loi17 du 6 janvier 1978 relative linformatique janvier 1978 relative
linformatique, aux fichiers et
aux fichiers et aux liberts qui institue une autorit administrative indpendante aux liberts.
franaise, garante de la protection des donnes caractre personnel: la CNIL18. (18) Commission nationale de
linformatique et des liberts.
En 1985, la Convention dite19108 est le premier instrument international (19) Convention pour la
contraignant qui a pour objet de protger les personnes contre lusage abusif du protection des personnes
traitement automatis des donnes caractre personnel. Elle rglemente les flux lgard du traitement
automatis des donnes
transfrontaliers des donnes et proscrit, entre autres, le traitement des donnes caractre personnel. Son
sensibles20 relatives lorigine raciale, aux opinions politiques, la sant, la entre en vigueur seffectue
le 01/10/85.
religion et la vie sexuelle.
(20) Google annonce
En 1995, une directive europennes21 reprend les principes de la loi franaise aujourdhui, dans ses
conditions dutilisation, la
de 1978. Larticle 29 de cette directive cre un groupe de travail protection de ces mmes
europen (G29) sur la protection des donnes, qui rassemble lquivalent des donnes sensibles.
CNIL lchelle europenne. (21) La directive 95/46/CE du
24 octobre 1995. Elle est
Le G29 ngocia avec les Amricains le Safe Harbor visant amliorer la rforme et transpose en
droit franais par la loi du
protection des donnes personnelles des rsidents de lUnion europenne traites 6 aot 2004 sur lconomie
aux tats-Unis. En effet, le Privacy Act en vigueur aux tats-Unis depuis 1974 numrique.
naccordait cette protection, par ailleurs juge infrieure celle tablie dans lUE,
quaux seuls ressortissants amricains.
Le principe de la protection des donnes personnelles se trouve rsum dans la
Charte des droits fondamentaux de lUnion europenne en son article 8 :
1- Toute personne a droit la protection des donnes caractre personnel
la concernant.
2- Ces donnes doivent tre traites loyalement, des fins dtermines et sur
la base du consentement de la personne concerne ou en vertu dun autre
fondement lgitime prvu par la loi. Toute personne a le droit daccder aux
donnes collectes la concernant et den obtenir la rectification.
3- Le respect de ces rgles est soumis au contrle dune autorit indpendante.
que le droit embrasse difficilement puisque son essence est de dfinir une rgle stable,
prenne donc prvisible par et pour le sujet de droit.
Dans ce contexte, si la donne est le nouveau carburant de lconomie, le droit est
ncessairement bouscul, notamment au regard des donnes caractre personnel
qui, travers lunimdia du numrique (multimdia des usages ou des appareils
(devices) mais unit du langage machine), recouvrent en ralit la quasi-totalit de
lactivit et de la personne humaine.
En outre sajoute une catgorie particulire des donnes caractre personnel,
les donnes sensibles cest--dire traduisant un choix/appartenance philosophique,
religieux, politique, une orientation sexuelle ou des donnes relatives la sant.
Ds lors, le premier principe respecter (et donc la premire problmatique) dun
projet Big Data est celui du respect de la finalit ou plus exactement de limitation de
finalit des donnes collectes.
Se pose ensuite le problme de la pertinence des donnes, puisque par hypothse,
aucune donne nest inutile au traitement lorsquil sagit de dresser un profil, mme si lon
ne sait pas lavance ce quelle va rvler, de sorte que toutes les donnes non sensibles
peuvent a priori tre collectes dans le cadre dun tel projet
Corrlativement, si linformation est capte dans le seul but de profiler, elle doit tre
qualifie de donne personnelle.
Enfin se posent les problmes dexactitudes et de qualits des donnes, notamment au
regard dune duplication linfini de linformation et de sa conservation sans rapport
avec les volutions dune vie dhomme.
Ainsi, le Prpos fdral la Protection des Donnes et la Transparence de
la Confdration Helvtique (PFPDT) note au sujet du Big Data lexigence de
lexactitude des donnes constitue une difficult supplmentaire: les algorithmes
appliqus aux donnes massives analysent de grande masses de donnes de manire
autonome, automatise, la recherche notamment de corrlations/...ces procdures
danalyse crent de nouvelles informations lies des personnes, sans quil soit
possible de les qualifier dexactes ou de fausses, puisquelles ne constituent que des
probabilits ou des interprtations.
LES PROMESSES
DU BIG DATA
Big Data
et objets connects
LInternet des objets occupe une place centrale, la fois outil au service des
utilisateurs (paiement invisible, domotique) et collecteur de donnes (machines
agricoles, drones, compteurs intelligents).
Les objets connects revtent une ralit trs large dapplications ouvrant la voie
de nouveaux Business Models. Loffre est trs en avance sur les usages. En effet,
lexplosion des usages est facilite par lre de lInternet tout connect.
Les cosystmes slargissent pour apprhender un march plus large ou apporter
des solutions un modle socital. Les rpercussions de lInternet des objets sont
plus tangibles dans lautomobile comme en tmoignent lindustrie 4.0 (technologies
connectes et de modlisation) et le dveloppement de nouvelles offres de
services (voiture connecte). Les services de la ville reprsentent, quant eux, des
cas trs concrets o se croisent les problmatiques dintrt gnral, de confiance
et de rgulation. Ils rpondent au triptyque scurit, efficacit et qualit.
Le systme de sant soriente sur une mdecine prventive (pidmiologie) et
prdictive. Les mtiers de lassurance tendent individualiser le risque de lassur.
Les villes sont impactes par les attentes des citoyens/usagers en matire de
bien-tre, de qualit de vie et de dveloppement durable. La valeur des services
sen trouve par ailleurs dmultiplie notamment dans le domaine des transports
qui intgre dans son environnement des applications mobiles (Blablacar, Autolib,
Faciligo), des rseaux sociaux et des infrastructures urbaines.
Big Data
et intelligence artificielle25 (25) h t t p : / / w w w .
informatiquenews.fr/
lintelligence-ar tificielle-
morte-vive-le-big-
Lapproche avec les Big Data est assez diffrente de celle qui sous-tendait data-13392
lintelligence artificielle des annes 1980. Les premiers traducteurs sappuyaient
sur des modles et de la programmation qui tendaient reproduire lintelligence et
la rflexion humaine (programme Watson conu par IBM).
Les systmes actuels sappuient sur des ordinateurs capables dutiliser des millions
de textes et de trouver la bonne quivalence dune langue lautre.
Pour exemple, le systme Google Vision de Google est capable de trouver une
image qui ressemble une autre. galement, des tudes bases sur lanalyse
dexamens IRM permettent didentifier des criminels avec une bonne probabilit.
Et sans aucune thorie sous-jacente, il est galement possible de faire sparer les
rcidivistes des non rcidivistes. Une telle approche nest certes pas sans poser
de lourdes questions.
Dans le domaine des crimes ou des dlits, les donnes permettent danticiper les
crimes prmdits typiquement les cambriolages, vol de voitures, braquages (outil
Predpol), les dlits ou actes terroristes (fichiers PNR), et de fournir en temps rel
les informations pertinentes aux quipes sur le terrain sur des smartphones ou des
assistants numriques personnels.
(27) Agence pour lemploi des LAPEC27 a reu de 2011 2015 moins de 650 offres demploi sur des postes
cadres.
de Data Analyst et Data Scientist. Avides de data talents, les entreprises crent
un vritable rseau spcialis afin de capter directement la ressource et anticiper
sur leurs besoins en personnels.
Dans un contexte de march de lemploi plutt morose en Europe, il y a des
opportunits saisir.
La France qui est le deuxime pays ayant obtenu le plus de mdailles Fields en
mathmatiques et dont les coles dingnieurs et formations en mathmatiques,
bnficient dune excellente rputation au niveau mondial, doit donc adapter son
systme ducatif pour rpondre aux besoins croissants en matire de recrutement
lis au Big Data. Elle a le potentiel de former les meilleurs experts de la data au
niveau international.
Il y a donc un besoin de formation et de prolifration de programmes acadmiques
autour de la thmatique Big Data. Certains vont mme jusqu penser que
lducation nationale devrait intgrer des modules de familiarisation avec le
codage et le traitement de la donne, afin de susciter des vocations et dveiller la
curiosit ds le plus jeune ge.
RECOMMANDATIONS
Les recommandations dactions dIntelligence conomiques proposes ici
sentendent comme autant de moyens identifis par notre Think Tank pour
permettre notre client le GIE spcialis en nouvelles technologies de
se dvelopper en favorisant linnovation dans le respect des contraintes
rglementaires existantes et venir.
AXE 1-
LIBRER LES POTENTIALITS
DUSAGE
OBJECTIFS GNRAUX
Disposer dinformations prcises sur lcosystme du Big Data en termes
juridique, conomique, technologique et ducatif.
Identifier, anticiper, insuffler et promouvoir les nouveaux usages.
Fdrer la communication pour entretenir la confiance des acteurs et en
particulier le grand public.
tre la tte dune filire Big Data et ainsi alimenter la fois les services
de ltat, un ple de comptitivit ddi, des filires ducatives et
professionnelles.
Fournir une source de dveloppement et daccs de nouveaux produits
et services.
OBJECTIFS OPRATIONNELS
Reprendre et faire aboutir la prconisation ralise par Nouvelle France
Industrielle savoir la mise en place dun observatoire des usages du Big Data.
Depuis 2 ans, le ministre de lconomie multiplie les initiatives telles que les
appels projets, les challenges ou encore comme en octobre 2015 lorsquil a
diligent une tude baptise Observatoire des usages du Big Data (donnes
massives) suivant ainsi une prconisation manant de Nouvelle France
Industrielle de 2014. Or ce jour, cette rsolution na pas connu les suites
(28) En ligne : http://www.
espres comme en atteste, le 12 avril 2016, le Conseil gnral de lconomie e c o n o m i e . g o u v. f r / c g e /
(CGE) sur son site internet28 en publiant la synthse de son rapport dtude meilleures-pratiques-pour-
big-data-et-lanalytique-dans-
avec un constat dimmobilisme. ladministration-nouvelle-etape
ACTIONS
Crer et animer une fondation ou une association de type loi 1901 ayant
pour objectif de mettre en place un Observatoire des usages Big Data.
Reprendre et ranimer les analyses et les initiatives du ministre de
lconomie pour sadosser la deuxime phase des 34 plans de
reconqute de Nouvelle France Industrielle.
Fdrer les principaux acteurs selon trois typologies: les producteurs, les
courtiers et les consommateurs des donnes.
Cibler directement un secteur conomique en particulier pour lancer
lobservatoire et ainsi dbuter avec un nombre dacteurs matrisable.
Se rapprocher des initiatives europennes.
Mettre en place une plate-forme (www.observatoiredesusages_BIGDATA.fr).
CONTRIBUTEURS
Le principal animateur, fondateur de lobservatoire doit tre le GIE afin
dorienter les travaux. Les autres acteurs pouvant tre:
Ministre de lconomie au travers de linitiative Nouvelle France Industrielle.
Universits et Grandes coles (dingnieurs ou de commerce).
Branche professionnelle des Technologies de linformation prsente dans
le GIE.
Un ple de comptitivit du numrique.
Juristes spcialiss dans le numrique.
AXE 2-
ANTICIPER EN MISANT
SUR LA FORMATION
OBJECTIFS GNRAUX
Adapter le systme ducatif franais afin de faire face la demande
exponentielle de spcialistes du Big Data (data scientist, data analyst,
data architect, chief data officer) ;
Former des profils, reconnus lchelle internationale, capables de
valoriser les donnes pour:
o Gnrer de la croissance pour les entreprises ;
o Extraire de la connaissance utile loptimisation des offres et services.
OBJECTIFS OPRATIONNELS
Dvelopper une offre de formation (initiale ou continue) par nature
transdisciplinaire lintersection de trois domaines dexpertise:
(i) linformatique, (ii) les statistiques et les mathmatiques, et (iii) les
connaissances mtier.
Construire une vritable filire Big data comprenant des modules de
familiarisation avec le traitement de la donne ds le plus jeune ge.
Faire voluer les comptences des professionnels actuellement la
priphrie du secteur (Charg dtudes statistiques, Chef de projet
informatique, Ingnieur en systme dinformation) pour les adapter aux
enjeux du Big Data.
ACTIONS
En matire de formation:
Construire un rfrentiel de formation Big Data qui permettra
dtablir pour chaque niveau dtude un contenu adapt et les
objectifs pdagogiques associs. Il fournira galement des lments
de mthodologie pour proposer un parcours de formation Big Data au
sein dune entit (publique ou prive).
Dfinir un rseau dcoles et universits pilotes charges de mettre en
uvre les recommandations du rfrentiel.
Cartographier et suivre lvolution des formations initiales ou continues
autour de la thmatique Big Data.
Crer de nouvelles formations transdisciplinaires entre institutions de
comptences varies (universits, coles dingnieurs, grandes coles
de management) et en y associant les entreprises. Celles-ci seront
charges de proposer des projets dexprimentation aux apprenants
(tudes de cas ou stages longs) ;
Crer une cole ex nihilo (inspire du modle 42) formant exclusivement et
en masse des spcialistes Big Data. Lcole sera entirement finance par
les principaux recruteurs franais et europens de comptences Big Data.
Dvelopper une gamme de matriels ducatifs ouverts et notamment:
o Crer des MOOC (Massive Open Online Courses) afin de rendre
disponibles des cours de rfrence notamment dans le monde
francophone. Pour y arriver, on pourra sappuyer sur la plateforme
FUN du MENESR. Le contenu offert pourra galement servir
la formation continue dans les entreprises et la formation des
enseignants eux-mmes.
o Dvelopper des serious games: application informatique, dont
lobjectif est de combiner la fois des aspects srieux (Serious)
tels, de manire non exhaustive, lenseignement, lapprentissage, la
communication, ou encore linformation, avec des ressorts ludiques
issus du jeu vido (Game).
Dvelopper dans les tudes juridiques la place des droits du numrique
et des donnes.
CONTRIBUTEURS
Ministre de lducation nationale, de lEnseignement suprieur et de la
Recherche (MENESR).
o La direction du numrique pour lducation (DNE).
Ministre du Travail, de lEmploi, de la Formation professionnelle et du
Dialogue social.
Universits et Grandes coles (dingnieurs ou de commerce).
Collges et Lyces.
Branches professionnelles.
AXE 3-
CONVERTIR LE GRAND PUBLIC
Promouvoir laide et le support apports aux citoyens par les innombrables
services issus du Big Data ainsi que les opportunits de croissance et
dveloppement pour les entreprises utilisatrices de services lis au Big Data.
Ddiaboliser le Big Data auprs du grand public et des entreprises
utilisatrices.
OBJECTIFS OPRATIONNELS
Communiquer sur des cas dusage grand public marquants (tmoignage
ou prospective).
Diffuser un ensemble de connaissances des forces et avantages de
lutilisation des solutions de Big Data auprs des entreprises.
Communiquer sur les lois, rgles, normes, labels en vigueur autour de lutilisation
des donnes prives auprs des consommateurs afin de les rassurer.
Former les entreprises utilisatrices lvaluation de la conformit des
solutions de Big Data.
ACTIONS
Designer une agence de communication pour dcliner les campagnes.
Engager les autorits sponsoriser les campagnes en qualit de caution
morale.
Promouvoir les normes et labels de bonnes pratiques dans lutilisation
massive des donnes.
INHESJ juillet 2016 Rapport du Groupe de veille et analyse 29
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
CONTRIBUTEURS
Associations professionnelles dutilisateurs et de producteurs.
Associations de consommateurs.
Ministre de lconomie, de lIndustrie et du Numrique.
CCI, Collectivits territoriales, services gouvernementaux.
Organismes de lablisation, normalisation, certification.
Agences de communication.
AXE 4-
FAIRE DU DROIT UN OUTIL
DE VALORISATION DE LA
TECHNIQUE PAR LA CONFIANCE
OBJECTIFS GNRAUX
Le respect de la norme juridique par la technique ne peut tre obtenu efficacement
que par la technique. Le code (au sens de programme informatique) doit faire Loi.
La donne personnelle est lempreinte numrique, lADN numrique dun homme.
Un impratif: garantir la confiance.
Comme pour toute relation ou interaction humaine, un projet Big Data durable
ncessite de garantir la confiance de lutilisateur, qui, allie la scurit juridique
ne du respect de la conformit, devient alors un avantage concurrentiel.
OBJECTIFS OPRATIONNELS
Anticiper par la formation, lapplication de la nouvelle rglementation europenne de
protection des donnes de 2018, pour que les entreprises du GIE obtiennent ds
prsent un avantage concurrentiel sur le march franais mais galement lexport.
Valoriser la technique pour valoriser limage des entreprises vis--vis des clients/
utilisateurs.
Dans le cadre du partenariat public/priv: dvelopper un label qualit de
compliance by design pour garantir la confiance en couplant le respect des
donnes personnelles ds la conception leur conservation par un registre et donc
au respect dun droit de proprit autonome analogue au droit dauteur, tant droits
patrimoniaux quextra-patrimoniaux.
30 INHESJ juillet 2016 Rapport du Groupe de veille et analyse
BIG DATA ENTRE RISQUE ET OPPORTUNIT ?
Groupe de veille et danalyse 19e Session nationale spcialise 2015-2016
Protection des entreprises et intelligence conomique
ACTIONS
Action de formation auprs des entreprises du GIE lapplication de la
rglementation europenne au printemps 2018.
Action de veille juridique auprs des entreprises du GIE sur le suivi de lapplication
de la rglementation.
Action dinfluence auprs de la chancellerie via un partenariat public/priv pour
la mise en place de:
formation spcifique la protection des donnes notamment auprs des
magistrats;
politique civile et pnale de protection des donnes et du patrimoine immatriel.
Action de veille juridique des dcisions et sanctions prises pour le non-respect de
la RGPD afin danticiper les futures volutions de la rglementation.
Action de financement public subordonn au respect du label de compliance by
design.
CONTRIBUTEURS
Juristes spcialiss dans la protection des donnes.
Acteurs et entrepreneurs des entreprises du Big Data.
Hommes politiques.
Associations thiques de protection des droits de lhomme et/ou en faveur dun
dveloppement durable sustainable development.
AXE 5-
INVESTIR SUR LES AVANCES
TECHNOLOGIQUES
OBJECTIFS GNRAUX
Se positionner en tant que leader sur les technologies de pointe en matire
dexploitation et surtout de protection des donnes.
Encourager lexcellence franaise et europenne en termes de conformit des
applications avec les rglementations actuelles et futures.
Protger les champions technologiques franais et europens des vises
amricaines.
OBJECTIFS OPRATIONNELS
Poursuivre et intensifier les efforts de recherche et dveloppement dans le primtre
technologique concern par des subventions ou partenariats public/priv.
Gagner la course de la mise sur le march des innovations technologiques majeures
afin de bnficier des avantages de premier entrant par des assouplissements,
aides incitatives ou partenariats public/priv.
ACTIONS
Crer ou renforcer des ples de comptitivit autour de lexploitation et/ou la
protection des donnes en y attirant les champions franais du secteur.
Subventionner les recherches universitaires et/ou crer des chaires spcifiques,
notamment sur le chiffrement homomorphe en lien avec des entreprises prives.
Encourager les initiatives voire influencer les objectifs des coles innovantes
(Ecole 42, ) et incubateurs/acclrateurs de start-up (The Family, ) par des
partenariats public /priv afin de maximiser les chances de trouver les projets
trs haut potentiel.
Crer un crdit impt recherche additionnel spcifique pour les entreprises
travaillant sur les sujets critiques (chiffrement homomorphe, ).
Btir un rfrentiel normatif de privacy by design lgitim par une obligation
assurantiel pour toute application ou service traitant des donnes.
Protger le capital des socits innovantes dans le secteur en limitant les prises de
participation trangre (prise de participation BPI France, fusion autres champions,
).
Lister et accompagner les socits innovantes afin de les prmunir des risques et
menaces conomiques (vol de technologies, ingnierie sociale, piratage) au
travers de rencontres (CCI, groupements, syndicats patronaux, ) ou de conseils
(DGSI, gendarmerie).
CONTRIBUTEURS
Ministre de lconomie, de lIndustrie et du Numrique.
Ministre de lducation nationale, de lEnseignement suprieur et de la Recherche.
Universits, centres de recherche.
Branches professionnelles.
BPI France.
Services dintelligence conomique.
CONCLUSION
NOTE DE SYNTHSE
Propos liminaire
Lappellation Big Data, donnes massives en franais, fait rfrence un domaine
en pleine expansion qui affectera demain tous les aspects de nos vies quotidiennes.
La transformation numrique de la socit qui sopre devant nos yeux, lchelle
de la plante entire, doit son succs une matire premire dont la source nest
pas prte de se tarir, et qui constitue dsormais le nouveau ptrole: le Big Data.
Primtre du sujet
Le Big Data met en jeu des volumes gigantesques de donnes, structures ou non,
qui sont difficilement grables avec les solutions classiques.
Ces donnes proviennent de sources diverses, pour la plupart produites en temps
rel, et trs souvent gnres leur insu par les utilisateurs. Cet aspect pose le
dbat de la protection des donnes individuelles et de lthique des entreprises et
du rle des tats, dautant quau cours des deux dernires annes, on a produit
davantage de donnes que dans toute lhistoire de lhumanit auparavant.
Analyses
Avec le Big Data, nous quittons la priode de lchantillonnage artisanal pour entrer
dans lre de lanalyse systmatique et de la modlisation des donnes mondiales.
GVA Big Data : Entre r
Son ambition nest pas moins que de Comprendre ce qui tait incomprhensible
et de Prvoir ce qui tait imprvisible.
SonII.
objectifANALYSE
est en priorit pourSTRATEGIQUE
les entreprises de rpondreDU BIG DATA
la question suivante:
quel avantage concurrentiel puis-je tirer
GVA Big Data : Entre risque et opportunit ? des donnes massives auxquelles jai
accs concernant2.1. Analyse
monData
GVA Big activit? par la matrice SWOT
: Entre risque et opportunit ?
(Cf. Annexe n5 page
urs PESTEL Les forces
yse des facteurs PESTEL
! Disponibilit de
-spage 46) donnes.
rs politiques ! Grande varit d
e des facteurs politiques
jouent dune vritable influence auprs des politiques. Les disponibles (avnemen
ta, les GAFA jouent dune vritable influence auprs des politiques. Les des rseaux sociaux)
nombreuses perspectives.
ent offrent de nombreuses perspectives. Ces deux pre
la campagne prsidentielle dObama, et dans une moindre proviennent des nom
nt a t gre la campagne prsidentielle dObama, et dans une moindre
uent des exemples concrets. par les technologies
de, en constituent des exemples concrets. nouvelles pratiques.
eurs conomiques
lyse des facteurs conomiques Les entreprises col
nnes constitue un vritable enjeu. Au-del des GAFA, de les donnes mais su
masses de donnes constitue un vritable enjeu. Au-del des GAFA, de
me celui de Data Brokers (courtier en donnes). Une chaine individus partagent lib
nt le jour comme celui de Data Brokers
phnomnale (courtier en donnes).
dinformations selon Une chaine
le principe du de
si cest gratuit, cest que vou
stockeurs, courtiers, analyseurs et exploiteurs des donnes
e producteurs, stockeurs, courtiers, analyseurs et exploiteurs des donnes de
Le Big
! Data repose surinfinies
Possibilits une technologie en volutionde
de recoupement constante
donnes (puissance de
(corrlations insoupon
calcul, capacit de stockage, algorithmes) et une permanente innovation des
! Efficacit et rapidit des outils danalyse ( la porte de lutilisateur mt
ce march
le leader sur est Acxiom
ce march (Socit
usages Prisetexane
! (applications qui
de la exploite
intelligentes).
en main
est Acxiom (Socit texane qui exploite les donnes dfinition des lestraitements
donnes par le mtier (crativit li
nsonnes
CA de 1,1 milliards de Mais
dollars).
! le Libration
avec un CA de 1,1 milliards dollars).de lutilisateur
droit ne pouvant
de mtier des
anticiper la technologie, lescontraintes des applications
limitations introduites en DSI (f
France par la CNIL, portant notamment sur lobligation de dclarer a priori la
eurs socitaux Les progrs technologiques croissants du stockage et du partage de la
lyse des facteurs socitaux finalit des donnes personnelles collectes, ont rapidement t dpasses.
algorithmes toujours plus puissants, offrent des capacits de traiteme
Datadupermet
alyse Big Data permet toujours plus performants. Ces services mis disposition des sachants
omportements librent linnovation mtier.
ces ou les comportements
Cela
des offre des
individus. Cela offre des ! Le Big Data permet de Comprendre ce qui tait inco
es
tionou deproduits
services ou produits Prvoir ce qui tait imprvisible .
possibilit de
lement une possibilit de Lexemple de Google permet dillustrer cet aspect prdictible grce l
imination.
e et de la discrimination. corrles lui permettant didentifier voire de localiser une pandmie grippa
RECOMMANDATION n1
Librer les potentialits dusage
Contribuer la mise en place dun observatoire des usages du Big Data dans le but
doffrir au GIE une position en vue, lui permettant dassocier son image la notion
de Big DATA.
Cette place stratgique est un atout pour suivre les volutions rglementaires, du
march et les nouveaux usages avec un temps davance. Cet observatoire devant
devenir un lieu dinfluence.
RECOMMANDATION n2
Anticiper en misant sur la formation
Tous les acteurs mondiaux (privs et publics) convoitent le march Big Data. Pour
profiter de la manne, ils vont devoir entre autres choses se doter de comptences
capables de valoriser linfini potentiel des donnes.
La formation (et par suite le recrutement) de ces nouveaux experts de la data revt
donc un intrt majeur pour les tats. La France devra adapter son systme ducatif
et imaginer une vritable filire Big Data comprenant notamment: des modules de
sensibilisation au traitement de la donne tout au long du cycle de formation, de
nouveaux programmes transdisciplinaires entre institutions de comptences varies
et enfin une gamme de matriels ducatifs innovants (MOOC, serious games, etc.).
RECOMMANDATION n3
Convertir le grand public
La dfiance des particuliers tout comme des entreprises vis--vis de lexploitation
de leurs donnes et, encore plus, des oprateurs les manipulant, est un frein au
dveloppement du Big Data. Les pouvoirs publics, les associations professionnelles
et les associations de consommateurs doivent donc diffuser des messages dans le
but de ddiaboliser le Big Data. Ces messages viseront expliquer les avantages
des usages du Big Data (au plan personnel mais aussi en termes de comptitivit
conomique) et dmontrer que la protection des donnes existe en faisant la
promotion des normes, labels existants ainsi quen vulgarisant larsenal juridique en
faveur de cette protection. Les moyens classiques de communication seront utiliss:
publicit, salons, sponsoring.
RECOMMANDATION n4
valuer la mise en uvre de la rglementation
La rglementation appelle une normalisation du dveloppement sous forme de
label et de bonnes pratiques du dveloppement. Le respect du Privacy by Design
ou du Privacy by Default garantira la confiance et ladhsion du grand public
aux entreprises qui lappliqueront. Il convient de ne pas attendre lentre en vigueur
de la rglementation en 2018 pour mettre en place ces principes fondamentaux.
Laccompagnement et la sensibilisation des entreprises doit sarticuler autour dune
veille juridique sur les risques ne pas tre vertueux, une formation des acteurs et les
avantages que le secteur public pourrait offrir aux pionniers.
RECOMMANDATION n5
Investir sur les avances technologiques
Linnovation technologique reste la base du Big Data. La France dispose dentreprises
performantes et de femmes et dhommes de talent autour des technologies de
traitement ou de protection des donnes, y compris natives (privacy by design).
Il faut donc la fois les encourager, les aider et les protger. Pour cela, les pouvoirs
publics et/ou les associations professionnelles peuvent renforcer les ples de
comptitivit, subventionner la recherche et accompagner les coles innovantes
(Ecole 42), allouer un crdit dimpt recherche additionnelle afin de faire converger
leurs efforts vers lmergence de solutions disruptives.
Avec les organismes normatifs et les assureurs, ils doivent mettre en place un systme
assurantiel pour imposer le privacy by design toutes les solutions existantes.
Enfin, les services ddis (DGSI, gendarmerie, CCI,) doivent protger les fleurons
franais, du point de vue capitalistique et des risques conomiques en les surveillant
et les sensibilisant.
ANNEXES
Annexe 1
GVA Big Data : Entre risque et opportunit ?
Infographie reprsentant
Annexe n1une cartographie
: Infographie des
reprsentant uneacteurs
cartographie des acteurs.
Annexe 2
70% des plus grosses entreprises amricaines ont dj
GVA Big Data : Entre risque et oppor
achet des donnes externes leur organisation
Annexe n2 : 70% des plus grosses entreprises amricaines ont dj achet des donnes externes
organisation.
42
Annexe 3
En 2016, les revenus gnrs par le Big Data travers
GVA Big Data : Entre risque et opportun
43
Annexe 4
Au niveau mondial, les principaux acteurs reconnus GVA Big Data : Entre risque et opportu
sur ce march sont les traditionnelles entreprises issues
Annexe n4du
: Ausecteur des technologies
niveau mondial, les principaux acteurs reconnus sur ce march sont les traditionne
entreprises issues du secteur des technologies.
44
Annexe 5
Analyse SWOT
Annexe n5 : Analyse SWOT
45
Analyse PESTEL
Annexe n6 : Analyse PESTEL
46
Annexe 8
La protection
Annexe europenne
N8 : La protection desdesdonnes
europenne donnes lre numrique.
lre numrique
Annexe 9
Les mtiers
mtiers porteurs porteurs
du Big Data. du Big Data
49