mardi 1 avril 2014

Big data : retour sur les enjeux juridiques


« Le big data, c’est comme le sexe chez les adolescents : tout le monde en parle, personne ne sait vraiment comment le faire, tout le monde pense que tout le monde le fait, donc tout le monde prétend le faire » [1]


Cette citation, devenue célèbre, de Dan Ariely met bien en exergue le flou qui accompagne la notion de big data.

Comme rapidement esquissé précédemment sur ce blog [2], le phénomène big data soulève également des interrogations juridiques.

Après avoir donné de nouveaux éléments de définition, cet article propose d’aller plus loin dans l’exploration des questions juridiques relatives au big data.



  1. Définition du big data 

Selon le Commissariat général à la stratégie et à la prospective [3], le big data représente « d’énormes volumes de données structurées et non structurées, difficilement gérables avec des solutions classiques de stockage et de traitement. Ces données proviennent de sources diverses et sont (pour la plupart) produites en temps réel ».


Ainsi, le big data renvoie à des masses de données qui sont tellement importantes qu’elles dépassent la capacité des outils classiques de collecte et de traitement des données. L’analyse de ces données est permise par les sciences statistiques et les mathématiques appliquées et donne lieu à une meilleure connaissance et la modélisation notamment des comportements des individus dans plusieurs domaines (consommation, transport, éducation, etc.).


Plus simplement, le big data peut être est caractérisé par un modèle tri dimensionnel composé des  célèbres « 3 V » [4].

-          Tout d’abord, la Volumétrie. En effet, le big data est composé d’une masse gigantesque de données produites notamment par les réseaux sociaux (Twitter génère 7 Teraoctects [5] par jour) mais également par les initiatives d’éducation en ligne ou MOOC (Massive Open Online Courses), via l’Internet des objets, etc.

-          Ensuite la Vélocité qui fait référence à la vitesse à laquelle changent les données ainsi qu’à la vitesse auxquelles celles-ci doivent être utilisées pour en tirer de la valeur.

-          Enfin, la Variété car les données concernées par le big data sont collectées sur des formats très variés (blogs, réseaux sociaux, tweets, textes, images, photos, vidéos, musiques, transactions, etc.).


Au final, le big data est associé à un nombre impressionnant de données issues de diverses et multiples sources dont l’échelle temps est l’immédiateté.


  1. Pourquoi « le big data bouscule le droit [6] » ?

Le concept de big data bouscule le droit en raison de son ambivalence car le big data se révèle à la fois profitable, principalement pour les opérateurs économiques [7] et potentiellement néfaste, principalement pour les individus.


En effet, d’une part, le big data peut permettre, entre autres, de connaître les besoins des consommateurs, de faire de la publicité ciblée ou comportementale, de prédire une épidémie de grippe grâce aux requêtes des internautes ou encore d’aider les gouvernements dans la lutte contre le terrorisme en se transformant en agence de renseignements.


Mais, d’autre part, avec le big data, il existe des risques de détournement de fichiers et d’interconnexion des données ayant trait à la vie privée des individus. Les données anonymisées deviennent, par recoupement, des données personnelles indirectement identifiantes. Au-delà du risque de surveillance individuel, le big data soulève le problème de la surveillance des personnes prises collectivement, en d’autres termes ce  qui intéresse le fournisseur n’est plus lié à la personne en tant que tel ou à son nom mais à con comportement qui est caractérisable et reproductible.


Enfin, le stockage d’une telle masse de données, que cela soit dans un data center privé, dans le cloud, hébergé par un prestataire, doit être sécurisé. Il faut donc que les contrats prévoient des clauses de sécurité et des clauses précisant les modalités de la protection des données personnelles.


Face aux multiples problèmes posés par le big data, le droit doit donc trouver un nouvel équilibre entre :

-          les intérêts commerciaux de l’entreprise et ceux du consommateur ;

-          l’équilibre entre les intérêts de l’Etat et ceux des citoyens ;

-          l’équilibre entre la protection des investissements et l’open data ;

-          l’équilibre entre la protection et la circulation des données personnelles.


En effet, les données collectées par le big data étant en grande majorité des données personnelles, il est indispensable de respecter les principes de la loi « Informatique et libertés »[8] à savoir notamment les principes de finalité, de pertinence et proportionnalité, de durée de conservation et de consentement de la personne.


De plus, le droit de la propriété intellectuelle est également sollicité par le biais de la protection des bases de données [9] elles-mêmes ainsi que par le droit d’auteur s’appliquant à la protection du « moteur »  (ou logiciel de traitement) et par la protection du savoir-faire de l’entreprise.


Enfin, le big data en lui-même peut devenir un actif immatériel pour l’entreprise devenant un patrimoine immatériel à protéger juridiquement [10].


En conclusion, le concept de big data reste encore largement méconnu tant dans les bouleversements qu’il induit que dans ses implications techniques et juridiques. Pour autant le droit n’est pas complètement démuni face à ce nouveau phénomène dont les enjeux dépassent largement la simple sphère juridique.

Il est toutefois important de rester vigilant vis-à-vis de l’évolution des usages du big data. Par exemple, l’utilisation des données issues des objets connectés ne sont pas forcément protégées par la loi « Informatique et libertés » et doivent quand même être protégées contre une utilisation à des fins malveillantes. Par exemple, la conduite intelligente des voitures se fondera sur des capteurs présents sur chaque voiture et traitera un ensemble de données (vitesse, distance de sécurité, etc.) qui ne sont pas juridiquement protégées.



[1] Cette citation datée de janvier 2013 est issue du blog de Dan Ariely, professeur de psychologie et d’économie comportementale à l’université Duke, Caroline du Nord : http://danariely.com/
[2] Cf article du 5 janvier 2014 « du Big à l’Open Data : aperçu des enjeux juridiques ».
[3] Cette définition est issue de la note d’analyse n°08 de novembre 2013 du Commissariat général à la stratégie et à la prospective  rédigée par Marie-Pierre Hamel et David Marguerit.
[4] D’autres V peuvent être associés au concept du big data telles la Visualisation, la Véracité, le Virtuel, la Valeur, etc.
[5] Un Teraoctet représente 1000 Gigaoctets ou 10^12 octets.
[6] MARINO L. , «le big data bouscule le droit », RLDI Droit de l’immatériel n°99 de décembre 2013, p.55-58
[7] Le chiffre d’affaires mondial du big data serait de 9 milliards de dollars en 2013 et devrait tripler dans les 3 ans à venir.
[8] Loi n°78-17 du 6 janvier 1978 relative à l’informatique, aux fichiers et aux libertés modifiée.
[9] Art. L341-1  et suivants du code de la propriété intellectuelle.

[10] Autres sources : Article de Bernard Lamon « Big Data, premier outil de l’organisation juridique : la base de données » sur le blog : www.blog-lamon-associes.com et article de Philippe Debry « Big Data : les nouveaux défis et enjeux juridiques » sur  le blog : www.fidal-avocats-leblog.fr.

Aucun commentaire:

Enregistrer un commentaire