Accueil > Protégez Votre Vie Privée > Vie Privée > Identité en ligne > Des données anonymes pour vous identifier

Des données anonymes pour vous identifier

  • par

Nous vous l’apprenons peut-être mais des données démographiques anonymes peuvent toujours être utilisées pour vous identifier. Une étude montre comment vous pouvez être “ré-identifié” à partir d’ensembles de données totalement anonymes, même sans vos détails uniques.

Si vous êtes l’une des rares personnes qui lisent les conditions d’utilisation, vous trouverez peut-être enfouie dans les politiques de confidentialité de diverses entreprises une clause indiquant qu’elles peuvent recueillir et vendre vos données à des tiers.

Les données, disent-ils, sont anonymisées, mais une nouvelle étude publiée dans Nature Communications démontre que, selon ce que vous partagez, il est encore possible de vous ré-identifier avec une précision étonnante. Des chercheurs de l’Imperial College de Londres et de l’Université de Louvain en Belgique ont créé un modèle d’apprentissage automatique qui permet de ré-identifier des individus à partir d’ensembles de données anonymes, même “très incomplets“.

De telles révélations surviennent à un moment où de plus en plus de personnes se méfient des entreprises qui vendent leurs données à des tiers et ont des politiques de confidentialité accablantes sur la vie privée et les données anonymes actuellement stockées (et partagées) avec de nombreuses entreprises et institutions universitaires.

L’anonymisation des données

À moins que vous ne soyez complètement déconnecté, vous produisez régulièrement beaucoup de données personnelles, depuis vos achats en ligne et vos itinéraires jusqu’à des données plus personnelles comme vos dossiers médicaux.

De telles données valent de l’or pour les annonceurs qui veulent améliorer leur ciblage, et pour les chercheurs en santé publique, ou dans le domaine de la reconnaissance faciale et l’intelligence artificielle.

Pour protéger l’identité des données, les “meilleures pratiques” générales ont consisté à supprimer les informations d’identification évidentes comme les noms, les adresses électroniques et les numéros de téléphone et de sécurité sociale.

Des techniques d’anonymisation dépassées

Bon nombre des méthodes populaires d’anonymisation sont demeurées inchangées depuis les années 1990, n’ayant pas réussi à adopter des techniques d’anonymisation plus complexes en réponse à l’explosion des données en ligne depuis.

Il y a eu plusieurs cas, remontant aux années 2000 déjà, d’ensembles de données supposément anonymes qui ont été divulgués et ré-identifiés par la suite.

En 2017, des journalistes ont réussi, dans un ensemble de données anonymes sur l’historique de la navigation web de 3 millions de citoyens allemands à “ré-identifier des politiciens, révélant leurs informations médicales et leurs préférences sexuelles”.

Une nouvelle étude fait également référence à des travaux antérieurs dans le cadre desquels les chercheurs ont pu “identifier de façon unique des individus dans des courses de taxi anonymisées à New York, des itinéraires fait à vélo en libre-service à Londres, des données de métro à Riga et des ensembles de données de téléphones portables et de cartes de crédit”.

Peu de points de données nécessaires pour vous ré-identifier

Les chercheurs à l’origine de l’étude ont créé un formulaire en ligne où les résidents anglais et américains peuvent tester leurs “chances” d’être identifiés par une hypothétique compagnie d’assurance maladie avec seulement trois points de données : leur sexe, date de naissance et code postal.

Par exemple, si vous étiez un homme américain né le 12 novembre 1990 et vivant actuellement sous le code postal 02139, il y a 54 % de chances que votre employeur ou voisin puisse vous identifier.

Des données anonymes vous identifient - Exemple 1 étude de désanonymisation
Etre authentifié avec 3 attributs

Mais ce pourcentage augmente lorsque vous ajoutez plus d’attributs : Le seul fait d’ajouter votre état civil pourrait augmenter vos chances de vous identifier jusqu’à 99 %. D’autres attributs comprennent le nombre de véhicules, la catégorie socio-professionnelles et la propriété de la maison.

Des données anonymes vous identifient - Exemple 1 étude de désanonymisation
Etre authentifié avec 4 attributs

Comment nos données devraient-elles être anonymisées?

Il ressort clairement de cette étude que les pratiques actuelles d’anonymisation ne protègent pas correctement la vie privée des gens et les rendent vulnérables à la ré-identification par quiconque a accès à leurs données.

Malheureusement, il n’y a pas grand-chose que l’individu puisse faire ici. C’est aux entreprises et aux institutions qui stockent, vendent et utilisent ces données de changer radicalement la façon dont elles rendent anonymes les données. Des règlements comme le GDPR de l’UE et le Consumer Privacy Act de la Californie exigent tous deux que les individus dans tous les ensembles de données soient anonymes et qu’il soit impossible de les identifier de nouveau, mais il peut s’avérer difficile pour les entreprise de tenir ces promesses.

Une façon de prévenir la ré-identification dans les données anonymisées est d’adopter la confidentialité différentielle, un modèle mathématique qui ajoute soigneusement une quantité contrôlée de ” bruit ” aléatoire dans les données avant qu’elles ne soient envoyées à un serveur, rendant les données un peu plus approximatives que précises, mais qui protège efficacement la confidentialité des personnes. Des entreprises comme Apple et Google ont déclaré avoir intégré la protection différentielle de la vie privée dans leur collecte de données, sans que cela puisse être vérifié (pour l’instant).

Comment vous protéger ?

Lorsqu’une entreprise vous demande l’autorisation de partager des données anonymes avec des tiers, que devriez-vous faire ?

Anonymisez vous-même vos données !

Toutes les entreprises n’ont pas droit à votre véritable date de naissance, à votre code postal actuel, à votre sexe ou à votre état civil, ni même nécessairement à votre vrai nom.

Si un détail n’est pas crucial pour votre utilisation d’un service particulier, mettez-y un peu d’incohérence. Changez de sexe ! Faites-vous appeler différemment ! Rajeunissez ou vieillissez-vous. Déménagez virtuellement dans une autre région, une autre ville ! Et si un nom mal orthographié commence à apparaître dans votre boîte aux lettres, vous saurez exactement quelle entreprise vous a vendu.

Mieux encore, ne faites affaire qu’avec des entreprises qui sont totalement honnêtes quant aux données qu’elles recueillent, qui ne recueillent jamais de données dont elles n’ont pas besoin, qui ne partagent ou ne vendent jamais vos renseignements personnels à un tiers et qui prennent au sérieux l’anonymat des informations non-personnelles. Il se trouve que nous en connaissons au moins une.

Mots-Clés: