Politique interne Kano.care — Extraction, anonymisation et traitement des données de santé à des fins statistiques.
1. Contexte et Finalité de l'Extraction
Dans le cadre de l'amélioration continue de nos parcours de soins, de nos prestations de services dématérialisés en santé sexuelle masculine (Dysfonction Érectile), Kano.care réalise périodiquement des analyses statistiques sur les données des patients. L'objectif est d'étudier l'efficacité des traitements (évolution du score IIEF-5), la satisfaction des patients, la fréquence des effets secondaires et l'adoption des prescriptions.
Afin de pouvoir traiter ce volume important d'informations (notamment avec l'aide de modèles d'intelligence artificielle - LLM), il est nécessaire de réaliser une extraction brute (souvent sous format CSV).
2. Le Cadre Légal et Règlementaire en France
Toute manipulation de données de santé à caractère personnel en France est encadrée de manière stricte par :
- Le Règlement Général sur la Protection des Données (RGPD - UE 2016/679) : Définit les principes de limitation des finalités, de minimisation des données (article 5) et l'exigence de garanties appropriées pour les "données concernant la santé" (article 9).
- La Loi Informatique et Libertés (Loi n° 78-17 modifiée) : Qui renforce dans le droit français la protection des données de santé et prévoit de lourdes sanctions en cas de violation.
- La certification Hébergeur de Données de Santé (HDS) : Obligatoire en France selon l'Article L. 1111-8 du Code de la Santé Publique, pour l'hébergement des données de santé couvertes par le secret médical.
- Le secret médical (Article 226-13 du Code Pénal) : Les praticiens qui interviennent (y compris de facto sur Kano.care) sont garants des données qui leur sont soumises.
3. Méthodologie Stricte d'Anonymisation
Pour utiliser librement un jeu de données à des fins statistiques sans risquer de compromettre l'identité d'un patient et en dehors du cadre lourd du recueil de consentement explicite, les données doivent être totalement et irréversiblement anonymisées selon les directives de la CNIL et du RGPD (Considérant 26).
Lors de la génération de nos exports de requêtes (ex: export_llm_data.cjs), les actions d'anonymisation suivantes sont appliquées automatiquement :
3.1 Suppression systématique des Identifiants (User ID)
- L'identifiant métier unique en base de données (
userIdouuid) n'est jamais présent dans les exports. - Il est remplacé au vol par des identifiants virtuels transitoires, factices, et séquentiels (ex:
patient_1,patient_2).
3.2 Élimination de toute Information Nominative Distinctive
- L'adresse e-mail, le numéro de téléphone, les noms, les prénoms ou l'adresse physique sont ignorés, bloqués, et formellement proscrits du flux d'export.
- Aucune date de naissance exacte n'est exportée. Seul l'âge (nombre entier) à l'instant T de la requête est calculé, la date de naissance elle-même étant écartée du fichier final.
3.3 Champs Libres et Risque de Ré-identification
- Les textes d'entrées libres (ex: requêtes personnalisées ou commentaires sur des évènements de vie) ne sont pas inclus s'ils risquent d'exposer la vie privée ou une histoire médicale trop ciblée (ce qui rendrait un profil statistiquement minoritaire identifiable par croisement).
3.4 Mesures d'Acheminement et Conservation
- Les
.csvproduits ne sont pas envoyés par un réseau non chiffré, et ont interdiction de stationner à long terme en clair sur du stockage Cloud grand public (ex: GDrive de l'entreprise). - Après le traitement statistique, le fichier de travail
.csvanonymisé peut être détruit. Les résultats d'analyses (statistiques agrégées finales ou graphiques) remplacent la conservation du tableau.
4. Conséquence de l'Anonymisation
Grâce à ce pipeline, le recueil de données exportées ne relève constitutionnellement plus du traitement des données à caractère personnel dans la mesure où l'identification d'une personne physique précise est impossible (RGPD, Art 11).
Le principe de minimisation des données est respecté (Kano.care n'exporte que l'âge, la posologie, et les réponses objectives aux questionnaires d'urologie type IIEF), tout en conservant une grande valeur ajoutée pour un modèle d'Intelligence Artificielle.
