Le projet Big Data et Droit Pénal : utilisation, compréhension et Impacts des Techniques prédictives (Drop IT) s’est attaché à évaluer l’intérêt et l’impact potentiels de l’introduction du numérique et plus spécifiquement de l’intelligence artificielle (IA) en médecine légale du vivant par des méthodes mixtes. Rencontre avec Sabine Guez et Thomas Lefèvre, co-porteurs du projet.
Propos recueillis par Laetitia Louis-Hommani
Laetitia L-H : L’objectif principal de votre recherche a consisté au développement d’outils numériques de médecine légale contextualisée pour permettre une estimation de l’incapacité totale de travail (ITT) au sens pénal, à partir de critères harmonisés : comment avez-vous procédé ?
Thomas Lefèvre : Plus généralement, nous avons poursuivi deux objectifs principaux au travers de ce projet : d’une part, étudier plusieurs utilisations possibles du numérique dans le cadre de l’évaluation du nombre de jours d’ITT chez les victimes de violences volontaires, et d’autre part, profiter de cette étude des possibilités du numérique pour documenter plus largement et plus précisément les enjeux et pratiques autour de l’évaluation de l’ITT et du certificat médical correspondant – par les médecins, par les magistrats – et structurer les moyens de la recherche multicentrique en médecine légale. Autrement dit : pour pouvoir parler de numérique, d’IA en matière d’ITT sans que cela soit totalement abstrait, il nous fallait développer en amont un ensemble d’outils, un réseau et des grilles d’analyses, et élaborer des premiers modèles d’IA. Pas d’IA sans données, pas de données sans recueil auprès des personnes concernées, pas de recueil sans le réseau et les outils qui vont bien.
Le projet Drop It, financé par la Mission, a ainsi été une opportunité sans précédent pour la médecine légale de se doter de moyens de structuration et de facilitation de la recherche multicentrique : le réseau ORFéAD – Outils et réseau pour la fédération, l’analyse et l’utilisation des données en médecine légale – en est la concrétisation. Le chemin est long, mais le réseau a passé avec succès sa première phase pilote en 2019, les premiers résultats et articles scientifiques sont en cours de rédaction, et nous sommes actuellement en train de sécuriser le fonctionnement du réseau d’un point de vue réglementaire (conformité RGPD…) et d’un point de vue technique, notamment grâce à nos partenaires : l’IRIS, l’EHESS, la MSHS-T/PUD-T, la PME Tekliko et les centres de médecine légale. Nous visons l’ouverture du service aux centres participants à la rentrée 2021. Nous espérons le soutien de l’Inserm et de Santé publique France, pour la pérennisation du réseau et la réalisation de deux études : une portant sur les violences policières et l’autre sur les violences conjugales. Parallèlement, le réseau devrait également permettre de soutenir un autre projet autour de l’IA, le projet IAViSE : IA, violences sexuelles et trajectoires psychosociojudiciaires des victimes, mené en partenariat avec le Centre national de ressources et de résilience (CN2R) et plusieurs centres de médecine légale.
Ainsi, pour produire des outils de médecine légale contextualisée, intégrés directement dans la pratique quotidienne des médecins, il nous a fallu aborder plusieurs dimensions :
– au-delà du constat de pratiques apparemment hétérogènes en matière d’ITT selon les centres ou les médecins, quels sont les déterminants de cette ITT ? Nous avons réalisé la première étude multicentrique identifiant 15 déterminants, sur la base de l’examen des certificats de 10 000 victimes, examinées dans 7 centres différents
– l’évaluation du nombre de jours d’ITT s’inscrit dans un contexte pénal, et apparaît comme la conclusion d’un raisonnement médicolégal, matérialisé par un certificat médical. Proposer des outils autour de l’évaluation de l’ITT nécessitait de s’interroger sur la place du certificat médical dans la procédure. Que doit-on prendre en compte dans ces outils numériques ?
– intégrer des outils de médecine contextualisée dans les pratiques quotidiennes pose la question de l’environnement de travail du médecin légiste : quels outils intégrer dans quel environnement ? Le projet nous a permis de continuer à développer un logiciel– Médilégist –, qui permet à la fois de répondre aux besoins spécifiques de l’activité de médecine légale, et d’intégrer facilement ce type d’outils
– le développement d’outils numériques ne peut se faire sans explorer les représentations des acteurs destinés à utiliser ces outils. Nous avons conçu des questionnaires pour les magistrats et pour les médecins proposant des cas simulés dans lesquels pouvait intervenir l’IA
Laetitia L-H : Quels sont les principaux résultats de votre recherche et que nous disent-ils du rapport des magistrats aux ITT et de l’usage qu’ils en font ?
Sabine Guez : Concernant les certificats médicaux et l’ITT, l’enquête qualitative correspondante a consisté en des entretiens menés avec des magistrats du siège et du parquet d’Île de France, dix-neuf au total. Nous souhaitions comprendre leurs usages, leurs attentes et leurs incompréhensions en matière de certificats médicaux avec incapacité totale de travail dans les faits d’atteintes volontaires à l’intégrité des personnes et notamment les violences sexuelles. Il ressort de ces entretiens qu’ils ont de l’ITT des utilités et usages différents en fonction du moment de la procédure. Elle intervient surtout aux « extrémités » : au tout début, en qualifiant les faits, elle a une fonction d’aiguillage de la procédure et un effet d’étiquetage du dossier (elle est aussi susceptible, plus tard, d’asseoir une culpabilité) ; dans certains cas, dans la dernière phase du procès pénal, l’ITT joue un rôle déterminant en tant que critère d’appréciation de la recevabilité de la procédure devant la Commission d’indemnisation des victimes d’infractions (CIVI) ; elle permet alors de contribuer à l’évaluation du préjudice et les possibles indemnisations. Le certificat avec ITT est rapporté comme souvent déterminant, notamment dans les violences de parent sur enfant et les violences conjugales.
Thomas Lefèvre : Cela peut alors être problématique, en particulier du point de vue du médecin : ces deux cas, fréquents, sont parmi les cas où évaluer un nombre de jours d’ITT n’a rapidement plus beaucoup de sens, ou s’avère quasiment impossible : il s’agit en général de faits répétés dans le temps, avec une dimension psychologique forte en termes de retentissement. Or, il s’agit d’évaluer la durée pendant laquelle une gêne notable existe pour la victime, dans les activités de la vie courante, qu’elle soit d’origine psychologique ou physique. L’ITT doit-elle alors être fixée à partir des derniers faits ? Des premiers faits ? Pour des violences régulières évoluant depuis 5 ou 10 ans, faut-il indiquer une durée d’ITT de 5 ou 10 ans ? C’est de fait une source importante de variabilités dans les pratiques des médecins.
Sabine Guez : Nous avons constaté une grande déférence des magistrats à l’endroit des médecins légistes, dont la scientificité des avis et le professionnalisme leur sont d’une importance cardinale, ainsi qu’une satisfaction globale de leur part en matière de certificats médicaux et de détermination d’ITT. Cette satisfaction cohabite toutefois avec des attentes non remplies du point de vue des magistrats, au premier rang desquelles figure l’insuffisante prévisibilité du quantum de l’ITT. Les magistrats reconnaissent s’interroger fréquemment sur les différences apparentes de nombres de jours d’ITT pour deux situations de violences rapportées de manière apparemment similaires, sur la corrélation entre nombre de jours d’ITT et types de lésions ou de retentissement fonctionnel (physique ou psychologique), et enfin sur la « sévérité » de certains légistes attribuant peu de jours d’ITT au regard des situations de violences et des lésions et du retentissement fonctionnel décrits dans le certificat. Des magistrats formulent le souhait d’une harmonisation des pratiques de détermination d’ITT aujourd’hui trop souvent divergentes.
Il est intéressant de noter que malgré ces questionnements, tous les magistrats interrogés ont précisé que bien qu’ils en aient le pouvoir aucun ne modifie ou ne revient sur le nombre de jours d’ITT établi par le médecin légiste. Cela dit, les magistrats du siège exercent leur liberté d’appréciation si d’autres éléments de preuve dans la procédure montrent que la gravité des faits est en deçà ou va au-delà de la durée d’ITT fixée. Dans ces cas rares où ils prennent leurs distances avec cette durée, ces éléments de preuve additionnels serviront à motiver leur jugement, seront pris en compte dans le quantum de la peine et auront plus tard une incidence sur la liquidation du préjudice.
Un autre point est revenu dans nos entretiens : la majorité des magistrats soulignent l’importance de la prise en compte du retentissement psychologique des violences, et la nécessité que celui-ci soit d’une part au mieux rapporté dans les certificats (but d’illustration et de rendre concret le retentissement évalué), et d’autre part mieux pris en compte en termes de nombre de jours d’ITT.
Le certificat médical, en tant qu’il objective les conséquences psychosomatiques des violences ou des faits rapportés par le plaignant, et à condition qu’il ait été établi par un médecin légiste, est vu quant à lui comme un élément de preuve majeur de leur réalité et matérialité. Les constatations médicales qui y sont consignées peuvent asseoir la crédibilité du plaignant (et leur absence au contraire le décrédibiliser).
Laetitia L-H : Quelles sont leurs attentes en la matière et en quoi les outils développés dans le cadre du projet Drop It pourraient contribuer à changer leur pratique professionnelle ?
Thomas Lefèvre : Je crois qu’en ce qui concerne les attentes, Sabine a bien développé dans la question précédente ce que les magistrats ont pu partager avec nous. Pour ce qui est de l’impact éventuel des outils développés dans le cadre du projet, il faut raisonner plus en amont et sur un terme plus ou moins long.
Les outils, et les analyses, développés sont avant tout à destination des médecins légistes, à qui il est demandé d’évaluer le nombre de jours d’ITT, à l’occasion d’une consultation médicale. Les analyses conduites fournissent une compréhension plus robuste, complémentaire et plus fine des déterminants de l’ITT, c’est-à-dire, de ce qui fait la variabilité des conclusions des médecins légistes en matière d’ITT, au niveau national. Une confirmation intéressante est par exemple le rôle du délai entre les faits et la consultation : ce délai détermine en partie le nombre de jours d’ITT, dans tous les centres. Cela plaide, en termes de pratiques, que ce soit de la part des centres de médecine légale que de la part des autorités requérantes dans la formulation de leur demande d’examen, pour une harmonisation des délais de consultation. Des délais différents, par centre, ou par catégorie de plaignants – par exemple : les personnes en garde à vue ou les fonctionnaires de police, pour lesquels il existe une demande forte d’évaluation dans les 6 à 12 heures suivant les faits, contre une médiane de 3 jours pour les autres victimes – sont source d’inégalité de traitement, médical et judiciaire. Il est aussi éclairant de constater que s’il semble que la dimension psychologique soit davantage prise en compte par les médecins légistes, en ce qu’ils rapportent peut-être plus régulièrement les symptômes et types de retentissements sur le sommeil ou l’alimentation dans leurs certificats, ces éléments sont bien associés chacun à des variations du nombre de jours d’ITT, mais cet effet disparaît dès lors qu’il existe des lésions traumatiques. Autrement dit, et de façon un peu caricaturale, il demeure une sorte de préemption de l’ecchymose et de la plaie sur l’insomnie, la perte d’appétit, les troubles de la concentration ou encore les symptômes relevant de l’état de stress aigu ou du syndrome de stress post traumatique, dans la fixation du nombre de jours d’ITT. Cette connaissance des déterminants de l’ITT peut donc aider le médecin, par une meilleure connaissance de sa pratique et de celle de ses collègues, mais aussi le magistrat, qui saura un peu mieux relier le contenu d’un certificat à la conclusion établie par le médecin.
Enfin, nous en revenons aussi à la question de l’impact supposé puis réel, du numérique et de l’intelligence artificielle à l’échelle microsociale, lorsqu’ils font irruption au sein d’un schéma organisationnel existant, mobilisant différents acteurs et tendu vers un ou plusieurs objectifs identifiés : ici, l’évaluation du retentissement fonctionnel chez les victimes de violences, quantifié en jours d’ITT et étayé par un certificat médical, en tant qu’éléments participant à une procédure pénale, et rassemblant plaignant.e.s, avocat.e.s, auteur.e.s présumé.e.s, médecins légistes, officiers de police judiciaires et magistrat.e.s.
Laetitia L-H : Quelle est la conception des magistrats par rapport au numérique et à l’intelligence artificielle en général par rapport à ce qu’ils peuvent leur apporter dans leur métier, leur environnement ?
Sabine Guez : Nous avons réalisé une seconde vague d’entretiens avec des magistrats, dans cinq tribunaux de grande instance, sur l’intérêt de l’IA en droit pénal. Plus précisément, ces entretiens visaient à explorer les représentations des magistrats en matière de numérique et d’intelligence artificielle et esquisser ce que l’introduction d’un algorithme d’aide à la décision pourrait induire comme modification dans l’orientation pénale choisie étant donné deux cas pratiques. Un certain scepticisme, et une inquiétude diffuse, étaient notés en préambule pour la plupart des magistrats interrogés. Disons d’abord que les réserves et les craintes à l’égard de l’IA étaient représentatives de celles exprimées usuellement, indépendamment du domaine ou de la discipline et ne semblaient donc pas spécifiques du droit pénal. En l’espèce, crainte d’une « régression vers la moyenne », ou d’une forme d’harmonisation des pratiques des médecins légistes (souhaitée, elle), qui pourrait davantage être une uniformisation peu différenciée et induite par une « pratique moyenne » favorisée par l’algorithme (non souhaitée). Crainte, aussi, d’un remplacement progressif des médecins dans un premier temps, puis des magistrats dans un second, pour un ensemble, sans doute majoritaire, de tâches qui nécessitent toujours plus de temps et de personnes, avec des ressources toujours insuffisantes. Crainte du benchmarking des tribunaux : qu’un tribunal soit choisi plutôt qu’un autre, connaissant les décisions prises en moyenne pour chacun (peu pertinent en matière pénale néanmoins). Crainte d’un biais d’apprentissage de l’algorithme. Disons ensuite que certaines craintes ou réserves relevaient de questions centrales dépassant la seule question du recours à un algorithme, mais les réactualisant, par exemple : la tension entre approche collective, statistique, et approche individuelle, personnalisée. Il était soulevé par un magistrat qu’il n’y aurait pas de sens à comparer une personne à un groupe d’autres personnes. Cette tension est importante au sein d’un système dont un des principes repose sur l’individualisation.
Cela dit, interrogés sur l’utilité d’indicateurs numériques, quantitatifs dans l’évaluation du retentissement fonctionnel des violences, la majorité des magistrats considérait important et intéressant d’en disposer, en particulier en complément d’informations littérales et qualitatives. Ceux se disant le plus en faveur d’indicateurs numériques sont ceux ayant l’expérience du dommage corporel, et de l’utilisation de la nomenclature Dintilhac.
Par ailleurs, un algorithme d’aide à la décision en matière de nombres de jours d’ITT initialement conçu pour aider le médecin dans son évaluation, apparaissait comme également un outil potentiel d’aide à la décision indirect pour le magistrat.
Que ce soit sur l’ITT ou en matière de numérique et d’IA, la question de l’hétérogénéité des modalités d’évaluation par les médecins de la gêne fonctionnelle résultant des faits de violence restait le nœud des préoccupations des magistrats. En effet, que l’algorithme se fonde sur les décisions passées n’est pas une garantie en soi, « encore faut-il qu’il se fonde sur des décisions harmonisées », nous a dit l’un d’eux. « Si on compte simplement faire la moyenne de tout ce qui n’est pas fiable, c’est pas bon. » C’est le fameux biais d’apprentissage de l’algorithme.
Thomas Lefèvre : Et là, il convient bien de rappeler que notre projet avait avant tout l’ambition d’explorer l’utilité de l’IA pour rendre compte des pratiques existantes, afin d’en aider à maîtriser les conséquences sur la détermination de l’ITT. Il ne s’agissait pas de « prédire » un nombre de jours d’ITT, ce qui correspondrait à une deuxième étape du travail, reposant nécessairement sur une évaluation suivie, des mesures standardisées et répétées, des différentes dimensions du retentissement fonctionnel chez les victimes de violence, puis l’apprentissage de modèles d’IA sur ces données… C’est ce que l’on va commencer à faire dans le cadre du projet IAViSE.
Sabine Guez : À noter aussi ce que plusieurs magistrats nous ont rappelé et pour le déplorer : aujourd’hui, la transformation numérique à l’œuvre dans leur profession est essentiellement représentée, disent-ils, par moins de contact humain, plus de temps derrière un ordinateur, du matériel peu performant et faisant fréquemment défaut, ou peu adapté, peu ergonomique.
Thomas Lefèvre : C’est certainement là que se situe l’enjeu central de l’intégration de l’IA, ou non, au sein d’organisations humaines : IA ne signifie certainement pas systématiquement moins d’humain, et ne peut être envisagée uniquement sous l’angle de l’économie de moyens. Ce serait, à notre sens, une erreur extrêmement lourde d’appréciation – mais ce peut être un choix politique ou social : il serait à débattre clairement. L’utilisation raisonnable et raisonnée, utile de l’IA entraîne en réalité la création de nouveaux métiers (pas seulement techniques, loin de là), et une reconfiguration des tâches dévolues aux humains. Il serait paradoxal que la place de ces humains découle des contraintes imposées par l’IA et par d’autres humains via cette IA et non que cette place soit d’abord choisie, puis que l’IA s’y intègre, si elle est pertinente.