Vue lecture

Il y a de nouveaux articles disponibles, cliquez pour rafraîchir la page.

Claire Mathieu et les algorithmes

Si on devait définir Claire Mathieu en mots-clés, ce serait, dans le désordre : algorithmes, Parcoursup, CNRS, pédagogie et éthique. Mais comme c’est très réducteur, ce portrait de celle qui a codé l’algorithme de Parcoursup évoquera, outre ces sujets, son parcours et son passage au Conseil présidentiel de la science. Et, si vous ne savez pas vraiment ce qu’est un algorithme, normalement, cette notion devrait vous être plus familière après la lecture de la dépêche, et qui sait, peut-être vous donner envie de vous y mettre.

Claire Mathieu, photo Patrick Imbert

Sommaire

Parcours

Claire Mathieu est une ancienne élève de l’École normale supérieure. En 1988, elle soutient une thèse en sciences : « Comparaison de modèles combinatoires et probabilistes : deux exemples en analyse d’algorithmes » sous la direction de Claude Puech, actuel directeur scientifique de la Fondation Inria.

En 1990, elle est Chargée de recherche au CNRS en informatique. Elle obtiendra le prix « IBM Jeune chercheur » en 1991.

À partir de 1997, elle occupe des fonctions de professeure d’informatique : à l’Université Paris-Sud (devenue Paris-Saclay en 2020), puis à l’École polytechnique (de 2002 à 2004) et à l’Université de Brown (en), USA (de 2004 à 2014). De retour en France, elle devient, en 2012, Directrice de recherche au CNRS en informatique, sera professeure associée au Département d’informatique de l’École normale supérieure de 2014 à 2018. Elle occupera la chaire annuelle d’Informatique et sciences numériques au Collège de France pour l’année 2017-2018.

En 2017 elle est chargée de mission « Parcoursup ».

En 2019, elle obtient la médaille d’argent du CNRS pour l’ensemble de son œuvre. Elle est élue la même année à l’Académie des sciences. Elle est actuellement directrice de recherche au CNRS en informatique au sein de l’Institut de recherche en informatique fondamentale (IRIF).

Qu’est-ce qu’un algorithme ?

Petit rappel de ce que sont les algorithmes, une notion devenue omniprésente. Dans sa leçon inaugurale au Collège de France, le 16 novembre 2017, Claire Mathieu constate d’ailleurs que :

ce mot a envahi les médias. Autrefois, lorsqu’on allait dans une administration et qu’on n’arrivait pas à obtenir ce que l’on souhaitait, la réponse était : « Ah, Madame, vous comprenez, c’est l’informatique ! » Maintenant on entend : « Ah, c’est l’algorithme. »

Au départ selon la notice étymologique du CNRTL, l’algorithme, vers 1220-30, s’appelait « augorisme » et c’était un « procédé de calcul utilisant les chiffres arabes ». Il deviendra « algorisme » puis, enfin « algorithme ». Le mot lui-même vient du surnom du mathématicien Abdallāh Muhammad ibn Mūsā : Al Ḫuwārizmī (qui est en fait son origine géographique). Et, si vous ne savez pas si on doit mettre ou pas un « y », retenez que ça n’a strictement rien à voir avec la musique ou la danse, donc, pas d’y.

Si une bonne part du lectorat de LinuxFr sait de quoi il s’agit, notamment parce que c’est leur métier d’en fabriquer, ce n’est pas forcément le cas de tout le monde, une petite explication s’impose. Un algorithme est ainsi une suite finie et non ambiguë d’opérations ou d’instructions permettant de résoudre un problème ou d’obtenir un résultat ou, pour reprendre la définition qu’en a donné Claire Mathieu dans sa leçon inaugurale : « un algorithme, c’est une méthode pour résoudre un problème de façon constructive en le décomposant en briques de base faciles à manipuler. » Elle donne l’exemple de l’apprentissage de la lecture par la méthode syllabique (découper les mots en lettres et syllabes) par rapport à la méthode globale (qui serait plus proche de l'apprentissage profond en informatique).

On peut avoir d’autres exemples simples, celui de la recette de cuisine ou encore, celui de modèles de tricot. Un algorithme reçoit des données à traiter (texte, nombres relations), les instructions peuvent être conditionnelles, passant les étapes suivies par l’algorithme vont varier, et, forcément, les résultats.

Trois sapins
Allégorie des résultats d’un algorithme avec des jeux de données différents.

Si vous voulez en savoir plus, je vous renvoie à la leçon inaugurale de Claire Mathieu au collège de France et à cet article de Jean Cardinal sur le site francophone The Conversation, vous apprendrez qu’il existe plusieurs « familles » d’algorithmes et comment cela fonctionne.

De l’importance des algorithmes

Pourquoi avoir choisi les algorithmes ?

Pourquoi avoir choisi les algorithmes ? À cette question qui lui a été posée à l’occasion de sa nomination au Conseil présidentiel de la science, en décembre 2023 par le site de l’Insmi (CNRS Mathématique), elle répond que cela date de sa formation à l’École normale supérieure de jeunes filles1.

Une question dans un projet de programmation « demandant un calcul par simulation de la profondeur moyenne des arbres 2-3 » l’avait «  plongée dans des abîmes de perplexité car la notion de “moyenne” dépendait de la distribution étudiée, qui n’était pas spécifiée : soit l’arbre est obtenu par une suite d’insertions aléatoires (facile à simuler), soit on considère la distribution uniforme sur tous les arbres 2-3 contenant n éléments » et « d’un cours montrant la borne inférieure n log n pour la complexité dans le pire cas pour tout algorithme de tri par comparaisons. L’idée qu’il était possible de montrer une borne inférieure sur tous les algorithmes imaginables de tri par comparaison, c’était magique. »

Dans la même interview, elle dira qu’elle aime l’aspect concret des algorithmes et « le fait que l’on puisse voir la solution en train de se construire. ».

Sur l’importance des algorithmes

Dans un entretien donné au magazine La Recherche en février 2020 elle explique que le rôle des algorithmes a toujours été important et ce, depuis le début de l’informatique. On se rappellera peut-être des regrets de Marion Créhange qui, dans un texte pour la revue Interstices déplorait le fait que les algorithmes conçus au départ pour économiser le temps et le volume d’informations à traiter par une machine étaient moins subtils.

Aujourd’hui, les algorithmes ne se concentrent plus seulement sur le fonctionnement des logiciels mais ce phénomène :

a pris une importance particulière en raison de la révolution numérique en cours, avec entre autres l’émergence d’algorithmes utilisant des réseaux de neurones profonds. […] Avec le passage au tout-numérique dans la société, l’utilisation des algorithmes partout et le succès des méthodes de l’intelligence artificielle, la proximité entre les algorithmes et les humains dans leur vie en société a changé.2

Et, évidemment, ce n’est pas sans conséquences, puisqu’à partir du moment où les algorithmes vont s’entremêler à la vie des êtres humains, des questions éthiques se font jour :

Cette omniprésence a fait apparaître de nouveaux critères, dont on ne se souciait pas auparavant, comme celui de vouloir que les algorithmes soient équitables et justes pour les humains. Jusqu’il y a deux ou trois ans, ce n’était pas vraiment une préoccupation des algorithmiciens. Cela a émergé d’un coup et pose de nouvelles questions : est-ce que ce sont les algorithmes qui décident et les humains qui suivent – ce qui n’est pas souhaitable – ou bien est-ce que les algorithmes sont au service de la société et des humains ? Que faire pour garantir que les humains gardent toujours le contrôle ?3

Claire Mathieu considère que les algorithmes peuvent contribuer au bien commun, pour peu qu’ils soient bien conçus et utilisés. Dans sa leçon inaugurale au Collège de France, par exemple, elle donne celui de la greffe de reins dont l’idée est d’apparier les reins des donneurs et donneuses aux malades ou encore celui du découpage électoral. Elle espère que « la perspective algorithmique fera partie de la culture des adultes de demain. »4.

Parcoursup : transcrire la loi dans le code

Parcoursup est un dispositif français concernant l’inscription dans les formations d’enseignement supérieur, notamment celles dont les capacités d’accueil sont inférieures au nombre de candidatures reçues, créé par la loi n° 2018-166 du 8 mars 2018 relative à l'orientation et à la réussite des étudiants.

Où la loi fait le code

En 2000, le juriste américain Lawrence Lessig écrit « Code is Law » pour Harvard Magazine, ce que l’on pourrait traduire par « le code est loi » ou le « code fait loi ». Il expliquait que, dans le cyberespace, c’est le code (informatique) qui fait la loi et que, dans l’exemple de l’identification, « l’architecture de certification qui se construit respecte ou non la vie privée dépend des choix de ceux qui codent. ». Il insistait sur le fait que quand l’État se retire, il laisse le champ aux intérêts privés.

Avec Parcoursup, c’est la loi qui fait le code. Laquelle loi fait partie du Code de l’éducation qu’elle a modifié, notamment dans son article D612-1.

Le principe : les lycéens, les lycéennes, les apprenti·e·s, et les étudiant·e·s en réorientation désireuses d’entrer dans l’enseignement supérieur formulent leurs vœux sur la plate-forme Parcoursup. Les capacités d’accueil des formations figurent sur le site de Parcoursup. Une commission d’examen des vœux pour chaque formation (chaque BTS, BUT, CPGE, chaque section d'école d'ingénieur, etc.) les examine et, au besoin met dans l’ordre les candidatures. Là, un algorithme va calculer l’ordre d’appel dans lequel les candidats et les candidates vont recevoir les propositions. Propositions qui évolueront à un rythme quotidien, du 30 mai au 12 juillet pour l'année 2024. Le temps de réponse accordé diminuant au cours du temps.

L’idée étant, idéalement, de faire correspondre les vœux et les capacités desdits candidats et candidates aux formations.

Quand la rédaction de la loi affaiblit les mariages stables

L’algorithme de Parcoursup fait partie de ceux qui servent d’exemple à sa leçon inaugurale au Collège de France. Elle y explique que le gouvernement voulait s’inspirer de l’algorithme des « mariages stables » de Gale et Shapley. Au départ, il n’était question que de classes péparatoires. Se sont ajoutées ensuite les formations non-sélectives avec plus de places que de candidats et candidates, puis les formations non-sélectives pour lesquelles l’offre est inférieure à la demande qui5 :

utilisent des critères géographiques (l’académie d’origine), ainsi que des critères dépendant des préférences des candidats.

Et, de facto, l’algorithme des mariages stables perd ses propriétés et la nécessité d’exprimer des choix stratégiques plutôt que des réelles préférences s’impose aux candidats et aux candidates ce qui « pénalise les candidats sincères » avec un autre effet secondaire :

malgré cela, les formations n’ont pas assez de critères pour départager les candidats et ne peuvent produire de liste ordonnée, d’où l’usage du tirage au sort. Cette extension de l’algorithme, du point de vue mathématique, était catastrophique.

Toujours, dans cette leçon inaugurale, Claire Mathieu en conclut :

C’est la loi elle-même qui dit que l’affectation peut se faire en fonction des préférences des candidats, et donc qui – indirectement – encourage la manipulation !
Ainsi, la loi a défini les contraintes. Du point de vue algorithmique, on peut dire qu’il y a eu une erreur de conception. Pour éviter ce genre d’impasse, la législation devrait peut-être être définie en concertation avec les algorithmiciens.

L’algorithme de Parcoursup est public ainsi que son explication (voir dans les liens) : « La transparence des algorithmes utilisée par le gouvernement est un moteur puissant pour une société plus démocratique. »6. Il a été primitivement publié sur un dépôt Framagit.

Quinze jours au Conseil présidentiel de la science

Le Conseil présidentiel de la science est un conseil national scientifique français créé le 7 décembre 2023 par le président de la République. Composé de douze membres, sa mission de tenir le président informé des évolutions scientifiques susceptibles d’être stratégiques. Les rapports de ce conseil ne seront pas rendus publics.

Claire Mathieu y est nommée ainsi qu’une brochette d’autres scientifiques de haut niveau. Elle en démissionne le 22 décembre en désaccord avec la loi sur l’immigration. Une loi considérée par ailleurs comme ni essentielle (les lois sur l’immigration ont été modifiées 133 fois en dix ans), ni vraiment souhaitée, dangereuse pour la politique de santé publique et votée dans des conditions démocratiques douteuses. Elle s’en explique ainsi dans un courrier adressé à Emmanuel Macron :

En effet, si au lieu de vous c’était l’extrême droite qui était au pouvoir, j’aurais refusé de participer à ce conseil. Or, la loi anti-immigration est une loi d’extrême droite, une loi xénophobe, d’exclusion et de repli sur soi.

Elle ajoutera sur X :

Maintenant déjà il est difficile à nos jeunes chercheurs étrangers de régler leurs problèmes de visas. Demain ce sera pire, et ils iront donc dans un pays plus accueillant. Cela accentuera le décrochage de la France en recherche.

Elle remarque au passage sur son compte Mastodon :

C’est drôle, il y a quinze jours j'ai reçu plein de messages de félicitations pour ma nomination au Conseil présidentiel de la science, et aujourd’hui je reçois plein de messages de félicitations pour ma démission du Conseil présidentiel de la science (y compris certains des mêmes personnes).
Je cherche le proverbe approprié pour décrire la séquence.

On suggérerait bien cette citation de Rabelais tirée de Pantagruel « Science sans conscience n’est que ruine de l’âme ».

Post-scriptum

Vous avez dans les « Liens » ceux qui m’ont servi à rédiger ce portrait. Je ne saurais que trop vous recommander d’aller y jeter un coup de souris, au moins la leçon inaugurale. Sur le site de Claire Mathieu, vous trouverez son CV ainsi que des liens vers certaines de ses publications et ses présentations. Les présentations sont d’un intérêt relativement mineur car elles sont, et c’est comme cela que ça doit être, des supports de sa parole et là uniquement pour agrémenter son discours, elles sont donc assez peu informatives pour qui ne connaît pas le domaine, tout au moins.

La leçon inaugurale a fait l’objet d’une publication papier, épuisée, et de versions epub et pdf. On doit pouvoir l’emprunter auprès d’une « institution partenaire ». Cela dit le texte intégral est en ligne.

Pour lire l’interview de Claire Mathieu dans la Recherche, il faut le payer, soit en achetant le numéro, soit en acceptant de voir une publicité (on peut se servir un café pendant qu’elle passe). Personnellement je n’avais pas le bouton sur mon Firefox, question de réglage ou d’extensions sans doute, il m’a fallu utiliser Chromium. À vous de voir.

Pourquoi un portrait, si on peut dire, à mi-chemin entre une biographie et une interview ? Parce qu’une biographie se doit d’être exhaustive, ce qui n’était pas trop l’idée ici. Et qu’une interview ça prend du temps à rédiger et que les personnes ne répondent finalement pas forcément. Quitte à travailler pour rien, autant travailler pour quelque chose. Il y en aura peut-être d’autres, ou peut-être pas (j’ai un autre nom en tête et dans Zotero). Mais j’espère que celui-ci fera au moins un heureux.

Pourquoi pas sa page Wikipédia ? D’abord parce que je ne l’ai pas lu, ce qui règle la question. Ensuite parce que, justement, j’ai privilégié les sources primaires pour avoir la parole de Claire Mathieu. Et enfin parce que je pense que le lectorat de LinuxFr est tout à fait capable de la trouver lui-même.

Et un grand merci à finss pour ses précisions.


  1. ENSJF, elle disparaît en 1986 suite à la fusion des deux ENS. 

  2. La Recherche, mensuel 556, février 2020. 

  3. La Recherche. 

  4. Leçon inaugurale, Collège de France. 

  5. Les citations qui suivent sont extraites de la leçon inaugurale 

  6. Claire Mathieu, Le Monde, blog binaire, La transparence à l’école de Parcoursup, 5 juin 2018. 

Commentaires : voir le flux Atom ouvrir dans le navigateur

❌