Comment est distribué l’argent de l’ANR ? Quelles institutions en sont les principales bénéficiaires ? Y-a-t-il objectivement des grands gagnants et des oubliés de l’ANR ?
Ce billet présente une analyse (imparfaite) des informations publiques pour essayer de faire la lumière sur cette question particulièrement sensible en cette période de discussion autour de la LPPR. Avec des choses attendues… et d’autres beaucoup moins.
L’ANR finance toujours les mêmes, les appels à projet sont un moyen de financement de la recherche très inégalitaire.
Lu sous diverses formes sur les réseaux sociaux
On entend souvent cette affirmation ces derniers temps, dans les couloirs des labos ou sur les réseaux sociaux. Qu’en est-il vraiment ?
Pour reprendre la philosophie spécifique de ce blog (voir ici : show me the data !), j’ai voulu partir des données réelles pour dresser un tableau le plus objectif possible de où va l’argent distribué dans les appels à projet financés par l’Agence Nationale pour la Recherche (ANR).
Spoiler : On trouve des choses attendues,
mais aussi des surprises…
Les données
Il y a des données publiques de l’ANR disponibles via le site open data de l’État (data.gouv.fr). Plusieurs jeux de données sont disponibles, mais ça ne s’est pas avéré aussi facile que prévu.
Pour les besoins de l’analyse que je souhaitais faire, je suis parti de celui qui est accessible par le lien suivant. C’est le seul qui comporte à la fois des données financières et d’identification des institutions bénéficiaires. C’est donc le seul qui permette d’aborder la question » où va l’argent ? « . Il récapitule tous les projets financés par l’ANR entre 2006 et 2017 (hors investissements d’avenir). J’ai du fortement pré-traiter ces données avant de pouvoir en sortir quelque chose (voir plus bas Contrôle et nettoyage des données).
Financement par l’ANR : analyse macroscopique
Les données analysées correspondent à 12 698 projets financés sur 11 appels entre 2006 et 2017. Il n’y a pas eu d’appel en 2009 (décalage du calendrier, effet post-crise 2008 ?). 39 473 équipes partenaires ont été financées, ce qui fait une moyenne d’environ 3,1 équipes par projet, chiffre très stable quelle que soit l’année.
Le budget total distribué a été de 5 219 M€, soit un budget moyen de 474 M€ par an, avec les variations connues représentées sur le graphe ci-dessus (chute 2012-2015, remontée partielle ensuite). Le budget moyen d’un projet est de 411 K€. Il a varié un peu dans le temps, avec un pic à 460 K€ en 2008 et un creux à 374 K€ en 2016.
J’ai aussi analysé quelle était la distribution de ces budgets de projets pour voir si cette moyenne de 411 K€ par projet cachait des disparités importantes. La distribution est indiquée dans le schéma ci-dessus. On constate qu’il y a une queue à droite, avec quelques projets financés à largement plus d’un million d’euros (le graphe est tronqué, avec quelques projets encore plus dotés).
Entre 2006 et 2017, 57 projets ont bénéficié d’un financement dépassant les 1,5 M€. On les trouve essentiellement dans les appels thématiques de l’ANR (seuls 2 projets sur les 57 sont dans les programmes blancs ou assimilés). L’appel qui a bénéficié le plus de ces « gros projets » est le programme PAN-H (Plan d’Action National sur l’Hydrogène et les piles à combustible). Le record toute catégorie est détenu par un projet porté par Peugeot-Citroën en partenariat avec le CEA et l’université de technologie de Belfort-Montbéliard, qui a frisé les 3 M€ en 2006. Ce sont des projets qui mobilisent systématiquement des grands consortium de 6 à 8 partenaires (le maximum est 17 partenaires).
Où va l’argent ? (par type d’institution)
Qui tire le mieux son épingle du jeu de l’appel à projet ANR ?
Le CNRS, les autres organismes de recherche, les universités ou bien les grands établissements (ENS, Polytechnique…) ? Quid des grandes fondations (Institut Pasteur, Institut Curie) ? des hôpitaux ? et le reste ?
Pour répondre à cette question, j’ai pris le parti de me focaliser sur une année représentative pour laquelle les données sont relativement propres (voir Contrôle et nettoyage des données), l’année 2011. En 2011, il y a eu 1218 projets financés par l’ANR pour un montant total de 526,6 M€. Sur ces 1218 projets, près des trois quart (899) ont un organisme de recherche pour partenaire (CNRS, INSERM, CEA, INRA, INRIA, IRD…) et près de la moitié associent (571) un établissement d’enseignement supérieur (université ou école). Il y a bien évidemment des recouvrements et près de 30% des projets associent les deux (organisme+université). Le CNRS est présent dans plus de la moitié de tous les projets financés cette année-la (667 sur 1218).
Quelques commentaires sur cette analyse à grain moyen :
- Les établissements publics d’enseignement supérieur ou de recherche sont présents dans plus de 90% des projets financés par l’ANR (et même peut-être un peu plus, j’ai pu en rater quelques uns dans le processus de pré-traitement des données). L’ANR finance donc bien principalement la recherche publique (pour ceux qui en doutaient).
- Il y a probablement une sous-estimation des collaborations université/organisme. Ceci est dû au fait que les données ne référencent souvent qu’une tutelle par équipe partenaire. Dans le cas d’une UMR, l’ANR recense l’organisme gestionnaire des crédits. (Gut feeling personnel : ceci doit plutôt jouer pour une sous-représentation des universités que des organismes, voir plus bas).
Quelques mots complémentaires sur les autres types d’acteurs :
- Les grandes fondations sont très efficaces en termes de succès à l’ANR (y compris les fondations de coopération scientifiques et assimilées). En 2011, elles sont partenaires de 66 projets (5% du total). Avec deux champions : l’Institut Pasteur (32 projets lauréats en 2011) et l’Institut Curie (17 projets). Ceci place cette année là l’Institut Pasteur au même niveau que l’université d’Aix-Marseille (avec son périmètre fusionné actuel).
- Les centres hospitaliers sont aussi substantiellement financés par l’ANR (CHU et CHR) . En 2011, 56 projets lauréats associaient une structure hospitalière (4,6% du total des projets). C’est beaucoup plus distribué sur le territoire que pour les fondations, puisque le premier CHU : l’AP-HP , n’est présent que sur 7 projets.
Où va l’argent ? (analyse par établissement)
C’est la partie la plus intéressante. L’analyse par établissement. C’est aussi la plus délicate, pour un ensemble de raison qui sont discutées dans la partie sur le contrôle des données plus bas. À partir de 2012, les données d’attribution aux institutions sont un peu plus lacunaires. Les chiffres indiqués sont donc nécessairement des sous-estimations.
Pour avoir une analyse plus robuste, j’ai pris le parti de considérer l’ensemble de la période 2006-2017. Pour éviter les effets de bords sur les petits effectifs et avoir un peu plus de puissance statistique. L’objectif est principalement d’avoir une représentation relative des financements reçus, à défaut de pouvoir être tout à fait quantitatif.
Les organismes
L’histogramme ci-dessous montre les financements cumulés des projets dont les principaux organismes de recherche nationaux étaient partenaires, sur la période 2006-2017. Il s’agit des montants totaux cumulés des projets, pas de la quote-part attribuée à chaque organisme (qui ne figure pas dans les données). Avec une moyenne de 3,1 partenaires par projet (cf plus-haut), on peut estimer que les subventions ANR réellement gérées par ces organismes doivent donc correspondre à la louche à environ 1/3 des montants indiqués.
Le CNRS occupe un leadership incontesté, avec un montant total cumulé de projets de 2 372 M€ (sur le total de 5 219 M€ distribués par l’ANR sur cette période). Le CEA et l’INSERM suivent avec un peu plus de 700 M€ chacun. L’INRA et l’INRIA complètent le « groupe des 5 » avec des montants respectifs de 384 M€ et 251 M€. Les autres organismes sont tous en dessous de 100 M€ cumulés, avec un peloton entre 40 et 90 M€.
Les universités
Pour les universités, le graphe équivalent à celui des organismes est indiqué ci-dessous.
Ces données appellent plusieurs commentaires de précaution. Dans tous les cas c’est en effet une sous-estimation du vrai chiffre (i.e. un minorant). Pour deux raisons :
- Parce que mon nettoyage des données est incomplet (je n’ai réattribué à leur institution tutelle qu’un peu moins de 80% des équipes, ça en laisse environ 20% dans la nature) ;
- Parce que lorsqu’il s’agit d’une équipe au sein d’une UMR, l’institution gestionnaire est souvent l’organisme national (CNRS, INSERM…), plutôt que l’université. Du coup, elle n’est pas toujours référencée pour sa tutelle universitaire
La valeur absolue de chaque barre de l’histogramme ci-dessus est donc une combinaison de deux facteurs : le montant des contrats effectivement obtenus par les équipes de l’université et le fait que ces contrats soient gérés ou pas par l’université.
Ce second paramètre (gestion par l’université) est probablement plus important dans des établissements où les structures de gestion des contrats de recherche sont très développées, à l’instar des organismes de recherche. Typiquement, les plus grands établissements d’enseignement supérieur et ceux qui sont très actifs en recherche.
Universités riches et universités pauvres ?
Sorbonne U constitue un point singulier qui sort nettement du lot dans le graphe. Je vois deux facteurs qui peuvent contribuer à expliquer ça : C’est indiscutablement une de nos meilleures universités en termes de recherche et elle a vraisemblablement su mettre en place une structure d’appui à la recherche efficace qui lui permet de gérer une grande partie des contrats de ses équipes.
Si on regarde la distribution du reste des universités (en faisant abstraction de Sorbonne U), je me fais plusieurs observations :
- La distribution est largement étalée, avec ~70% des universités représentées au dessus de 10 M€ cumulés.
- Beaucoup d’universités provinciales de taille moyenne hors Idex/Isite tirent très bien leur épingle du jeu : Brest, Pau, Tours, Limoges, Reims, Chambéry…, ce qui n’était pas forcément évident.
- Les universités à forte composante de sciences expérimentales sont dans le haut du classement et celles purement SHS dans le bas (ce qui n’est en revanche pas une vraie surprise).
- Les écarts seraient à pondérer par la taille des établissements (ramener par exemple à la subvention publique de fonctionnement, ou au nombre de statutaires dans les labos). Les plus dotées sont souvent aussi des grosses universités fusionnées. Les plus grosses sont aussi celles qui peuvent plus facilement investir des ressources dans la gestion des contrats et l’appui administratif, ce qui gonfle leur chiffre de contrats gérés. Si on pondère par la taille, ça devrait aplatir davantage la distribution (peut être le ferai-je pour un prochain billet, mais là je sature un peu sur l’analyse de données).
- Il faudrait aussi corriger quelques singularités, comme Toulouse I Capitole (en queue de classement) dont les équipes obtiennent pas mal d’ANR, mais celles-ci étant gérées par la fondation Toulouse School of Economics (TSE) elles ne sont pas comptabilisées pour l’université.
Tout ça pour dire que si on voit des différences réelles, on n’est à mon avis pas dans un stéréotype riches/pauvres très tranché, du genre « tout pour les Idex/Isite », rien pour les autres. Il y a cependant un vrai hiatus pour certaines universités purement SHS auquel il faudrait trouver des solutions.
Les données indiquent que l’ANR finance relativement large, plus large que le discours ambiant ne le laisse entendre.
Ceci n’est pas nécessairement incompatible avec une impression que l’ANR arrose parfois à répétition les mêmes équipes. Simplement, ces serial-ANR sont répartis dans pas mal d’établissements.
Les écoles et grands établissements
J’ai traité séparément les écoles et grands établissements qui constituent un groupe plus hétérogène, avec des niveaux d’activité de recherche et de formation assez variables. Le graphe ci-dessous montre le niveau de financement par l’ANR pour une sélection de ceux qui sont les plus actifs.
Les fondations et centres hospitaliers
Pour conclure, juste quelques remarques sur deux autres catégories de bénéficiaires de l’ANR :
- Les fondations et en particulier l’Institut Pasteur et l’Institut Curie sont très performantes à l’ANR. Elles sont également souvent coordinatrices des projets (pas justes partenaires). Pasteur, par exemple émarge sur des projets d’un montant cumulé de 125 M€ sur la période 2006-2017, soit autant que Paris-Saclay… Curie fait presque aussi bien avec 94 M€.
- Les structures hospitalières (AP-HP, AP-HM, Hospices civils de Lyon, CHU, CHR) sont partenaires de projets ANR pour un montant cumulé de 336 M€ sur 2006-2017. Ça fait ~30 M€ de montants de projets cumulés par an. À titre de comparaison, le PHRC national (programme hospitalier de recherche clinique du ministère chargé de la santé) a distribué un budget d’un peu moins de 70 M€ en 2019. La contribution de l’ANR à la recherche hospitalière est donc loin d’être négligeable.
Méthode : Contrôle et nettoyage des données
(Plongée dans le cambouis pour les geeks qui veulent tout savoir)
Les données dont je suis parti sont d’une qualité assez merdique et impossibles à utiliser directement (mais je n’avais pas mieux…). En particulier, l’identification directe des partenaires institutionnels est très problématique. Par exemple, pour l’université de Saint-Étienne, on peut trouver une dizaine de dénominations différentes avec St-Etienne ou Saint-Etienne, avec ou sans tiret, avec ou sans accent sur le É, avec U. ou Univ. ou Université… Pareil avec les numéros des universités (Paris 1 ou Paris I, avec ou sans Panthéon Sorbonne…). Sans parler de celles qui fusionnent ou changent de nom pendant la durée étudiée…
Pour chaque projet dans la base, on a :
- Identifiant de l’ANR
- Intitulé de l’ANR
- Coordinateur
- Nom du programme
- Montant
- Durée en mois
- Date de début
- Liste des partenaires
- URL de la page présentant l’ANR
C’est parfois incomplet. Par exemple, on n’a pas toujours la date de début, mais on peut la retrouver avec l’identifiant ANR. Bref, il faut faire un gros ménage avant de pouvoir faire quoi que ce soit.
J’ai fabriqué un filtre grep
comprenant environ 500 expressions régulières pour uniformiser les dénominations d’environ 200 à 250 institutions différentes (universités, grands établissements, EPST, EPIC, Fondations, CHU…). Pour ceux qui ne connaissent pas, grep
est un outil Unix permettant de faire des rechercher/remplacer très sophistiqués. Un truc de nerd.
Pour compliquer les choses, un certain nombre d’institutions ont changé de périmètre et/ou de dénomination pendant cette période. J’ai pris le parti de prendre le périmètre actuel (par exemple, pour Aix-Marseille le périmètre actuel d’AMU, par consolidation des données des trois universités fondatrices avant 2012, date de la fusion). Pour les universités de statut expérimental avec des établissements-composantes conservant leur personnalité juridique, je n’ai pas intégré ces établissements-composantes dans l’établissement fusionné, mais je les ai traités séparément (exemples : l’Institut polytechnique à Grenoble, l’IPGP à l’université de Paris, les différentes écoles de l’université de Lorraine…).
Je ne suis pas arrivé à tout corriger de manière exhaustive, c’est impossible, parce que pour environ 20% des partenaires de projets, la tutelle n’est juste pas indiquée. il y a juste un truc du style Monsieur Macheprot, Institut de pataphysique structurale, point barre. On n’a pas les institutions tutelles et quelquefois, même pas la ville. C’est impossible à corriger, à moins d’aller se les palucher une par une à la main sur son moteur de recherche préféré.
Mon objectif était d’aboutir à une analyse semi-quantitative. Avec environ 80% des projets ainsi nettoyés (un peu moins), je pense avoir une certaine fiabilité sur les ordres de grandeurs relatifs. Autre conséquence, mes chiffres par institution sont certainement un peu sous-estimés du fait que certains des projets dans les 20% restants sont passés entre les mailles de mon filet.
Dernier point sur ce sujet, Les données des années 2005 à 2011 pour les institutions partenaires sont plus propres que celles des années 2012 à 2017 (moins de partenaires non-identifiés). C’est pour cette raison que j’ai utilisé l’année 2011 comme référence plus haut (c’est la plus proche de nous dans la période « propre »).
J’ai conscience que ce n’est pas parfait et que plusieurs de mes choix peuvent être discutés, mais c’est ce qui m’a paru le plus logique/pertinent.
Source de l'image de titre : wikimedia commons
3 commentaires sur “3”
Les commentaires sont fermés