Catalogue d'idées IA qui dort : pourquoi ça arrive et comment en sortir

L'effet catalogue paralyse les démarches IA d'entreprise : pourquoi le scoring multi-critères ne tranche pas, et comment les disqualifiants débloquent la décision.

Thibault Le Balier/19 avril 2026/8 min

Catalogue d'idées IA qui dort : pourquoi ça arrive et comment en sortir

Quarante cas d'usage IA, scorés sur six dimensions, classés par catégorie, présentés dans un PowerPoint en comité innovation. Le sponsor exécutif acquiesce. La DSI ajoute deux candidats. Le RACI est mis à jour. Et six mois plus tard, le même catalogue revient en comité, enrichi de huit nouveaux candidats. Aucun pilote n'a démarré.

Cette situation est la version moderne du pilot purgatory : le purgatoire des catalogues. Elle est plus subtile que l'échec du POC qui meurt en production, parce qu'elle ne produit pas d'échec visible. Elle produit du sur-place. Et elle consomme du budget, en ateliers, en consulting, en outillage de gouvernance, sans jamais déboucher sur une initiative engagée.

L'effet catalogue n'est pas un problème de motivation. C'est un problème méthodologique. Comprendre pourquoi il survient et comment en sortir évite de répéter l'exercice avec un nouveau scoring qui produira le même résultat.

Pourquoi le scoring multi-critères ne tranche pas

La promesse du scoring multi-critères est séduisante. On définit cinq, six, parfois huit axes, impact, faisabilité, urgence, valeur stratégique, complexité, risque, adoption, on note chaque candidat, on agrège, on classe. Le candidat numéro un sort en tête. Le sponsor signe.

En pratique, sur un catalogue de plus de quinze candidats, le scoring ne classe pas, il égalise. Les candidats finissent par occuper une bande étroite de scores, entre 14 et 18 sur 25 par exemple. Cinq, six, parfois dix candidats à scores comparables, sans qu'aucune dimension ne tranche. Le COMEX ne signe pas, parce qu'il n'y a pas de tête de liste évidente, et qu'arbitrer entre des candidats à scores proches sans information supplémentaire ressemble à un coup de dé.

La cause mécanique est double. D'une part, l'agrégation par moyenne ou somme pondérée écrase les signaux forts. Un candidat 5/5 sur impact et 2/5 sur faisabilité finit à 3,5/5, le même score qu'un candidat 3/5 sur les deux axes. Ce ne sont pas le même type de pari, mais le score ne le dit pas. D'autre part, sur un catalogue large, les dimensions deviennent corrélées. Les candidats qui scorent haut sur l'impact tendent à scorer haut sur l'adoption, parce que les ateliers de remontée ont déjà filtré. Le scoring confirme un classement implicite plutôt qu'il ne le révèle.

Plus on raffine le scoring, plus de dimensions, plus de pondérations, plus de sous-critères, plus on accentue l'effet. C'est contre-intuitif, mais empiriquement observable : les catalogues les mieux scorés sont ceux qui dorment le plus profondément.

L'autre mécanisme : la peur de l'arbitrage

Au-delà du scoring lui-même, l'effet catalogue se nourrit d'un mécanisme organisationnel : la peur d'arbitrer. Chaque candidat du catalogue a un parrain interne, un directeur métier, un responsable BU, un chef de projet, qui l'a porté en remontée. Trancher signifie nommer un gagnant et, implicitement, des perdants. Beaucoup d'organisations préfèrent maintenir le catalogue en équilibre instable plutôt que de prendre le coût politique de l'arbitrage.

Le scoring multi-critères devient alors un outil de procrastination légitime. Tant qu'il « manque des données » ou que « certains scores méritent d'être affinés », l'arbitrage est différé. La gouvernance IA produit des comités, des ateliers, des matrices de priorisation. Elle ne produit pas de pilote signé.

C'est rarement de la mauvaise foi. C'est plus souvent une absence de mandat clair pour arbitrer, et une absence d'outil méthodologique pour le faire sans paraître arbitraire.

La sortie par les disqualifiants

La sortie de l'effet catalogue n'est pas un meilleur scoring. C'est l'introduction d'un mécanisme différent : les disqualifiants binaires, posés en amont du scoring.

Un disqualifiant n'est pas une note basse. C'est un critère qui élimine le candidat de la liste, quel que soit son score sur les autres axes. Pas de débat, pas de pondération, pas de recours. Le candidat sort, on le note dans la fiche, on passe au suivant.

Chez BUMPSLAB, on retient typiquement cinq disqualifiants pour un premier coup IA. Pas de sponsor exécutif nommé. Pas d'actif data disponible à court terme. Décision critique sans humain dans la boucle envisageable. Périmètre régi par une réglementation non instruite (santé, droit, finance régulée sans cadre interne). Dépendance à un système tiers dont l'évolution n'est pas maîtrisée. Cette liste varie selon les contextes, mais le principe est constant : cinq filtres binaires maximum, énoncés avant le scoring.

L'effet sur un catalogue de quarante candidats est radical. Dans la majorité des cas qu'on a vus reprendre, les disqualifiants éliminent la moitié à deux tiers des candidats en quinze minutes. Pas parce qu'ils sont mauvais, parce qu'ils ne sont pas en condition d'être engagés à court terme. Le scoring s'applique ensuite, mais sur un nombre restreint de candidats survivants, où il retrouve sa capacité à classer.

Le bénéfice secondaire est politique. Un candidat éliminé par un disqualifiant n'est pas un candidat dont l'idée est jugée mauvaise. C'est un candidat qui attend la levée du disqualifiant, un sponsor à nommer, un actif à constituer, un cadre réglementaire à poser. Le parrain interne peut continuer à le défendre, mais sur le terrain de la levée du disqualifiant, pas sur celui de la priorisation. La conversation se déplace.

Le seuil 18/25, ou pourquoi un score qui dépasse ne suffit pas

Une fois les disqualifiants appliqués et les survivants scorés, l'arbitrage doit encore se faire. Sur un scoring 5 axes noté de 1 à 5, on retient un seuil 18/25 pour engager un pilote. Sous ce seuil, l'engagement est reporté, quel que soit le rang relatif du candidat dans le catalogue.

Le seuil 18/25 n'est pas magique. C'est un calage empirique : sous ce niveau, l'expérience montre que le pilote a une probabilité significative de ne pas tenir la production. Au-dessus, il a une probabilité raisonnable. La discipline du seuil est aussi importante que sa valeur, elle interdit au sponsor de signer le moins mauvais d'une promotion faible. Plutôt instruire trois mois de plus et engager un meilleur candidat que de signer un 16/25 par dépit budgétaire.

Cette discipline est ce qui distingue un audit qui produit une initiative signable d'un audit qui produit un rapport. Le seuil tranche ce que le scoring n'arrive pas à trancher.

Sortir d'un catalogue qui dort demande un sponsor exécutif prêt à arbitrer. Pas un comité. Une personne, nommée, avec mandat clair. Si l'organisation n'a pas désigné ce sponsor, ou si elle a désigné un sponsor qui n'a pas le poids politique pour trancher, l'effet catalogue se reproduit à l'identique, quelle que soit la méthode appliquée.

Le sponsor exécutif idéal est un membre du COMEX ou un directeur de BU avec budget propre, capable de signer une fiche initiative sans repasser par une instance collégiale. Sa responsabilité méthodologique est triple : accepter le principe des disqualifiants, accepter le seuil 18/25, et engager le pilote retenu sans rouvrir le débat trois mois après.

Si ces trois engagements ne sont pas pris en amont, l'audit produit un catalogue mieux ordonné, pas une initiative engagée. C'est un sujet qu'on traite plus en détail dans Sponsor IA en entreprise.

Le cas client : réduire un catalogue de 38 candidats à un pilote

Un groupe assurance helvétique, environ 600 collaborateurs, avait constitué début 2026 un catalogue de 38 candidats IA après six mois d'ateliers transverses. Direction Innovation en charge, scoring sur huit dimensions, classement disponible mais aucun pilote engagé. Budget IA débloqué depuis huit mois.

Reprise en AI Use Case Audit cinq jours. Application des disqualifiants J2 : 23 candidats sortent. Sept par absence de sponsor exécutif nommé (les parrains internes étaient des chefs de projet sans mandat). Six par absence d'actif data vérifié, les bases mentionnées étaient en réalité dispersées sur plusieurs SI sans intégration. Quatre par périmètre réglementaire non instruit (sujets sinistres et conseil client engageant). Six pour des raisons diverses.

Quinze candidats survivants scorés sur cinq axes J3. Seuil 18/25 : trois candidats passent. Sélection finale : un pilote de classification entrante des courriers sinistres simples, pattern d'extraction et de routage, actif vérifié sur 18 mois d'historique numérisé, sponsor directrice indemnisation, métriques business chiffrées. Pilote signé J5, engagé la semaine suivante.

Les 35 autres candidats n'ont pas disparu. Treize ont été classés en attente de levée de disqualifiant. Sept ont été regroupés en deux candidats consolidés pour réinstruction au prochain audit. Quinze ont été écartés définitivement avec motivation écrite, ce qui a, comme effet de bord notable, fait cesser les remontées récurrentes des mêmes parrains internes sur ces sujets.

Quand le catalogue n'est pas le problème

Une nuance s'impose. Tous les catalogues qui dorment ne sont pas des dysfonctionnements. Certains catalogues sont la trace d'une organisation qui a fait l'effort de cartographier, et qui attend, à raison, qu'un sponsor exécutif soit en condition d'engager. Dans ces cas, le catalogue est un actif, pas un blocage.

Le signe que le catalogue est devenu un blocage est précis : quand il est revisité à intervalles réguliers, enrichi, re-scoré, sans qu'aucune décision d'engagement ne sorte de ces revues. Si vous reconnaissez ce schéma, vous êtes en effet catalogue. Sinon, votre catalogue fait probablement son travail.

Si votre catalogue d'idées IA tourne en revue depuis plus de six mois sans pilote engagé, l'AI Use Case Audit en cinq jours est conçu pour appliquer les disqualifiants, scorer les survivants, et produire une fiche initiative signable. Cinq jours pour sortir du catalogue.