IA générative vs IA prédictive : quel périmètre pour un premier pilote en entreprise

Cadrage technique de l'IA générative et prédictive à destination d'un sponsor non-tech : quel périmètre pour un premier pilote, et comment choisir entre les deux.

Thibault Le Balier/26 avril 2026/8 min

IA générative vs IA prédictive : quel périmètre pour un premier pilote en entreprise

Un sponsor exécutif qui débloque un budget IA pour la première fois rencontre rapidement un choix qu'il n'a pas été formé à arbitrer : son premier pilote relève-t-il de l'IA générative ou de l'IA prédictive. La question est rarement posée explicitement, parce que les équipes techniques sautent souvent à la solution avant de la nommer. Elle est pourtant structurante. Elle conditionne la nature du candidat, le type d'actif data nécessaire, les métriques de succès, et le profil de risque.

L'objectif de ce cadrage est de donner à un sponsor non-tech ce qu'il faut pour comprendre la distinction, identifier dans quelle famille son candidat se range, et arbitrer sans dépendre de la préférence technique de son équipe ou de son prestataire. Les distinctions sont plus simples qu'elles n'en ont l'air, à condition de les nommer correctement.

La distinction fondamentale en une phrase

L'IA générative produit du contenu en sortie, texte, image, structure, parfois code. L'IA prédictive produit une décision ou une estimation à partir de données structurées en entrée, un score, une catégorie, une valeur numérique, une probabilité.

Cette distinction sépare deux familles d'usages, deux types d'actifs data, et deux profils de pilotes. Elle n'épuise pas le sujet (certains pilotes mêlent les deux), mais elle suffit à orienter un premier coup.

L'IA générative repose typiquement sur les grands modèles de langage, Claude, Mistral, GPT, ainsi que leurs équivalents propriétaires. Elle excelle quand l'entrée et la sortie sont du texte ou des documents semi-structurés. L'IA prédictive repose sur les méthodes statistiques et d'apprentissage automatique, régression, forêts aléatoires, gradient boosting, plus rarement aujourd'hui des réseaux profonds spécialisés. Elle excelle quand les entrées sont des colonnes numériques ou catégorielles dans un SI propre.

Ce que l'IA générative permet en pilote

Un pilote d'IA générative en entreprise vise typiquement trois familles d'usages.

La première : la recherche assistée sur base documentaire dense. Pattern RAG. Le système trouve, dans un corpus de contrats, fiches techniques, archives ou normes, le passage exact qui répond à la question, avec citation de la source. Le sponsor visualise facilement le livrable : un outil interne où l'utilisateur tape une question en langage naturel et obtient une réponse sourcée. C'est le pilote génératif le plus mature en 2026, livrable en quatre à six semaines sur un corpus de quelques milliers à quelques dizaines de milliers de documents.

La deuxième : l'extraction et la structuration depuis du texte libre. Le système transforme un PDF de facture, un mail client ou un compte rendu en lignes propres dans le SI. C'est techniquement de la génération (le modèle produit du JSON ou un texte structuré), mais l'usage est très différent du chatbot. Pilote livrable en six à huit semaines, ROI mesurable au mois suivant.

La troisième : la pré-rédaction sous contrôle humain. Devis, comptes rendus, réponses standardisées. Le modèle produit une V0, l'humain valide. Gain de temps facile à mesurer.

Ces trois familles partagent une caractéristique : la valeur produite est immédiatement visible par l'utilisateur final, et la qualité se juge directement sur la sortie. C'est ce qui les rend adaptées à un premier coup. Le sponsor n'a pas besoin d'expertise statistique pour évaluer le résultat.

Ce que l'IA prédictive permet en pilote

Un pilote d'IA prédictive en entreprise vise des usages d'une autre nature.

Première famille : la prédiction d'un événement futur à partir de données historiques. Probabilité de churn client, risque de défaillance d'un fournisseur, prévision de demande sur un produit, détection de pannes machines avant occurrence. L'actif data requis est un historique numérique propre, suffisamment volumineux et représentatif, dans un SI accessible.

Deuxième famille : la classification ou le scoring à partir de variables structurées. Notation crédit, qualification de leads, priorisation de tickets. La sortie est un nombre ou une catégorie qui alimente une décision en aval.

Troisième famille : l'optimisation sous contrainte. Tournées de livraison, allocation de ressources, pricing dynamique. Plus rare en premier pilote PME, mais matérialisable quand l'actif data est mûr.

La valeur de l'IA prédictive est puissante quand l'actif est en condition. Elle l'est rarement en premier coup, parce qu'elle exige un historique structuré qui demande, dans la majorité des PME, plusieurs mois de préparation data avant d'être exploitable. C'est la principale raison pour laquelle, en pratique, les premiers pilotes IA en PME et ETI sont plus souvent génératifs que prédictifs.

Le critère d'arbitrage : où est l'actif

L'arbitrage entre génératif et prédictif ne se fait pas sur le sujet métier, il se fait sur l'actif data déjà présent.

Si l'actif disponible est documentaire (contrats, mails, archives PDF, comptes rendus), le candidat se range presque toujours côté génératif. Pas de discussion. Tenter de prédire à partir de PDF impose une étape de structuration qui annule le bénéfice de simplicité du pilote.

Si l'actif disponible est tabulaire (lignes de commandes, historique CRM, transactions, capteurs IoT, logs d'application), le candidat se range côté prédictif. Tenter de générer à partir de tabulaire pur revient à demander à un LLM un travail pour lequel des méthodes statistiques plus simples sont 10 à 100 fois plus efficaces.

Si l'actif est hybride, typiquement des fiches structurées qui incluent du texte libre, les pilotes les plus rentables combinent extraction générative puis traitement prédictif. C'est plus rare en premier coup, plus fréquent en coup suivant.

Cette grille d'arbitrage évite l'erreur la plus fréquente : choisir l'IA générative parce qu'elle est à la mode, sur un actif qui appelait du prédictif. La perte de temps est typiquement de trois à six mois.

La question du risque

Le profil de risque diffère entre les deux familles. C'est important pour le sponsor.

L'IA générative produit des sorties qu'un humain peut lire et juger sur pièces. Une réponse fausse présentée avec aplomb est détectable, à condition d'imposer la citation systématique des sources. Le mécanisme de contrôle est lisible.

L'IA prédictive produit des scores qu'aucun humain ne peut juger sans contexte statistique. Un modèle qui prédit 0,73 sur un client n'est pas évaluable individuellement. Le contrôle qualité passe par des métriques agrégées (précision, rappel, AUC) que le sponsor non-tech n'évalue pas à l'œil. Si une dérive apparaît, drift, biais nouveau, surajustement, elle ne se voit pas, sauf monitoring discipliné.

En premier coup, le risque génératif est plus facile à cadrer pour un sponsor non-tech, parce qu'il est lisible. Le risque prédictif demande des compétences internes de suivi qui sont rarement présentes en PME. C'est un argument fort en faveur du premier pilote génératif, indépendamment de la valeur du candidat, sauf si l'entreprise dispose déjà d'une data team mature.

Ce qui ne relève d'aucune des deux familles

Une partie des candidats IA remontés en ateliers ne relève en réalité d'aucune de ces deux familles. Ils relèvent d'automatisation classique, règles métier, scripts, intégrations entre SI. Si la tâche est totalement structurée (lecture d'un CSV, application d'une règle, écriture dans un système cible), l'IA est généralement le mauvais outil. Un script Python coûte dix fois moins, tourne cent fois plus vite, et ne hallucine pas.

Ce filtre est utile en cadrage. Un candidat dont la tâche est entièrement déterministe sort de la liste IA, sans débat. C'est un sujet d'IT, pas d'IA. Le sponsor évite alors d'imputer un budget IA à un projet qui n'en relève pas, ce qui est une cause récurrente d'échec apparent du portefeuille IA.

Le cas client : un pilote mal cadré côté prédictif

Une ETI logistique française, 280 personnes, avait engagé en 2025 un projet de prédiction de retard de livraison. Côté prédictif. L'actif annoncé : trois ans d'historique de livraisons dans le TMS. Budget engagé : CHF 140 000.- sur un cabinet spécialisé data science.

Trois mois après le démarrage : l'historique est exploitable à 60 %, les 40 % restants comportent des champs vides, des codes incohérents, des refactorings du TMS non documentés. Le modèle prédictif tient en démonstration sur l'échantillon propre, mais s'effondre en production sur les flux réels. Le pilote est arrêté à 70 % du budget consommé.

Reprise en 2026, AI Use Case Audit cinq jours. La double écoute J1 révèle que la friction des opérationnels n'était pas la prédiction. C'était la recherche d'information dans les comptes rendus de tournée, comprendre, après coup, pourquoi un retard s'était produit, en parcourant trois ans de comptes rendus rédigés en texte libre.

Bascule côté génératif : pattern de recherche assistée sur la base des comptes rendus, structurée en six semaines. Pilote en production, adoption à 80 % des chefs de file, valeur immédiate pour les opérationnels. Le candidat prédictif initial est replanifié à dix-huit mois, en coup suivant, le temps de remettre en propre l'historique TMS.

Le mauvais arbitrage initial n'était pas un choix technique, c'était un choix posé sans cadrage sponsor sur la nature de l'actif et la nature du besoin.

Ce qu'il faut emporter

Trois questions, à poser au sponsor avant d'engager le premier pilote, dans cet ordre.

Quel est l'actif data exact que le pilote mobilisera, et est-il documentaire, tabulaire ou hybride. La réponse oriente la famille technique. Si la réponse est floue ou si l'actif n'a pas été vérifié sur pièces, le pilote n'est pas mûr.

Quel est le besoin métier exprimé par les utilisateurs finaux, en entretiens individuels documentés. Pas par le sponsor seul, pas en atelier collectif. Si le besoin n'a pas été instrumenté à ce niveau, le candidat est en risque d'effet techno-push.

Quel est le mécanisme de contrôle qualité de la sortie, et est-il opérable par les utilisateurs sans expertise statistique. Si la réponse demande des compétences internes que l'entreprise n'a pas, l'arbitrage doit probablement basculer vers l'autre famille.

Ces trois questions ne demandent pas d'expertise IA pour être posées. Elles demandent un sponsor qui les pose, et qui n'engage le pilote que quand elles sont répondues.

Si vous hésitez entre IA générative et IA prédictive pour votre premier pilote, l'AI Use Case Audit en cinq jours arbitre sur la base de l'actif disponible et du besoin instruit, pas de la mode technique. La fiche initiative précise la famille retenue et justifie le choix.