Aller au contenu principal

Depuis l'irruption publique des LLM fin 2022, le mot « IA » s'est aplati. Dans la plupart des conversations que j'ai avec des dirigeants, il désigne tout et rien : parfois un chatbot, parfois un modèle prédictif, parfois un copilote dans un logiciel métier, parfois un simple moteur de règles enrichi. Cette confusion n'est pas anodine. Elle produit des erreurs de casting coûteuses, des projets mal posés dès le cadrage, et une frustration persistante quand « l'IA » ne tient pas ses promesses — alors qu'on l'avait simplement envoyée sur le mauvais problème.

Derrière le mot IA cohabitent aujourd'hui deux familles très différentes. L'IA générative, popularisée par ChatGPT, Claude ou Gemini, qui produit du contenu (texte, code, image, son) à partir d'une demande. Et l'IA prédictive, plus ancienne, qui estime une valeur ou une probabilité à partir de données historiques (prévoir une demande, scorer un client, classifier une transaction). Ces deux familles partagent une étiquette marketing, mais leurs logiques mathématiques, leurs cas d'usage et leurs modes d'évaluation sont distincts. Les confondre coûte cher. Savoir les distinguer est la première compétence que devrait acquérir un dirigeant avant de lancer la moindre initiative IA.

Deux natures fondamentalement différentes

La différence entre IA générative et IA prédictive n'est pas seulement une question de cas d'usage. C'est une différence de nature, qui se lit dans les données d'entrée, le modèle sous-jacent, et surtout dans ce que l'on considère comme un bon résultat.

L'IA prédictive modélise une relation conditionnelle : étant données certaines variables d'entrée (historique, contexte, caractéristiques), quelle est la valeur la plus probable d'une variable de sortie ? Régressions, forêts aléatoires, gradient boosting, réseaux de neurones classiques, séries temporelles : toutes ces techniques cherchent à estimer une valeur ou une probabilité. Les fondements statistiques de cette approche sont documentés depuis plusieurs décennies par des ouvrages de référence comme celui de Hastie, Tibshirani et Friedman[1]. Le bon résultat, ici, se mesure par des métriques chiffrées : erreur quadratique moyenne, précision, rappel, AUC.

L'IA générative, elle, modélise la distribution même des données : étant donnée la façon dont les textes, les images ou les sons se combinent dans un corpus massif, quelle est la séquence la plus plausible à produire en réponse à une demande ? Les LLM, les modèles de diffusion et leurs cousins multimodaux appartiennent à cette famille. Leurs fondements ont été posés notamment dans l'ouvrage fondateur de Goodfellow, Bengio et Courville[2]. Le bon résultat, ici, n'est pas un chiffre exact : c'est la pertinence, la cohérence, la fidélité au contexte — toutes choses qui se mesurent difficilement à travers une seule métrique.

Cette distinction mathématique a une conséquence pratique décisive. L'IA prédictive est faite pour produire une valeur ; l'IA générative est faite pour produire un contenu. Demander à l'une ce qu'on attend de l'autre, c'est s'assurer d'obtenir un résultat approximatif au mieux, catastrophique au pire.

Ce que chacune fait bien, ce que chacune rate

Les forces et les angles morts des deux familles sont suffisamment stables pour en faire une grille de lecture utile à un dirigeant.

L'IA générative excelle sur toute tâche qui consiste à produire, transformer ou extraire du contenu non structuré. Résumer un rapport de cinquante pages, rédiger une première version d'une note de synthèse, traduire un document technique, extraire les clauses clés d'un contrat, reformuler un discours en fonction d'une audience, dialoguer en langage naturel avec une base documentaire, classifier un mail dans un workflow : voilà où elle apporte une valeur considérable, souvent immédiate. Sur ces tâches, ses gains de productivité sont régulièrement estimés entre 20 et 60 % selon les cas d'usage et les études disponibles[3].

L'IA générative rate, en revanche, tout ce qui demande du calcul précis, de la reproductibilité parfaite ou de l'explicabilité statistique. Elle hallucine quand elle ne sait pas. Elle ne calcule pas une somme avec une garantie équivalente à un tableur. Elle ne retrouve pas deux fois la même réponse exacte pour une même question sans une ingénierie coûteuse. Elle ne sait pas dire « je ne sais pas » avec fiabilité. Pour toute décision où la valeur chiffrée compte, elle est un mauvais outil.

L'IA prédictive excelle sur toute tâche structurée : prévoir une demande, scorer une probabilité de churn, détecter une anomalie financière, segmenter une population, anticiper un risque. Sur des données historiques propres, elle produit des estimations reproductibles, mesurables, auditables. C'est ce que j'avais développé à propos des modèles prédictifs appliqués aux RH : ces modèles ne sont pas magiques, mais ils permettent de quantifier l'incertitude et d'ancrer la décision dans une base statistique défendable.

L'IA prédictive rate, de son côté, tout ce qui concerne la manipulation du langage naturel, la compréhension de documents non structurés et la production de commentaires intelligibles. Elle produit des chiffres, pas des phrases. Demander à un modèle de régression d'expliquer sa prévision en langage clair, c'est se heurter à un mur — ou bricoler une explication artificielle qui ne reflète pas la mécanique réelle du modèle.

La matrice de décision : quel problème appelle quelle IA

En pratique, la question « quelle IA utiliser ? » se résout presque toujours en reformulant la question métier. Deux critères suffisent à trancher dans 90 % des cas.

Matrice de décision simplifiée
  • Nature de la sortie attendue : est-ce un document, un texte, une synthèse ? → générative. Est-ce une valeur, un score, une probabilité ? → prédictive.
  • Nature de la donnée d'entrée : texte libre, document non structuré, dialogue ? → générative. Tableau structuré, série temporelle, base de transactions ? → prédictive.
Quand les deux critères pointent vers la même famille, le choix est clair. Quand ils divergent (entrée structurée, sortie textuelle, par exemple), on est dans un cas hybride, qui demande un pipeline combinant les deux.

Quelques exemples pour illustrer. Produire automatiquement la note de commentaire mensuel du comité de direction à partir de chiffres finaux : génératif. Prévoir le chiffre d'affaires du trimestre à venir : prédictif. Classifier les e-mails reçus par le service client en catégories : génératif (sur du texte libre) ou prédictif (sur des métadonnées), au choix selon la qualité des données. Détecter une anomalie dans les écritures comptables : prédictif. Résumer un rapport de 100 pages en 2 pages : génératif. Anticiper un risque de départ dans une équipe : prédictif.

Cette matrice n'est pas un dogme. Elle est une heuristique qui vaut pour la phase de cadrage. Les cas ambigus existent, et c'est précisément là que l'arbitrage humain, informé, fait la différence. Mais commencer un projet IA sans trancher cette première question, c'est se condamner à mélanger des outils inadaptés.

Les erreurs de casting les plus fréquentes

J'observe les mêmes cinq erreurs de casting dans presque toutes les missions où l'on m'appelle pour redresser un projet IA en difficulté.

Erreur 1 — Demander à un LLM de calculer. Un LLM n'est pas une calculatrice. Lui demander de produire un budget exact, de consolider des comptes ou de calculer un indicateur précis, c'est utiliser un marteau pour visser. L'erreur est fréquente parce que le LLM semble capable de calculer : il produit une réponse plausible. Mais cette réponse n'est ni reproductible, ni garantie. Pour tout calcul métier, utilisez un outil déterministe ou un modèle prédictif spécifiquement entraîné.

Erreur 2 — Demander à un modèle prédictif d'expliquer. Un modèle de régression ou de classification produit une valeur. Lui demander « pourquoi as-tu prédit cette valeur ? » relève soit d'un outil d'interprétabilité dédié (SHAP, LIME), soit d'un habillage par un LLM en aval. Dans les deux cas, cela demande une architecture pensée. Attendre d'un modèle prédictif qu'il génère un commentaire de comité de direction est une confusion de rôles.

Erreur 3 — Acheter « de l'IA » sans préciser laquelle. Les éditeurs vendent de plus en plus des solutions qui annoncent simplement « IA intégrée ». Derrière cette étiquette se cachent parfois un LLM connecté à un RAG, parfois un modèle prédictif calibré sur les données du client, parfois les deux, parfois ni l'un ni l'autre (un simple moteur de règles habillé). Le dirigeant doit exiger, à l'achat, que le fournisseur précise la nature technique de l'IA proposée — pas pour jargonner, mais pour anticiper les cas où elle ratera.

Erreur 4 — Ignorer la complémentarité. Dans la plupart des cas réels de pilotage, les deux IA sont utiles conjointement. Un modèle prédictif produit une prévision, un LLM la commente en langage naturel. Un LLM extrait l'information d'un document non structuré, un modèle prédictif l'intègre dans un scoring. Penser « ou bien l'une, ou bien l'autre » empêche de concevoir les architectures les plus efficaces. Ce que j'avais développé à propos des agents IA en pilotage illustre précisément ce type d'orchestration.

Erreur 5 — Choisir l'IA avant d'avoir posé la question. C'est la plus répandue et la plus coûteuse. Beaucoup de projets commencent par « nous voulons faire de l'IA » plutôt que par « nous voulons résoudre ce problème ». Dans ce cas, le choix de la technique précède la compréhension du besoin, et le résultat est presque toujours décevant. Le cadrage data avant IA est la seule séquence qui fonctionne durablement.

Comment un dirigeant non technique tranche sans se tromper

Un dirigeant n'a pas besoin de devenir ingénieur ML pour arbitrer correctement entre IA générative et IA prédictive. Trois questions suffisent, à poser systématiquement avant d'engager un budget.

Question 1 — Quelle est exactement la sortie attendue ? Forcez-vous à répondre en une phrase, de manière concrète. « Un résumé de deux pages du rapport mensuel » ; « une estimation chiffrée du CA à trois mois » ; « une probabilité de défaut client sur ce portefeuille ». Cette réponse oriente immédiatement vers la bonne famille d'IA. Les réponses vagues (« de l'aide à la décision », « un outil qui comprend les données ») signalent un cadrage insuffisant — et donc un projet à risque.

Question 2 — Quelle est l'exigence de reproductibilité ? Si la sortie doit être identique à chaque exécution avec les mêmes entrées (cas courant pour les chiffres financiers, les décisions d'octroi, les scorings auditables), c'est un terrain prédictif ou déterministe. Si la sortie peut varier légèrement sans poser de problème (rédaction de notes, résumés, dialogues), le terrain génératif est possible. Ce point est souvent sous-estimé par les métiers, et il est pourtant décisif sur le plan de la conformité et de l'audit.

Question 3 — Quelle est la nature de la donnée d'entrée disponible ? Données tabulaires, historique long, qualité mesurée : terrain prédictif possible. Documents, textes libres, corpus non structuré : terrain génératif possible. Pas de données : ni l'un ni l'autre, c'est un sujet de fondations à traiter avant de parler IA.

Quand le doute persiste après ces trois questions, la bonne pratique est le prototype parallèle. Demandez deux prototypes de trois à quatre semaines, l'un en générative, l'autre en prédictive, sur le même problème. Comparez. Le résultat tranche mieux que n'importe quel débat théorique. Ce type d'arbitrage est d'ailleurs au cœur du cadrage stratégique data que je conduis avec plusieurs organisations.

Quand les deux cohabitent : les architectures hybrides

Les cas les plus intéressants en pilotage ne sont pas « pur prédictif » ou « pur génératif ». Ce sont des architectures hybrides, où les deux familles collaborent dans un pipeline séquentiel.

Le pattern le plus courant : un modèle prédictif produit une estimation (prévision, score, classification), un LLM la met en mots dans un commentaire structuré destiné à un comité de direction. Le chiffre garde sa rigueur statistique, le texte apporte la lisibilité. C'est l'architecture sur laquelle reposent la plupart des copilotes de contrôle de gestion sérieux aujourd'hui.

Le pattern inverse : un LLM extrait l'information structurée d'un document non structuré (un contrat, un rapport, une note libre), qui vient alimenter un modèle prédictif en aval. C'est par exemple ainsi que fonctionnent les solutions modernes d'analyse de risque contractuel ou de détection d'anomalies dans la documentation. L'étude Stanford AI Index 2024 montre une croissance rapide de ce type de pipelines dans les organisations matures[4].

Le pattern RAG : un LLM interroge une base documentaire interne, produit une réponse ancrée sur les sources retrouvées, et peut s'appuyer sur un modèle prédictif pour évaluer la confiance de la réponse. Les limites de ces architectures sont bien documentées par la recherche académique[5] : sensibilité à la qualité des sources, risque d'hallucination résiduelle, coût computationnel. Leur maîtrise est un levier majeur de différenciation pour les prochaines années.

Le point commun de ces architectures hybrides : elles ne sont jamais un modèle unique tentant de tout faire. Elles décomposent le problème en étapes, assignent à chaque étape la famille d'IA la mieux outillée, et reconstruisent une sortie cohérente. Cette discipline d'orchestration est désormais le cœur du métier d'architecture IA en entreprise — et une compétence que les dirigeants gagnent à comprendre dans ses grandes lignes, même sans entrer dans les détails techniques. J'ai esquissé plusieurs de ces patterns dans le cadre général de l'IA au service du pilotage et sur le chapitre de la délégation à l'IA.

Questions fréquentes

Un LLM peut-il faire de la prévision chiffrée ?

Techniquement oui, sur des séries courtes et stéréotypées, un LLM peut produire une extrapolation plausible. En pratique, c'est presque toujours une fausse bonne idée. Le LLM ne calcule pas, il imite statistiquement ce que ressemble à une série prévue. Il n'a ni la reproductibilité, ni l'explicabilité, ni la robustesse d'un modèle statistique classique. Pour une prévision chiffrée destinée à nourrir une décision de pilotage, utilisez un modèle prédictif dédié. Le LLM peut intervenir pour commenter la prévision, pas pour la produire.

La frontière entre IA générative et IA prédictive est-elle en train de s'effacer ?

Elle se poreuse sur certaines tâches, mais elle reste fondamentale sur le plan de la décision. Les modèles multimodaux mélangent texte et valeurs, les architectures hybrides se développent, et les LLM embarquent des outils de calcul. Pour autant, la nature du problème reste structurée de la même manière : une question de production de contenu ou une question d'estimation d'une valeur. La question n'est pas laquelle est plus avancée, mais laquelle est appropriée au problème à résoudre.

Quel budget prévoir pour prototyper chaque approche ?

Un prototype d'IA générative de qualité se construit en deux à six semaines pour quelques milliers à quelques dizaines de milliers d'euros, selon le volume de données à indexer. Un prototype prédictif simple (classification, régression, série temporelle) se construit dans des budgets comparables, mais la donnée historique conditionne tout : sans historique propre, pas de modèle. La clé n'est pas le coût technique, c'est la qualité des fondations data et la clarté de la question posée au prototype.

Mon cas relève-t-il des deux IA ? Comment savoir ?

La règle pratique : si la sortie attendue est un document, un texte, une synthèse, une classification explicative, c'est de l'IA générative. Si la sortie attendue est une valeur chiffrée, un score, une probabilité, c'est de l'IA prédictive. Si les deux apparaissent (par exemple prévoir une valeur et l'expliquer dans une note à la direction), c'est un cas hybride qui chaîne les deux approches. La bonne architecture est alors un pipeline séquentiel, pas un modèle unique qui tente de tout faire.

Quelle gouvernance spécifique pour chaque type d'IA ?

Les enjeux diffèrent. Pour l'IA générative, les risques principaux sont l'hallucination, la fuite de données et la conformité RGPD sur les entrées. La gouvernance porte sur les prompts, les bases documentaires alimentées, les droits d'accès. Pour l'IA prédictive, les risques sont le biais algorithmique, la dérive du modèle dans le temps et la non-reproductibilité de la décision. La gouvernance porte sur les jeux de données d'entraînement, le suivi de performance et la traçabilité. Vouloir une gouvernance unique pour les deux produit presque toujours une gouvernance inadaptée. Pour les organisations qui s'interrogent sur l'hébergement de leurs modèles et la maîtrise de leurs données, l'article sur la souveraineté IA aborde ces choix d'architecture dans un contexte de taille intermédiaire.

Sources
  1. Hastie T., Tibshirani R. & Friedman J., The Elements of Statistical Learning, Springer, 2e édition 2009. Référence fondatrice de l'apprentissage statistique et des approches prédictives supervisées.
  2. Goodfellow I., Bengio Y. & Courville A., Deep Learning, MIT Press, 2016. Ouvrage de référence sur les fondements mathématiques des modèles génératifs profonds.
  3. McKinsey & Company, The Economic Potential of Generative AI, 2023-2024. Estimation des gains de productivité par cas d'usage de l'IA générative dans les fonctions d'entreprise.
  4. Stanford Institute for Human-Centered AI, AI Index Report 2024. Cartographie globale de l'état de l'IA, avec focus sur la montée des architectures hybrides.
  5. Bender E. M. & Koller A., Climbing Towards NLU: On Meaning, Form, and Understanding in the Age of Data, ACL 2020. Analyse critique de référence sur les limites des LLM en compréhension sémantique et en raisonnement.
  6. MIT Sloan Management Review & BCG, The GenAI Divide — State of AI in Business, 2024. Étude sur l'écart entre adoption et impact économique mesurable de l'IA générative.
  7. Gartner, Hype Cycle for Artificial Intelligence, 2024. Repères utiles pour distinguer les maturités respectives des familles IA dans l'usage entreprise.
14 min de lecture
Partager
Portrait de Brice Béchet, consultant en pilotage des organisations
Brice Béchet
Consultant en pilotage des organisations

Contrôleur de gestion sénior, data scientist et créateur d'effectivo.fr, application de prévision stratégique des effectifs (Anticipez. Simulez. Décidez) — j'accompagne les organisations à structurer leurs données et optimiser leur pilotage.

Envie de cadrer correctement votre prochain projet IA ?

Un cadrage stratégique de deux à trois semaines suffit à identifier la ou les familles d'IA adaptées à votre problème, éviter les erreurs de casting, et poser l'architecture pertinente. Échangeons sur votre contexte.

Échanger sur mon projet