Prévisions d’activité : Pourquoi la sobriété mathématique surpasse le Big Data

JSM et JN en conférence a global industrie
- Partager cet article -

Conférence Jean-Sébastien Mackiewicz et Jérémy Nusa Hub One DataTrust à Global Industrie

Lors du dernier salon Global Industrie, Jean-Sébastien Mackiewicz et Jérémy Nusa, docteur en mathématiques au sein de Hub One DataTrust, ont partagé une vision à contre-courant du "Big Data" traditionnel. Entre approche probabiliste et "rasoir d'Ockham", retour sur une méthode où l'efficacité algorithmique naît avant tout de la sobriété et de la maîtrise métier.

L'illusion du volume : L'approche par la sobriété

Dans un paysage industriel saturé de termes comme "Hyperscalers", "Big Data" ou "Jumeaux numériques", la tentation de l'accumulation de données est forte. Pourtant, Hub One DataTrust prône une approche inverse, fondée sur un principe philosophique du XIVe siècle : le Rasoir d’Ockham.

Comme l’a rappelé Jérémy Nusa, ce principe — mathématisé plus tard par le théorème de Solomonoff — démontre que l'explication la plus courte (ou le modèle le plus simple) est souvent la plus performante. Pour réussir des prévisions d'activité robustes, il ne faut pas "plus" de données, mais des données mieux choisies selon trois critères :

  1. La Représentativité : La donnée doit s'ancrer dans la réalité opérationnelle. En logistique, la volumétrie d'un véhicule est une donnée représentative ; la marque du camion, beaucoup moins.
  2. La Stabilité : Utiliser dix ans d'historique ne sert à rien si les systèmes d'information ont changé trois fois. Le succès repose sur des données dont la structure est restée cohérente dans le temps.
  3. L'Historisation pertinente : Pour détecter des cycles et des "patterns", trois ans de données fiables suffisent souvent amplement pour bâtir un modèle prédictif efficace.

IA & Modélisation : Sortir de la "Boîte Noire"

L'un des messages forts de cette intervention portait sur la nature des modèles utilisés. Face à l'émergence des Large Language Models (LLM), Hub One DataTrust rappelle que pour des prévisions industrielles opérationnelles, la rigueur mathématique doit primer sur la taille du modèle.

L'approche préconisée repose sur deux piliers :

  • Le Probabilisme : Un modèle doit intégrer nativement le fait que la donnée est biaisée ou incomplète. En abordant le sujet sous l'angle des probabilités, l'algorithme apprend à ignorer les "bruits" et les anomalies pour ne garder que la tendance réelle.
  • L'Explicabilité : Contrairement aux réseaux de neurones opaques, les modèles explicables permettent de comprendre pourquoi une prévision est faite. C'est cette transparence qui garantit l'adhésion des équipes métiers.

Du modèle à l'action : Le rôle du Tiers de Confiance

Une prévision, aussi parfaite soit-elle mathématiquement, n'a de valeur que si elle est actionnable. Pour Hub One DataTrust, cela signifie transformer une valeur brute en une décision métier :

  • Anticiper les seuils : Plutôt que de donner un chiffre exact, le modèle alerte sur le franchissement de seuils critiques.
  • Gérer l'incertitude : En communiquant sur le niveau d'incertitude d'une prévision, on permet à l'humain de réagir différemment et de mieux dimensionner ses ressources.

Cette collaboration et ce partage de données entre acteurs (comme au sein du consortium AEROSEED — impliquant des partenaires comme TaqtXXIIAtalian et City One — soutenu par France 2030) nécessitent un cadre de confiance total. Le rôle de Hub One DataTrust, en tant qu'intermédiaire certifié (label DGA/Arcep), est de garantir que la donnée partagée crée de la valeur sans jamais être utilisée contre le gré de son propriétaire originel.

Les 3 enseignements pour l'industrie :

  • Qualité > Quantité : Concentrez vos efforts sur le nettoyage et l'enrichissement de quelques flux clés.
  • IA Métier : Utilisez l'IA comme un amplificateur de productivité, mais gardez des modèles mathématiquement rigoureux et simples pour vos opérations.
  • Confiance et Écosystème : Le partage de données opérationnelles est le levier majeur pour faire face aux aléas et aux pics d'activité.