Construire des Workflows Agentiques : L’automatisation d’un processus documentaire avec l’IA Générative

Par ITRoad Group | Étude de cas technique

Le problème que personne n’osait aborder

Chaque organisation possède un processus que personne ne veut changer. En général, ce flux tourne de la même manière depuis quinze ans. Il fonctionne toujours, mais uniquement parce qu’une équipe dévouée s’assure manuellement de son exécution chaque matin. Par conséquent, ce type de travail devient vite coûteux, fragile et pèse lourdement sur les budgets opérationnels.

Pour l’un de nos clients du secteur public, ce problème concernait la réception de documents et l’extraction de données. Chaque jour, des milliers de fichiers arrivaient : formulaires, rapports ou scans. Une équipe importante devait lire, comprendre et classer ces documents. C’est pourquoi le processus constituait un véritable goulot d’étranglement. Il était lent, provoquait des erreurs et devenait difficile à justifier économiquement.

Pourquoi l’automatisation classique a échoué

Ce client avait déjà tenté d’automatiser ce flux dans le passé. Il avait testé des systèmes OCR classiques basés sur des règles rigides, mais rien n’avait fonctionné.

En effet, le défi principal résidait dans la grande diversité des documents. Les services publics reçoivent des fichiers qui ne respectent jamais un format fixe. Les documents proviennent de sources variées avec des mises en page très différentes. De plus, la qualité est parfois médiocre ou l’écriture est manuscrite. Un système classique qui fonctionne sur un modèle échoue donc dès que le format change. Par la suite, nous avons compris qu’il ne fallait pas un simple moteur de règles, mais une intelligence capable de comprendre les documents comme un humain.

L’architecture : Un Workflow Agentique

Nous avons construit notre solution autour d’un pipeline agentique à plusieurs étapes. Dans ce système, le Grand Modèle de Langage (LLM) ne se contente pas de répondre à une question. Il agit comme un véritable orchestrateur. En d’autres termes, il décompose une tâche complexe en plusieurs étapes logiques qu’il exécute l’une après l’autre.

Voici comment nous avons structuré le flux :

  1. Ingestion et Prétraitement : Les documents arrivent via des emails ou des portails. Le système normalise les formats et transforme les images en texte propre. Pour cela, nous combinons l’OCR traditionnel et des modèles de vision modernes.
  2. Agent de Classification : Avant d’extraire les données, un agent identifie le type de document. Cette étape est cruciale car elle définit le chemin de traitement. Si le score de confiance est trop bas, le système envoie le fichier vers une révision humaine.
  3. Agent d’Extraction : Une fois le document classé, un agent extrait les informations. Contrairement aux anciens systèmes, celui-ci comprend l’intention sémantique. Par exemple, il sait que « date de dépôt » et « reçu le » désignent la même chose.

La validation et le contrôle humain

De plus, nous avons ajouté des couches de sécurité pour garantir la fiabilité des données.

  1. Validation et Scores de Confiance : Le système attribue un score de certitude à chaque donnée extraite. Ensuite, une couche de validation croise ces valeurs avec des bases de données connues pour détecter les erreurs ou les contradictions.
  2. Interface de révision (Human-in-the-Loop) : Nous avons maintenu les humains dans la boucle en tant que gardiens de la qualité. L’interface montre uniquement les exceptions ou les doutes du système. Par conséquent, les agents corrigent les erreurs au lieu de tout saisir manuellement.
  3. Piste d’Audit : Pour ce client public, la transparence est une obligation légale. C’est pourquoi le système enregistre chaque décision avec son raisonnement complet.

Des résultats concrets et rapides

Les chiffres démontrent clairement l’efficacité de cette approche :

  • Nous avons réduit de ~80 % le travail manuel nécessaire.
  • Le temps de traitement est passé de 3 jours à moins de 15 minutes.
  • La précision de l’extraction dépasse désormais les 95 %.
  • Le coût par document a chuté de plus de 60 %.

En outre, le système peut désormais absorber des pics de volume sans embauche supplémentaire. Lorsqu’une vague de documents arrive, le pipeline gère le surplus sans ralentir.

Ce que l’IA « Agentique » apporte réellement

Qu’est-ce qui différencie ce workflow d’une automatisation simple ? En premier lieu, le système utilise un raisonnement conditionnel. Il prend des décisions à chaque étape au lieu de suivre un script figé. En deuxième lieu, il gère l’imprévu. Face à un document inconnu, il ne s’arrête pas mais alerte l’équipe de manière intelligente.

Enfin, le système apprend de ses erreurs. Les corrections effectuées par les humains servent à affiner les règles de validation. Ainsi, l’outil devient de plus en plus performant chaque jour sans nécessiter de nouvelle programmation complexe.

Leçons tirées de cette expérience

Nous avons appris trois leçons majeures durant ce projet. D’abord, il faut toujours prévoir la gestion des exceptions. C’est là que l’on construit la confiance des utilisateurs. Ensuite, le score de confiance est indispensable. Une IA qui n’indique pas son niveau de certitude est dangereuse. Enfin, il ne faut pas supprimer l’expertise humaine, mais l’utiliser pour superviser la machine.

Pour conclure, ce pipeline est aujourd’hui stable et performant. Le client envisage déjà d’utiliser ces données pour créer des rapports automatiques et détecter des fraudes plus tôt.

Vous avez un projet similaire ?

Chez ITRoad Group, nous créons des systèmes d’IA agentiques qui s’adaptent à vos outils actuels pour générer des résultats mesurables. Contactez-nous sur itroadgroup.com pour en discuter.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *