IA appliquée

Pourquoi huit agents, et non un seul chatbot.

Le schéma du chatbot unique échoue aux tests précis qu’une équipe de doctrine fait subir à un junior. Huit agents les passent.

Par Bamidele Aly 7 min de lecture

La forme du travail de doctrine

Le conseil en doctrine, dans un cabinet Big 4 ou une équipe interne, n’est pas un jeu de questions-réponses. C’est un raisonnement adversarial dans l’incertitude. Deux lectures d’un même paragraphe d’IAS 36 peuvent être également défendables. La question est laquelle l’auditeur acceptera et que le régulateur ne contestera pas. Ce n’est pas un problème d’extraction de faits.

Une vraie équipe de doctrine joue cela structurellement. Le préparateur rédige la position. Un réviseur la conteste depuis la perspective d’un auditeur sceptique. Un associé senior arbitre entre les deux et décide quel cadrage est robuste. Le résultat n’est pas la première réponse du préparateur ; c’est la réponse qui a survécu à l’échange.

Un chatbot unique ne dispose d’aucun de ces mécanismes. Il produit une réponse plausible et s’arrête. La plausibilité est le mode d’échec. Le lecteur ne peut pas distinguer, depuis la seule sortie, laquelle de trois ou quatre lectures alternatives également plausibles le modèle a envisagée et écartée. On est donc forcé de répéter le prompt avec des variations pour faire apparaître ce qui aurait dû être visible dès la première réponse.

Ce que chacun des huit agents fait

Ile Owo nomme explicitement les rôles et achemine le travail entre eux. L’Orchestrateur tient le contexte de travail et choisit quel agent exécute ensuite. Le Filtre restreint la requête au corpus pertinent — endossements de l’UK Endorsement Board, publications de la BRI, bibliothèques techniques des Big 4, mémos de doctrine internes — et écarte le hors-sujet. Le Synthéticien extrait les revendications porteuses de chaque source.

L’étape médiane abrite la structure adversariale. L’Historien situe la question dans les décisions de normalisation antérieures : quand ce paragraphe a-t-il été interprété pour la dernière fois, par qui, avec quelles modifications ultérieures ? Le Préparateur défend la position du préparateur — là où la norme laisse de la latitude, là où elle impose une règle stricte. Le Contradicteur tient la position de l’auditeur ou du régulateur, en faisant émerger les contestations que le Préparateur aurait préféré éviter.

La synthèse repose sur deux agents supplémentaires. L’Auditeur tranche l’échange Préparateur/Contradicteur au regard de la norme et des analogues de l’Historien, et écrit la position résolue. Le Rédacteur produit la note de doctrine finale dans le style maison — citations, démarche, synthèse.

La plausibilité est le mode d’échec. Un chatbot unique produit une réponse plausible et s’arrête ; le lecteur ne voit pas ce qui a été envisagé et écarté.

Pourquoi cela surpasse un grand modèle unique

Trois raisons, par ordre d’importance. Spécialisation d’abord : le prompt de chaque agent est ajusté à son rôle. Celui du Contradicteur récompense la position que le Préparateur a manquée ; celui du Préparateur récompense la rédaction la plus défendable. Un chatbot unique, moyenné sur les deux rôles, n’en écrit aucun bien.

Isolation contextuelle ensuite : chaque agent fonctionne avec sa mémoire de travail propre. Le Contradicteur ne voit pas le brouillon du Préparateur tant qu’il n’a pas formulé ses propres objections. Cela élimine la compression de politesse qui survient quand un seul modèle écrit la réponse et la critique d’un coup — il finit toujours par adoucir la critique pour qu’elle s’accorde au brouillon.

Piste d’audit enfin, et c’est celle dont se soucie le régulateur. La sortie de chaque agent est enregistrée avec horodatage, citations sources et raisonnement intermédiaire. Quand un superviseur demande « comment cette position est-elle apparue ? », la réponse n’est pas un transcript de chat : c’est un enregistrement structuré des sources considérées, des positions testées et de la revue qui a fait émerger tel contre-argument. C’est un artefact révisable. Un chatbot unique ne produit que la réponse finale et le prompt ; tout l’entre-deux reste implicite.

Ce que cela ne résout pas

Ile Owo ne certifie pas l’exhaustivité. Le Filtre peut avoir manqué une source pertinente ; l’Historien peut avoir manqué un précédent ; l’Auditeur peut avoir sous-pondéré une préoccupation connue du régulateur. Le système est un accélérateur de brouillon et un premier réviseur structuré, pas une autorité décisionnaire.

Il ne remplace pas non plus le jugement humain sur les questions véritablement inédites — celles où la réponse est « il faut interroger le normalisateur directement ». Dans ces cas, la sortie la plus utile des agents n’est pas leur conclusion ; c’est l’inventaire des considérations soulevées, qui devient le dossier de briefing de la conversation à venir.

Traitez-le comme le premier brouillon d’un collaborateur senior, rédigé en vingt minutes plutôt qu’en trois jours. Puis lisez-le comme tout premier brouillon de quelqu’un en qui vous n’avez pas encore pleinement confiance : en cherchant ce qui manque plutôt que ce qui est là.