Un guide visuel et interactif pour comprendre les fondamentaux de l'architecture d'un agent IA. Plongez dans la machine et voyez par vous-même.
— 9 min de lecture — 4 simulateurs interactifs
Que se passe-t-il quand on tape une question dans ChatGPT ? On appuie sur Entrée, on attend quelques secondes, et on obtient une réponse. Mais entre la question et la réponse, il se passe plusieurs choses.
Dans cet article, nous allons ouvrir le capot et regarder à l'intérieur.
Qu'est-ce qu'un agent IA ?
Un est bien plus qu'un . Alors qu'un modèle génère une seule réponse à votre message, un agent peut :
Raisonner sur ce qu'il doit faire
Choisir des outils pour collecter des informations ou agir
Observer les résultats de ces actions
Décider s'il doit continuer ou s'arrêter
Il faut essayer de voir la différence entre poser une question à quelqu'un et lui demander de résoudre un problème. La première demande de la mémoire. La seconde demande de la stratégie.
La boucle de l'agent
Au cœur de chaque agent IA se trouve un pattern simple : la . Elle se décompose en trois étapes : Think (réfléchir), Act (agir), et Observe (observer). C'est un cycle continu qui permet à l'agent de s'adapter et de répondre de manière intelligente.
1. Réfléchir
L'agent reçoit la question et raisonne sur la marche à suivre. Il ne fait pas que du . Il considère quels outils sont disponibles, quelles informations il lui faut, et quelle est la meilleure prochaine étape.
Réflexion de l'agent :
"L'utilisateur veut connaître la météo à Paris.
J'ai un outil API Météo disponible.
Je devrais l'appeler avec location='Paris'."
2. Agir
En se basant sur son raisonnement, l'agent sélectionne un et l'exécute. Cela peut être une recherche web, un appel , une requête en base de données, ou toute autre action.
L'agent examine le résultat. Est-ce que c'est ce qu'il attendait ? A-t-il besoin de plus d'informations ? Devrait-il essayer une approche différente ?
C'est là que les agents se distinguent du simple : ils évaluent les résultats et décident quoi faire ensuite.
Voyez la boucle en action
Parcourez une boucle d'agent complète étape par étape. Observez comment l'agent réfléchit, choisit un outil, l'exécute, observe le résultat, puis raisonne à nouveau avant de composer sa réponse finale :
Note : Les démos interactives de cet article sont des simulateurs pré-scriptés, pas de véritables agents IA. Leur but est d'illustrer les concepts, pas d'exécuter un vrai modèle derrière.
Remarquez les deux étapes "Think". L'agent raisonne avant d'agir (pour planifier) et après avoir observé (pour interpréter). Ce pattern de double réflexion est ce qui rend les agents bien plus capables que de simples systèmes requête-réponse.
Ce qui fait fonctionner un agent
La boucle ci-dessus montre comment un agent raisonne. Mais un agent n'opère pas dans le vide. Il a besoin d'outils, de mémoire et d'instructions pour être utile. Tout cela est fourni par le concepteur de l'agent.
Les outils sont fournis, pas inventés
Un agent ne peut utiliser que les outils qu'un concepteur a explicitement mis à sa disposition. Vous voulez que l'agent consulte la météo ? Vous lui fournissez un outil API météo. Vous voulez qu'il cherche sur le web ? Vous lui fournissez un outil de recherche. Sans ces outils, l'agent n'a aucun moyen d'interagir avec le monde extérieur. Il ne peut que raisonner avec les informations déjà présentes dans son contexte.
La mémoire est fournie, pas innée
Les agents ne "se souviennent" pas des choses par eux-mêmes. C'est le concepteur qui décide quel contexte l'agent reçoit : l'historique de conversation, les documents pertinents, les préférences utilisateur, ou toute autre information. Cette mémoire façonne la manière dont l'agent raisonne et ce qu'il sait de la situation actuelle.
Les instructions orientent l'agent
En plus des outils et de la mémoire, l'agent reçoit des instructions (souvent appelées ). Ces instructions, définies par le concepteur, guident l'agent dans sa manière de raisonner et d'agir. Elles peuvent définir un ton, des contraintes, des priorités, ou des règles à suivre.
Par exemple, un agent de service client pourrait recevoir comme instructions : "Réponds toujours en français, reste poli, et ne donne jamais de remboursement sans validation d'un superviseur." C'est grâce à ces instructions que l'agent sait comment orienter sa boucle Think-Act-Observe. Sans elles, le modèle a des capacités, mais aucune direction.
Le concepteur définit le cadre
Pensez à un agent comme un employé compétent à son premier jour. Il est capable et peut prendre des décisions, mais il travaille avec les outils et les informations qu'on lui donne. Le concepteur de l'agent définit ce cadre : quels outils, quelle mémoire, quelles instructions, quelles contraintes. L'agent opère à l'intérieur de ce cadre, autonome dans ses décisions, mais limité aux capacités qu'on lui a fournies.
C'est pourquoi construire un agent ne se résume pas à la boucle. C'est concevoir le bon environnement dans lequel l'agent va opérer.
Essayez par vous-même
Que se passe-t-il quand vous retirez un outil dont l'agent a besoin ? Activez et désactivez les outils ci-dessous pour le découvrir :
Remarquez ce qui se passe sans le bon outil : l'agent n'échoue pas silencieusement. Il improvise — inventant des données, se trompant dans les calculs, ou se rabattant sur des connaissances obsolètes. La note rouge sous chaque réponse révèle le problème. C'est la réalité du développement d'agents : l'agent n'est aussi capable que les outils que vous lui donnez.
Tool calling : comment les agents choisissent leurs outils
L'agent n'utilise pas un outil parce qu'on lui a dit. Il choisit le bon outil en fonction de la question.
Demandez "Quel temps fait-il ?" et il choisit l'API Météo. Demandez "Combien font 2+2 ?" et il choisit la Calculatrice. Demandez "Qui a gagné la Coupe du Monde ?" et il choisit la Recherche Web.
L'agent choisit l'outil, pas vous. C'est tout l'intérêt.
Comment ça marche sous le capot
Le reçoit votre question accompagnée des descriptions de tous les outils disponibles
Il génère un (nom de fonction + arguments)
Le exécute l'outil et renvoie le résultat
Le intègre le résultat dans son raisonnement
C'est le qui comprend les signatures de fonctions et les fait correspondre à l'intention de l'utilisateur.
Voyez par vous-même
Essayez. Changez la question ci-dessous et observez l'agent sélectionner l'outil approprié :
Remarquez que l'agent ne fait pas que matcher des mots-clés. Il comprend l'intention derrière votre question.
Assembler le tout
Quand vous discutez avec un agent IA, vous voyez une conversation fluide. En coulisses, l'agent fait quelque chose de bien plus complexe : analyser votre intention, appeler des outils, traiter les résultats, et composer une réponse.
Regardez les coulisses
Tapez une question et observez les deux côtés simultanément. Le panneau de gauche montre ce que vous verriez en tant qu'utilisateur. Le panneau de droite révèle ce que l'agent fait réellement :
C'est l'idée clé : chaque réponse IA fluide et conversationnelle est le résultat d'un structuré de raisonnement et d'action qui se déroule en quelques millisecondes. La simplicité de l'expérience utilisateur cache une couche d' sophistiquée en dessous.
Ce que vous avez appris
Récapitulons les concepts clés :
Les opèrent dans une boucle Think-Act-Observe, contrairement aux qui font du simple
Les outils, la mémoire et les instructions sont fournis à l'agent par le concepteur : sans les bons outils, l'agent improvise et peut se tromper ; sans instructions claires, il n'a aucune direction
Le permet aux agents de choisir de façon autonome le bon pour la tâche à accomplir, en fonction de l'intention de l'utilisateur
Derrière chaque réponse fluide se cache un pipeline structuré de raisonnement et d'action
Cet article fait partie de la série "Les agents IA pour tous". Restez à l'écoute pour le prochain volet.