LLM Primer IV — Concevoir la cognition de l'IA avec MCP : introduction de la série et index
« Un agent ne vaut que par le contexte qu'il voit, les outils qu'il peut atteindre et la mémoire qu'il porte. » Bienvenue dans le Livre IV de la série LLM Primer — et dans la tournée qui l'accompagne. Pendant les quatorze prochains jours, un billet par chapitre, nous ouvrirons le Model Context Protocol et la couche de cognition qu'il rend possible, et nous examinerons les décisions qui déterminent si un système d'agents fonctionne discrètement ou échoue discrètement.
Pourquoi le Livre IV existe
Les Livres I, II et III de cette série vous ont donné le modèle et l'appareil de récupération autour de lui. Le Livre I racontait, en langage clair, ce que sont les LLM. Le Livre II ouvrait les mathématiques en dessous. Le Livre III parcourait l'architecture de production du RAG. Le Livre IV traite de ce qui entoure un modèle dès lors qu'on essaie de le faire agir — appeler des outils, maintenir un état sur plusieurs tours, se coordonner avec d'autres agents, et faire tout cela sans réécrire la colle d'intégration à chaque trimestre.
Le motif qui s'est cassé en 2025, c'est l'agent monolithique : un long prompt système, une poignée d'outils, une seule fenêtre de contexte à laquelle on demande d'absorber toutes les préoccupations à la fois. Cela marchait pour les démos. Cela s'est effiloché en production à mesure que les prompts grossissaient, que les surfaces d'outils s'étendaient, et que chaque nouvelle sortie de modèle exigeait un nouveau cycle de code d'adaptateur sur mesure. Le diagnostic a convergé depuis plusieurs angles — dilution du contexte, collision des instructions, matrice d'intégration N fois M — et pointait vers la même réponse architecturale : une couche protocolaire sous le modèle qui laisse les agents découvrir des capacités, négocier des sessions et composer des outils sans que ni l'une ni l'autre des parties ait à connaître l'autre à l'avance.
Cette couche, c'est le Model Context Protocol. Ce livre la parcourt honnêtement, couche par couche. La promesse n'est pas que MCP résout tous les problèmes des agents. La promesse est qu'à la fin, vous saurez ce que le protocole vous donne, ce qu'il ne vous donne pas, et quels patrons construits dessus survivent au contact de la production.
Pour qui je l'ai écrit
Les ingénieurs qui construisent des systèmes d'agents, les PM techniques qui les cadrent, et les architectes qui doivent défendre les choix devant une revue de sécurité. Le livre suppose que le lecteur est à l'aise avec l'image que le Livre I donne du comportement d'un LLM et avec celle que le Livre III donne du câblage de la récupération ; il ne suppose pas les mathématiques du Livre II. Le centre de gravité reste l'ingénierie : où vivent les modes de défaillance, quelles décisions sont réversibles, et lesquelles enferment l'équipe pour des années.
Comment le lire
Trois modes ont fonctionné pour les premiers lecteurs. De bout en bout, si vous êtes sur le point de commencer à construire un système d'agents fondé sur MCP et que vous voulez le protocole dans l'ordre où les décisions se présentent réellement. Comme référence, si vous avez un système qui tourne et une couche précise qui fait mal — le chapitre sur le transport, celui sur la mémoire, les chapitres sur la sécurité tiennent chacun debout. Ou comme support pour la revue d'architecture, où les chapitres deviennent les amorces de la conversation qu'une équipe doit avoir avant de s'engager sur une topologie de déploiement.
La tournée en 14 chapitres
30 mars — Chapitre 1 : La crise d'intégration de l'IA et l'essor de l'architecture agentique. Pourquoi les agents monolithiques s'effilochent, ce qu'est le problème d'intégration N fois M, et le passage de l'ingénierie de prompt à l'ingénierie de contexte.
31 mars — Chapitre 2 : Dévoiler le Model Context Protocol. Ce que MCP standardise, les trois rôles (Hôte, Client, Serveur), en quoi la découverte dynamique diffère de REST, et le cycle de vie d'une session qui s'ouvre par une négociation des capacités.
1er avril — Chapitre 3 : Primitives du serveur : exposer le contexte et les capacités. Ressources, Prompts et Outils — les trois noms qu'un serveur peut offrir, leurs schémas, leurs cycles de vie, et la discipline de choisir la bonne primitive pour chaque chose.
2 avril — Chapitre 4 : Primitives du client : Sampling, Roots, Elicitation. La surface inverse — ce que l'hôte rend au serveur — et les implications de sécurité de chaque capacité prêtée à travers la frontière de confiance.
3 avril — Chapitre 5 : Transport et découverte. stdio contre Streamable HTTP, quand choisir l'un ou l'autre, et comment serveurs et clients se trouvent en déploiement local et distant.
4 avril — Chapitre 6 : Patrons d'orchestration fondamentaux. La boucle de l'agent, le routage d'outils, la gestion d'état intermédiaire, et les patrons qui gardent le raisonnement d'un agent lisible.
5 avril — Chapitre 7 : Patrons d'orchestration avancés. Planificateur-exécuteur, coordination multi-agents, décomposition hiérarchique, et là où chaque patron mérite sa complexité.
6 avril — Chapitre 8 : Topologies de déploiement. Pureté MCP stricte contre Agents IA réutilisables contre topologies hybrides, et les arbitrages que chacune impose à l'hôte.
7 avril — Chapitre 9 : Le budget d'attention. Le contexte comme ressource gérée, le coût des fenêtres longues, et les politiques qui décident de ce qui entre dans la vue du modèle à chaque tour.
8 avril — Chapitre 10 : Mémoire à long horizon. Mémoire épisodique contre mémoire sémantique, politiques de résumé, et les architectures qui permettent à un agent de porter un état sur plusieurs jours.
9 avril — Chapitre 11 : Surfaces d'attaque dans les systèmes MCP. Le modèle de menace — injection de prompt par les ressources, serveurs malveillants, empoisonnement des outils, voies d'exfiltration.
10 avril — Chapitre 12 : Durcissement du protocole. Server cards, UI de consentement, cadrage des capacités, et les contrôles opérationnels qui placent la politique là où elle doit être.
11 avril — Chapitre 13 : Frameworks et cloud. L'écosystème autour de MCP — frameworks d'agents, serveurs hébergés, registres — et comment choisir sur quoi construire.
12 avril — Chapitre 14 : Évaluer les agents. Les mesures qui comptent, celles qui trompent, et comment bâtir un harnais d'évaluation qui survit à un changement de modèle.
À propos de ce livre et de la série
La série LLM Primer est la réponse longue à la question que des ingénieurs, des fondateurs et, à l'occasion, un régulateur n'ont cessé de me poser : comment ces systèmes fonctionnent-ils en réalité, et que faut-il pour en construire un qui tienne sous la charge ? Le Livre I en a donné la forme. Le Livre II a donné les mathématiques. Le Livre III a donné l'architecture de production du RAG. Le Livre IV donne la couche de cognition qui s'assoit au-dessus du modèle. Le Livre V, en préparation, se tourne vers la construction d'applications LLM en conditions réelles, de bout en bout.
À demain, avec le Chapitre 1.