LLM Primer IV — KI-Kognition mit MCP entwerfen: Serieneinführung & Index
„Agenten sind nur so gut wie der Kontext, den sie sehen, die Werkzeuge, die sie erreichen, und das Gedächtnis, das sie tragen." Willkommen zu Buch IV der LLM-Primer-Reihe — und zur Tour, die es begleitet. Über die nächsten vierzehn Tage, einen Beitrag pro Kapitel, öffnen wir das Model Context Protocol und die Kognitionsschicht, die es möglich macht, und schauen uns die Entscheidungen an, die darüber entscheiden, ob ein Agentensystem still funktioniert oder still versagt.
Warum Buch IV existiert
Die Bücher I, II und III dieser Reihe haben dir das Modell gezeigt und den Retrieval-Apparat drumherum. Buch I erzählte die schlichte Geschichte, was LLMs sind. Buch II öffnete die Mathematik darunter. Buch III ging durch die Produktionsarchitektur von RAG. Buch IV handelt von dem, was ein Modell umgibt, sobald du versuchst, es handeln zu lassen — Werkzeuge aufzurufen, Zustand über Turns zu halten, mit anderen Agenten zu koordinieren, und das alles, ohne jedes Quartal Integrations-Glue neu zu schreiben.
Das Muster, das 2025 zerbrach, war der monolithische Agent: ein langer System-Prompt, eine Handvoll Werkzeuge, ein einziges Kontextfenster, das alles auf einmal aufnehmen sollte. Für Demos funktionierte das. In der Produktion franste es aus, je länger die Prompts wurden, je weiter die Werkzeugflächen wuchsen und je öfter jedes neue Modellrelease eine weitere Runde maßgeschneiderten Adaptercodes verlangte. Die Diagnose kam aus mehreren Richtungen zur selben Antwort — Kontextverdünnung, Instruktionskollision, die N-mal-M-Integrationsmatrix — und zeigte in dieselbe Richtung: eine Protokollschicht unter dem Modell, die es Agenten erlaubt, Fähigkeiten zu entdecken, Sessions auszuhandeln und Werkzeuge zu komponieren, ohne dass eine Seite die andere vorher kennen muss.
Diese Schicht ist das Model Context Protocol. Dieses Buch geht sie ehrlich durch, Schicht für Schicht. Das Versprechen ist nicht, dass MCP jedes Agentenproblem löst. Das Versprechen ist, dass du am Ende weißt, was das Protokoll dir gibt, was nicht, und welche darauf aufbauenden Muster in der Produktion bestehen.
Für wen ich das geschrieben habe
Für Entwickler, die Agentensysteme bauen, für technische PMs, die sie scopen, und für Architekten, die die Entscheidungen vor einem Security-Review verteidigen müssen. Das Buch setzt voraus, dass dir das Bild aus Buch I zur Arbeitsweise eines LLM vertraut ist und das Bild aus Buch III dazu, wie Retrieval verdrahtet wird; es setzt die Mathematik aus Buch II nicht voraus. Der Schwerpunkt liegt auf der Ingenieurarbeit: wo die Fehlermodi leben, welche Entscheidungen reversibel sind und welche das Team auf Jahre festlegen.
Wie du es liest
Drei Modi haben sich bei frühen Lesern bewährt. Von vorne nach hinten, wenn du gerade ein MCP-basiertes Agentensystem bauen wirst und das Protokoll in der Reihenfolge willst, in der die Entscheidungen tatsächlich anfallen. Als Nachschlagewerk, wenn du ein laufendes System hast und eine bestimmte Schicht schmerzt — das Transport-, das Speicher- und die Sicherheitskapitel stehen jeweils für sich. Oder als Vorlage für ein Architektur-Review, in dem die Kapitel die Gesprächsthemen werden, die ein Team durchgehen sollte, bevor es sich auf eine Deployment-Topologie festlegt.
Der Gang durch die 14 Kapitel
30. März — Kapitel 1: Die KI-Integrationskrise und der Aufstieg der agentischen Architektur. Warum monolithische Agenten ausfransen, was das N-mal-M-Integrationsproblem ist und der Übergang vom Prompt-Engineering zum Context-Engineering.
31. März — Kapitel 2: Das Model Context Protocol enthüllt. Was MCP standardisiert, die drei Rollen (Host, Client, Server), wie sich dynamische Entdeckung von REST unterscheidet und der Session-Lebenszyklus mit Capability-Verhandlung.
1. April — Kapitel 3: Server-Primitives: Kontext und Fähigkeiten freigeben. Resources, Prompts und Tools — die drei Nomen, die ein Server anbieten kann, ihre Schemata, ihre Lebenszyklen und die Disziplin, das richtige Primitiv für jede Sache zu wählen.
2. April — Kapitel 4: Client-Primitives: Sampling, Roots, Elicitation. Die umgekehrte Fläche — was der Host dem Server zurückgibt — und die Sicherheitsimplikationen jeder Capability, die über die Vertrauensgrenze hinweg geliehen wird.
3. April — Kapitel 5: Transport und Discovery. stdio gegen Streamable HTTP, wann was die richtige Wahl ist und wie sich Server und Clients in lokalen wie entfernten Deployments finden.
4. April — Kapitel 6: Grundlegende Orchestrierungsmuster. Die Agentenschleife, Tool-Routing, das Verwalten von Zwischenzuständen und die Muster, die das Reasoning eines Agenten lesbar halten.
5. April — Kapitel 7: Fortgeschrittene Orchestrierungsmuster. Planner-Executor, Multi-Agent-Koordination, hierarchische Zerlegung und wo jedes Muster seine Komplexität rechtfertigt.
6. April — Kapitel 8: Deployment-Layouts. Strenge MCP-Reinheit gegen wiederverwendbare KI-Agenten gegen Hybrid-Layouts und die Trade-offs, die jeder dem Host abverlangt.
7. April — Kapitel 9: Das Aufmerksamkeitsbudget. Kontext als verwaltete Ressource, die Kosten langer Fenster und die Richtlinien, die entscheiden, was pro Turn in den Blick des Modells gelangt.
8. April — Kapitel 10: Langzeit-Gedächtnis. Episodisches gegen semantisches Gedächtnis, Zusammenfassungs-Strategien und Architekturen, mit denen ein Agent Zustand über Tage trägt.
9. April — Kapitel 11: Angriffsflächen in MCP-Systemen. Das Bedrohungsmodell — Prompt-Injection über Resources, bösartige Server, Tool-Poisoning, Exfiltrationswege.
10. April — Kapitel 12: Protokoll-Härtung. Server-Cards, Consent-UI, Capability-Scoping und die operativen Kontrollen, die Policy dort verankern, wo sie hingehört.
11. April — Kapitel 13: Frameworks und Cloud. Das Ökosystem um MCP — Agenten-Frameworks, gehostete Server, Registries — und worauf man tatsächlich aufbauen sollte.
12. April — Kapitel 14: Agenten benchmarken. Die Messungen, die zählen, die irreführenden und wie man ein Eval-Harness baut, das einen Modellwechsel überlebt.
Über dieses Buch und die Reihe
Die LLM-Primer-Reihe ist die lange Antwort auf die Frage, die mir immer wieder gestellt wurde — von Entwicklern, Gründern und gelegentlich von Aufsichtsbehörden: wie funktionieren diese Systeme eigentlich, und was braucht es, eines zu bauen, das unter Last hält? Buch I gab die Form. Buch II die Mathematik. Buch III die Produktionsarchitektur von RAG. Buch IV gibt die Kognitionsschicht, die über dem Modell sitzt. Buch V, in Arbeit, wendet sich dem Bau realer LLM-Anwendungen Ende-zu-Ende zu.
Bis morgen, mit Kapitel 1.