LLM Primer IV — KI-Kognition mit MCP entwerfen: Serieneinführung & Index

„Agenten sind nur so gut wie der Kontext, den sie sehen, die Werkzeuge, die sie erreichen, und das Gedächtnis, das sie tragen." Willkommen zu Buch IV der LLM-Primer-Reihe — und zur Tour, die es begleitet. Über die nächsten vierzehn Tage, einen Beitrag pro Kapitel, öffnen wir das Model Context Protocol und die Kognitionsschicht, die es möglich macht, und schauen uns die Entscheidungen an, die darüber entscheiden, ob ein Agentensystem still funktioniert oder still versagt.

Warum Buch IV existiert

Die Bücher I, II und III dieser Reihe haben dir das Modell gezeigt und den Retrieval-Apparat drumherum. Buch I erzählte die schlichte Geschichte, was LLMs sind. Buch II öffnete die Mathematik darunter. Buch III ging durch die Produktionsarchitektur von RAG. Buch IV handelt von dem, was ein Modell umgibt, sobald du versuchst, es handeln zu lassen — Werkzeuge aufzurufen, Zustand über Turns zu halten, mit anderen Agenten zu koordinieren, und das alles, ohne jedes Quartal Integrations-Glue neu zu schreiben.

Das Muster, das 2025 zerbrach, war der monolithische Agent: ein langer System-Prompt, eine Handvoll Werkzeuge, ein einziges Kontextfenster, das alles auf einmal aufnehmen sollte. Für Demos funktionierte das. In der Produktion franste es aus, je länger die Prompts wurden, je weiter die Werkzeugflächen wuchsen und je öfter jedes neue Modellrelease eine weitere Runde maßgeschneiderten Adaptercodes verlangte. Die Diagnose kam aus mehreren Richtungen zur selben Antwort — Kontextverdünnung, Instruktionskollision, die N-mal-M-Integrationsmatrix — und zeigte in dieselbe Richtung: eine Protokollschicht unter dem Modell, die es Agenten erlaubt, Fähigkeiten zu entdecken, Sessions auszuhandeln und Werkzeuge zu komponieren, ohne dass eine Seite die andere vorher kennen muss.

Diese Schicht ist das Model Context Protocol. Dieses Buch geht sie ehrlich durch, Schicht für Schicht. Das Versprechen ist nicht, dass MCP jedes Agentenproblem löst. Das Versprechen ist, dass du am Ende weißt, was das Protokoll dir gibt, was nicht, und welche darauf aufbauenden Muster in der Produktion bestehen.

Buch in einem Satz: Agentische Systeme brauchen ein Protokoll, das Modelle von Werkzeugen entkoppelt, eine Disziplin für das Budgetieren von Aufmerksamkeit und Gedächtnis und ein Sicherheitsmodell, das die Herkunft von Servern ernst nimmt — und MCP ist die Schicht, an der alle drei zusammentreffen.

Für wen ich das geschrieben habe

Für Entwickler, die Agentensysteme bauen, für technische PMs, die sie scopen, und für Architekten, die die Entscheidungen vor einem Security-Review verteidigen müssen. Das Buch setzt voraus, dass dir das Bild aus Buch I zur Arbeitsweise eines LLM vertraut ist und das Bild aus Buch III dazu, wie Retrieval verdrahtet wird; es setzt die Mathematik aus Buch II nicht voraus. Der Schwerpunkt liegt auf der Ingenieurarbeit: wo die Fehlermodi leben, welche Entscheidungen reversibel sind und welche das Team auf Jahre festlegen.

Wie du es liest

Drei Modi haben sich bei frühen Lesern bewährt. Von vorne nach hinten, wenn du gerade ein MCP-basiertes Agentensystem bauen wirst und das Protokoll in der Reihenfolge willst, in der die Entscheidungen tatsächlich anfallen. Als Nachschlagewerk, wenn du ein laufendes System hast und eine bestimmte Schicht schmerzt — das Transport-, das Speicher- und die Sicherheitskapitel stehen jeweils für sich. Oder als Vorlage für ein Architektur-Review, in dem die Kapitel die Gesprächsthemen werden, die ein Team durchgehen sollte, bevor es sich auf eine Deployment-Topologie festlegt.

Der Gang durch die 14 Kapitel

30. März — Kapitel 1: Die KI-Integrationskrise und der Aufstieg der agentischen Architektur. Warum monolithische Agenten ausfransen, was das N-mal-M-Integrationsproblem ist und der Übergang vom Prompt-Engineering zum Context-Engineering.

31. März — Kapitel 2: Das Model Context Protocol enthüllt. Was MCP standardisiert, die drei Rollen (Host, Client, Server), wie sich dynamische Entdeckung von REST unterscheidet und der Session-Lebenszyklus mit Capability-Verhandlung.

1. April — Kapitel 3: Server-Primitives: Kontext und Fähigkeiten freigeben. Resources, Prompts und Tools — die drei Nomen, die ein Server anbieten kann, ihre Schemata, ihre Lebenszyklen und die Disziplin, das richtige Primitiv für jede Sache zu wählen.

2. April — Kapitel 4: Client-Primitives: Sampling, Roots, Elicitation. Die umgekehrte Fläche — was der Host dem Server zurückgibt — und die Sicherheitsimplikationen jeder Capability, die über die Vertrauensgrenze hinweg geliehen wird.

3. April — Kapitel 5: Transport und Discovery. stdio gegen Streamable HTTP, wann was die richtige Wahl ist und wie sich Server und Clients in lokalen wie entfernten Deployments finden.

4. April — Kapitel 6: Grundlegende Orchestrierungsmuster. Die Agentenschleife, Tool-Routing, das Verwalten von Zwischenzuständen und die Muster, die das Reasoning eines Agenten lesbar halten.

5. April — Kapitel 7: Fortgeschrittene Orchestrierungsmuster. Planner-Executor, Multi-Agent-Koordination, hierarchische Zerlegung und wo jedes Muster seine Komplexität rechtfertigt.

6. April — Kapitel 8: Deployment-Layouts. Strenge MCP-Reinheit gegen wiederverwendbare KI-Agenten gegen Hybrid-Layouts und die Trade-offs, die jeder dem Host abverlangt.

7. April — Kapitel 9: Das Aufmerksamkeitsbudget. Kontext als verwaltete Ressource, die Kosten langer Fenster und die Richtlinien, die entscheiden, was pro Turn in den Blick des Modells gelangt.

8. April — Kapitel 10: Langzeit-Gedächtnis. Episodisches gegen semantisches Gedächtnis, Zusammenfassungs-Strategien und Architekturen, mit denen ein Agent Zustand über Tage trägt.

9. April — Kapitel 11: Angriffsflächen in MCP-Systemen. Das Bedrohungsmodell — Prompt-Injection über Resources, bösartige Server, Tool-Poisoning, Exfiltrationswege.

10. April — Kapitel 12: Protokoll-Härtung. Server-Cards, Consent-UI, Capability-Scoping und die operativen Kontrollen, die Policy dort verankern, wo sie hingehört.

11. April — Kapitel 13: Frameworks und Cloud. Das Ökosystem um MCP — Agenten-Frameworks, gehostete Server, Registries — und worauf man tatsächlich aufbauen sollte.

12. April — Kapitel 14: Agenten benchmarken. Die Messungen, die zählen, die irreführenden und wie man ein Eval-Harness baut, das einen Modellwechsel überlebt.

Was an Band IV anders ist: Band I und II handelten vom Modell. Band III vom Retrieval-Apparat drumherum. Dieser hier handelt von der Kognitionsschicht — dem Protokoll, der Orchestrierung, dem Gedächtnis und der Sicherheit, die aus einem Modell etwas machen, das handeln kann. Die meisten Agentenfehler sind keine Modellfehler. Sie sind Entscheidungen eine Schicht darüber, die kein noch so feines Prompt-Engineering wieder einfangen kann.

Über dieses Buch und die Reihe

Die LLM-Primer-Reihe ist die lange Antwort auf die Frage, die mir immer wieder gestellt wurde — von Entwicklern, Gründern und gelegentlich von Aufsichtsbehörden: wie funktionieren diese Systeme eigentlich, und was braucht es, eines zu bauen, das unter Last hält? Buch I gab die Form. Buch II die Mathematik. Buch III die Produktionsarchitektur von RAG. Buch IV gibt die Kognitionsschicht, die über dem Modell sitzt. Buch V, in Arbeit, wendet sich dem Bau realer LLM-Anwendungen Ende-zu-Ende zu.

Möchtest du das ganze Bild? LLM Primer IV: Designing AI Cognition with MCP ist das Buch, das diese Tour kartiert — mit der vollständigen Protokollreferenz, Orchestrierungs-Playbooks, Sicherheits-Checklisten und Deployment-Vorlagen, die die Tour nur andeutet. LLM Primer IV auf Amazon →

Bis morgen, mit Kapitel 1.

LLM Primer IV — Serieneinführung & Index