Einführung in LLM
Diese Seite bietet einen Leitfaden zu großen Sprachmodellen (LLM), von den Grundlagen bis hin zu Anwendungen für KI-Enthusiasten.
Kapitel 14 — Benchmarking, Testen und Performance
Fünfzehnter und letzter Beitrag der LLM-Primer-IV-Tour. Der MCP-Universe-Benchmark auf echten Servern, die zwei systemischen Fehlermodi, die er enthüllte, die Zehnfach-Durchsatzlücke zwischen Session-per-Request und geteilten Session-Pools und die Brücke zu Band V.
2026-04-12Kapitel 13 — Frameworks und Cloud-Integration
Dreizehnter Beitrag der LLM-Primer-IV-Tour. Strands mit Bedrock, das AWS-State-Layer-Muster, das Microsoft Agent Framework, LangChain, Semantic Kernel — und die drei produktiven Integrationsformen, auf die Teams unabhängig immer wieder kommen.
2026-04-11Kapitel 12 — Protokoll-Härtung und Verteidigungen
Zwölfter Beitrag der LLM-Primer-IV-Tour. Die vier Verteidigungs-Cluster — kryptographische Attestation, OAuth-Scope-Disziplin mit begrenzten Sessions, Laufzeit-Sandboxing und Human-in-the-Loop-Gates — komponieren zu einer Haltung, die nicht davon abhängt, dass sich das Modell unter adversariellen Bedingungen korrekt verhält.
2026-04-10Kapitel 11 — Angriffsflächen und Protokoll-Schwachstellen
Elfter Beitrag der LLM-Primer-IV-Tour. Die klassischen Angriffe an MCP angepasst — Confused Deputy, Token-Passthrough, Session-Hijacking — die Protokoll-Schwachstellen rund um Capability-Eskalation und unauthentifiziertes Sampling und die implizite Vertrauenspropagation, die Kontextvergiftung zu einem strukturellen Problem macht.
2026-04-09Kapitel 9 — Das Aufmerksamkeitsbudget verwalten
Neunter Beitrag der LLM-Primer-IV-Tour. Context Rot, die Lost-in-the-Middle-Klippe, Tool-Loadout-Rot und die drei architektonischen Antworten — MCP, RAG, Fine-Tuning — auf die Frage, wo das fehlende Wissen eines Modells tatsächlich hingehört.
2026-04-07Kapitel 8 — Architektonische Deployment-Layouts
Achter Beitrag der LLM-Primer-IV-Tour. Die drei Deployment-Layouts, die im MCP-Ökosystem entstanden sind — wiederverwendbarer Agent, strenge Reinheit, Hybrid — und die vier bindenden Beschränkungen, die entscheiden, welches zu welchem Projekt passt.
2026-04-06Kapitel 7 — Fortgeschrittene kollaborative und dynamische Muster
Siebter Beitrag der LLM-Primer-IV-Tour. Roundtable-Konsens, Handoff-Routing und magentische Orchestrierung — die Muster, die entstehen, wenn die Topologie pro Request gebaut werden muss, mit den Fehlermodi (Nicht-Terminierung, Fehlrouting, durchgegangenes Planen), die die einfacheren Muster vermeiden.
2026-04-05Kapitel 5 — Transportprotokolle und Discovery
Fünfter Beitrag der LLM-Primer-IV-Tour. Die drei Transports, die MCP unterstützt, die .well-known-Discovery-Schicht mit Server Cards und die langweiligen operativen Themen — CORS, Origin-Validierung, Caching — die darüber entscheiden, ob ein Server ein kooperativer Netzwerkbürger oder eine Haftung ist.
2026-04-03Kapitel 4 — Client-Primitives: Agentisches Verhalten und Kontrolle
Vierter Beitrag der LLM-Primer-IV-Tour. Sampling, Roots und Elicitation sind die drei kleinen, kontrollierten Öffnungen, die MCP in die Host-Server-Wand schneidet — jede eine geliehene Capability, jede ein im Namen der Nutzerin akzeptiertes Risiko.
2026-04-02Kapitel 3 — Server-Primitives: Kontext und Fähigkeiten freigeben
Dritter Beitrag der LLM-Primer-IV-Tour. Die drei Nomen, die ein MCP-Server anbieten kann — Resources (Lesezustand), Prompts (wiederverwendbares Gerüst), Tools (Schreibaktionen) — ihre Schemata, ihre Lebenszyklen, ihre Fehlermodelle und die Disziplin, das richtige Primitiv zu wählen.
2026-04-01Kapitel 2 — Das Model Context Protocol (MCP) enthüllt
Zweiter Beitrag der LLM-Primer-IV-Tour. Was MCP tatsächlich standardisiert, die Drei-Rollen-Aufteilung in Host, Client und Server, warum sich dynamische Discovery und bidirektionales Messaging in den entscheidenden Fällen von REST unterscheiden und der Session-Lebenszyklus, der mit Capability-Verhandlung beginnt.
2026-03-31Kapitel 1 — Die KI-Integrationskrise und der Aufstieg der agentischen Architektur
Erster Beitrag der LLM-Primer-IV-Tour. Warum monolithische Agenten ausfransen, je länger ihre System-Prompts werden, das darunterliegende N-mal-M-Integrationsproblem und der Übergang vom Prompt-Engineering zum Context-Engineering, den MCP ermöglichen soll.
2026-03-30LLM Primer IV — Serieneinführung & Index
Auftakt der kapitelweisen Tour durch Buch IV der LLM-Primer-Reihe — KI-Kognition mit MCP entwerfen. Warum Agenten eine Protokollschicht brauchen, um über Demoware hinauszuwachsen, für wen das Buch geschrieben ist und der Zeitplan der vierzehn Beiträge vom 30. März bis zum 12. April.
2026-03-29Kapitel 6 — Bedrohungsmodelle und Schwachstellen von RAG
Sechster Beitrag der LLM-Primer-III-Tour. Die erweiterte Angriffsfläche von Retrieval — Korpus-Vergiftung, adversariale Chunks, indirekte Prompt Injection, Embedding-Inversion und das Confused-Deputy-Problem in agentischem RAG. Konkrete Angriffe, jeder demonstriert, jeder reproduzierbar.
2026-03-23Kapitel 9 — Leistung, Skalierung und Kosten: Die echten Engineering-Trade-offs
Kapitel 9 der LLM Primer I Serie. Die operativen Realitäten beim Betrieb von LLMs im großen Maßstab — Modellgröße versus Fähigkeit, der Trade-off zwischen Latenz und Throughput, Kostenökonomie, Quantisierung und Edge-Deployment. Warum Frontier-Modelle oft die falsche Wahl sind, selbst wenn du sie dir leisten kannst.
2026-02-26Die LLM Primer Serie — Ein Feldhandbuch zur generativen KI, Band für Band aufgebaut
Die LLM Primer Serie — ein siebenbändiges Feldhandbuch zur generativen KI von Sho Shimoda. Jeder Band behandelt eine eigene Ebene der Arbeit mit großen Sprachmodellen, von den Grundlagen bis zur Sicherheit. Dies ist die Landingpage: ein Überblick über die gesamte Serie plus die laufende Kapitel-für-Kapitel-Tour durch die ersten Bände.
2026-02-15