La Série LLM Primer

Un guide de terrain en sept volumes désormais complet sur l'IA générative par Sho Shimoda. Sept livres, chacun centré sur une couche différente du travail avec les grands modèles de langage — des fondations à la mise à l'échelle jusqu'à la sécurité.

De quoi parle cette série

La Série LLM Primer est un traitement structuré, centré sur les mécanismes, des grands modèles de langage — écrit pour les ingénieurs, les chefs de produit techniques, les professionnels curieux et toute personne prête à lire attentivement. La série est désormais complète : les sept volumes sont publiés et disponibles sur Amazon. Chaque volume couvre une couche distincte de la discipline de l'ingénierie LLM, en gardant la précision technique tout en restant suffisamment ancré pour être utilisable.

La série est conçue pour fonctionner de deux manières. Vous pouvez lire le Volume I comme une base complète et vous arrêter là. Ou vous pouvez suivre la progression complète — fondations, mathématiques, recherche, conception de contexte, ingénierie de production, mise à l'échelle, sécurité — et terminer avec une connaissance pratique exhaustive de la façon de construire avec les LLM de manière responsable. Un volume compagnon, Physical AI, prolonge la série vers les systèmes incarnés — la robotique, les capteurs et les boucles de contrôle où les modèles rencontrent le monde physique.

Tous les volumes sont écrits par Sho Shimoda, fondateur et ingénieur, qui construit et exploite des systèmes d'IA en production et écrit à leur sujet dans un langage suffisamment clair pour que tout le monde puisse suivre.

Pour qui c'est : Les ingénieurs et architectes qui veulent une compréhension durable. Les chefs de produit et dirigeants qui doivent décider quelle IA construire. Les professionnels curieux et étudiants qui veulent comprendre la technologie sous les gros titres. La série est écrite de sorte que vous n'avez pas besoin de formation mathématique pour la lire, mais conserve assez de précision technique pour qu'un ingénieur expérimenté n'y perde pas son temps.

Comment lire cette page

Chaque volume ci-dessous liste sa table des matières complète, organisée par Partie, avec un lien Amazon vers l'édition publiée. Nous publions un billet chapitre par chapitre pour chaque chapitre de la série. Les chapitres qui ont déjà un billet sont liés ; ceux dont le billet est à venir apparaissent en texte simple.

Les annexes sont listées pour la transparence mais sont du contenu réservé au livre — matériel de référence, fiches récapitulatives, exercices avec solutions, et autres éléments qui appartiennent à l'arrière du livre plutôt qu'à un billet séparé. Pour obtenir les annexes, lisez le livre.

Volume I — Comment fonctionne l'IA générative

Un guide clair et pratique des fondations des grands modèles de langage.

La rampe d'accès en langage clair à toute la série. En partant de zéro — tokens, entraînement et l'acte simple de prédire le mot suivant — il construit une image honnête et sans jargon de ce qu'est un grand modèle de langage, comment il est entraîné, et pourquoi il se comporte comme il le fait, en ne supposant aucune base préalable. C'est la fondation sur laquelle chaque volume ultérieur s'appuie.

Disponible maintenant sur Amazon. Voir LLM Primer I sur Amazon →

Introduction à la série : Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index

Partie I — Concepts et fondations

Chapitre 1 —	Qu'est-ce qu'un grand modèle de langage ?
Chapitre 2 —	Probabilité, tokens et texte
Chapitre 3 —	Réseaux neuronaux pour le langage

Partie II — Comment fonctionnent les LLM

Chapitre 4 —	L'architecture Transformer
Chapitre 5 —	Entraîner de grands modèles
Chapitre 6 —	Affinage et adaptation
Chapitre 7 —	Au-delà de la prédiction du prochain token

Partie III — Perspectives pratiques

Chapitre 8 —	Utiliser les LLM dans les applications
Chapitre 9 —	Performance, mise à l'échelle et coûts
Chapitre 10 —	Sécurité, éthique et confiance

Partie IV — Sujets avancés

Chapitre 11 —	Recherche de pointe
Chapitre 12 —	Construire votre propre système LLM

Annexes (livre uniquement)

A —	Glossaire LLM
B —	Les mathématiques derrière l'attention
C —	Aide-mémoire de prompting

D —	Outils et bibliothèques
E —	Lectures recommandées

Volume II — Les modèles de langage par les mathématiques

Explorer le fonctionnement interne de l'IA avec une intuition mathématique.

Une tournée mathématiquement rigoureuse mais lisible du fonctionnement interne de l'IA : attention, dynamique d'optimisation, paysages de perte et comportement à l'échelle, expliqués à travers les mathématiques qui les font fonctionner. Chaque équation qui compte est entièrement dérivée — chacune enveloppée dans une histoire, une analogie et un exemple numérique résolu. Pour les lecteurs qui veulent les mathématiques que le premier volume garde dans les encadrés.

Disponible maintenant sur Amazon. Voir LLM Primer II sur Amazon →

Introduction à la série : Une tournée chapitre par chapitre de LLM Primer II — Introduction à la série et index

Partie I — Fondations mathématiques

Chapitre 1 —	Intuition mathématique pour les modèles de langage
Chapitre 2 —	Les LLM en contexte
Chapitre 3 —	Outils mathématiques

Partie II — L'architecture des modèles

Chapitre 4 —	Attention
Chapitre 5 —	Position, ordre et structure de séquence
Chapitre 6 —	Blocs Transformer
Chapitre 7 —	Efficacité et variantes Transformer

Partie III — Entraînement et évaluation

Chapitre 8 —	Comment les modèles apprennent
Chapitre 9 —	Entraînement à grande échelle
Chapitre 10 —	Mathématiques du post-entraînement et de l'alignement
Chapitre 11 —	Évaluation, calibration et inférence

Partie IV — Applications et perspectives

Chapitre 12 —	Applications des LLM dans le monde réel
Chapitre 13 —	Limites, risques et défis ouverts
Chapitre 14 —	Connaissances pratiques pour les ingénieurs

Annexes (livre uniquement)

—	L'aide-mémoire mathématique des LLM
—	Une perspective statistique sur les LLM
—	Questions que les gens posent
—	Dérivations résolues

—	Exercices, avec solutions
—	Index des symboles
—	Une passe avant complète, par les nombres
—	Une chronologie des idées

Volume III — Renforcer l'IA d'entreprise avec RAG

Un guide pratique pour construire des systèmes de Retrieval-Augmented Generation pour l'entreprise.

RAG pratique — bases de données vectorielles, stratégies de chunking, et l'architecture pour ancrer un modèle dans vos propres documents afin d'obtenir des réponses d'entreprise fiables et à jour. Le volume à lire si votre travail est de livrer des fonctionnalités d'IA qui doivent rester actuelles et qui doivent citer leurs sources.

Disponible maintenant sur Amazon. Voir LLM Primer III sur Amazon →

Introduction à la série : LLM Primer III — Introduction de la série et index

Partie I — Fondations de la Retrieval-Augmented Generation

Chapitre 1 —

L'évolution de l'architecture RAG

Partie II — Ingestion, parsing et chunking des données

Chapitre 2 —	Parsing intelligent de documents
Chapitre 3 —	Cadres avancés de chunking

Partie III — Bases de données vectorielles et optimisation de la recherche

Chapitre 4 —	Choisir la bonne base de données vectorielle
Chapitre 5 —	Architecturer le pipeline de recherche

Partie IV — Sécurité, confidentialité et contrôle d'accès

Chapitre 6 —	Modèles de menace RAG et vulnérabilités
Chapitre 7 —	Implémenter le contrôle d'accès
Chapitre 8 —	Anonymisation des données dans le pipeline RAG

Partie V — Évaluation, monitoring et maintenance

Chapitre 9 —	Le triptyque d'évaluation RAG
Chapitre 10 —	Cadres d'évaluation de premier plan
Chapitre 11 —	Mises à jour continues et optimisation du pipeline

Annexes (livre uniquement)

A —	Formules mathématiques essentielles pour l'optimisation RAG
B —	Exemples de system prompts pour l'anonymisation et l'évaluation

C —	Matrices de décision pour bases vectorielles et outils
D —	Jeux de données de référence pour l'évaluation RAG

Volume IV — Concevoir la cognition de l'IA avec MCP

Concevoir le contexte, les outils et la mémoire pour des agents IA fiables.

Modélisation structurée du contexte et orchestration : comment façonner le raisonnement d'un modèle en concevant le contexte et les situations qu'il voit, plutôt que le modèle lui-même. Le volume à lire si vous construisez des systèmes agentiques — inventaires d'outils, boucles longues, mémoire à travers les sessions, et la discipline de concevoir ce que le modèle est autorisé à voir.

Disponible maintenant sur Amazon. Voir LLM Primer IV sur Amazon →

Introduction à la série : LLM Primer IV — Introduction de la série et index

Partie I — Le changement de paradigme dans l'intégration IA

Chapitre 1 —	La crise d'intégration IA et la montée de l'architecture agentique
Chapitre 2 —	Dévoiler le Model Context Protocol (MCP)

Partie II — Mécanismes centraux du Model Context Protocol

Chapitre 3 —	Primitives serveur — exposer contexte et capacités
Chapitre 4 —	Primitives client — comportements agentiques et contrôle
Chapitre 5 —	Protocoles de transport et découverte

Partie III — Modèles d'orchestration multi-agents

Chapitre 6 —	Stratégies fondamentales d'orchestration
Chapitre 7 —	Modèles collaboratifs et dynamiques avancés
Chapitre 8 —	Topologies de déploiement architectural

Partie IV — Concevoir la cognition de l'IA : contexte et mémoire

Chapitre 9 —	Gérer le budget d'attention
Chapitre 10 —	Mémoire des tâches à long horizon

Partie V — Sécuriser les flux agentiques

Chapitre 11 —	Surfaces d'attaque et vulnérabilités du protocole
Chapitre 12 —	Durcissement et défenses du protocole

Partie VI — Ingénierie de production et mise à l'échelle

Chapitre 13 —	Cadres et intégration cloud
Chapitre 14 —	Benchmarking, tests et performance

Annexes (livre uniquement)

A —	Référence rapide et aide-mémoire MCP
B —	Plans d'implémentation et exemples de code
C —	Listes de vérification production et sécurité

D —	Spécifications avancées et propositions standard (SEPs)
E —	Benchmarks et données de performance
F —	Ressources officielles et liens écosystème

Volume V — Construire des applications LLM du monde réel

Concevoir, évaluer et exploiter des systèmes LLM en production.

Un guide centré sur les systèmes, du prototype à la production — conception d'API, boucles d'évaluation, monitoring et intégration — pour transformer un modèle capable en produit fiable. Le volume qui transforme la compréhension architecturale en services qui tournent avec de vrais utilisateurs.

Disponible maintenant sur Amazon. Voir LLM Primer V sur Amazon →

Introduction à la série : LLM Primer V — Introduction de la série et index

Partie I — Fondations de l'ingénierie IA

Chapitre 1 —	La discipline de l'ingénierie IA
Chapitre 2 —	Modèles de fondation et prompt engineering

Partie II — Construire des capacités agentiques et de recherche

Chapitre 3 —	Retrieval-Augmented Generation (RAG)
Chapitre 4 —	Agents IA et appel d'outils

Partie III — Assurance qualité et observabilité

Chapitre 5 —	Évaluer les applications LLM
Chapitre 6 —	Observabilité IA et traçage

Partie IV — Sécurité, mise à l'échelle et optimisation

Chapitre 7 —	Sécurité LLM et garde-fous
Chapitre 8 —	Optimiser performance, serving et coût

Annexes (livre uniquement)

A —	Listes de vérification production et sécurité
B —	Matrices de sélection d'outils et de cadres
C —	Protocoles, streaming et sorties structurées

D —	Architecture de rate limiting et gestion des coûts
E —	Glossaire des métriques et termes de l'ingénierie IA

Volume VI — Mettre les systèmes d'IA à l'échelle

Architecturer une inférence LLM à faible latence pour l'échelle de production.

Architecturer une inférence haute performance : serving distribué, optimisation de la latence et modélisation des coûts pour des systèmes qui doivent répondre des millions de fois par jour. Le volume à lire quand votre système d'IA a dépassé un seul serveur et doit maintenant se comporter comme une vraie pièce d'infrastructure.

Disponible maintenant sur Amazon. Voir LLM Primer VI sur Amazon →

Introduction à la série : LLM Primer VI — Introduction de la série et index

Partie I — Les fondations de l'inférence LLM

Chapitre 1 —	La mécanique de la génération de tokens
Chapitre 2 —	Le défi du cache clé-valeur (KV)

Partie II — Le substrat matériel

Chapitre 3 —	GPU de centre de données pour l'IA générative
Chapitre 4 —	Silicium IA spécialisé et ASICs

Partie III — Optimisation au niveau modèle (compression)

Chapitre 5 —	Démystifier la quantification
Chapitre 6 —	Pruning et distillation de connaissances

Partie IV — Optimisations au niveau système et moteur

Chapitre 7 —	Stratégies avancées de batching
Chapitre 8 —	Gestion du cache KV de nouvelle génération
Chapitre 9 —	Décodage spéculatif

Partie V — Cadres de serving et orchestration

Chapitre 10 —	La couche moteur LLM
Chapitre 11 —	La couche plateforme et orchestration
Chapitre 12 —	Serving désagrégé et Kubernetes
Chapitre 13 —	Autoscaling et atténuation du démarrage à froid

Partie VI — Économie applicative et TCO

Chapitre 14 —	Économie des tokens et tarification API
Chapitre 15 —	API serverless vs infrastructure dédiée
Chapitre 16 —	Stratégies de réduction des coûts en production

Annexes (livre uniquement)

A —	Référence des formules mathématiques et modélisation des coûts
B —	Guide des spécifications matérielles et accélérateurs

C —	Configurations de déploiement et extraits de code
D —	Méthodologie de benchmarking et définitions des métriques

Volume VII — Sécurité de l'IA

Défendre les systèmes LLM contre la prompt injection, les jailbreaks et les menaces adversariales.

Concevoir une IA sûre et robuste : risques adversariaux, prompt injection, cadres de gouvernance et conception défensive pour des systèmes déployés dans le monde réel. Le volume à lire quand votre système d'IA doit être traité comme une infrastructure pertinente pour la sécurité.

Disponible maintenant sur Amazon. Voir LLM Primer VII sur Amazon →

Introduction à la série : LLM Primer VII — Introduction de la série et index

Partie I — Fondations de la sécurité IA

Chapitre 1 —	Pourquoi la sécurité IA est différente
Chapitre 2 —	Modélisation des menaces pour les systèmes LLM
Chapitre 3 —	Sécurité des données et confidentialité

Partie II — Sécurité du prompt et de l'interaction

Chapitre 4 —	Prompt injection et jailbreaks
Chapitre 5 —	Validation des entrées et filtrage des sorties
Chapitre 6 —	Risques de la Retrieval-Augmented Generation

Partie III — Robustesse et fiabilité du modèle

Chapitre 7 —	Hallucinations et fiabilité
Chapitre 8 —	Attaques adversariales sur les modèles
Chapitre 9 —	Intégrité du modèle et risques de chaîne d'approvisionnement

Partie IV — Architecture de sécurité au niveau système

Chapitre 10 —	Concevoir des architectures LLM sûres
Chapitre 11 —	Observabilité, journalisation et réponse aux incidents
Chapitre 12 —	Contrôle d'accès et identité

Partie V — Gouvernance, éthique et conformité

Chapitre 13 —	Paysage réglementaire
Chapitre 14 —	Biais, équité et IA responsable
Chapitre 15 —	Construire une organisation IA sûre

Partie VI — Sujets avancés

Chapitre 16 —	Affinage et adaptation sûrs
Chapitre 17 —	Menaces futures et défenses émergentes

Annexes (livre uniquement)

A —	Liste de vérification de sécurité IA pour systèmes de production
B —	Modèle d'exemple de modélisation des menaces
C —	Modèles de conception de prompts sûrs

D —	Modèle de réponse aux incidents pour applications LLM
E —	Outils et cadres recommandés

Physical AI — un volume compagnon

En parallèle des sept volumes principaux, Physical AI prolonge la même approche mécanisme-d'abord vers les systèmes incarnés : robotique, capteurs, actionneurs et boucles de contrôle où les modèles rencontrent le monde physique. Là où la Série LLM Primer se concentre sur les systèmes de langage et de raisonnement, Physical AI examine comment les mêmes idées — apprentissage à partir de données, prise de décision sous incertitude, mise à l'échelle du calcul — se comportent lorsqu'un modèle doit percevoir, agir et réagir dans un environnement réel. C'est un compagnon plutôt qu'une continuation ; les deux séries peuvent être lues indépendamment, mais ensemble elles couvrent la surface complète de la façon dont l'IA moderne est construite aujourd'hui.

La Série LLM Primer

De quoi parle cette série

Comment lire cette page

Volume I — Comment fonctionne l'IA générative

Partie I — Concepts et fondations

Partie II — Comment fonctionnent les LLM

Partie III — Perspectives pratiques

Partie IV — Sujets avancés

Annexes (livre uniquement)

Volume II — Les modèles de langage par les mathématiques

Partie I — Fondations mathématiques

Partie II — L'architecture des modèles

Partie III — Entraînement et évaluation

Partie IV — Applications et perspectives

Annexes (livre uniquement)

Volume III — Renforcer l'IA d'entreprise avec RAG

Partie I — Fondations de la Retrieval-Augmented Generation

Partie II — Ingestion, parsing et chunking des données

Partie III — Bases de données vectorielles et optimisation de la recherche

Partie IV — Sécurité, confidentialité et contrôle d'accès

Partie V — Évaluation, monitoring et maintenance

Annexes (livre uniquement)

Volume IV — Concevoir la cognition de l'IA avec MCP

Partie I — Le changement de paradigme dans l'intégration IA

Partie II — Mécanismes centraux du Model Context Protocol

Partie III — Modèles d'orchestration multi-agents

Partie IV — Concevoir la cognition de l'IA : contexte et mémoire

Partie V — Sécuriser les flux agentiques

Partie VI — Ingénierie de production et mise à l'échelle

Annexes (livre uniquement)

Volume V — Construire des applications LLM du monde réel

Partie I — Fondations de l'ingénierie IA

Partie II — Construire des capacités agentiques et de recherche

Partie III — Assurance qualité et observabilité

Partie IV — Sécurité, mise à l'échelle et optimisation

Annexes (livre uniquement)

Volume VI — Mettre les systèmes d'IA à l'échelle

Partie I — Les fondations de l'inférence LLM

Partie II — Le substrat matériel

Partie III — Optimisation au niveau modèle (compression)

Partie IV — Optimisations au niveau système et moteur

Partie V — Cadres de serving et orchestration

Partie VI — Économie applicative et TCO

Annexes (livre uniquement)

Volume VII — Sécurité de l'IA

Partie I — Fondations de la sécurité IA

Partie II — Sécurité du prompt et de l'interaction

Partie III — Robustesse et fiabilité du modèle

Partie IV — Architecture de sécurité au niveau système

Partie V — Gouvernance, éthique et conformité

Partie VI — Sujets avancés

Annexes (livre uniquement)

Physical AI — un volume compagnon

SHO