La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

Publié le: 2026-02-15 Dernière mise à jour le: 2026-06-12 Version: 7
La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

La Série LLM Primer

Un guide de terrain de l'IA générative, construit volume après volume. Sept livres, chacun centré sur une couche différente du travail avec les grands modèles de langage — des fondations à la mise à l'échelle jusqu'à la sécurité.


De quoi parle cette série

La Série LLM Primer est un traitement structuré, centré sur les mécanismes, des grands modèles de langage — écrit pour les ingénieurs, les chefs de produit techniques, les professionnels curieux et toute personne prête à lire attentivement. Chaque volume couvre une partie du domaine en profondeur, en conservant la précision technique tout en gardant des explications suffisamment ancrées pour pouvoir être utilisées.

La série est conçue pour fonctionner de deux manières. Vous pouvez lire le Volume I comme une base complète et vous arrêter là. Ou vous pouvez suivre la progression complète — fondations, mathématiques, recherche, conception de contexte, ingénierie de production, mise à l'échelle, sécurité — et terminer avec une connaissance pratique exhaustive de la façon de construire avec les LLM de manière responsable.

Tous les volumes sont écrits par Sho Shimoda, CTO de Receipt Roller Inc., qui construit et exploite des systèmes d'IA en production et écrit à leur sujet dans un langage suffisamment clair pour que tout le monde puisse suivre.

Pour qui c'est : Les ingénieurs et architectes qui veulent une compréhension durable. Les chefs de produit et dirigeants qui doivent décider quelle IA construire. Les professionnels curieux et étudiants qui veulent comprendre la technologie sous les gros titres. La série est écrite de sorte que vous n'avez pas besoin de formation mathématique pour la lire, mais conserve assez de précision technique pour qu'un ingénieur expérimenté n'y perde pas son temps.

Comment lire cette page

Chaque volume ci-dessous liste sa table des matières complète, organisée par Partie. Nous publierons un billet chapitre par chapitre pour chaque chapitre de la série. Les chapitres qui ont déjà un billet sont liés ; ceux dont le billet est à venir apparaissent en texte simple.

Les annexes sont listées pour la transparence mais sont du contenu réservé au livre — matériel de référence, fiches récapitulatives, exercices avec solutions, et autres éléments qui appartiennent à l'arrière du livre plutôt qu'à un billet séparé. Pour obtenir les annexes, lisez le livre.


Volume I — Comment fonctionne l'IA générative

Un guide clair et pratique des fondations des grands modèles de langage.

La rampe d'accès en langage clair à toute la série. En partant de zéro — tokens, entraînement et l'acte simple de prédire le mot suivant — il construit une image honnête et sans jargon de ce qu'est un grand modèle de langage, comment il est entraîné, et pourquoi il se comporte comme il le fait, en ne supposant aucune base préalable. C'est la fondation sur laquelle chaque volume ultérieur s'appuie.

Lisez le livre sur Amazon : LLM Primer I — How Generative AI Works

LLM Primer I — couverture

Introduction à la série : Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index

Partie I — Concepts et fondations

Chapitre 1 —Qu'est-ce qu'un grand modèle de langage ?
Chapitre 2 —Probabilité, tokens et texte
Chapitre 3 —Réseaux neuronaux pour le langage

Partie II — Comment fonctionnent les LLM

Chapitre 4 —L'architecture Transformer
Chapitre 5 —Entraîner de grands modèles
Chapitre 6 —Affinage et adaptation
Chapitre 7 —Au-delà de la prédiction du prochain token

Partie III — Perspectives pratiques

Chapitre 8 —Utiliser les LLM dans les applications
Chapitre 9 —Performance, mise à l'échelle et coûts
Chapitre 10 —Sécurité, éthique et confiance

Partie IV — Sujets avancés

Chapitre 11 —Recherche de pointe
Chapitre 12 —Construire votre propre système LLM

Annexes (livre uniquement)

A —Glossaire LLM
B —Les mathématiques derrière l'attention
C —Aide-mémoire de prompting
D —Outils et bibliothèques
E —Lectures recommandées

Volume II — Les modèles de langage par les mathématiques

Explorer le fonctionnement interne de l'IA avec une intuition mathématique.

Une tournée mathématiquement rigoureuse mais lisible du fonctionnement interne de l'IA : attention, dynamique d'optimisation, paysages de perte et comportement à l'échelle, expliqués à travers les mathématiques qui les font fonctionner. Chaque équation qui compte est entièrement dérivée — chacune enveloppée dans une histoire, une analogie et un exemple numérique résolu. Pour les lecteurs qui veulent les mathématiques que le premier volume garde dans les encadrés.

Lisez le livre sur Amazon : LLM Primer II — Language Models Through Mathematics

LLM Primer II — couverture

Introduction à la série : Une tournée chapitre par chapitre de LLM Primer II — Introduction à la série et index

Partie I — Fondations mathématiques

Chapitre 1 —Intuition mathématique pour les modèles de langage
Chapitre 2 —Les LLM en contexte
Chapitre 3 —Outils mathématiques

Partie II — L'architecture des modèles

Chapitre 4 —Attention
Chapitre 5 —Position, ordre et structure de séquence
Chapitre 6 —Blocs Transformer
Chapitre 7 —Efficacité et variantes Transformer

Partie III — Entraînement et évaluation

Chapitre 8 —Comment les modèles apprennent
Chapitre 9 —Entraînement à grande échelle
Chapitre 10 —Mathématiques du post-entraînement et de l'alignement
Chapitre 11 —Évaluation, calibration et inférence

Partie IV — Applications et perspectives

Chapitre 12 —Applications des LLM dans le monde réel
Chapitre 13 —Limites, risques et défis ouverts
Chapitre 14 —Connaissances pratiques pour les ingénieurs

Annexes (livre uniquement)

L'aide-mémoire mathématique des LLM
Une perspective statistique sur les LLM
Questions que les gens posent
Dérivations résolues
Exercices, avec solutions
Index des symboles
Une passe avant complète, par les nombres
Une chronologie des idées

Volume III — Renforcer l'IA d'entreprise avec RAG (Disponible maintenant)

Un guide pratique pour construire des systèmes de Retrieval-Augmented Generation pour l'entreprise.

RAG pratique — bases de données vectorielles, stratégies de chunking, et l'architecture pour ancrer un modèle dans vos propres documents afin d'obtenir des réponses d'entreprise fiables et à jour. Le volume à lire si votre travail est de livrer des fonctionnalités d'IA qui doivent rester actuelles et qui doivent citer leurs sources.

Lire sur Amazon : LLM Primer III — Améliorer l'IA d'entreprise avec RAG

LLM Primer III — couverture

Introduction à la série : LLM Primer III — Introduction de la série et index

Partie I — Fondations de la Retrieval-Augmented Generation

Chapitre 1 —L'évolution de l'architecture RAG

Partie II — Ingestion, parsing et chunking des données

Chapitre 2 —Parsing intelligent de documents
Chapitre 3 —Cadres avancés de chunking

Partie III — Bases de données vectorielles et optimisation de la recherche

Chapitre 4 —Choisir la bonne base de données vectorielle
Chapitre 5 —Architecturer le pipeline de recherche

Partie IV — Sécurité, confidentialité et contrôle d'accès

Chapitre 6 —Modèles de menace RAG et vulnérabilités
Chapitre 7 —Implémenter le contrôle d'accès
Chapitre 8 —Anonymisation des données dans le pipeline RAG

Partie V — Évaluation, monitoring et maintenance

Chapitre 9 —Le triptyque d'évaluation RAG
Chapitre 10 —Cadres d'évaluation de premier plan
Chapitre 11 —Mises à jour continues et optimisation du pipeline

Annexes (livre uniquement)

A —Formules mathématiques essentielles pour l'optimisation RAG
B —Exemples de system prompts pour l'anonymisation et l'évaluation
C —Matrices de décision pour bases vectorielles et outils
D —Jeux de données de référence pour l'évaluation RAG

Volume IV — Concevoir la cognition de l'IA avec MCP (Disponible maintenant)

Concevoir le contexte, les outils et la mémoire pour des agents IA fiables.

Modélisation structurée du contexte et orchestration : comment façonner le raisonnement d'un modèle en concevant le contexte et les situations qu'il voit, plutôt que le modèle lui-même. Le volume à lire si vous construisez des systèmes agentiques — inventaires d'outils, boucles longues, mémoire à travers les sessions, et la discipline de concevoir ce que le modèle est autorisé à voir.

Lire sur Amazon : LLM Primer IV — Concevoir la cognition de l'IA avec MCP

LLM Primer IV — couverture

Introduction à la série : LLM Primer IV — Introduction de la série et index

Partie I — Le changement de paradigme dans l'intégration IA

Chapitre 1 —La crise d'intégration IA et la montée de l'architecture agentique
Chapitre 2 —Dévoiler le Model Context Protocol (MCP)

Partie II — Mécanismes centraux du Model Context Protocol

Chapitre 3 —Primitives serveur — exposer contexte et capacités
Chapitre 4 —Primitives client — comportements agentiques et contrôle
Chapitre 5 —Protocoles de transport et découverte

Partie III — Modèles d'orchestration multi-agents

Chapitre 6 —Stratégies fondamentales d'orchestration
Chapitre 7 —Modèles collaboratifs et dynamiques avancés
Chapitre 8 —Topologies de déploiement architectural

Partie IV — Concevoir la cognition de l'IA : contexte et mémoire

Chapitre 9 —Gérer le budget d'attention
Chapitre 10 —Mémoire des tâches à long horizon

Partie V — Sécuriser les flux agentiques

Chapitre 11 —Surfaces d'attaque et vulnérabilités du protocole
Chapitre 12 —Durcissement et défenses du protocole

Partie VI — Ingénierie de production et mise à l'échelle

Chapitre 13 —Cadres et intégration cloud
Chapitre 14 —Benchmarking, tests et performance

Annexes (livre uniquement)

A —Référence rapide et aide-mémoire MCP
B —Plans d'implémentation et exemples de code
C —Listes de vérification production et sécurité
D —Spécifications avancées et propositions standard (SEPs)
E —Benchmarks et données de performance
F —Ressources officielles et liens écosystème

Volume V — Construire des applications LLM du monde réel

Concevoir, évaluer et exploiter des systèmes LLM en production.

Un guide centré sur les systèmes, du prototype à la production — conception d'API, boucles d'évaluation, monitoring et intégration — pour transformer un modèle capable en produit fiable. Le volume qui transforme la compréhension architecturale en services qui tournent avec de vrais utilisateurs.

LLM Primer V — couverture

Partie I — Fondations de l'ingénierie IA

Chapitre 1 —La discipline de l'ingénierie IA
Chapitre 2 —Modèles de fondation et prompt engineering

Partie II — Construire des capacités agentiques et de recherche

Chapitre 3 —Retrieval-Augmented Generation (RAG)
Chapitre 4 —Agents IA et appel d'outils

Partie III — Assurance qualité et observabilité

Chapitre 5 —Évaluer les applications LLM
Chapitre 6 —Observabilité IA et traçage

Partie IV — Sécurité, mise à l'échelle et optimisation

Chapitre 7 —Sécurité LLM et garde-fous
Chapitre 8 —Optimiser performance, serving et coût

Annexes (livre uniquement)

A —Listes de vérification production et sécurité
B —Matrices de sélection d'outils et de cadres
C —Protocoles, streaming et sorties structurées
D —Architecture de rate limiting et gestion des coûts
E —Glossaire des métriques et termes de l'ingénierie IA

Volume VI — Mettre les systèmes d'IA à l'échelle

Architecturer une inférence LLM à faible latence pour l'échelle de production.

Architecturer une inférence haute performance : serving distribué, optimisation de la latence et modélisation des coûts pour des systèmes qui doivent répondre des millions de fois par jour. Le volume à lire quand votre système d'IA a dépassé un seul serveur et doit maintenant se comporter comme une vraie pièce d'infrastructure.

LLM Primer VI — couverture

Partie I — Les fondations de l'inférence LLM

Chapitre 1 —La mécanique de la génération de tokens
Chapitre 2 —Le défi du cache clé-valeur (KV)

Partie II — Le substrat matériel

Chapitre 3 —GPU de centre de données pour l'IA générative
Chapitre 4 —Silicium IA spécialisé et ASICs

Partie III — Optimisation au niveau modèle (compression)

Chapitre 5 —Démystifier la quantification
Chapitre 6 —Pruning et distillation de connaissances

Partie IV — Optimisations au niveau système et moteur

Chapitre 7 —Stratégies avancées de batching
Chapitre 8 —Gestion du cache KV de nouvelle génération
Chapitre 9 —Décodage spéculatif

Partie V — Cadres de serving et orchestration

Chapitre 10 —La couche moteur LLM
Chapitre 11 —La couche plateforme et orchestration
Chapitre 12 —Serving désagrégé et Kubernetes
Chapitre 13 —Autoscaling et atténuation du démarrage à froid

Partie VI — Économie applicative et TCO

Chapitre 14 —Économie des tokens et tarification API
Chapitre 15 —API serverless vs infrastructure dédiée
Chapitre 16 —Stratégies de réduction des coûts en production

Annexes (livre uniquement)

A —Référence des formules mathématiques et modélisation des coûts
B —Guide des spécifications matérielles et accélérateurs
C —Configurations de déploiement et extraits de code
D —Méthodologie de benchmarking et définitions des métriques

Volume VII — Sécurité de l'IA

Défendre les systèmes LLM contre la prompt injection, les jailbreaks et les menaces adversariales.

Concevoir une IA sûre et robuste : risques adversariaux, prompt injection, cadres de gouvernance et conception défensive pour des systèmes déployés dans le monde réel. Le volume à lire quand votre système d'IA doit être traité comme une infrastructure pertinente pour la sécurité.

LLM Primer VII — couverture

Partie I — Fondations de la sécurité IA

Chapitre 1 —Pourquoi la sécurité IA est différente
Chapitre 2 —Modélisation des menaces pour les systèmes LLM
Chapitre 3 —Sécurité des données et confidentialité

Partie II — Sécurité du prompt et de l'interaction

Chapitre 4 —Prompt injection et jailbreaks
Chapitre 5 —Validation des entrées et filtrage des sorties
Chapitre 6 —Risques de la Retrieval-Augmented Generation

Partie III — Robustesse et fiabilité du modèle

Chapitre 7 —Hallucinations et fiabilité
Chapitre 8 —Attaques adversariales sur les modèles
Chapitre 9 —Intégrité du modèle et risques de chaîne d'approvisionnement

Partie IV — Architecture de sécurité au niveau système

Chapitre 10 —Concevoir des architectures LLM sûres
Chapitre 11 —Observabilité, journalisation et réponse aux incidents
Chapitre 12 —Contrôle d'accès et identité

Partie V — Gouvernance, éthique et conformité

Chapitre 13 —Paysage réglementaire
Chapitre 14 —Biais, équité et IA responsable
Chapitre 15 —Construire une organisation IA sûre

Partie VI — Sujets avancés

Chapitre 16 —Affinage et adaptation sûrs
Chapitre 17 —Menaces futures et défenses émergentes

Annexes (livre uniquement)

A —Liste de vérification de sécurité IA pour systèmes de production
B —Modèle d'exemple de modélisation des menaces
C —Modèles de conception de prompts sûrs
D —Modèle de réponse aux incidents pour applications LLM
E —Outils et cadres recommandés

Comment cette page grandit

Cette page sera mise à jour à mesure que chaque volume de la série est publié, et à mesure que les billets chapitre par chapitre de chaque chapitre paraissent. Les Volumes III à VII ont chacun leur table des matières complète ci-dessus ; les billets pour ces chapitres seront ajoutés à mesure qu'ils seront écrits.

Mettez cette page dans vos favoris si vous voulez suivre la série au fur et à mesure. Ou abonnez-vous au fil du channel pour recevoir chaque nouveau billet le jour de sa parution.


Commencez avec le Volume I. Douze chapitres, entièrement révisés pour 2026, avec diagrammes, encadrés en langage simple, exemples de code et un traitement complet de la façon dont l'IA générative fonctionne vraiment. Procurez-vous LLM Primer I sur Amazon →
Puis allez plus loin avec le Volume II. Les mathématiques sous la machinerie — chaque équation qui compte est entièrement dérivée, et chacune est enveloppée dans une histoire, une analogie et un exemple résolu. Procurez-vous LLM Primer II sur Amazon →

SHO
SHO
CTO et Fondateur de RECEIPTROLLER. Axé sur les données, motivé par l'innovation, toujours curieux.