Une tournée chapitre par chapitre de LLM Primer I
Introduction à la série et index de la tournée en douze parties de LLM Primer I: How Generative AI Works — publiée un billet par jour, du 18 février au 1er mars 2026.
Pourquoi cette série existe
J'ai écrit LLM Primer I pour faire quelque chose que je ne trouvais nulle part ailleurs : expliquer comment les grands modèles de langage fonctionnent vraiment, mécanisme par mécanisme, d'une façon qu'un lecteur général curieux peut suivre mais qu'un ingénieur respecterait quand même.
La plupart des introductions aux LLM tombent dans l'un de deux camps. Soit ce sont des récits marketing qui pointent vaguement vers la « magie de l'IA » sans rien vous apprendre d'utile, soit ce sont des articles de recherche qui vous lancent de l'algèbre matricielle dans le premier paragraphe. Le premier type vous laisse aussi peu informé qu'au départ. Le second type ne vous aide pas vraiment à raisonner sur la technologie — il vous intimide simplement.
Le livre prend un chemin intermédiaire. Il explique chaque concept important clairement, en conservant la précision technique, tout en restant lisible. L'édition 2026 ajoute des encadrés « En langage simple » tout au long du livre, de sorte que n'importe qui — quel que soit son bagage mathématique — peut suivre le livre entier.
Cette série de douze billets est une tournée quotidienne. Chaque billet présente un chapitre, partage les idées centrales et explique pourquoi j'ai structuré le chapitre comme je l'ai fait. Les billets fonctionnent soit comme une tournée autonome du domaine, soit comme un guide pour décider si le livre lui-même est fait pour vous.
Pour qui c'est
Si vous avez utilisé un chatbot et vous êtes demandé ce qui se passe vraiment en dessous, cette série est pour vous. Si vous êtes ingénieur et voulez une compréhension durable des LLM plutôt qu'une autre fournée d'astuces de prompt, cette série est pour vous. Si vous êtes manager ou dirigeant et devez prendre des décisions sur des outils d'IA que vous n'avez pas construits, cette série est pour vous. Si vous êtes étudiant et cherchez une entrée accessible vers un domaine technique sérieux, cette série est pour vous.
Ce dont vous n'avez pas besoin : un bagage mathématique, un bagage en programmation, ou une exposition préalable à l'apprentissage automatique. Le livre lui-même est écrit sur deux niveaux — un texte principal techniquement soigneux et un encadré en langage simple qui court en parallèle — et cette série penche vers le langage simple.
Les douze chapitres
Partie I — Concepts et fondations
Chapitre 1 — Qu'est-ce qu'un grand modèle de langage ? (18 février) — Ce que les mots « grand », « langage » et « modèle » signifient vraiment, comment nous en sommes arrivés là historiquement, et les trois plus grands mythes sur les LLM qui mènent à de mauvaises décisions.
Chapitre 2 — Probabilité, tokens et texte (19 février) — Comment les LLM convertissent le texte en tokens, pourquoi la modélisation du langage est fondamentalement un problème de probabilité, et comment la prédiction du prochain token devient tout le reste.
Chapitre 3 — Réseaux neuronaux pour le langage (20 février) — Pourquoi les réseaux feedforward ne pouvaient pas gérer le langage, comment les RNN ont buté contre un mur, et ce que l'attention a changé.
Partie II — Comment fonctionnent les LLM
Chapitre 4 — L'architecture Transformer (21 février) — Dans le moteur de l'IA moderne. Self-attention, positional encoding, topologies encodeur/décodeur et lois de mise à l'échelle.
Chapitre 5 — Entraîner de grands modèles (22 février) — D'où viennent les données, ce que fait la fonction de perte, comment fonctionne l'entraînement distribué, et pourquoi entraîner un modèle de frontière coûte des centaines de millions de dollars.
Chapitre 6 — Affinage et adaptation (23 février) — Des astuces de prompt à l'instruction tuning aux méthodes efficaces en paramètres comme LoRA. Et les techniques d'alignement — RLHF et ses successeurs modernes — qui transforment les modèles bruts en assistants utiles.
Chapitre 7 — Au-delà de la prédiction du prochain token (24 février) — Embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales.
Partie III — Perspectives pratiques
Chapitre 8 — Utiliser les LLM dans les applications (25 février) — Chatbots, résumé, génération de code, extraction de connaissances, évaluation et la montée des systèmes agentiques où le modèle pilote une boucle d'utilisation d'outils.
Chapitre 9 — Performance, mise à l'échelle et coûts (26 février) — Taille du modèle versus capacité, le compromis latence-throughput, quantification, déploiement en périphérie, et pourquoi les modèles de frontière sont souvent le mauvais choix même quand vous pouvez vous les permettre.
Chapitre 10 — Sécurité, éthique et confiance (27 février) — Pourquoi les hallucinations se produisent mécaniquement, où vit vraiment le biais, comment fonctionnent les garde-fous en couches, et pourquoi la gouvernance est la couche institutionnelle que les contrôles techniques ne peuvent pas remplacer.
Partie IV — Sujets avancés
Chapitre 11 — Recherche de pointe (28 février) — Mixture-of-experts, mécanismes de recherche et de mémoire, multimodalité native, apprentissage continu et le paradigme du scaling au moment de l'inférence qui a produit les modèles de raisonnement d'aujourd'hui. Le plus grand ajout de contenu de l'édition 2026.
Chapitre 12 — Construire votre propre système LLM (1er mars) — Le chapitre final. Jeux de données et licences, pipelines d'entraînement, cadres d'évaluation, la pile d'applications intégrée et les motifs d'études de cas qui distinguent les déploiements réussis des pilotes échoués.
À propos du livre et de la série
Le livre est LLM Primer I: How Generative AI Works — A Clear and Practical Guide to the Foundations of Large Language Models par Sho Shimoda.
C'est le premier volume de la Série LLM Primer. Les autres volumes vont plus en profondeur sur des sujets spécifiques — retrieval-augmented generation, conception de contexte avec MCP, construction d'applications LLM du monde réel, mise à l'échelle des systèmes d'IA et sécurité de l'IA. Chaque volume tient debout par lui-même, mais ensemble ils couvrent le tableau d'ingénierie complet du travail avec les grands modèles de langage.
Si LLM Primer I vous laisse sur votre faim concernant un sujet spécifique, les volumes compagnons sont la suite logique.