Une tournée chapitre par chapitre de LLM Primer I

Introduction à la série et index de la tournée en douze parties de LLM Primer I: How Generative AI Works — publiée un billet par jour, du 18 février au 1^er mars 2026.

Pourquoi cette série existe

J'ai écrit LLM Primer I pour faire quelque chose que je ne trouvais nulle part ailleurs : expliquer comment les grands modèles de langage fonctionnent vraiment, mécanisme par mécanisme, d'une façon qu'un lecteur général curieux peut suivre mais qu'un ingénieur respecterait quand même.

La plupart des introductions aux LLM tombent dans l'un de deux camps. Soit ce sont des récits marketing qui pointent vaguement vers la « magie de l'IA » sans rien vous apprendre d'utile, soit ce sont des articles de recherche qui vous lancent de l'algèbre matricielle dans le premier paragraphe. Le premier type vous laisse aussi peu informé qu'au départ. Le second type ne vous aide pas vraiment à raisonner sur la technologie — il vous intimide simplement.

Le livre prend un chemin intermédiaire. Il explique chaque concept important clairement, en conservant la précision technique, tout en restant lisible. L'édition 2026 ajoute des encadrés « En langage simple » tout au long du livre, de sorte que n'importe qui — quel que soit son bagage mathématique — peut suivre le livre entier.

Cette série de douze billets est une tournée quotidienne. Chaque billet présente un chapitre, partage les idées centrales et explique pourquoi j'ai structuré le chapitre comme je l'ai fait. Les billets fonctionnent soit comme une tournée autonome du domaine, soit comme un guide pour décider si le livre lui-même est fait pour vous.

Comment lire cette série : Chaque billet est autonome. Vous pouvez les lire dans l'ordre pour une visite guidée, ou choisir le chapitre qui vous concerne le plus pour ce que vous essayez de comprendre. Chaque billet renvoie ici.

Pour qui c'est

Si vous avez utilisé un chatbot et vous êtes demandé ce qui se passe vraiment en dessous, cette série est pour vous. Si vous êtes ingénieur et voulez une compréhension durable des LLM plutôt qu'une autre fournée d'astuces de prompt, cette série est pour vous. Si vous êtes manager ou dirigeant et devez prendre des décisions sur des outils d'IA que vous n'avez pas construits, cette série est pour vous. Si vous êtes étudiant et cherchez une entrée accessible vers un domaine technique sérieux, cette série est pour vous.

Ce dont vous n'avez pas besoin : un bagage mathématique, un bagage en programmation, ou une exposition préalable à l'apprentissage automatique. Le livre lui-même est écrit sur deux niveaux — un texte principal techniquement soigneux et un encadré en langage simple qui court en parallèle — et cette série penche vers le langage simple.

Les douze chapitres

Partie I — Concepts et fondations

Chapitre 1 — Qu'est-ce qu'un grand modèle de langage ? (18 février) — Ce que les mots « grand », « langage » et « modèle » signifient vraiment, comment nous en sommes arrivés là historiquement, et les trois plus grands mythes sur les LLM qui mènent à de mauvaises décisions.

Chapitre 2 — Probabilité, tokens et texte (19 février) — Comment les LLM convertissent le texte en tokens, pourquoi la modélisation du langage est fondamentalement un problème de probabilité, et comment la prédiction du prochain token devient tout le reste.

Chapitre 3 — Réseaux neuronaux pour le langage (20 février) — Pourquoi les réseaux feedforward ne pouvaient pas gérer le langage, comment les RNN ont buté contre un mur, et ce que l'attention a changé.

Partie II — Comment fonctionnent les LLM

Chapitre 4 — L'architecture Transformer (21 février) — Dans le moteur de l'IA moderne. Self-attention, positional encoding, topologies encodeur/décodeur et lois de mise à l'échelle.

Chapitre 5 — Entraîner de grands modèles (22 février) — D'où viennent les données, ce que fait la fonction de perte, comment fonctionne l'entraînement distribué, et pourquoi entraîner un modèle de frontière coûte des centaines de millions de dollars.

Chapitre 6 — Affinage et adaptation (23 février) — Des astuces de prompt à l'instruction tuning aux méthodes efficaces en paramètres comme LoRA. Et les techniques d'alignement — RLHF et ses successeurs modernes — qui transforment les modèles bruts en assistants utiles.

Chapitre 7 — Au-delà de la prédiction du prochain token (24 février) — Embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales.

Partie III — Perspectives pratiques

Chapitre 8 — Utiliser les LLM dans les applications (25 février) — Chatbots, résumé, génération de code, extraction de connaissances, évaluation et la montée des systèmes agentiques où le modèle pilote une boucle d'utilisation d'outils.

Chapitre 9 — Performance, mise à l'échelle et coûts (26 février) — Taille du modèle versus capacité, le compromis latence-throughput, quantification, déploiement en périphérie, et pourquoi les modèles de frontière sont souvent le mauvais choix même quand vous pouvez vous les permettre.

Chapitre 10 — Sécurité, éthique et confiance (27 février) — Pourquoi les hallucinations se produisent mécaniquement, où vit vraiment le biais, comment fonctionnent les garde-fous en couches, et pourquoi la gouvernance est la couche institutionnelle que les contrôles techniques ne peuvent pas remplacer.

Partie IV — Sujets avancés

Chapitre 11 — Recherche de pointe (28 février) — Mixture-of-experts, mécanismes de recherche et de mémoire, multimodalité native, apprentissage continu et le paradigme du scaling au moment de l'inférence qui a produit les modèles de raisonnement d'aujourd'hui. Le plus grand ajout de contenu de l'édition 2026.

Chapitre 12 — Construire votre propre système LLM (1^er mars) — Le chapitre final. Jeux de données et licences, pipelines d'entraînement, cadres d'évaluation, la pile d'applications intégrée et les motifs d'études de cas qui distinguent les déploiements réussis des pilotes échoués.

Nouveautés de l'édition 2026 : Le livre a été substantiellement révisé pour 2026. De nouvelles sections couvrent l'alignement et l'optimisation des préférences (Chapitre 6.6), les schémas agentiques et d'utilisation d'outils (Chapitre 8.6) et le scaling au moment de l'inférence et les modèles de raisonnement (Chapitre 11.6). Le traitement du mixture-of-experts au Chapitre 11 est repositionné de la recherche à la réalité de production. Les exemples de fenêtre de contexte sont mis à jour pour les modèles de frontière actuels. Et tout au long du livre, les nouveaux encadrés « En langage simple » rendent chaque section accessible aux lecteurs généralistes.

À propos du livre et de la série

Le livre est LLM Primer I: How Generative AI Works — A Clear and Practical Guide to the Foundations of Large Language Models par Sho Shimoda.

C'est le premier volume de la Série LLM Primer. Les autres volumes vont plus en profondeur sur des sujets spécifiques — retrieval-augmented generation, conception de contexte avec MCP, construction d'applications LLM du monde réel, mise à l'échelle des systèmes d'IA et sécurité de l'IA. Chaque volume tient debout par lui-même, mais ensemble ils couvrent le tableau d'ingénierie complet du travail avec les grands modèles de langage.

Si LLM Primer I vous laisse sur votre faim concernant un sujet spécifique, les volumes compagnons sont la suite logique.

Prêt à lire le livre ? Douze chapitres, entièrement révisés pour 2026, avec diagrammes, encadrés en langage simple, exemples de code et un traitement complet de la façon dont l'IA générative fonctionne vraiment. Procurez-vous LLM Primer I sur Amazon →

Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index