Introduction aux LLM
Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.
Chapitre 12 — Durcissement du protocole et défenses
Douzième billet de la tournée du LLM Primer IV. Les quatre clusters de défenses — attestation cryptographique, discipline de scopes OAuth avec sessions bornées, sandboxing à l'exécution, et portes human-in-the-loop — se composent en une posture qui ne dépend pas du modèle qui se comporterait correctement sous conditions adversariales.
2026-04-10Chapitre 10 — Mémoire de tâche à long horizon
Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.
2026-04-08Chapitre 8 — Topologies de déploiement architecturales
Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.
2026-04-06Chapitre 7 — Patrons collaboratifs et dynamiques avancés
Septième billet de la tournée du LLM Primer IV. Consensus en table ronde, routage par handoff, orchestration magentique — les patrons qui émergent quand la topologie doit être bâtie par requête, avec les modes de défaillance (non-terminaison, mauvais routage, planification emballée) que les patrons plus simples évitent.
2026-04-05Chapitre 6 — Stratégies d'orchestration fondamentales
Sixième billet de la tournée du LLM Primer IV. Les deux formes fondatrices d'orchestration — pipelines séquentiels et scatter-gather concurrent — et la question préalable que toute équipe devrait poser : un système multi-agents est-il bien la bonne réponse ?
2026-04-04Chapitre 4 — Primitives du client : comportements agentiques et contrôle
Quatrième billet de la tournée du LLM Primer IV. Sampling, Roots et Elicitation sont les trois petits trous contrôlés que MCP perce dans le mur entre l'hôte et le serveur — chacun une capacité concédée en retour, chacun un risque accepté au nom de l'utilisateur.
2026-04-02Chapitre 2 — Dévoiler le Model Context Protocol (MCP)
Deuxième billet de la tournée du LLM Primer IV. Ce que MCP standardise réellement, le découpage en trois rôles Hôte, Client, Serveur, pourquoi la découverte dynamique et la messagerie bidirectionnelle diffèrent de REST dans les cas qui comptent, et le cycle de vie d'une session qui s'ouvre par une négociation des capacités.
2026-03-31Chapitre 1 — La crise d'intégration de l'IA et l'essor de l'architecture agentique
Premier billet de la tournée du LLM Primer IV. Pourquoi les agents monolithiques s'effilochent à mesure que les prompts système grossissent, le problème d'intégration N fois M qui se cache en dessous, et le passage de l'ingénierie de prompt à l'ingénierie de contexte que MCP a été conçu pour rendre possible.
2026-03-30LLM Primer IV — Introduction de la série et index
Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.
2026-03-29Chapitre 11 — Mises à jour continues et optimisation du pipeline
Onzième et dernier billet de la tournée du LLM Primer III. CDC et indexation incrémentale gardent le corpus frais, cache sémantique et tiering de modèles maintiennent la latence basse, et une boucle de feedback en quatre étapes ferme l'écart entre ce que la production dit à l'équipe et ce que l'équipe change effectivement — plus un pont vers le Volume IV sur le Model Context Protocol.
2026-03-28Chapitre 8 — Anonymisation des données dans la chaîne RAG
Huitième billet de la tournée du LLM Primer III. Anonymisation pré-génération contre post-génération, les trois familles de techniques — masquage, remplacement synthétique, confidentialité différentielle — et le compromis utilité-confidentialité qui détermine si le système reste utile.
2026-03-25Chapitre 2 — L'analyse intelligente de documents
Deuxième billet de la tournée du LLM Primer III. Pourquoi un PDF n'est pas un fichier texte, ce que les parseurs sensibles à la mise en page préservent réellement, le paysage actuel des outils (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), et la piste multimodale qui retrouve directement sur les images de pages.
2026-03-19LLM Primer III — Améliorer l'IA d'entreprise avec RAG : présentation de la série et sommaire
Lancement de la tournée chapitre par chapitre du Livre III de la série LLM Primer — Améliorer l'IA d'entreprise avec RAG. Pourquoi la génération augmentée par la recherche semble simple vue de l'extérieur et constitue, en réalité, un empilement de disciplines, à qui ce livre s'adresse, et le calendrier des onze billets qui suivent, du 18 au 28 mars.
2026-03-17Chapitre 11 — Évaluation, Calibration et Inférence
Chapitre 11 de la série LLM Primer II. Le chapitre où l'on demande comment quiconque peut mesurer une machine capable de dire n'importe quoi — et où l'on découvre qu'un modèle confiant est souvent un modèle mal calibré. Perplexité, calibration, barres d'erreur des benchmarks, et la géométrie de la recherche pour contrôler les hallucinations.
2026-03-13Chapitre 10 — Mathématiques du Post-Entraînement et de l'Alignement
Chapitre 10 de la série LLM Primer II. Le chapitre où un prédicteur du prochain mot brillant mais sauvage est civilisé en assistant utile — affinage supervisé, modélisation de la récompense, RLHF tenu en laisse par KL, et la dérivation élégante de DPO qui fait disparaître tout le pipeline de RL.
2026-03-12Chapitre 12 — Construire votre propre système LLM : des jeux de données à la production
Chapitre 12 de la série LLM Primer I. Le chapitre final. Ce qu'il faut vraiment pour construire un système alimenté par LLM de bout en bout — licences de jeux de données, pipelines d'entraînement, cadres d'évaluation, la pile d'applications intégrée et les motifs d'études de cas qui distinguent les déploiements réussis des pilotes échoués.
2026-03-01Chapitre 11 — Recherche de pointe : MoE, modèles de raisonnement et le nouvel axe de mise à l'échelle
Chapitre 11 de la série LLM Primer I. Les frontières de recherche qui sont désormais réalité de production — mixture-of-experts, mémoire augmentée par recherche, tokenisation multimodale native, apprentissage continu et le paradigme de scaling au moment de l'inférence qui a produit les modèles de raisonnement d'aujourd'hui. Le plus grand ajout de contenu de l'édition 2026.
2026-02-28Chapitre 9 — Performance, mise à l'échelle et coûts : les vrais compromis d'ingénierie
Chapitre 9 de la série LLM Primer I. Les réalités opérationnelles de faire tourner les LLM à l'échelle — taille du modèle vs capacité, le compromis latence-throughput, économie des coûts, quantification et déploiement edge. Pourquoi les modèles de frontière sont souvent le mauvais choix même quand vous pouvez vous les permettre.
2026-02-26Chapitre 7 — Au-delà de la prédiction du prochain token : embeddings, recherche et multimodalité
Chapitre 7 de la série LLM Primer I. Les capacités qui transforment un prédicteur du prochain token en bien plus — embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales. Comment RAG garde réellement un LLM ancré dans de vrais documents au lieu d'inventer.
2026-02-24Chapitre 6 — Affinage et adaptation : du modèle brut à l'assistant utile
Chapitre 6 de la série LLM Primer I. La pile complète d'adaptation — du pilotage bon marché basé sur les prompts à l'affinage efficace en paramètres jusqu'à l'alignement complet avec RLHF et ses successeurs modernes comme DPO. Pourquoi le post-entraînement est désormais là où se différencient vraiment les API de modèles fermés.
2026-02-23Chapitre 5 — Entraîner de grands modèles : ce qu'il faut vraiment pour un modèle de frontière
Chapitre 5 de la série LLM Primer I. Comment les LLM de frontière sont vraiment entraînés — le pipeline de données, la fonction de perte, les mois de temps GPU, et pourquoi l'« entraînement » est aujourd'hui un problème d'ingénierie à échelle industrielle plus qu'un problème de recherche. Démystifie ce que paient ces runs d'entraînement à cent millions de dollars.
2026-02-22Chapitre 4 — L'architecture Transformer : dans le moteur de l'IA moderne
Chapitre 4 de la série LLM Primer I. Une tournée du bloc Transformer — comment le self-attention, le positional encoding et les couches empilées se combinent pour produire l'architecture sur laquelle est construit chaque LLM moderne. Avec une explication claire de pourquoi le scaling des Transformers fonctionne, et ce qu'il coûte.
2026-02-21Chapitre 3 — Réseaux neuronaux pour le langage : des RNN au self-attention
Chapitre 3 de la série LLM Primer I. Pourquoi les réseaux feedforward ne pouvaient pas gérer le langage, comment les RNN ont buté contre un mur, et ce que l'attention a changé. Une progression conceptuelle nette à travers les trois formes de réseaux neuronaux qui ont défini le NLP moderne — sans l'anxiété mathématique.
2026-02-20Chapitre 2 — Probabilité, tokens et texte : le jeu de la devinette du mot suivant
Chapitre 2 de la série LLM Primer I. Comment les LLM convertissent le texte en tokens, pourquoi la modélisation du langage est fondamentalement un problème de probabilité, et comment l'ancienne approche par n-grammes a cédé la place à des modèles neuronaux capables de généraliser. Avec des explications en langage simple sur la perplexité et pourquoi les frontières de tokens comptent.
2026-02-19Chapitre 1 — Qu'est-ce qu'un grand modèle de langage ? (Au-delà des gros titres)
Chapitre 1 de la série LLM Primer I. Nous démêlons ce que « grand », « langage » et « modèle » veulent vraiment dire, parcourons le passage des systèmes à base de règles aux réseaux neuronaux, et abordons les trois plus grandes idées fausses sur le fonctionnement des LLM modernes. Une base claire et accessible pour tout ce qui suit.
2026-02-18Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index
Introduction et index de la tournée en douze parties chapitre par chapitre de LLM Primer I : Comment fonctionne l'IA générative. Un billet par jour, du 18 février au 1er mars 2026. Lisez-les dans l'ordre ou choisissez le chapitre qui vous intéresse le plus. Tous les douze sont listés et liés ici.
2026-02-17La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume
La Série LLM Primer — un guide de terrain en sept volumes sur l'IA générative par Sho Shimoda. Chaque volume couvre une couche distincte du travail avec les grands modèles de langage, des fondations à la mise à l'échelle jusqu'à la sécurité. Voici la page d'accueil : un aperçu de toute la série, plus la tournée chapitre par chapitre en cours des premiers volumes.
2026-02-15