Introduction aux LLM
Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.
Chapitre 9 — Gérer le budget d'attention
Neuvième billet de la tournée du LLM Primer IV. Context rot, la falaise du « lost-in-the-middle », tool-loadout rot, et les trois réponses architecturales — MCP, RAG, affinage — à la question de savoir où la connaissance manquante du modèle appartient vraiment.
2026-04-07Chapitre 8 — Topologies de déploiement architecturales
Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.
2026-04-06LLM Primer IV — Introduction de la série et index
Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.
2026-03-29Chapitre 2 — L'analyse intelligente de documents
Deuxième billet de la tournée du LLM Primer III. Pourquoi un PDF n'est pas un fichier texte, ce que les parseurs sensibles à la mise en page préservent réellement, le paysage actuel des outils (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), et la piste multimodale qui retrouve directement sur les images de pages.
2026-03-19Chapitre 4 — L'architecture Transformer : dans le moteur de l'IA moderne
Chapitre 4 de la série LLM Primer I. Une tournée du bloc Transformer — comment le self-attention, le positional encoding et les couches empilées se combinent pour produire l'architecture sur laquelle est construit chaque LLM moderne. Avec une explication claire de pourquoi le scaling des Transformers fonctionne, et ce qu'il coûte.
2026-02-21Chapitre 3 — Réseaux neuronaux pour le langage : des RNN au self-attention
Chapitre 3 de la série LLM Primer I. Pourquoi les réseaux feedforward ne pouvaient pas gérer le langage, comment les RNN ont buté contre un mur, et ce que l'attention a changé. Une progression conceptuelle nette à travers les trois formes de réseaux neuronaux qui ont défini le NLP moderne — sans l'anxiété mathématique.
2026-02-20Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index
Introduction et index de la tournée en douze parties chapitre par chapitre de LLM Primer I : Comment fonctionne l'IA générative. Un billet par jour, du 18 février au 1er mars 2026. Lisez-les dans l'ordre ou choisissez le chapitre qui vous intéresse le plus. Tous les douze sont listés et liés ici.
2026-02-17La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume
La Série LLM Primer — un guide de terrain en sept volumes sur l'IA générative par Sho Shimoda. Chaque volume couvre une couche distincte du travail avec les grands modèles de langage, des fondations à la mise à l'échelle jusqu'à la sécurité. Voici la page d'accueil : un aperçu de toute la série, plus la tournée chapitre par chapitre en cours des premiers volumes.
2026-02-15