Introduction aux LLM

Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.


Total de 17 articles disponibles. | Actuellement à la page 1 de 1.

Chapitre 10 — Mémoire de tâche à long horizon

Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.

2026-04-08

Chapitre 8 — Topologies de déploiement architecturales

Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.

2026-04-06

Chapitre 4 — Primitives du client : comportements agentiques et contrôle

Quatrième billet de la tournée du LLM Primer IV. Sampling, Roots et Elicitation sont les trois petits trous contrôlés que MCP perce dans le mur entre l'hôte et le serveur — chacun une capacité concédée en retour, chacun un risque accepté au nom de l'utilisateur.

2026-04-02

Chapitre 1 — La crise d'intégration de l'IA et l'essor de l'architecture agentique

Premier billet de la tournée du LLM Primer IV. Pourquoi les agents monolithiques s'effilochent à mesure que les prompts système grossissent, le problème d'intégration N fois M qui se cache en dessous, et le passage de l'ingénierie de prompt à l'ingénierie de contexte que MCP a été conçu pour rendre possible.

2026-03-30

LLM Primer IV — Introduction de la série et index

Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.

2026-03-29

Chapitre 6 — Modèles de menaces et vulnérabilités RAG

Sixième billet de la tournée du LLM Primer III. La surface d'attaque élargie de la recherche — empoisonnement de corpus, morceaux adversariaux, injection de prompt indirecte, inversion d'embedding, et le problème du deputy confus en RAG agentique. Attaques concrètes, chacune démontrée, chacune reproductible.

2026-03-23

Chapitre 5 — Architecturer la chaîne de recherche

Cinquième billet de la tournée du LLM Primer III. Pourquoi une seule recherche vectorielle n'est pas une chaîne — recherche hybride, fusion de rangs réciproques, reranking par cross-encoder, et réécriture côté requête plus HyDE — assemblés dans l'architecture de production sur laquelle les systèmes RAG mûrs convergent.

2026-03-22

Chapitre 4 — Choisir la bonne base vectorielle

Quatrième billet de la tournée du LLM Primer III. La séparation architecturale entre bases vectorielles dédiées et extensions de type Postgres, les leaders managés (Pinecone, Vertex), le terrain open source (Qdrant, Milvus, Weaviate), les options embarquées, et les trois axes opérationnels — résidence, exploitation, coût — qui décident du vrai choix.

2026-03-21

Chapitre 1 — L'évolution de l'architecture RAG

Premier billet de la tournée du LLM Primer III. Les quatre postures architecturales de RAG — Naïve, Avancée, Modulaire, Agentique — se lisent comme l'histoire de l'agentivité progressivement confiée au LLM, et la réponse honnête à la question de savoir quand l'affinage est le meilleur outil plutôt que la recherche.

2026-03-18

LLM Primer III — Améliorer l'IA d'entreprise avec RAG : présentation de la série et sommaire

Lancement de la tournée chapitre par chapitre du Livre III de la série LLM Primer — Améliorer l'IA d'entreprise avec RAG. Pourquoi la génération augmentée par la recherche semble simple vue de l'extérieur et constitue, en réalité, un empilement de disciplines, à qui ce livre s'adresse, et le calendrier des onze billets qui suivent, du 18 au 28 mars.

2026-03-17

Chapitre 12 — Construire votre propre système LLM : des jeux de données à la production

Chapitre 12 de la série LLM Primer I. Le chapitre final. Ce qu'il faut vraiment pour construire un système alimenté par LLM de bout en bout — licences de jeux de données, pipelines d'entraînement, cadres d'évaluation, la pile d'applications intégrée et les motifs d'études de cas qui distinguent les déploiements réussis des pilotes échoués.

2026-03-01

Chapitre 11 — Recherche de pointe : MoE, modèles de raisonnement et le nouvel axe de mise à l'échelle

Chapitre 11 de la série LLM Primer I. Les frontières de recherche qui sont désormais réalité de production — mixture-of-experts, mémoire augmentée par recherche, tokenisation multimodale native, apprentissage continu et le paradigme de scaling au moment de l'inférence qui a produit les modèles de raisonnement d'aujourd'hui. Le plus grand ajout de contenu de l'édition 2026.

2026-02-28

Chapitre 9 — Performance, mise à l'échelle et coûts : les vrais compromis d'ingénierie

Chapitre 9 de la série LLM Primer I. Les réalités opérationnelles de faire tourner les LLM à l'échelle — taille du modèle vs capacité, le compromis latence-throughput, économie des coûts, quantification et déploiement edge. Pourquoi les modèles de frontière sont souvent le mauvais choix même quand vous pouvez vous les permettre.

2026-02-26

Chapitre 8 — Utiliser les LLM dans les applications : chatbots, code, extraction et agents

Chapitre 8 de la série LLM Primer I. Les motifs d'application qui sortent vraiment en production — chatbots, résumé, assistants de code, extraction structurée et la montée des systèmes agentiques où le modèle pilote une boucle d'utilisation d'outils. Plus les benchmarks que chaque ingénieur devrait reconnaître par leur nom.

2026-02-25

Chapitre 5 — Entraîner de grands modèles : ce qu'il faut vraiment pour un modèle de frontière

Chapitre 5 de la série LLM Primer I. Comment les LLM de frontière sont vraiment entraînés — le pipeline de données, la fonction de perte, les mois de temps GPU, et pourquoi l'« entraînement » est aujourd'hui un problème d'ingénierie à échelle industrielle plus qu'un problème de recherche. Démystifie ce que paient ces runs d'entraînement à cent millions de dollars.

2026-02-22

Chapitre 4 — L'architecture Transformer : dans le moteur de l'IA moderne

Chapitre 4 de la série LLM Primer I. Une tournée du bloc Transformer — comment le self-attention, le positional encoding et les couches empilées se combinent pour produire l'architecture sur laquelle est construit chaque LLM moderne. Avec une explication claire de pourquoi le scaling des Transformers fonctionne, et ce qu'il coûte.

2026-02-21

La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

La Série LLM Primer — un guide de terrain en sept volumes sur l'IA générative par Sho Shimoda. Chaque volume couvre une couche distincte du travail avec les grands modèles de langage, des fondations à la mise à l'échelle jusqu'à la sécurité. Voici la page d'accueil : un aperçu de toute la série, plus la tournée chapitre par chapitre en cours des premiers volumes.

2026-02-15