Introduction aux LLM

Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.


Total de 11 articles disponibles. | Actuellement à la page 1 de 1.

Chapitre 2 — Dévoiler le Model Context Protocol (MCP)

Deuxième billet de la tournée du LLM Primer IV. Ce que MCP standardise réellement, le découpage en trois rôles Hôte, Client, Serveur, pourquoi la découverte dynamique et la messagerie bidirectionnelle diffèrent de REST dans les cas qui comptent, et le cycle de vie d'une session qui s'ouvre par une négociation des capacités.

2026-03-31

Chapitre 8 — Anonymisation des données dans la chaîne RAG

Huitième billet de la tournée du LLM Primer III. Anonymisation pré-génération contre post-génération, les trois familles de techniques — masquage, remplacement synthétique, confidentialité différentielle — et le compromis utilité-confidentialité qui détermine si le système reste utile.

2026-03-25

Chapitre 7 — Implémenter le contrôle d'accès

Septième billet de la tournée du LLM Primer III. ACL au niveau document comme fondation, RBAC avec les étiquettes de sensibilité Microsoft Purview, ReBAC avec Zanzibar et SpiceDB, et la discipline pré-filtre contre post-filtre qui tourne sous tous.

2026-03-24

Chapitre 6 — Modèles de menaces et vulnérabilités RAG

Sixième billet de la tournée du LLM Primer III. La surface d'attaque élargie de la recherche — empoisonnement de corpus, morceaux adversariaux, injection de prompt indirecte, inversion d'embedding, et le problème du deputy confus en RAG agentique. Attaques concrètes, chacune démontrée, chacune reproductible.

2026-03-23

Chapitre 1 — L'évolution de l'architecture RAG

Premier billet de la tournée du LLM Primer III. Les quatre postures architecturales de RAG — Naïve, Avancée, Modulaire, Agentique — se lisent comme l'histoire de l'agentivité progressivement confiée au LLM, et la réponse honnête à la question de savoir quand l'affinage est le meilleur outil plutôt que la recherche.

2026-03-18

Chapitre 11 — Évaluation, Calibration et Inférence

Chapitre 11 de la série LLM Primer II. Le chapitre où l'on demande comment quiconque peut mesurer une machine capable de dire n'importe quoi — et où l'on découvre qu'un modèle confiant est souvent un modèle mal calibré. Perplexité, calibration, barres d'erreur des benchmarks, et la géométrie de la recherche pour contrôler les hallucinations.

2026-03-13

Chapitre 10 — Mathématiques du Post-Entraînement et de l'Alignement

Chapitre 10 de la série LLM Primer II. Le chapitre où un prédicteur du prochain mot brillant mais sauvage est civilisé en assistant utile — affinage supervisé, modélisation de la récompense, RLHF tenu en laisse par KL, et la dérivation élégante de DPO qui fait disparaître tout le pipeline de RL.

2026-03-12

Chapitre 10 — Sécurité, éthique et confiance : au-delà du marketing

Chapitre 10 de la série LLM Primer I. L'image honnête de la sécurité des LLM — pourquoi les hallucinations se produisent mécaniquement, où vit vraiment le biais, comment fonctionnent les garde-fous en couches, et pourquoi la gouvernance est la couche institutionnelle que les contrôles techniques ne peuvent pas remplacer. Pour les praticiens qui doivent livrer en toute sécurité.

2026-02-27

Chapitre 6 — Affinage et adaptation : du modèle brut à l'assistant utile

Chapitre 6 de la série LLM Primer I. La pile complète d'adaptation — du pilotage bon marché basé sur les prompts à l'affinage efficace en paramètres jusqu'à l'alignement complet avec RLHF et ses successeurs modernes comme DPO. Pourquoi le post-entraînement est désormais là où se différencient vraiment les API de modèles fermés.

2026-02-23

Chapitre 5 — Entraîner de grands modèles : ce qu'il faut vraiment pour un modèle de frontière

Chapitre 5 de la série LLM Primer I. Comment les LLM de frontière sont vraiment entraînés — le pipeline de données, la fonction de perte, les mois de temps GPU, et pourquoi l'« entraînement » est aujourd'hui un problème d'ingénierie à échelle industrielle plus qu'un problème de recherche. Démystifie ce que paient ces runs d'entraînement à cent millions de dollars.

2026-02-22

La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

La Série LLM Primer — un guide de terrain en sept volumes sur l'IA générative par Sho Shimoda. Chaque volume couvre une couche distincte du travail avec les grands modèles de langage, des fondations à la mise à l'échelle jusqu'à la sécurité. Voici la page d'accueil : un aperçu de toute la série, plus la tournée chapitre par chapitre en cours des premiers volumes.

2026-02-15