Introduction aux LLM

Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.


Total de 25 articles disponibles. | Actuellement à la page 1 de 1.

Chapitre 14 — Benchmarking, tests et performance

Quinzième et dernier billet de la tournée du LLM Primer IV. Le MCP-Universe Benchmark sur de vrais serveurs, les deux modes de défaillance systémiques qu'il a exposés, l'écart de débit dix-pour-un entre session-par-requête et pools de sessions partagées, et le pont vers le Volume V.

2026-04-12

Chapitre 13 — Frameworks et intégration cloud

Treizième billet de la tournée du LLM Primer IV. Strands avec Bedrock, le patron de couche d'état AWS, le Microsoft Agent Framework, LangChain, Semantic Kernel — et les trois formes d'intégration de production sur lesquelles les équipes convergent indépendamment.

2026-04-11

Chapitre 12 — Durcissement du protocole et défenses

Douzième billet de la tournée du LLM Primer IV. Les quatre clusters de défenses — attestation cryptographique, discipline de scopes OAuth avec sessions bornées, sandboxing à l'exécution, et portes human-in-the-loop — se composent en une posture qui ne dépend pas du modèle qui se comporterait correctement sous conditions adversariales.

2026-04-10

Chapitre 11 — Surfaces d'attaque et vulnérabilités du protocole

Onzième billet de la tournée du LLM Primer IV. Les attaques classiques adaptées à MCP — Confused Deputy, Token Passthrough, Session Hijacking — les défauts au niveau protocole autour de l'escalade de capacités et du sampling non authentifié, et la propagation implicite de confiance qui fait de l'empoisonnement de contexte un problème structurel plutôt qu'une affaire d'hygiène.

2026-04-09

Chapitre 10 — Mémoire de tâche à long horizon

Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.

2026-04-08

Chapitre 9 — Gérer le budget d'attention

Neuvième billet de la tournée du LLM Primer IV. Context rot, la falaise du « lost-in-the-middle », tool-loadout rot, et les trois réponses architecturales — MCP, RAG, affinage — à la question de savoir où la connaissance manquante du modèle appartient vraiment.

2026-04-07

Chapitre 8 — Topologies de déploiement architecturales

Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.

2026-04-06

Chapitre 7 — Patrons collaboratifs et dynamiques avancés

Septième billet de la tournée du LLM Primer IV. Consensus en table ronde, routage par handoff, orchestration magentique — les patrons qui émergent quand la topologie doit être bâtie par requête, avec les modes de défaillance (non-terminaison, mauvais routage, planification emballée) que les patrons plus simples évitent.

2026-04-05

Chapitre 6 — Stratégies d'orchestration fondamentales

Sixième billet de la tournée du LLM Primer IV. Les deux formes fondatrices d'orchestration — pipelines séquentiels et scatter-gather concurrent — et la question préalable que toute équipe devrait poser : un système multi-agents est-il bien la bonne réponse ?

2026-04-04

Chapitre 4 — Primitives du client : comportements agentiques et contrôle

Quatrième billet de la tournée du LLM Primer IV. Sampling, Roots et Elicitation sont les trois petits trous contrôlés que MCP perce dans le mur entre l'hôte et le serveur — chacun une capacité concédée en retour, chacun un risque accepté au nom de l'utilisateur.

2026-04-02

Chapitre 3 — Primitives du serveur : exposer le contexte et les capacités

Troisième billet de la tournée du LLM Primer IV. Les trois noms qu'un serveur MCP peut offrir — Ressources (lecture d'état), Prompts (échafaudage réutilisable), Outils (actions d'écriture) — leurs schémas, leurs cycles de vie, leurs modèles d'erreur, et la discipline de choisir la bonne primitive.

2026-04-01

Chapitre 2 — Dévoiler le Model Context Protocol (MCP)

Deuxième billet de la tournée du LLM Primer IV. Ce que MCP standardise réellement, le découpage en trois rôles Hôte, Client, Serveur, pourquoi la découverte dynamique et la messagerie bidirectionnelle diffèrent de REST dans les cas qui comptent, et le cycle de vie d'une session qui s'ouvre par une négociation des capacités.

2026-03-31

Chapitre 1 — La crise d'intégration de l'IA et l'essor de l'architecture agentique

Premier billet de la tournée du LLM Primer IV. Pourquoi les agents monolithiques s'effilochent à mesure que les prompts système grossissent, le problème d'intégration N fois M qui se cache en dessous, et le passage de l'ingénierie de prompt à l'ingénierie de contexte que MCP a été conçu pour rendre possible.

2026-03-30

LLM Primer IV — Introduction de la série et index

Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.

2026-03-29

Chapitre 11 — Mises à jour continues et optimisation du pipeline

Onzième et dernier billet de la tournée du LLM Primer III. CDC et indexation incrémentale gardent le corpus frais, cache sémantique et tiering de modèles maintiennent la latence basse, et une boucle de feedback en quatre étapes ferme l'écart entre ce que la production dit à l'équipe et ce que l'équipe change effectivement — plus un pont vers le Volume IV sur le Model Context Protocol.

2026-03-28

Chapitre 10 — Les frameworks d'évaluation de référence

Dixième billet de la tournée du LLM Primer III. Un guide de terrain des frameworks qui transforment la triade d'évaluation en quelque chose qu'une équipe peut faire tourner — RAGAS, TruLens, DeepEval d'un côté, Braintrust, LangSmith, Phoenix, Galileo, Opik de l'autre, et l'écart d'évaluation qu'aucun d'eux n'a encore comblé.

2026-03-27

Chapitre 6 — Modèles de menaces et vulnérabilités RAG

Sixième billet de la tournée du LLM Primer III. La surface d'attaque élargie de la recherche — empoisonnement de corpus, morceaux adversariaux, injection de prompt indirecte, inversion d'embedding, et le problème du deputy confus en RAG agentique. Attaques concrètes, chacune démontrée, chacune reproductible.

2026-03-23

Chapitre 4 — Choisir la bonne base vectorielle

Quatrième billet de la tournée du LLM Primer III. La séparation architecturale entre bases vectorielles dédiées et extensions de type Postgres, les leaders managés (Pinecone, Vertex), le terrain open source (Qdrant, Milvus, Weaviate), les options embarquées, et les trois axes opérationnels — résidence, exploitation, coût — qui décident du vrai choix.

2026-03-21

Chapitre 2 — L'analyse intelligente de documents

Deuxième billet de la tournée du LLM Primer III. Pourquoi un PDF n'est pas un fichier texte, ce que les parseurs sensibles à la mise en page préservent réellement, le paysage actuel des outils (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), et la piste multimodale qui retrouve directement sur les images de pages.

2026-03-19

Chapitre 11 — Évaluation, Calibration et Inférence

Chapitre 11 de la série LLM Primer II. Le chapitre où l'on demande comment quiconque peut mesurer une machine capable de dire n'importe quoi — et où l'on découvre qu'un modèle confiant est souvent un modèle mal calibré. Perplexité, calibration, barres d'erreur des benchmarks, et la géométrie de la recherche pour contrôler les hallucinations.

2026-03-13

Chapitre 12 — Construire votre propre système LLM : des jeux de données à la production

Chapitre 12 de la série LLM Primer I. Le chapitre final. Ce qu'il faut vraiment pour construire un système alimenté par LLM de bout en bout — licences de jeux de données, pipelines d'entraînement, cadres d'évaluation, la pile d'applications intégrée et les motifs d'études de cas qui distinguent les déploiements réussis des pilotes échoués.

2026-03-01

Chapitre 7 — Au-delà de la prédiction du prochain token : embeddings, recherche et multimodalité

Chapitre 7 de la série LLM Primer I. Les capacités qui transforment un prédicteur du prochain token en bien plus — embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales. Comment RAG garde réellement un LLM ancré dans de vrais documents au lieu d'inventer.

2026-02-24

Chapitre 5 — Entraîner de grands modèles : ce qu'il faut vraiment pour un modèle de frontière

Chapitre 5 de la série LLM Primer I. Comment les LLM de frontière sont vraiment entraînés — le pipeline de données, la fonction de perte, les mois de temps GPU, et pourquoi l'« entraînement » est aujourd'hui un problème d'ingénierie à échelle industrielle plus qu'un problème de recherche. Démystifie ce que paient ces runs d'entraînement à cent millions de dollars.

2026-02-22

Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index

Introduction et index de la tournée en douze parties chapitre par chapitre de LLM Primer I : Comment fonctionne l'IA générative. Un billet par jour, du 18 février au 1er mars 2026. Lisez-les dans l'ordre ou choisissez le chapitre qui vous intéresse le plus. Tous les douze sont listés et liés ici.

2026-02-17

La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

La Série LLM Primer — un guide de terrain en sept volumes sur l'IA générative par Sho Shimoda. Chaque volume couvre une couche distincte du travail avec les grands modèles de langage, des fondations à la mise à l'échelle jusqu'à la sécurité. Voici la page d'accueil : un aperçu de toute la série, plus la tournée chapitre par chapitre en cours des premiers volumes.

2026-02-15