Introduction aux LLM
Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.
Chapitre 14 — Benchmarking, tests et performance
Quinzième et dernier billet de la tournée du LLM Primer IV. Le MCP-Universe Benchmark sur de vrais serveurs, les deux modes de défaillance systémiques qu'il a exposés, l'écart de débit dix-pour-un entre session-par-requête et pools de sessions partagées, et le pont vers le Volume V.
2026-04-12Chapitre 13 — Frameworks et intégration cloud
Treizième billet de la tournée du LLM Primer IV. Strands avec Bedrock, le patron de couche d'état AWS, le Microsoft Agent Framework, LangChain, Semantic Kernel — et les trois formes d'intégration de production sur lesquelles les équipes convergent indépendamment.
2026-04-11Chapitre 10 — Mémoire de tâche à long horizon
Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.
2026-04-08Chapitre 8 — Topologies de déploiement architecturales
Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.
2026-04-06LLM Primer IV — Introduction de la série et index
Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.
2026-03-29Chapitre 11 — Mises à jour continues et optimisation du pipeline
Onzième et dernier billet de la tournée du LLM Primer III. CDC et indexation incrémentale gardent le corpus frais, cache sémantique et tiering de modèles maintiennent la latence basse, et une boucle de feedback en quatre étapes ferme l'écart entre ce que la production dit à l'équipe et ce que l'équipe change effectivement — plus un pont vers le Volume IV sur le Model Context Protocol.
2026-03-28Chapitre 10 — Les frameworks d'évaluation de référence
Dixième billet de la tournée du LLM Primer III. Un guide de terrain des frameworks qui transforment la triade d'évaluation en quelque chose qu'une équipe peut faire tourner — RAGAS, TruLens, DeepEval d'un côté, Braintrust, LangSmith, Phoenix, Galileo, Opik de l'autre, et l'écart d'évaluation qu'aucun d'eux n'a encore comblé.
2026-03-27Chapitre 3 — Frameworks avancés de découpage
Troisième billet de la tournée du LLM Primer III. Le spectre du découpage du taille fixe au structurel, le mythe du recouvrement, la falaise de contexte qui détruit la recherche silencieusement, et les techniques de recherche contextuelle et de découpage tardif qui ont redessiné la frontière.
2026-03-20Chapitre 2 — L'analyse intelligente de documents
Deuxième billet de la tournée du LLM Primer III. Pourquoi un PDF n'est pas un fichier texte, ce que les parseurs sensibles à la mise en page préservent réellement, le paysage actuel des outils (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR), et la piste multimodale qui retrouve directement sur les images de pages.
2026-03-19Chapitre 8 — Utiliser les LLM dans les applications : chatbots, code, extraction et agents
Chapitre 8 de la série LLM Primer I. Les motifs d'application qui sortent vraiment en production — chatbots, résumé, assistants de code, extraction structurée et la montée des systèmes agentiques où le modèle pilote une boucle d'utilisation d'outils. Plus les benchmarks que chaque ingénieur devrait reconnaître par leur nom.
2026-02-25Chapitre 7 — Au-delà de la prédiction du prochain token : embeddings, recherche et multimodalité
Chapitre 7 de la série LLM Primer I. Les capacités qui transforment un prédicteur du prochain token en bien plus — embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales. Comment RAG garde réellement un LLM ancré dans de vrais documents au lieu d'inventer.
2026-02-24Chapitre 6 — Affinage et adaptation : du modèle brut à l'assistant utile
Chapitre 6 de la série LLM Primer I. La pile complète d'adaptation — du pilotage bon marché basé sur les prompts à l'affinage efficace en paramètres jusqu'à l'alignement complet avec RLHF et ses successeurs modernes comme DPO. Pourquoi le post-entraînement est désormais là où se différencient vraiment les API de modèles fermés.
2026-02-23Une tournée chapitre par chapitre de LLM Primer I — Introduction à la série et index
Introduction et index de la tournée en douze parties chapitre par chapitre de LLM Primer I : Comment fonctionne l'IA générative. Un billet par jour, du 18 février au 1er mars 2026. Lisez-les dans l'ordre ou choisissez le chapitre qui vous intéresse le plus. Tous les douze sont listés et liés ici.
2026-02-17