Introduction aux LLM

Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.

Total de 33 articles disponibles. | Actuellement à la page 1 de 1.

Chapitre 17 — Menaces futures et défenses émergentes

Chapitre final de la série : agents autonomes, surfaces multimodales, identité synthétique et IA-contre-IA — puis un pont vers l'arc I–VII et le volume compagnon Physical AI.

2026-05-26

Chapitre 16 — Fine-tuning et adaptation sécurisés

Érosion d'alignement par données bénignes, empoisonnement délibéré, portes d'évaluation en CI et discipline de rollback — le fine-tuning traité comme sa propre surface de sécurité.

2026-05-25

Chapitre 14 — Biais, équité et IA responsable

Sources des biais, benchmarks d'équité et leurs limites, l'arbitrage sécurité-utilité, et la politique IA organisationnelle qui rend les choix explicites.

2026-05-23

Chapitre 9 — Intégrité du modèle et risques de la chaîne d'approvisionnement

Backdoors qui survivent à l'alignement, pickle contre safetensors, Sigstore et surveillance de dérive : mettre la chaîne d'approvisionnement du modèle à parité avec celle du logiciel.

2026-05-18

Chapitre 8 — Attaques adverses contre les modèles

De FGSM à TextFooler puis aux suffixes universels ; attaques boîte-noire contre les API et vol de modèle — la dette de recherche derrière l'injection de prompt.

2026-05-17

Chapitre 6 — Risques de la génération augmentée par récupération

Frontières de confiance dans le RAG, injection de documents malveillants, empoisonnement d'index et d'embeddings, et surveillance du chemin de récupération.

2026-05-15

Chapitre 2 — Modélisation des menaces pour les systèmes LLM

Les quatre questions de Shostack, STRIDE et PASTA contre les actifs LLM, MITRE ATLAS pour les adversaires — et le modèle de menace opérationnel dont chaque chapitre suivant se réclame.

2026-05-11

LLM Primer VII — Introduction de la série et index

Introduction et index de la tournée chapitre par chapitre du LLM Primer VII : Sécurité de l'IA — le volume final de la série LLM Primer.

2026-05-09

Chapitre 15 — API serverless vs infrastructure dédiée

Quinzième billet du LLM Primer VI. Le calcul du seuil de rentabilité, la ligne d'ingénierie plateforme sous-estimée, et pourquoi la posture réaliste est presque toujours hybride.

2026-05-07

Chapitre 12 — Service désagrégé et Kubernetes

Douzième billet du LLM Primer VI. Séparer préremplissage et décodage sur des pools GPU distincts, transporter le cache KV, et exprimer la topologie par LeaderWorkerSet, Grove et KAI.

2026-05-04

Chapitre 11 — La couche plateforme et orchestration

Onzième billet du LLM Primer VI. Ray Serve, KServe, BentoML, Triton — le choix de plateforme comme adéquation avec la culture d'exploitation plutôt que comparatif de fonctionnalités.

2026-05-03

Chapitre 10 — La couche moteur LLM

Dixième billet du LLM Primer VI. La frontière entre moteur et plateforme, et les cinq moteurs — vLLM, TensorRT-LLM, SGLang, TGI, Ollama — qui dominent cette couche en 2026.

2026-05-02

LLM Primer VI — Introduction de la série & index

Introduction à la tournée chapitre par chapitre du LLM Primer VI : Mettre à l'échelle les systèmes IA. L'inférence LLM traitée comme une discipline d'ingénierie où bande passante mémoire, ordonnancement et lignes de facture se rencontrent.

2026-04-22

Chapitre 5 — Évaluer les applications LLM

Cinquième billet de la tournée du LLM Primer V. Le chapitre qui admet qu'assertEqual est mort pour les sorties LLM et reconstruit la discipline de test autour de juges ancrés, du Triangle RAG et des tests de trajectoire.

2026-04-18

Chapitre 4 — Agents IA et appel d'outils

Quatrième billet de la tournée du LLM Primer V. Le chapitre qui traite un agent comme un modèle de langage bouclé sur des outils dont les schémas, les couches de mémoire et le câblage multi-agents doivent être conçus avant de confier la boucle à quoi que ce soit de réel.

2026-04-17

Chapitre 3 — Génération augmentée par la récupération

Troisième billet de la tournée du LLM Primer V. Le chapitre qui parcourt le pipeline RAG de bout en bout et sépare la démo qui marche sur vos dix documents favoris du système qui survit au contact de votre corpus réel.

2026-04-16

LLM Primer V — Introduction de la série et sommaire

Une tournée chapitre par chapitre de LLM Primer V — le volume qui traite l'ingénierie IA comme une discipline à part entière et parcourt les huit surfaces où cette discipline vit : modèles de base, prompts, récupération, agents, évaluations, observabilité, sécurité et service.

2026-04-13

Chapitre 14 — Benchmarking, tests et performance

Quinzième et dernier billet de la tournée du LLM Primer IV. Le MCP-Universe Benchmark sur de vrais serveurs, les deux modes de défaillance systémiques qu'il a exposés, l'écart de débit dix-pour-un entre session-par-requête et pools de sessions partagées, et le pont vers le Volume V.

2026-04-12

Chapitre 13 — Frameworks et intégration cloud

Treizième billet de la tournée du LLM Primer IV. Strands avec Bedrock, le patron de couche d'état AWS, le Microsoft Agent Framework, LangChain, Semantic Kernel — et les trois formes d'intégration de production sur lesquelles les équipes convergent indépendamment.

2026-04-11

Chapitre 10 — Mémoire de tâche à long horizon

Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.

2026-04-08

Chapitre 9 — Gérer le budget d'attention

Neuvième billet de la tournée du LLM Primer IV. Context rot, la falaise du « lost-in-the-middle », tool-loadout rot, et les trois réponses architecturales — MCP, RAG, affinage — à la question de savoir où la connaissance manquante du modèle appartient vraiment.

2026-04-07

Chapitre 8 — Topologies de déploiement architecturales

Huitième billet de la tournée du LLM Primer IV. Les trois topologies de déploiement qui ont émergé dans l'écosystème MCP — agent réutilisable, pureté stricte, hybride — et les quatre contraintes contraignantes qui décident laquelle convient à quel projet.

2026-04-06

Chapitre 7 — Patrons collaboratifs et dynamiques avancés

Septième billet de la tournée du LLM Primer IV. Consensus en table ronde, routage par handoff, orchestration magentique — les patrons qui émergent quand la topologie doit être bâtie par requête, avec les modes de défaillance (non-terminaison, mauvais routage, planification emballée) que les patrons plus simples évitent.

2026-04-05

Chapitre 6 — Stratégies d'orchestration fondamentales

Sixième billet de la tournée du LLM Primer IV. Les deux formes fondatrices d'orchestration — pipelines séquentiels et scatter-gather concurrent — et la question préalable que toute équipe devrait poser : un système multi-agents est-il bien la bonne réponse ?

2026-04-04

Chapitre 5 — Protocoles de transport et découverte

Cinquième billet de la tournée du LLM Primer IV. Les trois transports que MCP soutient, la couche de découverte .well-known avec les Server Cards, et les soucis opérationnels ennuyeux — CORS, validation d'origine, mise en cache — qui décident si un serveur est un citoyen réseau coopératif ou une responsabilité.

2026-04-03

Chapitre 3 — Primitives du serveur : exposer le contexte et les capacités

Troisième billet de la tournée du LLM Primer IV. Les trois noms qu'un serveur MCP peut offrir — Ressources (lecture d'état), Prompts (échafaudage réutilisable), Outils (actions d'écriture) — leurs schémas, leurs cycles de vie, leurs modèles d'erreur, et la discipline de choisir la bonne primitive.

2026-04-01

Chapitre 1 — La crise d'intégration de l'IA et l'essor de l'architecture agentique

Premier billet de la tournée du LLM Primer IV. Pourquoi les agents monolithiques s'effilochent à mesure que les prompts système grossissent, le problème d'intégration N fois M qui se cache en dessous, et le passage de l'ingénierie de prompt à l'ingénierie de contexte que MCP a été conçu pour rendre possible.

2026-03-30

LLM Primer IV — Introduction de la série et index

Lancement de la tournée chapitre par chapitre du Livre IV de la série LLM Primer — Concevoir la cognition de l'IA avec MCP. Pourquoi les agents ont besoin d'une couche protocolaire pour dépasser le stade de la démo, à qui ce livre s'adresse, et le calendrier des quatorze billets qui suivent, du 30 mars au 12 avril.

2026-03-29

Chapitre 11 — Mises à jour continues et optimisation du pipeline

Onzième et dernier billet de la tournée du LLM Primer III. CDC et indexation incrémentale gardent le corpus frais, cache sémantique et tiering de modèles maintiennent la latence basse, et une boucle de feedback en quatre étapes ferme l'écart entre ce que la production dit à l'équipe et ce que l'équipe change effectivement — plus un pont vers le Volume IV sur le Model Context Protocol.

2026-03-28

Chapitre 6 — Modèles de menaces et vulnérabilités RAG

Sixième billet de la tournée du LLM Primer III. La surface d'attaque élargie de la recherche — empoisonnement de corpus, morceaux adversariaux, injection de prompt indirecte, inversion d'embedding, et le problème du deputy confus en RAG agentique. Attaques concrètes, chacune démontrée, chacune reproductible.

2026-03-23

Chapitre 1 — L'évolution de l'architecture RAG

Premier billet de la tournée du LLM Primer III. Les quatre postures architecturales de RAG — Naïve, Avancée, Modulaire, Agentique — se lisent comme l'histoire de l'agentivité progressivement confiée au LLM, et la réponse honnête à la question de savoir quand l'affinage est le meilleur outil plutôt que la recherche.

2026-03-18

Chapitre 8 — Utiliser les LLM dans les applications : chatbots, code, extraction et agents

Chapitre 8 de la série LLM Primer I. Les motifs d'application qui sortent vraiment en production — chatbots, résumé, assistants de code, extraction structurée et la montée des systèmes agentiques où le modèle pilote une boucle d'utilisation d'outils. Plus les benchmarks que chaque ingénieur devrait reconnaître par leur nom.

2026-02-25

La Série LLM Primer — Un guide de terrain de l'IA générative, construit volume après volume

La série LLM Primer — un guide de terrain en sept volumes désormais complet sur l'IA générative par Sho Shimoda. Des fondamentaux à la sécurité. Comprend Physical AI comme volume compagnon. Les 7 volumes disponibles sur Amazon.

2026-02-15