Introduction aux LLM

Cette page fournit un guide facile à comprendre sur les LLM (grands modèles de langage) des bases aux applications pour les passionnés d'IA.

Total de 17 articles disponibles. | Actuellement à la page 1 de 1.

Chapitre 8 — Attaques adverses contre les modèles

De FGSM à TextFooler puis aux suffixes universels ; attaques boîte-noire contre les API et vol de modèle — la dette de recherche derrière l'injection de prompt.

2026-05-17

Chapitre 7 — Hallucinations et fiabilité

La fiabilité comme propriété de sécurité — pourquoi les modèles fabulent avec assurance, ce que la calibration corrige, et les architectures hybrides qui rendent la fiabilité ingénieriable.

2026-05-16

Chapitre 6 — Risques de la génération augmentée par récupération

Frontières de confiance dans le RAG, injection de documents malveillants, empoisonnement d'index et d'embeddings, et surveillance du chemin de récupération.

2026-05-15

Chapitre 5 — Évaluer les applications LLM

Cinquième billet de la tournée du LLM Primer V. Le chapitre qui admet qu'assertEqual est mort pour les sorties LLM et reconstruit la discipline de test autour de juges ancrés, du Triangle RAG et des tests de trajectoire.

2026-04-18

Chapitre 4 — Agents IA et appel d'outils

Quatrième billet de la tournée du LLM Primer V. Le chapitre qui traite un agent comme un modèle de langage bouclé sur des outils dont les schémas, les couches de mémoire et le câblage multi-agents doivent être conçus avant de confier la boucle à quoi que ce soit de réel.

2026-04-17

Chapitre 3 — Génération augmentée par la récupération

Troisième billet de la tournée du LLM Primer V. Le chapitre qui parcourt le pipeline RAG de bout en bout et sépare la démo qui marche sur vos dix documents favoris du système qui survit au contact de votre corpus réel.

2026-04-16

Chapitre 10 — Mémoire de tâche à long horizon

Dixième billet de la tournée du LLM Primer IV. Mémoire à court terme par fenêtres et scratchpads ReAct, mémoire à long terme par vecteurs épisodiques et stores sémantiques, et les techniques de compaction qui maintiennent un agent productif sur des heures et des jours.

2026-04-08

Chapitre 11 — Mises à jour continues et optimisation du pipeline

Onzième et dernier billet de la tournée du LLM Primer III. CDC et indexation incrémentale gardent le corpus frais, cache sémantique et tiering de modèles maintiennent la latence basse, et une boucle de feedback en quatre étapes ferme l'écart entre ce que la production dit à l'équipe et ce que l'équipe change effectivement — plus un pont vers le Volume IV sur le Model Context Protocol.

2026-03-28

Chapitre 10 — Les frameworks d'évaluation de référence

Dixième billet de la tournée du LLM Primer III. Un guide de terrain des frameworks qui transforment la triade d'évaluation en quelque chose qu'une équipe peut faire tourner — RAGAS, TruLens, DeepEval d'un côté, Braintrust, LangSmith, Phoenix, Galileo, Opik de l'autre, et l'écart d'évaluation qu'aucun d'eux n'a encore comblé.

2026-03-27

Chapitre 9 — La triade d'évaluation RAG

Neuvième billet de la tournée du LLM Primer III. Un système RAG peut échouer à trois endroits différents et les échecs paraissent identiques vus de l'extérieur — la triade d'évaluation Pertinence du Contexte, Fidélité, et Pertinence de la Réponse est le petit vocabulaire qui empêche de corriger un bug en mesurant un autre.

2026-03-26

Chapitre 8 — Anonymisation des données dans la chaîne RAG

Huitième billet de la tournée du LLM Primer III. Anonymisation pré-génération contre post-génération, les trois familles de techniques — masquage, remplacement synthétique, confidentialité différentielle — et le compromis utilité-confidentialité qui détermine si le système reste utile.

2026-03-25

Chapitre 6 — Modèles de menaces et vulnérabilités RAG

Sixième billet de la tournée du LLM Primer III. La surface d'attaque élargie de la recherche — empoisonnement de corpus, morceaux adversariaux, injection de prompt indirecte, inversion d'embedding, et le problème du deputy confus en RAG agentique. Attaques concrètes, chacune démontrée, chacune reproductible.

2026-03-23

Chapitre 5 — Architecturer la chaîne de recherche

Cinquième billet de la tournée du LLM Primer III. Pourquoi une seule recherche vectorielle n'est pas une chaîne — recherche hybride, fusion de rangs réciproques, reranking par cross-encoder, et réécriture côté requête plus HyDE — assemblés dans l'architecture de production sur laquelle les systèmes RAG mûrs convergent.

2026-03-22

Chapitre 4 — Choisir la bonne base vectorielle

Quatrième billet de la tournée du LLM Primer III. La séparation architecturale entre bases vectorielles dédiées et extensions de type Postgres, les leaders managés (Pinecone, Vertex), le terrain open source (Qdrant, Milvus, Weaviate), les options embarquées, et les trois axes opérationnels — résidence, exploitation, coût — qui décident du vrai choix.

2026-03-21

Chapitre 3 — Frameworks avancés de découpage

Troisième billet de la tournée du LLM Primer III. Le spectre du découpage du taille fixe au structurel, le mythe du recouvrement, la falaise de contexte qui détruit la recherche silencieusement, et les techniques de recherche contextuelle et de découpage tardif qui ont redessiné la frontière.

2026-03-20

Chapitre 1 — L'évolution de l'architecture RAG

Premier billet de la tournée du LLM Primer III. Les quatre postures architecturales de RAG — Naïve, Avancée, Modulaire, Agentique — se lisent comme l'histoire de l'agentivité progressivement confiée au LLM, et la réponse honnête à la question de savoir quand l'affinage est le meilleur outil plutôt que la recherche.

2026-03-18

Chapitre 7 — Au-delà de la prédiction du prochain token : embeddings, recherche et multimodalité

Chapitre 7 de la série LLM Primer I. Les capacités qui transforment un prédicteur du prochain token en bien plus — embeddings, recherche sémantique, retrieval-augmented generation et la transition vers les entrées multimodales. Comment RAG garde réellement un LLM ancré dans de vrais documents au lieu d'inventer.

2026-02-24