الفصل التاسع — RAG: نَخيط معلوماتٍ حديثة في السياق

المقالة التاسعة من الجولة الفصلية في LLM Primer I: How Generative AI Works. النمط الأكثر شيوعاً لاستخدام الأدوات اليوم، عن قُربٍ أكبر.

ما الذي يَحلّه RAG

RAG — Retrieval-Augmented Generation، التوليد المعزَّز بالاسترجاع — يَحلّ مَهَمَّةً مَلموسة جدّاً. أن نَجلب من الخارج معلوماتٍ لم يَرها النموذج خلال التدريب، وأن نَخيطها في سياقه قبل أن يَبدأ بالإجابة.

لماذا هذا مُهمّ؟ لأنّ اثنَين من عيوب الفصل الخامس — فقدان الإحساس بالزمن، اضطراب الحقائق — جذورُهما واحدة: النموذج محصورٌ في ما تَعلَّمه. علاجُ ذلك من داخل النموذج مكلِّفٌ وهَشّ. أمّا تَغذية السياق بمعلوماتٍ ذاتِ صلةٍ في كلِّ استدعاء، فأَرخصُ بكثير وأكثرُ متانة.

في جملة واحدة: RAG لا يُغيِّر النموذج، يُضيف إلى السياق. هذه البساطة — القدرة على تحديث المصدر في كلِّ استدعاءٍ مع إبقاء النموذج كما هو — هي القوّة الأكبر في هذا النمط.

كيف يَسير استدعاءُ RAG، خطوةً بخطوة

إذا فَكَّكتَه خطوةً خطوة، فإنّ استدعاءَ RAG لا يَحوي سرّاً.

1. يَصل سؤالُ المستخدِم. مثلاً: "ما سياسة الإرجاع في شركتنا؟".

2. يَتحوَّل السؤالُ إلى تضمين. يَعود إلى المشهد تضمينُ الفصل الثالث — تَصير الجملةُ متَّجِهاً بِبضع مئاتٍ من الأبعاد.

3. بَحثٌ متَّجِهي. بين المقاطع المُفهرَسة مسبقاً — وثائق الشركة، أدلّة المنتج، وثائق السياسات — تُسحَب أقربُها إلى تضمين السؤال. "الأقرب" هنا قُربٌ دلالي، لا حرفيّ.

4. تَدخل النتائجُ إلى السياق. تُلصَق المقاطعُ المسحوبة في سياق النموذج، عادةً بمقدّمةٍ من قبيل "أجِب اعتماداً على هذه المواد".

5. يُولِّد النموذجُ فوق ذلك. ثمَّ يَجمع النموذج بين ما تَعلَّمَه وما وَصلَه للتوّ، ويُكمل الإجابة.

الفرق بين RAG جيِّد و RAG سيِّئ

بناءُ النسخة الأولى ليس عسيراً. جعلُها تَستحقّ الاستعمال هو الجزء الصعب. يُبيِّن الكتاب بصدقٍ — ما الذي يَفصل بين RAG مقبولٍ وآخر يَصمد عند التوسُّع.

التقطيع (chunking). كيف تَقطع وثائقك يُحدِّد نصف الأثر. القطعُ القصيرة جدّاً تَفقد السياق؛ والطويلة جدّاً تَضبب البحث. في الحالة المثالية، تَكون كلُّ قطعةٍ مكتفيةً بذاتها — قسمٌ، فقرة متماسكة، إجابةٌ كاملة.

اختيار التضمين. لا يوجد تضمينٌ "صالحٌ لكلِّ الميادين". الميادين — الطب، القانون، البرمجة — لها تضميناتٌ تَلتقط مفرداتها بدقّةٍ أعلى. اختيارُ المناسب يَقطع نصف الطريق.

إعادة الترتيب (reranking). قبل إرسال النتائج إلى النموذج، خَطوةٌ ثانية أكثر تكلفةً وأكثر دقّة لإعادة ترتيب المجموعة الأوّلية، تَدفع الأوثقَ صلةً إلى الأعلى.

التأريض (Grounding). إِلزامُ الإجابة بأن تَتقيَّد بالمواد المسترجَعة فحسب — مثلاً بِذكر المصدر مع كلِّ ادّعاء. هذه العادة، عادةً، تَدفع الهلوسة إلى الأسفل بقدرٍ مَلموس.

يستحقّ التذكُّر: هكذا يَبدو RAG السيِّئ — "البحث جَلب نتائج، لكنّ النموذج أجاب كأنّه لم يَرَها". أمّا RAG الجيِّد فهو بحثٌ متماسك، وإعادة ترتيبٍ حكيمة، وتأريضٌ راسخ، مَنسوجاتٌ معاً حتّى تَنبثق الإجابةُ من المواد.

الحدود بصدقٍ

التوقُّعات حول RAG غالباً مُبالَغٌ فيها. لا بدَّ من معايرة. يَدعم RAG النموذج، لكنّه لا يُغيِّر كيف يَستدلّ. البحث الخاطئ يَقود إلى إجابةٍ واثقة وخاطئة. الطبقاتُ — استرجاعٌ مُتعدِّد المسارات، تَحقُّقٌ متقاطع، إدارةُ جودة الفهرسة — تَحفَظ شيئاً، لكنّ المصدر والنموذج لا بدَّ أن يَسيرا معاً.

خيط الفصل التاسع

ما يَبقى من هذا الفصل: RAG، اليوم، ربّما هو أرخصُ وأكثرُ السبل فعاليّةً لِسَدّ فجوة الحقائق والزمن دون استبدال النموذج. النموذج نفسه مع مصادرَ تُحدَّث باستمرار، يَحلّ مسائلَ كانت تَتطلَّب إعادةَ تدريبٍ قبل ذلك.

غداً — الفصل العاشر: متعدِّد الوسائط — وراء النصّ. نُوسِّع النطاق. كيف بدأ Transformer ذاتُه يَقبل الصورَ والصوت، وما الذي تَغيَّر وما الذي لم يَتغيَّر.

هل تريد الصورة الكاملة؟ يَفتح الكتاب كلَّ خطوةٍ من خطوات RAG، ويُظهر كيف تَضبط كلَّ خطوةٍ على حالتك — بمخطّطات. اطّلع على «LLM Primer I» على أمازون ←