كنت أفكر في مفهوم أسميه "أنطولوجيا السياق" - في الغالب لأنني أتمنى لو كان لدي مكان واحد يمكنني من خلاله معرفة مصدر السياق ، والمطالبات التي يتم استخدامها فيها.
قد يتضمن السياق المفيد لماجستير القانون لإنشاء استجابة أو اتخاذ إجراء أشياء مثل (1) هدف عالي المستوى ، (2) مهمة / مجال تركيز حالي ، (3) معلومات ملخصة من المهام السابقة ذات الصلة ، (4) الدروس المستفادة من المحاولات السابقة ، إلخ.
نظرا لأننا نتوقع المزيد من وكلائنا (مهام أطول ، ومشاريع أكثر تعقيدا ، وما إلى ذلك) ، فإن الذاكرة الأولية سرعان ما تصبح ثقيلة وصاخبة ، مما يقلل من جودة إخراج LLM. تحتوي معظم تطبيقات الذكاء الاصطناعي المعقدة على نوع من السياق الملخص (أفترض) ، ومصادر سياق متعددة.
الفكرة هنا هي تحديد أنطولوجيا للسياق الذي تقوم بتخزينه * ، وكيفية هيكلته ، وما يجب استرداده لكل مطالبة في نظامك.
* من خلال المتجر ، لا أعني بالضرورة في DB الخاص بالذكاء الاصطناعي. من المفترض ، يبدو من المنطقي اعتبار البيانات المخزنة في أي تطبيق جزءا من ذاكرة الذكاء الاصطناعي (مثل اتصال API / MCP). ربما يجب أن تحدد هذه الأنطولوجيا هذا أيضا.
بالانتقال إلى خطوة أخرى إلى الأمام ، يمكنك جعل هذا أنطولوجيا ديناميكية يمكن للذكاء الاصطناعي إدارتها واختبارها ، ثم لصقها في بيئة RL للوكلاء لتحسين إدارة السياق بأنفسهم (افتراضيا)
لست متأكدا مما إذا كانت استراتيجية التلخيص يجب أن تدخل هنا ولكنها منطقية على مستوى عال. أصعب لأن معظم الناس يلخصون المعلومات عند الابتلاع ، لذا سيتعين عليك إعادة تلخيص عمليات الابتلاع السابقة في كل مرة تقوم فيها بتغييرها (لاختبار التغييرات وتحسين الذات) - لكنني أعتقد أن هذه المشكلة لا تزال مستمرة بغض النظر.
لا أعتقد أن أي شيء هنا جديد بشكل خاص. مجرد التفكير بصوت عال وأنا أحاول إنشاء بعض الإطار داخليا لرسم خريطة للاستراتيجيات المختلفة التي رأيتها.