أعلنت جوجل كلاود عن إطلاق نماذج تضمين جديدة في Vertex AI، "text-embedding-004" و "text-multilingual-embedding-002". تتميز هذه النماذج بقدرتها على إنشاء تضمينات مُحسّنة بناءً على "أنواع المهام".
تُعد هذه الميزة قيّمة بشكل خاص في تطبيقات توليد الاسترجاع المُعزز (RAG)، حيث غالبًا ما يؤدي البحث التقليدي للتشابه إلى نتائج غير دقيقة بسبب اختلاف طبيعة الأسئلة والإجابات. على سبيل المثال، سؤال مثل "لماذا السماء زرقاء؟" وإجابته "تشتت ضوء الشمس يتسبب في اللون الأزرق" لهما معانٍ مختلفة.
تعمل "أنواع المهام" على سد هذه الفجوة من خلال السماح للنماذج بفهم العلاقة بين الاستعلام والإجابة. على سبيل المثال، من خلال تحديد نوع المهمة "QUESTION_ANSWERING" للنصوص الاستعلامية و "RETRIEVAL_DOCUMENT" للنصوص الإجابة، يمكن للنماذج وضع تضمينات أقرب لبعضها في مساحة التضمين، مما يؤدي إلى نتائج بحث أكثر دقة.
تعتمد هذه النماذج الجديدة على تقنية تُسمى "تقطير LLM"، حيث يتم تدريب نموذج أصغر من نموذج لغة كبير (LLM). يسمح ذلك للنماذج المُضمّنة بوراثة بعض قدرات التفكير من LLM، مما يؤدي إلى تحسين جودة البحث مع تقليل زمن الانتقال والتكلفة.
باختصار، تُعد "أنواع المهام" في Vertex AI Embeddings خطوة كبيرة إلى الأمام في تحسين دقة وكفاءة أنظمة RAG. من خلال تبسيط عملية البحث الدلالي، تتيح هذه الميزة للمطورين إنشاء تطبيقات أكثر ذكاءً وقدرة على فهم اللغة الطبيعية.