أعلنت جوجل كلاود عن إطلاق معاينة تقنية TreeAH للفهرسة الشعاعية، والتي تجلب معها جوهر أبحاث جوجل وابتكاراتها في خوارزميات أقرب جار تقريبي إلى خدمة BigQuery. يستخدم نوع الفهرس الجديد نفس التقنية الأساسية التي تدعم بعضًا من خدمات جوجل الأكثر شيوعًا، ويوفر تخفيضات كبيرة في زمن الوصول والتكلفة في بعض الحالات مقارنةً بأول فهرس تم تنفيذه في BigQuery، وهو فهرس الملفات المقلوبة (IVF).
تتمثل إحدى المزايا الرئيسية لفهرس TreeAH في استخدامه للتجزئة غير المتماثلة (AH)، والتي تستخدم تكميم المنتج لضغط حوامل البيانات. إلى جانب خوارزمية حساب المسافة المحسّنة لوحدة المعالجة المركزية، يمكن أن يكون البحث الشعاعي باستخدام TreeAH أسرع وأكثر فعالية من حيث التكلفة من IVF ب مراتب من حيث الحجم. يمكن أن يكون إنشاء الفهرس أيضًا أسرع وأرخص بعشر مرات، وله بصمة ذاكرة أصغر، حيث يتم تخزين حوامل البيانات المضغوطة فقط.
أظهرت الاختبارات المعيارية التي أجراها فريق جوجل للهندسة أن TreeAH يتفوق بشكل كبير على IVF عندما يكون حجم دفعة الاستعلام كبيرًا. على سبيل المثال، بالنسبة لدفعات الاستعلام التي تحتوي على 10000 متجه، كان TreeAH أسرع بما يصل إلى 23 مرة وأقل تكلفة بنسبة 95٪ من IVF. كان تدريب فهرس TreeAH أيضًا أسرع بكثير وأرخص من IVF في معظم الحالات.
مع ذلك، تجدر الإشارة إلى أن TreeAH لا يزال قيد التطوير النشط وهناك بعض القيود الحالية. على سبيل المثال، يمكن أن يحتوي الجدول الأساسي على 200 مليون صف كحد أقصى، ولا يتم دعم الأعمدة المخزنة والتصفية المسبقة لفهرس TreeAH.
بشكل عام، يعتبر TreeAH إضافة قيّمة إلى BigQuery، حيث يوفر تحسينات كبيرة في الأداء والتكلفة لأنواع معينة من أحمال عمل البحث الشعاعي. من المتوقع أن يؤدي هذا إلى تمكين المزيد من حالات الاستخدام للبحث الشعاعي في BigQuery، مثل البحث الدلالي والجيل المعزز بالاسترجاع المستند إلى LLM.