قامت جوجل كلاود بنشر دليل حول كيفية التعامل مع أخطاء 429 الناتجة عن استنفاد الموارد، خاصة عند استخدام نماذج اللغات الكبيرة (LLMs). تُشدد المقالة على أهمية إدارة استهلاك الموارد لتوفير تجربة مستخدم سلسة، مع الأخذ في الاعتبار متطلبات الموارد الحسابية الكبيرة لهذه النماذج. تتناول المقالة ثلاث استراتيجيات رئيسية للتعامل مع هذه الأخطاء:

1. **التراجع وإعادة المحاولة:** استخدام خوارزميات التراجع الأسي وإعادة المحاولة لمعالجة استنفاد الموارد أو عدم توفر واجهة برمجة التطبيقات. ويتضمن ذلك زيادة وقت الانتظار بشكل أسي مع كل إعادة محاولة حتى يتعافى النظام المُحمّل فوق طاقته.

2. **الحصص الديناميكية المشتركة:** تقوم جوجل كلاود بإدارة تخصيص الموارد لبعض النماذج من خلال توزيع سعة متوفرة ديناميكيًا بين جميع المستخدمين الذين يقدمون طلبات. ويُحسّن هذا من كفاءة استخدام الموارد ويقلل من زمن الوصول.

3. **الإنتاجية المخصصة:** تتيح لك هذه الخدمة حجز سعة مخصصة لنماذج الذكاء الاصطناعي التوليدية على منصة Vertex AI، مما يضمن أداءً متوقعًا وموثوقًا حتى أثناء فترات الذروة.

تُشدد المقالة على أهمية الجمع بين آليات التراجع وإعادة المحاولة والحصص الديناميكية المشتركة، خاصة مع زيادة حجم الطلبات وحجم الرموز المميزة. وتُقدم أيضًا خيارات أخرى مثل تجاوز حصة المستهلك والإنتاجية المخصصة لضمان مرونة تطبيقات LLM. وتُختتم المقالة بتشجيع المستخدمين على البدء في بناء تطبيقات الذكاء الاصطناعي التوليدية باستخدام عينات Vertex AI على GitHub أو الاستفادة من دليل المبتدئين والإرشادات السريعة وحزمة البدء التي تقدمها جوجل كلاود.