أعلنت جوجل كلاود عن ابتكارات قوية في البنية التحتية للذكاء الاصطناعي، بما في ذلك الجيل السادس من وحدة المعالجة المركزية Trillium، وأجهزة A3 Ultra VMs المدعومة بوحدات معالجة الرسومات NVIDIA H200 Tensor Core، وعناقيد Hypercompute، وأجهزة C4A VMs القائمة على معالجات Axion المخصصة، وتحسينات على شبكة مراكز البيانات Jupiter، وقدرات Titanium لتحميل المضيف، وخدمة Hyperdisk ML للتخزين. تهدف هذه التحسينات إلى تعزيز أداء البنية التحتية للذكاء الاصطناعي، وتسهيل استخدامها، وتحسين كفاءة التكلفة للعملاء. توفر Trillium تحسينات كبيرة في الأداء مقارنةً بـ TPU v5e، بما في ذلك تحسين 4 أضعاف في أداء التدريب، وزيادة تصل إلى 3 أضعاف في إنتاجية الاستدلال، وزيادة بنسبة 67% في كفاءة الطاقة. تم تصميم A3 Ultra VMs لتقديم قفزة كبيرة في الأداء مقارنةً بالأجيال السابقة، مع ضعف عرض النطاق الترددي للشبكة من وحدة معالجة الرسومات إلى وحدة معالجة الرسومات، وأداء استدلال LLM أعلى مرتين تقريبًا. يبسط Hypercompute Cluster إدارة مجموعات مسرعات الذاء الاصطناعي، ويوفر عمليات نشر موثوقة وقابلة للتكرار من خلال واجهة برمجة تطبيقات واحدة. تتوفر أجهزة C4A VMs الآن بشكل عام، مما يوفر أداءً وكفاءةً محسنين لمجموعة واسعة من أعباء العمل للأغراض العامة. تم تحسين Titanium وشبكة Jupiter لدعم أعباء عمل الذاء الاصطناعي، مع محول شبكة Titanium ML الجديد الذي يوفر 3.2 تيرابايت/ثانية من حركة مرور وحدة معالجة الرسومات إلى وحدة معالجة الرسومات عبر RoCE. تتوفر Hyperdisk ML الآن بشكل عام، مما يوفر تخزينًا عالي الأداء لأعباء عمل الذاء الاصطناعي وHPC، مع أوقات تحميل بيانات أسرع وكفاءة تكلفة أكبر.
ابتكارات قوية في البنية التحتية لمستقبل يركز على الذكاء الاصطناعي
Google Cloud