عنق الزجاجة التالي للذكاء الاصطناعي لم يعد التدريب فقط
استغلت Google وNvidia حدث Google Cloud Next لتسليط الضوء على مشكلة تنتقل بسرعة إلى قلب أعمال الذكاء الاصطناعي: تكلفة الاستدلال. ووفقًا لـ feed المرشح، أوضحت الشركتان خريطة طريق عتادية مصممة لمعالجة تكلفة تشغيل نماذج الذكاء الاصطناعي على نطاق واسع، بما في ذلك مثيلات A5X bare-metal الجديدة.
حتى بصيغة مختصرة، يمثل ذلك تحولًا مهمًا في الأولويات. على مدى السنوات القليلة الماضية، دار جزء كبير من النقاش حول بنية الذكاء الاصطناعي التحتية حول تدريب نماذج أكبر فأكبر. لكن بمجرد انتقال الأنظمة إلى الإنتاج، يصبح الاستدلال المصروف التشغيلي المتكرر. إنه التكلفة التي تُدفع كلما أرسل المستخدم prompt، أو استدعى تطبيق نموذجًا، أو نفّذ agent جولة أخرى من الاستدلال.
لماذا تهم اقتصاديات الاستدلال الآن
الاستدلال هو المكان الذي تصبح فيه منتجات الذكاء الاصطناعي أعمالًا قابلة للحياة أو تبقى عروضًا مكلفة. يمكن للمختبر أن يبرر تكاليف تدريب مرتفعة إذا أصبح النموذج الناتج مهمًا استراتيجيًا. أما عميل السحابة، فيحتاج إلى اقتصاديات يومية تعمل بالفعل. ويمكن لانخفاض تكاليف الخدمة أن يوسع الهوامش، ويدعم منتجات أرخص، أو يتيح أهداف أداء أكثر طموحًا.
لهذا السبب تحمل إعلانات البنية التحتية مثل هذا الإعلان وزنًا استراتيجيًا. فـGoogle وNvidia لا تكتفيان بشحن المزيد من العتاد. إنهما تعالجان قيدًا يؤثر في التبني عبر كامل الطبقة التقنية، من روبوتات الدردشة الاستهلاكية إلى copilots المؤسسية وأنظمة الأتمتة الصناعية.
معركة السحابة تتحول إلى معركة كفاءة
يشير feed تحديدًا إلى أن خريطة الطريق عُرضت في Google Cloud Next وصُممت لمعالجة تكاليف الاستدلال “على نطاق واسع”. هذه العبارة مهمة لأن المنافسة في الذكاء الاصطناعي السحابي لم تعد تدور فقط حول الوصول إلى المسرّعات. بل أصبحت تدور أيضًا حول مدى كفاءة نشر هذه المسرّعات وجدولتها وإتاحتها للعملاء عبر مثيلات تتوافق مع أحمال العمل الفعلية.
وإشارة مثيلات A5X bare-metal توحي بأن Google تستهدف عملاء يريدون تحكمًا أكثر مباشرة في البنية التحتية عالية الأداء. قد تكون عروض bare-metal مهمة لعمليات نشر الذكاء الاصطناعي الكبيرة لأنها تقلل الطبقات بين البرمجيات والعتاد، ما قد يحسن الأداء ومرونة الضبط. النص المقدم لا يوفّر تفاصيل تقنية كاملة، لذلك سيكون من الخطأ الادعاء بوجود مكاسب محددة. لكن التموضع واضح: هذه بنية تحتية موجهة للاستدلال الإنتاجي الجاد.
لماذا تبقى Nvidia في المركز
وجود Nvidia مهم بالقدر نفسه. فالشركة لا تزال تحتل دورًا حاسمًا في بنية الذكاء الاصطناعي التحتية، وأصبحت الإعلانات المشتركة مع منصات السحابة الكبرى إحدى الطرق الأساسية التي تشير بها الصناعة إلى اتجاهات السعة والتحسين ومواءمة خريطة الطريق. عندما تقدم Google وNvidia إجابة مشتركة على تكلفة الاستدلال، فإنهما تخبران العملاء فعليًا بأن الكفاءة أصبحت الآن ميزة من الدرجة الأولى، لا مجرد شاغل خلفي.
كما يعكس ذلك تغير نضج السوق. فالشركات أصبحت أقل انبهارًا بعروض النماذج وحدها وأكثر تركيزًا على throughput، وlatency، وملاءمة النشر، وإمكانية التنبؤ بالميزانية. بعبارة أخرى، لم يعد السؤال مجرد ما إذا كان النموذج قادرًا على تنفيذ مهمة ما. بل أصبح ما إذا كان يمكن تقديم تلك المهمة بشكل موثوق ومربح ملايين المرات.
إشارة إلى المرحلة التالية من الذكاء الاصطناعي
الأهمية الأوسع لهذا الإعلان هي أن بنية الذكاء الاصطناعي التحتية تدخل مرحلة أكثر انضباطًا. كانت الموجة الأولى تدور حول القدرة، بينما تدور الموجة التالية حول الاقتصاد. لا تزال الشركات تريد نماذج أقوى، لكنها تحتاج أيضًا إلى أنظمة رخيصة بما يكفي للخدمة ومستقرة بما يكفي للتوسع.
لهذا السبب تستحق خفض تكلفة الاستدلال الانتباه باعتبارها قصة صناعية كبرى. فهي تكشف أين ترى hyperscalers أن ألم العملاء هو الأكبر. كما تلمح إلى ما قد يفصل الفائزين في الذكاء الاصطناعي المؤسسي: ليس فقط جودة النموذج الخام، بل القدرة على جعل تلك الجودة ميسورة التكلفة في الإنتاج.
تراهن Google وNvidia على أن السوق مستعد لهذه الرسالة. وتشير الأدلة المتزايدة إلى أنهما على حق.
تعتمد هذه المقالة على تقرير AI News. اقرأ المقال الأصلي.
Originally published on artificialintelligence-news.com






