الطرح لصيغة مختلفة من كفاءة الذكاء الاصطناعي

مع استمرار نمو نماذج الذكاء الاصطناعي، اضطرت الصناعة إلى مواجهة مفاضلة مألوفة: الأنظمة الأكبر تميل إلى تقديم قدرات أوسع، لكنها تتطلب أيضًا طاقة أكبر وذاكرة أكثر ووقت تشغيل أطول. وقد ركزت كثير من الجهود للسيطرة على هذه التكاليف على تصغير النماذج أو خفض الدقة العددية. أما خط بحث مختلف فيرى أن الإجابة الأفضل قد تكون إعادة تصميم العتاد حول خاصية تمتلكها النماذج الكبيرة أصلًا بكثرة: الأصفار.

تُعرف هذه الخاصية باسم التفرّغ أو sparsity. ففي كثير من الشبكات العصبية، تكون أعداد كبيرة من الأوزان والتفعيلات مساوية للصفر تمامًا أو قريبة منه إلى حد يمكن معاملتها على هذا الأساس من دون فقد ملحوظ في الدقة. ومن حيث المبدأ، تمثل هذه المناطق شبه الفارغة فرصة هائلة. فبدلًا من إنفاق الطاقة على ضرب وجمع قيم لا تضيف شيئًا أو تضيف القليل جدًا، يمكن للنظام تخطيها. وبدلًا من تخزين سلاسل طويلة من الأصفار، يمكنه التركيز على الأجزاء غير الصفرية التي تهم فعليًا.

لكن المشكلة أن عتاد الحوسبة السائد لا يستفيد من هذه البنية بصورة طبيعية. فالمعالجات المركزية ووحدات معالجة الرسوميات جيدة في العمل العددي الكثيف، حيث يُفترض أن كل موضع في المصفوفة مهم. أما الحوسبة المتفرغة فهي أصعب، لأن الآلة يجب أن تعرف ما الذي ستتجاهله، وكيف تجلب القيم ذات الصلة بكفاءة، وكيف تتجنب إنفاق قدر كبير من الحمل الإداري على بيانات غير منتظمة بحيث تضيع الفوائد.

لماذا يعتقد الباحثون أن الطبقة الكاملة يجب أن تتغير

يقول مهندسون في ستانفورد إن التعامل الجاد مع التفرّغ يتطلب إعادة تصميم كاملة عبر الطبقة كلها: العتاد، والبرمجيات الثابتة منخفضة المستوى، والبرمجيات. وتذكر مجموعتهم البحثية أنها طورت شريحة تستطيع التعامل بكفاءة مع كل من أعباء العمل المتفرغة والتقليدية، بدلًا من اعتبار التفرّغ حالة خاصة مزعجة مضافة فوق افتراضات الحوسبة الكثيفة.

وبحسب المجموعة، كانت العوائد كبيرة. ففي أعباء العمل التي جرى تقييمها، استهلكت الشريحة في المتوسط جزءًا من سبعين من طاقة المعالج المركزي، وأنجزت الحسابات أسرع بنحو ثماني مرات في المتوسط. وقد اختلفت الأرقام بحسب عبء العمل، لكن الادعاء الجوهري هو أن التصميم الأصلي للتفرّغ يمكن أن يحقق مكاسب كبيرة من دون إجبار الصناعة على التخلي عن النماذج عالية القدرة.

إذا أمكن تعميم هذه النتيجة، فالأمر مهم أبعد من المقاييس الأكاديمية. فمستقبل الذكاء الاصطناعي لم يعد مقيدًا فقط بالتقدم الخوارزمي، بل أيضًا بتوافر الطاقة، والتبريد، والبصمة الكربونية، وتكلفة تشغيل أنظمة الاستدلال الضخمة المتزايدة. وأي مسار موثوق إلى حوسبة أقل استهلاكًا للطاقة مهم استراتيجيًا.

ما الذي يقدمه التفرّغ ولا تقدمه النماذج الأصغر

جاذبية التفرّغ أنه لا يتطلب بالضرورة التخلي عن حجم النموذج أو أدائه. فالنماذج الأصغر والحسابات منخفضة الدقة يمكن أن تخفض التكاليف، لكنها غالبًا ما تقيد القدرة أيضًا. أما التفرّغ فيقترح خيارًا آخر: الاحتفاظ بنماذج ضخمة جدًا، مع تجنب إهدار الحوسبة على الأجزاء الأقل إسهامًا.

وتصبح هذه الفكرة مهمة بشكل خاص مع استمرار الشركات الرائدة في طرح أنظمة هائلة. وتشير المقالة إلى أن أحدث إصدار من Llama لدى Meta وصل إلى تريليوني معامل، ما يوضح مدى السرعة التي يمكن أن تضاعف بها الحوسبة المتزايدة احتياجات الطاقة. وإذا كانت نسبة كبيرة من تلك المعاملات أو تفعيلاتِها غير مؤثرة عمليًا أثناء الاستخدام، فإن العتاد الذي يتعامل معها بذكاء قد يحقق كفاءة من دون إجبار الصناعة على التراجع عن الحجم.

عمليًا، قد تشمل الفوائد:

  • انخفاض استهلاك الطاقة للتدريب أو الاستدلال
  • تراجع زمن التشغيل لأعباء العمل المتفرغة
  • تخفف عبء الذاكرة عبر عدم تخزين كتل كبيرة من الأصفار
  • خفض البصمة الكربونية لنشر الذكاء الاصطناعي على نطاق واسع

هذه ليست تحسينات هامشية. إنها تمس مباشرة اقتصاديات الذكاء الاصطناعي الحديث واستدامته البيئية.

تحدي جعل الحوسبة المتفرغة واقعًا

كان التفرّغ جذابًا من الناحية المفاهيمية لسنوات، لكن الاستفادة منه صعبة. فالأجهزة الكثيفة تزدهر على الانتظام، بينما البيانات المتفرغة غير منتظمة بطبيعتها. وهذا يعني أن المصممين يجب أن يحلوا مشكلات الفهرسة والتوجيه والجدولة والوصول إلى الذاكرة، وهي تصبح أكثر تعقيدًا عندما تغيب قيم كثيرة.

ولهذا يؤكد فريق ستانفورد على التصميم الشامل للطبقة كلها. فمسرّع متخصص واحد لا يكفي إذا كانت البرمجيات الثابتة والبرمجيات ما تزال تفترض أنماط تنفيذ كثيفة. يجب أن تفهم الأدوات التمثيلات المتفرغة، وأن يعالجها العتاد بكفاءة، وأن يتجنب النظام الكامل تحويل عبارة «تخطي الأصفار» إلى «إضاعة الوقت في معرفة أين توجد الأصفار».

هذه النظرة النظامية هي ما يجعل العمل لافتًا. فهو لا يعرض التفرّغ كحيلة خوارزمية منفردة، بل كإعادة تفكير معمارية في كيفية مواءمة أعباء عمل الذكاء الاصطناعي مع الآلات.

لماذا قد يهم ذلك بناء الذكاء الاصطناعي الأوسع

لا يظهر أن شهية الصناعة الفورية للحوسبة ستتراجع قريبًا. وحتى مع قول بعض الخبراء إن التوسع البسيط بدأ يواجه عوائد متناقصة، تواصل الشركات السعي إلى نماذج أكبر ونشر أوسع. وهذا يجعل كفاءة الطاقة مشكلة من الدرجة الأولى لا مجرد مسألة هندسية ثانوية.

وقد يصبح العتاد الأصلي للتفرّغ أحد أهم الردود إذا انتقلت مكاسبه إلى ما هو أبعد من المختبر. فهو سيقدم وسيلة للإبقاء على النماذج المتقدمة قابلة للاستخدام مع تقليل استهلاك الطاقة وزمن التشغيل. وهذا قد يؤثر بدوره في:

  • تصميم مراكز البيانات وتكاليف التشغيل
  • جدوى خدمة النماذج الكبيرة على نطاق واسع
  • أنظمة الذكاء الاصطناعي الطرفية أو المدمجة ذات الحدود الصارمة للطاقة
  • النقاشات المناخية والبنية التحتية حول نمو الذكاء الاصطناعي

والأهم أنه قد يغير أيضًا طريقة بناء النماذج المستقبلية. فبمجرد أن يكافئ العتاد التفرّغ بصورة مباشرة، قد يعمل مصممو النماذج على تحسين البنى وطرق التدريب لإظهار مزيد منه.

تقدم واقعي لكنه مؤثر

لا تزال هناك فجوة بين النتائج البحثية القوية والتبني السائد. فالبنية التحتية الحالية للذكاء الاصطناعي تستثمر بعمق في وحدات معالجة الرسوميات والنظم البيئية البرمجية المبنية على الحوسبة الكثيفة. ولا بد أن يثبت العتاد الجديد ليس فقط أنه يعمل، بل أنه يندمج ويتوسع ويبرر تكلفة التحول.

ومع ذلك، يصعب تجاهل الحجة الناتجة عن هذا البحث. فإذا كانت النماذج الكبيرة مليئة بقيم لا تحتاج إلى المعالجة بالطريقة التقليدية، فإن طبقة العتاد الحالية تترك كفاءة حقيقية على الطاولة. وتحوّل الحوسبة المتفرغة هذه اللاكفاءة إلى هدف تصميمي.

في لحظة بات فيها تقدم الذكاء الاصطناعي يُقاس مقابل حدود الطاقة بقدر ما يُقاس مقابل نتائج الاختبارات المعيارية، قد يكون هذا أحد أهم الأهداف الهندسية في المجال. ربما يعتمد مستقبل الذكاء الاصطناعي القوي أقل على التخلص من النماذج الكبيرة، وأكثر على تعلم التوقف عن حساب ما لا تستخدمه تلك النماذج.

هذه المقالة مبنية على تقرير IEEE Spectrum. اقرأ المقال الأصلي.

Originally published on spectrum.ieee.org