من نموذج اللغة إلى منصة الوكلاء
أعلنت OpenAI عن توسع كبير في Responses API الخاص بها، وتزويدها ببيئة حاوية مستضافة تحول API من خدمة إنشاء نص إلى منصة runtime وكيل كاملة. يضيف التحديث إمكانية الوصول إلى أدوات shell وقدرات إدارة الملفات وحاويات حوسبة رملية تسمح لوكلاء AI بتنفيذ الكود وتعديل الملفات والحفاظ على الحالة المستمرة عبر مهام متعددة الخطوات — كل ذلك ضمن بنية أساسية آمنة وموثوقة.
يمثل الإعلان الخطوة الأكثر مباشرة من OpenAI نحو مجال بنية أساسية الوكلاء، حيث يوفر للمطورين اللبنات الأساسية اللازمة لإنشاء وكلاء AI يمكنها تنفيذ سير عمل معقد ومتعدد الخطوات بشكل مستقل دون الحاجة إلى أن يدير المطورون بنيتهم الحاسوبية الخاصة لتنفيذ الوكلاء.
بنية Agent Runtime
يتكون runtime الوكيل الجديد من ثلاثة مكونات أساسية. أولاً، توفر أداة shell لوكلاء AI القدرة على تنفيذ أوامر shell عشوائية داخل حاوية رملية. هذا يعني أن الوكيل يمكنه تثبيت الحزم وتشغيل البرامج النصية وتجميع الكود والتفاعل مع أدوات سطر الأوامر تماماً كما يفعل مطور بشري من محطة طرفية.
ثانياً، يسمح نظام إدارة الملفات للوكلاء بقراءة وكتابة وإنشاء وتعديل الملفات داخل حاويتهم. تستمر الملفات عبر استدعاءات API متعددة داخل جلسة واحدة، مما يمكن الوكلاء من بناء أشياء معقدة — أساسيات الأكواد وخطوط أنابيب تحليل البيانات والتوثيق — على مدار مهمة متعددة الخطوات.
ثالثاً، الحاويات نفسها عبارة عن بيئات رملية معزولة تماماً تمنع الوكلاء من الوصول إلى الموارد خارج بيئتهم المخصصة. تعمل كل حاوية في مساحة الاسم الخاصة بها مع إمكانية الوصول إلى الشبكة مقيدة، مما يضمن أنه حتى لو قام الوكيل بتنفيذ كود ضار أو خاطئ، فإن التأثير يبقى محصوراً داخل البيئة الرملية.
لماذا يحتاج المطورون إلى هذا
يعتبر بناء وكلاء AI التي يمكنها اتخاذ إجراءات في العالم الحقيقي — بدلاً من مجرد إنشاء نصوص — أحد أنشط مجالات تطوير AI على مدى العام الماضي. لقد أظهرت أطر العمل مثل LangChain و AutoGPT و CrewAI إمكانيات وكلاء AI، لكن المطورين الذين يستخدمون هذه الأطر اضطروا إلى إدارة بنيتهم الحاسوبية الخاصة لتنفيذ الكود وتخزين الملفات وإدارة الحالة.
عبء البنية الأساسية هذا كبير. يتطلب تشغيل الكود الذي ينشئه AI بأمان استخدام بيئة رملية لمنع حوادث الأمان. يتطلب الحفاظ على الحالة عبر سير عمل وكلاء متعدد الخطوات تخزين مستمر. يتطلب توسيع تنفيذ الوكلاء عبر جلسات متزامنة متعددة تنسيق الحاويات. من خلال توفير runtime موثوقة، تتحمل OpenAI هذه المسؤوليات البنية الأساسية، مما يسمح للمطورين بالتركيز على تصميم الوكلاء وتنسيق المهام بدلاً من DevOps.
حالات الاستخدام والتطبيقات
يمكّن agent runtime عدة فئات من التطبيقات التي كان من الصعب بناؤها مع الوصول إلى API فقط. يمكن لوكلاء إنشاء واختبار الكود الآن كتابة الكود وتشغيله ومراقبة المخرجات والتصحيح بشكل تكراري — كل ذلك ضمن جلسة API واحدة. يمكن لوكلاء تحليل البيانات تحميل مجموعات البيانات وتنفيذ برامج التحليل وإنشاء التصورات وإرجاع النتائج دون نقل البيانات ذهاباً وإياباً بين API والبنية الحاسوبية للمطور.
يمكن تجهيز وكلاء البحث بأدوات تصل إلى قواعد البيانات والواجهات البرمجية وخدمات الويب، وتجميع المعلومات من مصادر متعددة في تقارير متماسكة. يمكن لوكلاء DevOps تنفيذ برامج النشر وتشغيل فحوصات الصحة والرد على حوادث التشغيل.
تم تصميم runtime أيضاً لدعم المهام طويلة المدى. يمكن أن تستمر الحاويات لفترات طويلة، مما يسمح للوكلاء بالعمل على مهام تستغرق دقائق أو ساعات بدلاً من الثواني النموذجية لاستدعاءات API الفردية.
المنافسة والسياق السوقي
يدخل agent runtime من OpenAI مشهداً تنافسياً. تقدم Anthropic قدرة استخدام الكمبيوتر المماثلة لـ Claude، مما يسمح للنموذج بالتفاعل مع بيئات سطح المكتب. تتضمن منصة Gemini من Google تنفيذ الكود من خلال AI Studio الخاص بها. وتوفر نظام بيئي متنامٍ من الأدوات مفتوحة المصدر بنية أساسية للوكلاء غير مرتبطة بأي مزود نموذج واحد.
الفرق في نهج OpenAI هو عمق التكامل. لأن runtime مدمجة مباشرة في Responses API، فإن قدرات الوكلاء مرتبطة ارتباطاً وثيقاً بقدرات المنطق في النموذج. يمكن للنموذج أن يقرر متى يتم تنفيذ الكود، وأي ملفات يتم إنشاء أو تعديلها، وكيفية تفسير مخرجات shell — كل ذلك كجزء من عملية إنشاء الاستجابة الطبيعية.
الأمان والحوكمة
تؤكد OpenAI على أن بيئة الحاوية المستضافة تتضمن طبقات أمان متعددة. تعمل الحاويات بأقل الامتيازات، والوصول إلى الشبكة مقيد بنقاط نهاية موافق عليها، وتسجل جميع إجراءات الوكلاء لأغراض التدقيق. يمكن للمطورين تعيين حدود الموارد على الحاويات — وحدة المعالجة المركزية والذاكرة ومساحة القرص ووقت التنفيذ — لمنع العمليات الخارجة عن السيطرة.
تعتبر قدرات التسجيل والتدقيق مهمة بشكل خاص لحالات الاستخدام الموثوقة حيث تتطلب متطلبات الامتثال الرؤية في ما يفعله وكلاء AI. يتم تسجيل كل أمر shell مُنفذ وكل ملف تم إنشاء أو تعديله وكل طلب شبكة يتم تقديمه بواسطة وكيل ويمكن مراجعته.
عندما تتولى وكلاء AI مهاماً ذات أهمية متزايدة، يجب أن تكون البنية الأساسية التي تدعمها قوية مثل النماذج نفسها. يمثل بيئة الحاوية المستضافة من OpenAI اعترافاً بأن الطريق من نموذج اللغة إلى الوكيل المستقل يتطلب ليس فقط نماذج أفضل بل بنية أساسية أفضل.
تستند هذه المقالة إلى تقارير OpenAI. اقرأ المقالة الأصلية.

