كل خطوة يقوم بها الوكيل — مرئية وقابلة للإعادة
بحث الويب، قراءة المستندات، تعديل الكود، أوامر الـ shell — كل خطوة تظهر مباشرة في الدردشة ويمكن مراجعتها لاحقاً.
بحث الويب، قراءة المستندات، تعديل الكود، أوامر الـ shell — كل خطوة تظهر مباشرة في الدردشة ويمكن مراجعتها لاحقاً.
ليست مجرد إجابة نهائية — كل بحث وقراءة وكتابة وأمر يظهر في بطاقة مستقلة. افتح التفاصيل، انسخ النتائج، اقفز إلى المصدر. سلسلة التفكير كاملة شفافة.
سأبدأ أولاً بالبحث في مصادر عالية الجودة، ثم أبني تقرير مقارنة:
من ReAct إلى الاستقلالية طويلة الأمد — استعراض لكيفية تطور أطر عمل الوكلاء وما يعمل منها في الإنتاج.
يحقق Opus 4.7 تحسينات على SWE-bench والاستدلال متعدد الخطوات، مع توفر سياق 1M بشكل عام.
كيف يقارن إطارا تنسيق الوكلاء الرائدان من حيث الاستقرار في الإنتاج وقابلية المراقبة وتكلفة التشغيل.
بحث الويب، جلب الصفحات، تحليل المستندات، أوامر shell، قراءة وكتابة الملفات، مطابقة الأنماط، الجدولة، استدعاء الوكلاء الفرعيين، إعادة استخدام Skill — معظم ما يتطلبه العمل اليومي.
الأوامر وتعديلات الملفات والسكربتات كلها تعمل داخل Sandbox مخصص للوكيل — جهازك يبقى نظيفاً، والإنتاج يبقى دون مساس. تحتاج لمعاينة موقع ويب؟ يمكن للـ Sandbox عرض رابط عام.
Spinning up a Next.js project and exposing a public URL from the sandbox:
سجّل الدخول لمراقبة الوكلاء أثناء العمل في الوقت الفعلي — شفاف وقابل للمراجعة والإعادة.